日本語データ資源

日本語データ資源

日中韓辭典研究所の包括的な日本語語彙資源は現在260万以上の項目を含み、一般語彙、専門用語、固有名詞、会社名、カタカナ語、その他を網羅している。

データ資源は、機械翻訳、情報検索、固有表現認識、音声認識、入力システム等のアプリケーション開発に使用される。データベースには、詳細な文法、音韻、意味属性を備え、仮名とローマ字読み、IPA、品詞コード、活用形、異表記、頻度等の付加情報も豊富に含む。

ご要望に応じ、より大きいサイズのデータサンプルを提供いたしますので、お問い合わせください。

日本語データ資源 (種類別)