辞書
データ資源
コンサルティング
日本語
中国語
韓国語
アラビア語
辞書類
ウェブサイト
日中韓辭典研究所
漢英字典刊行会
春遍雀來
(Jack Halpern)
文献・論文
辞典
|
主な日本語辞書データ資源
Principal Japanese Lexical Resources
300万項目を超える大規模な語彙データベースであり、一般語彙、専門用語、
人名・地名・企業名の固有名詞等を網羅している。機械翻訳(MT)、知的情報検索(IR)
、入力システム(IME)等のアプリケーションに幅広く活用されている。
- 速報:日英地理情報データベース 市・町(村)・通り・丁目・字名及び駅・学校・施設・官公庁等の名称を広範囲に収録。
- 世界初: 日本語音韻データベース 音声合成用データベースで、 アクセント及び正確なIPA等の音声属性を網羅している。アクセント付き人名辞書は即提供可能。詳細解説をご参照下さい。
- 速報: 日本人名異表記辞書 約400万語に拡張。ローマ字方式は7種を網羅。
- 速報: 日本地名異表記辞書 市・町(村)・通り・丁目・字名や駅・学校・官公庁等の日本の地名及び施設名の異表記を数十万項目収録。
- 大拡張:
専門用語辞書
数年前に100万語を突破し、最先端の計算言語学手法により絶えず大拡張と整備を続けている包括的専門用語辞書である。科学技術の主要な分野を網羅する充実の日英英日専門用語辞書データベースであり、分野別の提供も可。
- 速報:
多言語固有名詞辞書データベース
電子辞書に頻出の日本語・簡体中文・繁体中文・英語・韓国語を収録。
- 速報:
中日英専門用語辞書データベース 15分野収録の充実したシリーズ。特にコンピュータ/IT用語辞書は推奨。
- 大拡張:
CJKI和英辞典
11万項目の最新和英辞典であり、一般語彙及び重要固有名詞を収録している。姉妹版のCJKI英日辞典 は8万2千項目を収録。
- 最新版(2008年): CJKI英和辞典
8万2千項目の最新英和辞典。一般語彙及び重要固有名詞を収録している。欧米固有名詞及び専門用語等の拡張が可能である。
- 日本語語彙データベース (JLD)
一般語彙約30万語を収録し、詳細な文法属性も備えている。特に日本語情報処理及びNLPアプリケーション
のために設計された極めて強力なデータベースである。
- 日本固有名詞辞典
140万項目の、日本の人名(姓・名)・地名・企業名の日英データベースで、意味に
よって分類されている。頻度情報付き。日本語の知的情報検索、機械翻訳、固有名確認等の自然言語処理に最適である。
- 西洋人名
日本以外の人名・地名の日英英日辞書データベースで、約6万語収録。意味コード及び異表記付き。
-
世界最大の日本語異表記データベース Yahoo!やAmazon等の大手ポータルサイトに採用されている。知的情報検索のためのアプリケーションや先進的な言語学ツールにとっての理想的な資源である。
詳細論文をご参照下さい。
-
片仮名語データベース 種々の文法属性を備えた包括的カタカナ語データベースは、自然言語処理のアプリケーション強化に重要な役割を果たす。
- IT・コンピュータ用語
包括的な最新の日英コンピュータ用語データベース。現在の収録見出し語数
約12万5千語で、なお更新中。日・中・英の多言語データベースもご提供可。
[日本語]
[英語]
- 固有名認識
日本語の固有名認識のためのキーワードデータベース。
固有名詞の前後に来るキーワードは、固有名認識(NER)ツールの精度向上に重要な役割を果たす。
- 日本の企業名・団体名
約60万の日本の企業名・団体名データベース。頻度情報と、一部には英訳も付いている。
- 日英新語 新語を約3万語収録した包括的な日英新語データベース。
- 英日新語データベース
専門の編集委員による最新且つ正確な英日新語データベース。
[日本語]
[英語]
- 著名芸能人名 日本及び海外の歌手、俳優、タレントを網羅した包括的
な日英芸能人名データベース。携帯電話等の携帯機器用IMEの入力効率向上に
適している。
[日本語]
[英語]
- 日本語の頻度統計
大規模なコーパスに基づいた包括的な日本語の語彙統計データベース。
単語や文字の出現頻度情報等を含む。
- 日本語の連接属性 当研究所の日本語辞書データベース中の派生属性、語形成接続情報等を紹介している。特に日本語入力システム(IME)や検索エンジンでの問い
合わせ処理に於いて、日本語の語彙素を特定するのに最適である。
- ビジネス・財政用語
ビジネス・財政・経済用語の包括的な最新日英辞書データベース。
- 漢英辞典
日本語学習用漢字辞典の定番として評判の高い
「新漢英字典」
の包括的な特徴を備えた漢英データベース。
- 漢字データベース
日中韓各語に於ける漢字用法のあらゆる側面を網羅した単漢字データベース。
使用頻度、音韻情報、部首、文字コード、その他の属性を備えている。
|