Japanese Lexical Database

Japanese Lexical Database

Covers approximately 290,000 entries

Optimized for NLP applications

Various grammatical and phonological attributes

Overview

CJKI’s Japanese Lexical Database (JLD) is a comprehensive monolingual lexical database that includes a rich set of grammatical attributes. JLD contains about 290,000 entries covering general vocabulary, both free forms and bound forms, and includes a significant number of affixes, particles, auxiliaries and conjugation patterns to account for all the inflectional, derivational and lexical morphology in Japanese. This enables NLP software to easily recognize inflected, conjugated and derived forms even though they are not explicitly listed in the lexicon.

Developed by CJKI’s team of experienced Japanese editors and linguists over more than a decade, JLD is a significant contribution to the field of Japanese natural language processing and information processing.

Main Features

Phonological information

such as hiragana and romanized readings

Morphological information

such as derivational affixes and conjugation patterns

Grammatical information

such as part-of-speech codes

Japanese Lexical Database
JapaneseKanaPOSSubConj.Type
買いあおるかいあおるV5R
買い煽るかいあおるV5Rt
買煽るかいあおるV5R
改悪かいあくVNt
買いあげかいあげNC
買い上げかいあげNC
買上かいあげNC
買上げかいあげNC
買いあげるかいあげるV1
買い上げるかいあげるV1St
買い上げるかいあげるV2
買上げるかいあげるV1
買いあさるかいあさるV5R
買い漁るかいあさるV5Rt
買い漁るかいあさるV4
買漁るかいあさるV5R
貝合かいあわせNC
貝合せかいあわせNC
貝合わせかいあわせNC
介意かいいVNt
会意かいいNC
解頤かいいNC
怪異かいいAN2
怪異かいいNC
魁偉かいいAN0
魁偉かいいAN2
海尉かいいNC
痒いかいいAJ
海域かいいきNC
海域礁かいいきしょうNC
海域制御かいいきせいぎょNC
海域利用かいいきりようNC
魁偉さかいいさNC
買い急ぐかいいそぐV5Gt
飼い犬かいいぬNC
飼犬かいいぬNC
飼い犬に手を噛まれるかいいぬにてをかまれるV1
飼犬に手を噛まれるかいいぬにてをかまれるEJ
買いいれるかいいれるV1
買い入れるかいいれるV1St
買い入れるかいいれるV2
買入れるかいいれるV1
会員かいいんNC
拐引かいいんVNt
改印かいいんVNi
海員かいいんNC
開院かいいんVNr
誨淫かいいんNC
会員会社かいいんがいしゃNC
海員組合かいいんくみあいNC
会員券かいいんけんNC
会員権かいいんけんNC
会員権商法かいいんけんしょうほうNC
会員証かいいんしょうNC
会員数かいいんすうNC
会員制かいいんせいNC
会員組織かいいんそしきNC
海芋かいうNC
買いうけるかいうけるV1
買い受けるかいうけるV1St
買い受けるかいうけるV2
買受けるかいうけるV1
買い埋めるかいうめるV1
買埋めるかいうめるV1
海運かいうんNC
開運かいうんNC
海運局かいうんきょくNC
海運業かいうんぎょうNC
海運同盟かいうんどうめいNC
カイエかいえNC
快泳かいえいNC
開映かいえいVN
改易かいえきVNt
快演かいえんVN
海塩かいえんNC
海淵かいえんNC
開園かいえんVNr
開宴かいえんVN
開演かいえんVNi
海王星かいおうせいNC
貝覆かいおおいNC
貝覆いかいおおいNC
買い置きかいおきVN
買置かいおきVN
買置きかいおきVN
壊屋かいおくNC
買い置くかいおくV5K
買置くかいおくV5K
飼い桶かいおけNC
飼桶かいおけNC
買いオペかいおぺNC
買オペかいおぺNC
買いオペレーションかいおぺれーしょんNC
買オペレーションかいおぺれーしょんNC
介音かいおんNC
快音かいおんNC
怪音かいおんNC
海温かいおんNC
開音かいおんNC
開音節かいおんせつNC
会歌かいかNC
怪火かいかNC
開化かいかVNi
開架かいかVN
開花かいかVNi
階下かいかNC
諧和かいかVNi
怪々かいかいAN0
怪怪かいかいAN0
恢々かいかいAN1
恢恢かいかいAN1
恢恢かいかいAN2
開会かいかいVNr
開会式かいかいしきNC
買いかえすかいかえすV5S
買い返すかいかえすV5St
買い返すかいかえすV4
買返すかいかえすV5S
買い換えるかいかえるV1
買い替えるかいかえるV1
買換えるかいかえるV1
買替えるかいかえるV1
買替るかいかえるV1
開花期かいかきNC
改革かいかくVNt
海角かいかくNC
買い掛けかいかけNC
買掛かいかけNC
買掛けかいかけNC
買い掛け金かいかけきんNC
買掛け金かいかけきんNC
買掛金かいかけきんNC
開花前線かいかぜんせんNC
買い方かいかたNC
買方かいかたNC
快活かいかつAN0
快活かいかつAN2
快豁かいかつAN0
快豁かいかつAN2
快闊かいかつAN0
快闊かいかつAN2
開豁かいかつAN0
開豁かいかつAN2
快活さかいかつさNC
開化どんぶりかいかどんぶりNC
開化丼かいかどんぶりNC
買いかぶりかいかぶりVN
買い被りかいかぶりVN
買被かいかぶりVN
買被りかいかぶりVN
買いかぶるかいかぶるV5R
買い被るかいかぶるV5Rt
買い被るかいかぶるV4
買被るかいかぶるV5R
開花ホルモンかいかほるもんNC
買い為替かいかわせNC
買為替かいかわせNC
会館かいかんNC
会舘かいかんNC
快感かいかんNC
快漢かいかんNC
怪漢かいかんNC
海関かいかんNC
開巻かいかんVN
開館かいかんVNr
POS: Part of speech
Sub: Sub-part of speech
Conj.: Conjugation pattern codes
Type: Semantic or grammatical code
- [i] intransitive verb
- [t] transitive verb
- [ti] transitive and intransitive verb

Practical Applications

JLD is being used by major IT companies to enhance their Japanese morphological analysis technology, and is especially suitable for natural language processing (NLP) applications for:

Segmentation and tokenization

Input method editors

Information retrieval

Morphological analysis

Part-of-speech tagging

Related Resources

Japanese Lexical Database

Chinese Lexical Database

Monolingual general vocabulary for NLP applications

Japanese Lexical Database

Korean Lexical Database

Monolingual general vocabulary for NLP applications

Japanese Lexical Database

Japanese Wordlist

General vocabulary, proper nouns and technical terms

Reference Documents

To make JLD robust for information retrieval and morphological analysis, it is highly recommended to supplement it with our JOD (Japanese Orthographical Database), described in detail in the papers below.

The Challenges of Intelligent Japanese Searching

Linguistic issues that need to be addressed by advanced information retrieval technologies

Morphological Attributes in Japanese

Describes derivational affixes and binding valency