Japanese Lexical Database

Covers approximately 290,000 entries

Optimized for NLP applications

Various grammatical and phonological attributes

Overview

CJKIโ€™sย Japanese Lexical Databaseย (JLD) is a comprehensive monolingual lexical database that includes a rich set of grammatical attributes.ย JLDย contains about 290,000ย entries covering general vocabulary, both free forms and bound forms, and includes a significant number of affixes, particles, auxiliaries and conjugation patterns to account for all the inflectional, derivational and lexical morphology in Japanese. This enables NLP software to easily recognize inflected, conjugated and derived forms even though they are not explicitly listed in the lexicon.

Developed by CJKIโ€™s team of experienced Japanese editors and linguists over more than a decade,ย JLDย is a significant contribution to the field of Japanese natural language processingย and information processing.

Main Features

Phonological information

Such as hiragana and romanized readings

Grammatical information

Such as part-of-speech codes

Morphological information

Such as derivational affixes and conjugation patterns

Japanese Lexical Database

JapaneseKanaPOSSubConj.Type
่ฒทใ„ใ‚ใŠใ‚‹ใ‹ใ„ใ‚ใŠใ‚‹V5R
่ฒทใ„็…ฝใ‚‹ใ‹ใ„ใ‚ใŠใ‚‹V5Rt
่ฒท็…ฝใ‚‹ใ‹ใ„ใ‚ใŠใ‚‹V5R
ๆ”นๆ‚ชใ‹ใ„ใ‚ใVNt
่ฒทใ„ใ‚ใ’ใ‹ใ„ใ‚ใ’NC
่ฒทใ„ไธŠใ’ใ‹ใ„ใ‚ใ’NC
่ฒทไธŠใ‹ใ„ใ‚ใ’NC
่ฒทไธŠใ’ใ‹ใ„ใ‚ใ’NC
่ฒทใ„ใ‚ใ’ใ‚‹ใ‹ใ„ใ‚ใ’ใ‚‹V1
่ฒทใ„ไธŠใ’ใ‚‹ใ‹ใ„ใ‚ใ’ใ‚‹V1St
่ฒทใ„ไธŠใ’ใ‚‹ใ‹ใ„ใ‚ใ’ใ‚‹V2
่ฒทไธŠใ’ใ‚‹ใ‹ใ„ใ‚ใ’ใ‚‹V1
่ฒทใ„ใ‚ใ•ใ‚‹ใ‹ใ„ใ‚ใ•ใ‚‹V5R
่ฒทใ„ๆผใ‚‹ใ‹ใ„ใ‚ใ•ใ‚‹V5Rt
่ฒทใ„ๆผใ‚‹ใ‹ใ„ใ‚ใ•ใ‚‹V4
่ฒทๆผใ‚‹ใ‹ใ„ใ‚ใ•ใ‚‹V5R
่ฒๅˆใ‹ใ„ใ‚ใ‚ใ›NC
่ฒๅˆใ›ใ‹ใ„ใ‚ใ‚ใ›NC
่ฒๅˆใ‚ใ›ใ‹ใ„ใ‚ใ‚ใ›NC
ไป‹ๆ„ใ‹ใ„ใ„VNt
ไผšๆ„ใ‹ใ„ใ„NC
่งฃ้ คใ‹ใ„ใ„NC
ๆ€ช็•ฐใ‹ใ„ใ„AN2
ๆ€ช็•ฐใ‹ใ„ใ„NC
้ญๅ‰ใ‹ใ„ใ„AN0
้ญๅ‰ใ‹ใ„ใ„AN2
ๆตทๅฐ‰ใ‹ใ„ใ„NC
็—’ใ„ใ‹ใ„ใ„AJ
ๆตทๅŸŸใ‹ใ„ใ„ใNC
ๆตทๅŸŸ็คใ‹ใ„ใ„ใใ—ใ‚‡ใ†NC
ๆตทๅŸŸๅˆถๅพกใ‹ใ„ใ„ใใ›ใ„ใŽใ‚‡NC
ๆตทๅŸŸๅˆฉ็”จใ‹ใ„ใ„ใใ‚Šใ‚ˆใ†NC
้ญๅ‰ใ•ใ‹ใ„ใ„ใ•NC
่ฒทใ„ๆ€ฅใใ‹ใ„ใ„ใใV5Gt
้ฃผใ„็Šฌใ‹ใ„ใ„ใฌNC
้ฃผ็Šฌใ‹ใ„ใ„ใฌNC
้ฃผใ„็Šฌใซๆ‰‹ใ‚’ๅ™›ใพใ‚Œใ‚‹ใ‹ใ„ใ„ใฌใซใฆใ‚’ใ‹ใพใ‚Œใ‚‹V1
้ฃผ็Šฌใซๆ‰‹ใ‚’ๅ™›ใพใ‚Œใ‚‹ใ‹ใ„ใ„ใฌใซใฆใ‚’ใ‹ใพใ‚Œใ‚‹EJ
่ฒทใ„ใ„ใ‚Œใ‚‹ใ‹ใ„ใ„ใ‚Œใ‚‹V1
่ฒทใ„ๅ…ฅใ‚Œใ‚‹ใ‹ใ„ใ„ใ‚Œใ‚‹V1St
่ฒทใ„ๅ…ฅใ‚Œใ‚‹ใ‹ใ„ใ„ใ‚Œใ‚‹V2
่ฒทๅ…ฅใ‚Œใ‚‹ใ‹ใ„ใ„ใ‚Œใ‚‹V1
ไผšๅ“กใ‹ใ„ใ„ใ‚“NC
ๆ‹ๅผ•ใ‹ใ„ใ„ใ‚“VNt
ๆ”นๅฐใ‹ใ„ใ„ใ‚“VNi
ๆตทๅ“กใ‹ใ„ใ„ใ‚“NC
้–‹้™ขใ‹ใ„ใ„ใ‚“VNr
่ชจๆทซใ‹ใ„ใ„ใ‚“NC
ไผšๅ“กไผš็คพใ‹ใ„ใ„ใ‚“ใŒใ„ใ—ใ‚ƒNC
ๆตทๅ“ก็ต„ๅˆใ‹ใ„ใ„ใ‚“ใใฟใ‚ใ„NC
ไผšๅ“กๅˆธใ‹ใ„ใ„ใ‚“ใ‘ใ‚“NC
ไผšๅ“กๆจฉใ‹ใ„ใ„ใ‚“ใ‘ใ‚“NC
ไผšๅ“กๆจฉๅ•†ๆณ•ใ‹ใ„ใ„ใ‚“ใ‘ใ‚“ใ—ใ‚‡ใ†ใปใ†NC
ไผšๅ“ก่จผใ‹ใ„ใ„ใ‚“ใ—ใ‚‡ใ†NC
ไผšๅ“กๆ•ฐใ‹ใ„ใ„ใ‚“ใ™ใ†NC
ไผšๅ“กๅˆถใ‹ใ„ใ„ใ‚“ใ›ใ„NC
ไผšๅ“ก็ต„็น”ใ‹ใ„ใ„ใ‚“ใใ—ใNC
ๆตท่Š‹ใ‹ใ„ใ†NC
่ฒทใ„ใ†ใ‘ใ‚‹ใ‹ใ„ใ†ใ‘ใ‚‹V1
่ฒทใ„ๅ—ใ‘ใ‚‹ใ‹ใ„ใ†ใ‘ใ‚‹V1St
่ฒทใ„ๅ—ใ‘ใ‚‹ใ‹ใ„ใ†ใ‘ใ‚‹V2
่ฒทๅ—ใ‘ใ‚‹ใ‹ใ„ใ†ใ‘ใ‚‹V1
่ฒทใ„ๅŸ‹ใ‚ใ‚‹ใ‹ใ„ใ†ใ‚ใ‚‹V1
่ฒทๅŸ‹ใ‚ใ‚‹ใ‹ใ„ใ†ใ‚ใ‚‹V1
ๆตท้‹ใ‹ใ„ใ†ใ‚“NC
้–‹้‹ใ‹ใ„ใ†ใ‚“NC
ๆตท้‹ๅฑ€ใ‹ใ„ใ†ใ‚“ใใ‚‡ใNC
ๆตท้‹ๆฅญใ‹ใ„ใ†ใ‚“ใŽใ‚‡ใ†NC
ๆตท้‹ๅŒ็›Ÿใ‹ใ„ใ†ใ‚“ใฉใ†ใ‚ใ„NC
ใ‚ซใ‚คใ‚จใ‹ใ„ใˆNC
ๅฟซๆณณใ‹ใ„ใˆใ„NC
้–‹ๆ˜ ใ‹ใ„ใˆใ„VN
ๆ”นๆ˜“ใ‹ใ„ใˆใVNt
ๅฟซๆผ”ใ‹ใ„ใˆใ‚“VN
ๆตทๅกฉใ‹ใ„ใˆใ‚“NC
ๆตทๆทตใ‹ใ„ใˆใ‚“NC
้–‹ๅœ’ใ‹ใ„ใˆใ‚“VNr
้–‹ๅฎดใ‹ใ„ใˆใ‚“VN
้–‹ๆผ”ใ‹ใ„ใˆใ‚“VNi
ๆตท็Ž‹ๆ˜Ÿใ‹ใ„ใŠใ†ใ›ใ„NC
่ฒ่ฆ†ใ‹ใ„ใŠใŠใ„NC
่ฒ่ฆ†ใ„ใ‹ใ„ใŠใŠใ„NC
่ฒทใ„็ฝฎใใ‹ใ„ใŠใVN
่ฒท็ฝฎใ‹ใ„ใŠใVN
่ฒท็ฝฎใใ‹ใ„ใŠใVN
ๅฃŠๅฑ‹ใ‹ใ„ใŠใNC
่ฒทใ„็ฝฎใใ‹ใ„ใŠใV5K
่ฒท็ฝฎใใ‹ใ„ใŠใV5K
้ฃผใ„ๆกถใ‹ใ„ใŠใ‘NC
้ฃผๆกถใ‹ใ„ใŠใ‘NC
่ฒทใ„ใ‚ชใƒšใ‹ใ„ใŠใบNC
่ฒทใ‚ชใƒšใ‹ใ„ใŠใบNC
่ฒทใ„ใ‚ชใƒšใƒฌใƒผใ‚ทใƒงใƒณใ‹ใ„ใŠใบใ‚Œใƒผใ—ใ‚‡ใ‚“NC
่ฒทใ‚ชใƒšใƒฌใƒผใ‚ทใƒงใƒณใ‹ใ„ใŠใบใ‚Œใƒผใ—ใ‚‡ใ‚“NC
ไป‹้Ÿณใ‹ใ„ใŠใ‚“NC
ๅฟซ้Ÿณใ‹ใ„ใŠใ‚“NC
ๆ€ช้Ÿณใ‹ใ„ใŠใ‚“NC
ๆตทๆธฉใ‹ใ„ใŠใ‚“NC
้–‹้Ÿณใ‹ใ„ใŠใ‚“NC
้–‹้Ÿณ็ฏ€ใ‹ใ„ใŠใ‚“ใ›ใคNC
ไผšๆญŒใ‹ใ„ใ‹NC
ๆ€ช็ซใ‹ใ„ใ‹NC
้–‹ๅŒ–ใ‹ใ„ใ‹VNi
้–‹ๆžถใ‹ใ„ใ‹VN
้–‹่Šฑใ‹ใ„ใ‹VNi
้šŽไธ‹ใ‹ใ„ใ‹NC
่ซงๅ’Œใ‹ใ„ใ‹VNi
ๆ€ชใ€…ใ‹ใ„ใ‹ใ„AN0
ๆ€ชๆ€ชใ‹ใ„ใ‹ใ„AN0
ๆขใ€…ใ‹ใ„ใ‹ใ„AN1
ๆขๆขใ‹ใ„ใ‹ใ„AN1
ๆขๆขใ‹ใ„ใ‹ใ„AN2
้–‹ไผšใ‹ใ„ใ‹ใ„VNr
้–‹ไผšๅผใ‹ใ„ใ‹ใ„ใ—ใNC
่ฒทใ„ใ‹ใˆใ™ใ‹ใ„ใ‹ใˆใ™V5S
่ฒทใ„่ฟ”ใ™ใ‹ใ„ใ‹ใˆใ™V5St
่ฒทใ„่ฟ”ใ™ใ‹ใ„ใ‹ใˆใ™V4
่ฒท่ฟ”ใ™ใ‹ใ„ใ‹ใˆใ™V5S
่ฒทใ„ๆ›ใˆใ‚‹ใ‹ใ„ใ‹ใˆใ‚‹V1
่ฒทใ„ๆ›ฟใˆใ‚‹ใ‹ใ„ใ‹ใˆใ‚‹V1
่ฒทๆ›ใˆใ‚‹ใ‹ใ„ใ‹ใˆใ‚‹V1
่ฒทๆ›ฟใˆใ‚‹ใ‹ใ„ใ‹ใˆใ‚‹V1
่ฒทๆ›ฟใ‚‹ใ‹ใ„ใ‹ใˆใ‚‹V1
้–‹่ŠฑๆœŸใ‹ใ„ใ‹ใNC
ๆ”น้ฉใ‹ใ„ใ‹ใVNt
ๆตท่ง’ใ‹ใ„ใ‹ใNC
่ฒทใ„ๆŽ›ใ‘ใ‹ใ„ใ‹ใ‘NC
่ฒทๆŽ›ใ‹ใ„ใ‹ใ‘NC
่ฒทๆŽ›ใ‘ใ‹ใ„ใ‹ใ‘NC
่ฒทใ„ๆŽ›ใ‘้‡‘ใ‹ใ„ใ‹ใ‘ใใ‚“NC
่ฒทๆŽ›ใ‘้‡‘ใ‹ใ„ใ‹ใ‘ใใ‚“NC
่ฒทๆŽ›้‡‘ใ‹ใ„ใ‹ใ‘ใใ‚“NC
้–‹่Šฑๅ‰็ทšใ‹ใ„ใ‹ใœใ‚“ใ›ใ‚“NC
่ฒทใ„ๆ–นใ‹ใ„ใ‹ใŸNC
่ฒทๆ–นใ‹ใ„ใ‹ใŸNC
ๅฟซๆดปใ‹ใ„ใ‹ใคAN0
ๅฟซๆดปใ‹ใ„ใ‹ใคAN2
ๅฟซ่ฑใ‹ใ„ใ‹ใคAN0
ๅฟซ่ฑใ‹ใ„ใ‹ใคAN2
ๅฟซ้—Šใ‹ใ„ใ‹ใคAN0
ๅฟซ้—Šใ‹ใ„ใ‹ใคAN2
้–‹่ฑใ‹ใ„ใ‹ใคAN0
้–‹่ฑใ‹ใ„ใ‹ใคAN2
ๅฟซๆดปใ•ใ‹ใ„ใ‹ใคใ•NC
้–‹ๅŒ–ใฉใ‚“ใถใ‚Šใ‹ใ„ใ‹ใฉใ‚“ใถใ‚ŠNC
้–‹ๅŒ–ไธผใ‹ใ„ใ‹ใฉใ‚“ใถใ‚ŠNC
่ฒทใ„ใ‹ใถใ‚Šใ‹ใ„ใ‹ใถใ‚ŠVN
่ฒทใ„่ขซใ‚Šใ‹ใ„ใ‹ใถใ‚ŠVN
่ฒท่ขซใ‹ใ„ใ‹ใถใ‚ŠVN
่ฒท่ขซใ‚Šใ‹ใ„ใ‹ใถใ‚ŠVN
่ฒทใ„ใ‹ใถใ‚‹ใ‹ใ„ใ‹ใถใ‚‹V5R
่ฒทใ„่ขซใ‚‹ใ‹ใ„ใ‹ใถใ‚‹V5Rt
่ฒทใ„่ขซใ‚‹ใ‹ใ„ใ‹ใถใ‚‹V4
่ฒท่ขซใ‚‹ใ‹ใ„ใ‹ใถใ‚‹V5R
้–‹่Šฑใƒ›ใƒซใƒขใƒณใ‹ใ„ใ‹ใปใ‚‹ใ‚‚ใ‚“NC
่ฒทใ„็‚บๆ›ฟใ‹ใ„ใ‹ใ‚ใ›NC
่ฒท็‚บๆ›ฟใ‹ใ„ใ‹ใ‚ใ›NC
ไผš้คจใ‹ใ„ใ‹ใ‚“NC
ไผš่ˆ˜ใ‹ใ„ใ‹ใ‚“NC
ๅฟซๆ„Ÿใ‹ใ„ใ‹ใ‚“NC
ๅฟซๆผขใ‹ใ„ใ‹ใ‚“NC
ๆ€ชๆผขใ‹ใ„ใ‹ใ‚“NC
ๆตท้–ขใ‹ใ„ใ‹ใ‚“NC
้–‹ๅทปใ‹ใ„ใ‹ใ‚“VN
้–‹้คจใ‹ใ„ใ‹ใ‚“VNr

Practical Applications

JLDย is being used by major IT companies to enhance their Japanese morphological analysis technology, and is especially suitable for natural language processing (NLP) applications for:

Segmentation and tokenization

Input method editors

Information retrieval

Morphological analysis

Part-of-speech tagging

Reference Documents

To makeย JLDย robust for information retrieval and morphological analysis, it is highly recommended to supplement it with ourย JODย (Japanese Orthographic Database), described in detail in the papers below.

The Challenges of Intelligent Japanese Searching

Linguistic issues that need to be addressed by advanced information retrieval technologies

Morphological Attributes in Japanese

Describes derivational affixes and binding valency

JLD Related Resources

CLD

Chinese Lexical Database

Monolingual general vocabulary for NLP applications

Korean Lexical Database

Monolingual general vocabulary for NLP applications

JPD

Japanese Wordlist

General vocabulary, proper nouns and technical terms