中国語語彙データベース

50万項目以上を収録

簡体字と繁体字

自然言語処理アプリ向けに最適化

概要

中国語語彙データベース(CLD: Chinese Lexical Database)は自然言語処理アプリ向けに開発された包括的な単言語語彙データベースです。簡体字と繁体字の2つのモジュールがあり、一般語彙と専門用語、重要固有名詞をそれぞれ25万項目収録します。

CLDは中国大陸と台湾の読みの違いを踏まえ、ピンインと注音を正確に付けています。例えば「危険」は、簡体字では「危险」wēixiǎnであるのに対して, 繁体字では「危險」 wéixiǎnと読みが異なってきます。

繁体字データベースは、簡体字から書字レベルで一括変換させたものではなく、語彙レベル変換に注意を払い校正したのも、このデータベースの特徴です。例えば、「タクシー」は、簡体字「出租车」chūzūchēから書字レベルで変換した訳語「出租車」より、語彙レベルの訳語「計程車」jīchéngchēのほうがより適切だと言えます。

CLDは、CJKIの中国語専門チームが長年に亘って編纂したデータベースで、中国語の辞書編集と情報処理分野で大きく貢献しています。

主な特徴

音韻情報

ピンイン、注音、IPA等

意味情報

固有名詞のタイプ等

文法情報

品詞と連接属性等

形態素情報

派生接辞と結合属性

* タブで画面を切り替えることができます。

POSSCPinyin
NC东家之子dōngjiāzhīzǐ
E东家效颦dōngjiāxiàopín
NP东架松dōngjiàsōng
NP东河dōnghé
NP东河dōnghé
NP东河镇dōnghézhèn
NP东河沿dōnghéyán
NP东河区dōnghéqū
NP东河漕胡同dōnghécáo hútóng
NP东河道dōnghédào
NP东花dōnghuā
NP东花厅胡同dōnghuātīng hútóng
NP东花枝胡同dōnghuāzhī hútóng
NP东霞dōngxiá
NP东会村dōnghuìcūn
NC东海dōnghǎi
NP东海dōnghǎi
NP东海dōnghǎi
NP东海县dōnghǎixiàn
E东海扬尘dōnghǎiyángchén
E东海捞针dōnghǎilāozhēn
U东海舰队dōnghǎijiànduì
E东海桑田dōnghǎisāngtián
NP东海大学dōnghǎidàxué
NP东外大街dōngwàidàjiē
NC东郭dōngguō
NP东郭dōngguō
E东郭先生dōngguōxiānshēng
NC东郭履dōngguōlǚ
NP东革新里dōnggéxīnlǐ
NC东岳dōngyuè
NP东岳dōngyuè
NP东冠英胡同dōngguānyīng hútóng
NP东官房胡同dōngguānfáng hútóng
NC东干dōnggān
NP东管头dōngguǎntóu
NP东管头前街dōngguǎntóuqiánjiē
NP东莞dōngguān
NP东莞市dōngguānshì
NC东岸dōngàn
NP东岩dōngyán
NP东喜dōngxǐ
NP东旗dōngqí
NP东起dōngqǐ
NP东吉dōngjí
NP东吉祥胡同dōngjíxiáng hútóng
NP东弓匠胡同dōnggōngjiàng hútóng
NP东旧帘子胡同dōngjiùliánzǐ hútóng
NP东牛角胡同dōngniújiǎo hútóng
NP东京dōngjīng
NP东京影展dōngjīngyǐngzhǎn
NP东京畿道dōngjīngjīdào
NC东京股市dōngjīnggǔshì
NP东京大学dōngjīngdàxué
NP东京都dōngjīngdū
NP东京湾dōngjīngwān
NP东教场胡同dōngjiāocháng hútóng
NP东教胡同dōngjiāo hútóng
NP东局村dōngjúcūn
NP东玉dōngyù
NP东玉河dōngyùhé
NP东琴dōngqín
NP东琴科dōngqínkē
NP东区dōngqū
NC东隅dōngyú
NC东君dōngjūn
NP东慧dōnghuì
NP东月dōngyuè
NP东健dōngjiàn
NP东源dōngyuán
NP东源县dōngyuánxiàn
NP东湖dōnghú
NP东湖渠dōnghúqú
NP东湖区dōnghúqū
NC东胡dōnghú
N东胡史dōnghúshǐ
NP东交民巷dōngjiāomínxiàng
NP东光dōngguāng
NP东光dōngguāng
NP东光县dōngguāngxiàn
NP东光镇dōngguāngzhèn
NP东光胡同dōngguāng hútóng
NP东公街dōnggōngjiē
NP东公文dōnggōngwén
NP东厚dōnghòu
NP东口袋胡同dōngkǒudài hútóng
NC东向dōngxiàng
NP东向dōngxiàng
NP东后河沿dōnghòuhéyán
NP东幸福街dōngxìngfújiē
NP东康dōngkāng
NP东江dōngjiāng
NP东浩dōnghào
NP东港dōnggǎng
NP东港区dōnggǎngqū
NP东港市dōnggǎngshì
NC东皇dōnghuáng
NP东皇城根南街dōnghuángchénggēnnánjiē
NP东皇城根北街dōnghuángchénggēnběijiē
NA东航dōngháng
NP东航dōngháng
NP东航dōngháng
U东行航程dōngxínghángchéng
NC东郊dōngjiāo
NP东香dōngxiāng
NP东香河园dōngxiānghéyuán
NP东高地dōnggāodì
NP东高房胡同dōnggāofáng hútóng
NP东合dōnghé
NP东合盛dōnghéchéng
NP东克尔dōngkèěr
NP东克尔曼dōngkèěrmàn
NP东国dōngguó
NP东根dōnggēn
NP东佐夫dōngzuǒfū
E东差西误dōngchāxīwù
NP东沙岛dōngshādǎo
NP东沙群岛dōngshāqúndǎo
NP东塞尔dōngsāiěr
NP东才dōngcái
NC东作dōngzuò
NP东三亲家坟dōngsānqīnjiāfén
NP东三环中路dōngsānhuánzhōnglù
NP东三环北路dōngsānhuánběilù
NP东三巷dōngsānxiàng
NC东三省dōngsānshěng
NP东三省事宜条约dōngsānshěngshìyítiáoyuē
NP东三条dōngsāntiáo
NP东三道街dōngsāndàojiē
NP东山dōngshān
NP东山dōngshān
NP东山县dōngshānxiàn
NP东山镇dōngshānzhèn
NP东山区dōngshānqū
E东山高卧dōngshāngāowò
E东山再起dōngshānzàiqǐ
E东山之志dōngshānzhīzhì
NC东山法门dōngshānfǎmén
NP东山坡一里dōngshānpōyīlǐ
NP东山坡三里dōngshānpōsānlǐ
NP东山坡二里dōngshānpōèrlǐ
NC东司dōngsī
NP东四块玉南街dōngsìkuàiyùnánjiē
NP东四块玉北街dōngsìkuàiyùběijiē
NP东四头条dōngsìtóutiáo
NP东四九条dōngsìjiǔtiáo
NP东四西大街dōngsìxīdàjiē
NP东四道街dōngsìdàojiē
NP东四道口dōngsìdàokǒu
NP东四南大街dōngsìnándàjiē
NP东四北大街dōngsìběidàjiē
NP东子dōngzǐ
NC东市dōngshì
NP东市dōngshì
NP东市场五巷dōngshìchángwǔxiàng
NP东市区dōngshìqū
E东市朝衣dōngshìcháoyī
NP东志远dōngzhìyuǎn
NC东指dōngzhǐ
E东支西吾dōngzhīxīwú
NP东斯dōngsī
NP东斯科伊dōngsīkēyī
E东施效颦dōngshīxiàopín
NP东枝dōngzhī
NP东至县dōngzhìxiàn
NP东耳dōngěr

使用分野

CLDは世界有数のIT企業で使用され、中国語形態素分析を含む多様な分野の自然言語処理アプリ開発に有用です。

単語分割と単語識別

固有表現認識

入力システム

形態素解析

情報検索

品詞付け

関連データベース

JLD

日本語語彙データベース

NLP用単言語一般語彙データベース

KLD

韓国語語彙データベース

NLP用単言語一般語彙データベース

CHD

中国語ピンインデータベース

専門用語と固有名詞を含むデータベースで、正確なピンイン表記が特徴