中国人名の方言異表記データベース

4,000万項目以上を収録​

四つの方言に対応

性別とタイプ等​

概要​

中国人名の方言異表記データベース(CDV: Chinese Name Dialectal Variants)は、中国人名異表記データベース(CNV)の簡体字版を補完するものとして、広東語・閩南語・客家語・海南語の四つの方言に対応します。各方言は、それぞれ数百万項目収録し、下位方言を明記しています。

CDVは、意味情報、頻度、性別等の多様な付加情報も提供します。

中国人名の方言異表記データベース

* タブをクリックして各方言データをご覧ください。

使用分野

CDVは、人名とその異表記を識別、処理、正規化するために使用され、次のような幅広い分野のソフトウェア開発に有用です。

機械翻訳の精度を向上

セキュリティアプリ​

データクレンジングと正規化

検索エンジンのクエリ処理等​

固有表現認識

マネーロンダリング対策

関連データベース

CEN

中英人名データベース

中日韓と西洋人名の中英データベース

CJN

中日人名データベース

中日韓と西洋人名の中日データベース

JNV

日本人名異表記データベース

日本人名とローマ字異表記