中国語(簡/繁)変換システム

中国語(簡/繁)変換システム

70万項目以上を収録

簡体字と繁体字の双方向変換

書字レベルと語彙レベルの変換に対応

概要

中国語(簡/繁)変換システム(C2C: Chinese to Chinese Conversion)の開発は1996年から始まり、簡体字から繁体字へと繁体字から簡体字への変換はほぼ完璧な変換結果を得るに至りました。書字レベルの変換は単漢字と単語を、簡体字と繁体字の双方向で変換します。「国」の簡体字訳語「国家」を繁体字「國家」へ変換するのが書字レベルの変換;「タクシー」の簡体字訳語「出租车」を繁体字「計程車」へ変換するのが語彙レベルの変換と言います。繁体字から簡体字への変換も可能です。

C2Cは研究開発に多くの費用と労力をかけ完成させたもので、特に次の研究開発に力を入れました。

簡繁変換の技術的言語学的課題についての考察

中国語の単語分割技術に関する研究

包括的な簡体字・繁体字変換表の構築

変換表は高精度な変換を実現するために必要な、ピンイン、文法情報、品詞、タイプ等の多様な情報を提供します。

特徴

各見出し語は以下のような特徴を含みます。

書字レベルの変換

簡体字と繁体字の双方向

意味情報

書字レベルと語彙レベルの変換コード

語彙レベルの変換

簡体字と繁体字の双方向

書字レベルの変換

簡体字と繁体字の双方向

音韻情報

ピンインと注音等

文法情報

品詞等を収録

簡体字と繁体字の変換

使用分野

C2Cは次のような幅広い分野のソフトウェア開発に有用です。

繁体字への機械翻訳

英語を経由し繁体字へ機械翻訳する代わりに、簡体字から繁体字へ直接変換する等

簡体字と繁体字の双方向変換

簡体字への機械翻訳

英語を経由し簡体字へ機械翻訳する代わりに、繁体字から簡体字へ直接変換する等

関連データベース

CHD

中国語ピンインデータベース

専門用語と固有名詞を含むデータベースで、正確なピンイン表記が特徴

CEN

中英人名データベース

中日韓と西洋人名の中英データベース

CEP

中英地名データベース

中日韓と西洋地名の中英データベース