JAPANESE PHONOLOGICAL DATABASE

JPD

日本語音韻データベース

[英語 English]   


©2004-2008 The CJK Dictionary Institute, Inc.


 

基本仕様

概要

収録内容

 

日中韓辭典研究所は日中韓各語(CJK)の音声学及び音韻論の研究や音声・音韻データベースの開発に力を注いでおり、日本語音韻データベース(JPD)はその開発活動の一環である。JPDの音声表記は日本語の固有名詞や語句が実際の発話でどの様に発音されるかを示すもので、仮名表記はもとより詳細な音素表記でも表し得ない正確な情報を提供する。

JPDの開発には日本語方言学の専門家を含む経験豊富な日本語編集者が当たっており、下記を含む様々な方面での活用が期待できる:

1.      音声合成システム(テキスト音声生成、TTS

2.      外国語としての日本語の習得の手引きとなる教授法の研究

3.      日本語音声技術の研究開発全般

特徴


各見出し語に、次のような詳細情報が収録されている。

1.      音素表記、音声表記、アクセントを初めとする詳細な音韻情報

2.      品詞その他の文法情報

3.      固有名詞に於ける分類コード等の属性情報

 

編集方針

 

日本語音韻データベースは、自然言語処理を初めとする音声技術への貢献を目指し、専門知識を持つ経験豊かな編集者によって構築される音韻・音声データベースである。データにはIPA(国際音声記号)を初め、音素表記・音声表記等様々な情報が収録されている。内容の詳細については、下のデータサンプルと併せて「日本語音声技術への挑戦 をお読み戴きたい。

 

フィールド解説

1

日本語

仮名・漢字を含む日本語表記

2

品詞

品詞コードその他の文法情報

3

分類

地名・人名、更に姓・男性名・女性名等、固有名詞の性質を特定するための分類情報

4

アクセント

 

経験豊富な日本人編集者によって付与された、東京地域に於ける標準的な高低アクセント情報。名前のアクセントは地域や話者個人によって異なるため、厳密な意味での「正しいアクセント」は存在せず、一つの名前が複数の違ったアクセントで使われることもある。

数字はアクセントが置かれるモーラ(拍)を示し、次の拍から下がることを意味する。例えば [1]は、最初の拍が高く(アクセントがあり)2番めの拍からは低い頭高型を意味する。また[0]は、後続助詞も含めて下がる箇所のない平板型を意味する。(詳細については「日本語音声技術への挑戦5.高低アクセント」参照のこと)

 

5

読み

片仮名による読み

6

片仮名
音素表記

読みだけでは判断出来ない発音を示す。これによって鼻音化や無声化等の顕著な特徴は把握出来るが、更に語全体の正確な発音は音声表記情報によって明らかになる。

[‘]

直前のモーラ(拍)にアクセントが置かれる。次の拍からピッチが低くなる。

[&]

直前のガ行の音が鼻音化する、いわゆる鼻濁音。アオカゲは[aokage]ではなく[aokaŋe]となる。

[^]

直前の母音が無声化する。主に無声化子音に挟まれたイ段またはウ段の音で発生する。アイノスケのスは[sɯ]ではなく[sɯ̥]となる。

[~]

直前の母音が長音。読みが「イノウエ」の場合、音素表記が「イノウエ」なら /inoue/ [inoɯe]、音素表記が「イノウ~エ」なら/inooe/ [inoːe]となる。

7

音素表記

ローマ字による音素表記。読みや片仮名音素表記では分かり難い音韻情報がかなり明確に示さjpd_jれるが、音声表記で明らかになる異音変異等の詳細情報は含まない。

8

音声表記

音素表記のみでは正確で自然な日本語の発音を知るには不十分である。そのために必要なのが、このIPA国際音声記号による音声表記であり、本データベースに於ける最も重要なフィールドである。IPAは一般的に使われている従来の発音記号よりも精度が高く、異音変異を伴う実際の発音にかなり近い。(更に厳密な精密表記の付与も可能だが、内容が煩雑過ぎてあまり勧められない)

9

備考

異音変異等の情報

10

ランク

日本語コーパスその他の語彙情報に基く頻度情報
(本サンプルには未掲載)

 

データ見本

以下が日本語音韻データベース(JPD)の見本である。最大の特徴は、IPA(国際音声記号)による音素表記アクセント情報であり、これによって無声化・鼻音化を含む様々な異音変異の詳細やアクセントパターンをかなり高い精度で知ることが出来る。異音変異は、母語話者にとって日常特に意識されることはないが、自然な音声合成には大きな影響を与えるものである。

 

日本語

品詞

属性

アクセント

読み

片仮名
音素表記

音素表記

音声表記

備考

NC

-

3

カガミ

カガ&ミ

kagami

kaŋami

有声軟口蓋鼻音

NC

-

3

カガミ

カガミ

kagami

kaɡami

有声軟口蓋閉鎖音

NC

-

3

カガミ

カガ&ミ

kagami

kaɣami

有声軟口蓋摩擦音

危ない

AJ

-

0

アブナイ

アブナイ

abunai

abɯnai

有声両唇破裂音

危ない

AJ

-

0

アブナイ

アブナイ

abunai

aβɯ̥nai

有声両唇摩擦音

飾り

NC

-

0

カザリ

カザリ

kazari

kazaɾi

有声歯茎硬口蓋摩擦音

ザリガニ

NC

-

0

ザリガニ

ザリガ&ニ

zarigani

dzaɾiɡaɲi

有声歯茎硬口蓋破擦音・有声硬口蓋鼻音

新聞

NC

-

0

シンブン

シンブン

siNbuN

ɕimbɯɴ

 

自分

NC

-

0

ジブン

ジブン

zibuN

dʑibɯɴ

有声歯茎硬口蓋破裂音の弱化(摩擦音化)

比較

VN

-

0

ヒカク

ヒ^カク

hikaku

hi̥kakɯ

[hi]の無声化

比較

VN

-

0

ヒカク

ヒカク

hikaku

hikakɯ

無声化母音無し

続く

V5

-

0

ツヅク

ツ^ヅク

tuzuku

tsɯ̥zɯkɯ

[tsɯ]の無声化

続く

V5

-

0

ツヅク

ツヅク

tuzuku

tsɯzɯkɯ

無声化母音無し

NC

-

2

ハジ

ハジ

hazi

haʑi

歯茎硬口蓋摩擦音

NC

-

2

ハジ

ハジ

hazi

hadʑi

歯茎硬口蓋破擦音

NC

-

0

ハチ

ハチ

hati

hatɕi

 

NC

-

2

ハチ

ハチ

hati

hatɕi

 

NC

-

1

u

ʔɯʔ

声門閉鎖音化

あっ

I

-

1

アッ

アッ

aQ

声門閉鎖音化

運動

VN

-

0

ウンドウ

ウンドウ~

uNdoo

ɯndoː

 

病院

NC

-

0

ビョウイン

ビョウ~イン

bjooiN

bʲoː

有声硬口蓋化音

美容院

NC

-

2

ビヨウイン

ビヨ'ウ~イン

bijooiN

bijoː

 

宴会

NC

-

0

エンカイ

エンカイ

eNkai

eŋkai

 

蒟蒻

NC

-

0

コンニャク

コンニャク

koNnjaku

koɲɲakɯ

歯茎鼻音、有声硬口蓋鼻音

NC

-

1

ホン

ホ'ン

hoN

hoɴ

口蓋垂鼻子音

NC

-

1

ホン

ホ'ン

hoN

hõ

前舌狭口鼻母音

本案

NC

-

1

ホンアン

ホ'ンアン

hoNaN

hoãɴ

後舌狭口鼻母音(撥音の前の母音が微鼻音化)

本意

NC

-

1

ホンイ

ホ'ンイ

hoNi

hõĩ

前舌狭口鼻母音

本会議

NC

-

3

ホンカイギ

ホンカイギ

hoNkaigi

hoŋkaiŋi

軟口蓋鼻音

本棚

NC

-

1

ホンダナ

ホ'ンダナ

hoNdana

hondana

歯茎鼻音

本箱

NC

-

1

ホンバコ

ホ'ンバコ

hoNbako

hombako