フリーのアメリカ英語用発音辞書であるCMUdict (The Carnegie Mellon University
Pronouncing Dictionary)をIPA/X-SAMPA表記に変換したものです。UTAU向けの英語音
源開発、及びUTAUで英語の歌を歌わせる際の発音記号への変換等に使われる事を想定
しています。
サンプル:
ACKNOWLEDGE æknˈɑːlɪd͡ʒ { k n A l I dZ
ACKNOWLEDGE(1) ɪknˈɑːlɪd͡ʒ I k n A l I dZ
ACKNOWLEDGEABLE æknˈɑːlɪd͡ʒəbəl { k n A l I dZ @ b @ l
ACKNOWLEDGEABLE(1) ɪknˈɑːlɪd͡ʒəbəl I k n A l I dZ @ b @ l
ACKNOWLEDGED æknˈɑːlɪd͡ʒd { k n A l I dZ d
$ egrep -i '^sing' dict.txt
SING sˈɪŋ s I N
SING'S sˈɪŋz s I N z
SINGAPORE sˈɪŋəpˌɔːɹ s I N @ p O r\
SINGAPORE'S sˈɪŋəpɔːɹz s I N @ p O r\ z
...
・X-SAMPAシーケンスで検索(完全一致)
$ egrep ' oU z$' dict.txt
EAUX(1) ˈoʊz oU z
O'S ˈoʊz oU z
...
OOOHS(1) ˈoʊz oU z
OSE ˈoʊz oU z
OWES ˈoʊz oU z
$ egrep ' k [^ ]+ t$' dict.txt
CAT kˈæt k { t
CATE kˈeɪt k eI t
CATT kˈæt k { t
CAUGHT kˈɑːt k A t
CAUGHT(1) kˈɔːt k O t
・母音→子音のbigram作成
$ for v in i .\?I e { A V O .\?U u @ @\` 3\`; do printf "%8d $v N\n" `egrep " $v N( |$)" dict.txt | wc -l`; done | sort -rn
7538 .?I N
956 { N
357 V N
274 O N
263 A N
254 e N
72 @ N
35 .?U N
20 i N
17 u N
0 @` N
0 3` N