したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

UTAU@英語部

1619:2009/07/05(日) 00:04:30 ID:9PiAbRss0
GUIアプリを使ってちまちま音素列パターンを検索するのが面倒になってきたんで、
フリーの発音辞書(CMUdict)をIPA表記のテキストに変換して上げときました。
よかったら使ってみて下さい。

 http://ux.getuploader.com/utau_a5/download/9/utau_a5_9.zip
 MD5 (cmudict-ipa-20090704.zip) = c0d57093db62b5c45517e479cfc831ea

以下添付の文書から抜粋。

■ これは何?

フリーのアメリカ英語用発音辞書であるCMUdict (The Carnegie Mellon University
Pronouncing Dictionary)をIPA/X-SAMPA表記に変換したものです。UTAU向けの英語音
源開発、及びUTAUで英語の歌を歌わせる際の発音記号への変換等に使われる事を想定
しています。

■ 想定用途

コマンドライン上での利用を想定したデータ形式となっています。各種UNIXコマン
ドをフィルタとして組み合わせる事で目的を達成します。

このデータを利用したGUIツールもできれば欲しいところですが、他の優先事項があ
るため今のところ作成する予定はありません。

1629:2009/07/05(日) 00:07:04 ID:9PiAbRss0
■ データ形式

- 1行1エントリ形式

- 各行は以下のように見出し語と発音を含んでいます。各部は必ず2つ以上のス
ペースで区切られています。タブ文字は使われません

見出し語 IPA表記の発音 X-SAMPA表記の発音

- IPA表記の発音部には強勢記号及び長音記号が含まれ、また各音素間に空白を空
けずに一語として表記しています。主に人間が見て発音を確認するためのも
のです

- X-SAMPA表記の発音部には強勢記号及び長音記号は含まれず、また、各音素は
空白で区切られています。これはUTAU向けの英語音源でustファイルの編集に
使いやすいよう原音名に1対1で対応させるためと、後述の音素列の
検索における利便性のためです

サンプル:
ACKNOWLEDGE æknˈɑːlɪd͡ʒ { k n A l I dZ
ACKNOWLEDGE(1) ɪknˈɑːlɪd͡ʒ I k n A l I dZ
ACKNOWLEDGEABLE æknˈɑːlɪd͡ʒəbəl { k n A l I dZ @ b @ l
ACKNOWLEDGEABLE(1) ɪknˈɑːlɪd͡ʒəbəl I k n A l I dZ @ b @ l
ACKNOWLEDGED æknˈɑːlɪd͡ʒd { k n A l I dZ d

1639:2009/07/05(日) 00:08:35 ID:9PiAbRss0
■ 各種利用法

上述のように、基本的にコマンドライン上での利用を想定しています。以下の各種
利用例を参考にご活用下さい。Windows環境ではCygwinを導入すれば一通り実行でき
ると思います。

・見出し語で検索(前方一致)

$ egrep -i '^sing' dict.txt
SING sˈɪŋ s I N
SING'S sˈɪŋz s I N z
SINGAPORE sˈɪŋəpˌɔːɹ s I N @ p O r\
SINGAPORE'S sˈɪŋəpɔːɹz s I N @ p O r\ z
...

・X-SAMPAシーケンスで検索(完全一致)

$ egrep ' oU z$' dict.txt
EAUX(1) ˈoʊz oU z
O'S ˈoʊz oU z
...
OOOHS(1) ˈoʊz oU z
OSE ˈoʊz oU z
OWES ˈoʊz oU z

$ egrep ' k [^ ]+ t$' dict.txt
CAT kˈæt k { t
CATE kˈeɪt k eI t
CATT kˈæt k { t
CAUGHT kˈɑːt k A t
CAUGHT(1) kˈɔːt k O t

・母音→子音のbigram作成

$ for v in i .\?I e { A V O .\?U u @ @\` 3\`; do printf "%8d $v N\n" `egrep " $v N( |$)" dict.txt | wc -l`; done | sort -rn
7538 .?I N
956 { N
357 V N
274 O N
263 A N
254 e N
72 @ N
35 .?U N
20 i N
17 u N
0 @` N
0 3` N

1649:2009/07/05(日) 00:23:15 ID:9PiAbRss0
[j]とか[w]の発音が心もとない事に気付いて>>144みたいな練習用の単語集を作ろうとしたものの、
適当な単語がなかなか見つからなくて結構大変だったんで、前からやろうと思ってたCMUdictのIPA表記変換を片付けてみました。
…収録は来週になっちゃうかも。

>>62のテキスト→IPA変換も内部でこの辞書を使ってるんだけど、バージョンが古いんで更新してからリリースしたいと思ってます。
一応今回の辞書だけでも、短い曲なら英文からUTAU向け歌詞への変換もできると思うんで、英語音源を実験してやるぜ! という方は試してみてもらえると嬉しいです。


>>159
>等ラウドネス曲線
すっかり存在を忘れてました。そんなのもありましたねー
英語の[sa]とかがどんな音の遷移をしてるのかは確かめてみないと行けないですね。

>>160
「た」の[t]部分よりも、口が開いて行く過程での母音の変化が効いてる気がします。
早く実験して確かめろという感じですがw

165魅亜:2009/07/05(日) 02:02:59 ID:syB9tuxU0
今日午後いっぱいかけて217/449files, 640/1107voices録音完了。
こんだけ録ってまだ折り返し点(他言語入れたら折り返してもいない)とかw

>>161-163
乙であります。ここでの変換(+符割り)がUTAUのさらに前段に組み込まれるとかなり英語版VOCALOIDに近づくわけですが、二重母音や複合子音をばらすかどうかの判断などを考えると難しそうですね。

>[s@] + [a]
とりあえず自分の音源(2009-06-07)でやってみたら[sa]っぽくは聞こえます。
テトでどうなるかは不明。
もともと加工して作った声だけに、生身の声とはかなり特性が違うと思ってます>テト

1669:2009/07/06(月) 02:16:25 ID:Ey/RRanA0
>>165
収録に加えて実験まで乙です。[s@]方式が使えそうなのは朗報ですね。
自分の方は結局収録延期して、練習用単語リスト作成もあんまり進んでないです。[j]が悩ましい…
とりあえず[w]のリスト貼って今日は寝ます。

1679:2009/07/06(月) 02:18:00 ID:Ey/RRanA0
■ [w]→母音 練習用単語リスト
[wˈiːk] week http://www.excite.co.jp/dictionary/english_japanese/?block=44392&offset=1388
[wˈɪt] wit http://www.excite.co.jp/dictionary/english_japanese/?block=44537&offset=1426
[wˈet] wet http://www.excite.co.jp/dictionary/english_japanese/?block=44421&offset=1644
[wˈæk] whack http://www.excite.co.jp/dictionary/english_japanese/?block=44424&offset=1062
[wˈɑːt] watt http://www.excite.co.jp/dictionary/english_japanese/?block=44361&offset=144
[wˈʌn] one http://www.excite.co.jp/dictionary/english_japanese/?block=40635&offset=1862
[wˈɔːɹd] ward http://www.excite.co.jp/dictionary/english_japanese/?block=44321&offset=1738
[wˈoʊk] woke http://www.excite.co.jp/dictionary/english_japanese/?block=44550&offset=2042
[wˈʊd] would http://www.excite.co.jp/dictionary/english_japanese/?block=44598&offset=748
[wˈuː] woo http://www.excite.co.jp/dictionary/english_japanese/?block=44559&offset=560
[wˈɝːs] worse http://www.excite.co.jp/dictionary/english_japanese/?block=44593&offset=8
[ˈedwɚd] Edward http://www.excite.co.jp/dictionary/english_japanese/?block=37285&offset=1140
[ˈaɪəwə] Iowa http://www.excite.co.jp/dictionary/english_japanese/?block=39254&offset=1480

1689:2009/07/06(月) 02:20:19 ID:Ey/RRanA0
しまったh抜くの忘れた…
まあ広告までスキップするわけじゃないからいいか?

あと最後の2つの弱母音練習用単語は、最後の音節の母音で練習するためのものです。
おやすみなさい

1699:2009/07/08(水) 23:11:57 ID:2IdVUdwE0
連投失礼。

使ってる人はいないと思いますが、>>161の辞書の発音記号の変換に問題があったんで注意して下さい。
 - ER0は一律に[ɚ]に変換したが、[əɹ]に変換すべき場合が多々ある模様。例えば around が[ɚaʊnd]になってしまう
 - 強勢記号が子音ではなく母音の直前に付いている。[əbˈʌv]ではなく[əˈbʌv]が正しい
 - 単音節でも強勢記号が入ってしまう

というわけでCEPD他で発音記号を確認しながら半母音等の発声リストを作ってみました。
あとは[N][l][m][n]の分が未完だけど、週末までに作成・練習できた分だけで一旦収録してみるかも。

今回はこのリストの単語そのものを原音として収録して、原音設定で必要部だけ切り出してみる予定です。
普段練習してる単語全体で発声した方が拠り所があって発音が安定しそうな気がしたんで、実験実験。


※merriam-webster.comの音声ファイルは再生アイコンを押して開いたウィンドウの
 "Click here to listen with your defualt audio player." のリンク先をファイルに保存

1709:2009/07/08(水) 23:12:41 ID:2IdVUdwE0
■ [j]→母音 発声用単語リスト
[jiːst] (yeast) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44640&offset=302
[jɪɹ] (year) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44637&offset=1058
[jet] (yet) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44647&offset=710
[ˈjæŋ.ki] (Yankee) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44631&offset=2004
[jaʊl] (yowl) ttp://www.merriam-webster.com/dictionary/yowl
[jɑːt] (yacht) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44629&offset=1092
[jʌŋ] (young) ttp://www.merriam-webster.com/dictionary/young
[jɔːn] (yawn) ttp://www.merriam-webster.com/dictionary/yawn
[joʊk] (yolk) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44653&offset=632
[ˈjʊɹ.əp] (Europe) ttp://www.excite.co.jp/dictionary/english_japanese/?block=37506&offset=414
[juːs] (use) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44121&offset=1568
 ※発音が2通りあるが、[s]で終わる方のファイルを使う
[jɝːn] (yearn) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44639&offset=668
[ˈlɔː.jɚ] (lawyer) ttp://www.merriam-webster.com/dictionary/lawyer
 ※発音が2通りあるが、以下のファイルの方を使う
 ttp://www.merriam-webster.com/cgi-bin/audio.pl?lawyer01.wav=lawyer
[ˈʌn.jən] (onion) ttp://www.merriam-webster.com/dictionary/onion

1719:2009/07/08(水) 23:13:21 ID:2IdVUdwE0
■ [w]→母音 発声用単語リスト
[wiːk] (week) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44392&offset=1388
[wɪt] (wit) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44537&offset=1426
[wet] (wet) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44421&offset=1644
[wæk] (whack) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44424&offset=1062
[waɪd] (wide) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44485&offset=808
[wɑːt] (watt) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44361&offset=144
[wʌn] (one) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40635&offset=1862
[wɔːɹd] (ward) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44321&offset=1738
[woʊk] (woke) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44550&offset=2042
[wʊd] (would) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44598&offset=748
[wuː] (woo) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44559&offset=560
[wɝːs] (worse) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44593&offset=8
[ˈed.wɚd] (Edward) ttp://www.excite.co.jp/dictionary/english_japanese/?block=37285&offset=1140
[ˈaɪə.wə] (Iowa) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39254&offset=1480

1729:2009/07/08(水) 23:14:08 ID:2IdVUdwE0
■ [ɹ]→母音 発声用単語リスト
[ɹiːt͡ʃ] (reach) ttp://www.excite.co.jp/dictionary/english_japanese/?block=41697&offset=488
[ɹɪt͡ʃ] (rich) ttp://www.excite.co.jp/dictionary/english_japanese/?block=41972&offset=718
[ɹed] (red) ttp://www.excite.co.jp/dictionary/english_japanese/?block=41759&offset=1498
[ɹæp] (wrap) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44603&offset=606
[ɹaɪd] (ride) ttp://www.excite.co.jp/dictionary/english_japanese/?block=41977&offset=1534
[ɹɑːd] (rod) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42034&offset=1680
[ɹʌʃ] (rush) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42133&offset=1300
[ɹɔːŋ] (wrong) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44618&offset=778
[ɹoʊp] (rope) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42063&offset=1306
[ɹʊk] (rook) ttp://www.merriam-webster.com/dictionary/rook%5B1%5D
[ɹuːt] (root) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42060&offset=468
[ɹɝː] ※音声無し [ɹɝː]を含む単語はほとんど存在しないので、自分で[ɹɝːt]とか発音して練習
[ˈteɹ.ɚ] (terror) ttp://www.merriam-webster.com/dictionary/terror
[ˈɑː.pɹə] (opera) ttp://www.merriam-webster.com/dictionary/opera%5B2%5D

1739:2009/07/08(水) 23:14:52 ID:2IdVUdwE0
■ [h]→母音 発声用単語リスト
[hiːt] (heat) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38630&offset=18
[hɪt] (hit) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38733&offset=518
[hed] (head) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38604&offset=1928
[hæt] (hat) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38580&offset=168
[haɪd] (hide) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38697&offset=984
[hɑːt] (hot) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38819&offset=1742
[hʌm] (hum) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38851&offset=16
[hɔːk] (hawk) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38597&offset=1662
[hoʊm] (home) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38765&offset=698
[hʊk] (hook) ttp://www.merriam-webster.com/dictionary/hook
[huːz] (whose) ttp://www.merriam-webster.com/dictionary/whose
[hɝːt] (hurt) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38873&offset=210
[hɚˈmet.ɪk] (hermetic) ttp://www.merriam-webster.com/dictionary/hermetic
[həˈloʊ] (hello) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38659&offset=254

1749:2009/07/08(水) 23:15:41 ID:2IdVUdwE0
■ 無音→母音 発声用単語リスト
[iːt] (eat) ttp://www.merriam-webster.com/dictionary/eat
[ɪt] (it) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39283&offset=40
[ed͡ʒ] (edge) ttp://www.excite.co.jp/dictionary/english_japanese/?block=37277&offset=1774
[æt] (at) ttp://www.excite.co.jp/dictionary/english_japanese/?block=34897&offset=980
[aɪs] (ice) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38900&offset=1578
[ɑːd] (odd) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40584&offset=304
[ʌs] (us) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44120&offset=802
[ɔːt] (ought) ttp://www.merriam-webster.com/dictionary/ought
[oʊn] (own) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40773&offset=1610
[ˈʊm.laʊt] (umlaut) ttp://www.merriam-webster.com/dictionary/umlaut
 ※発音が2通りあるが、以下のファイルの方を使う
 ttp://www.merriam-webster.com/cgi-bin/audio.pl?umlau02l=umlaut
[uːz] (ooze) ttp://www.merriam-webster.com/dictionary/ooze
[ɝːn] (earn) ttp://www.merriam-webster.com/dictionary/earn
[ɚˈbiv.ɹəs] (herbivorous) ttp://www.merriam-webster.com/dictionary/herbivorous
[əˈbʌv] (above) ttp://www.excite.co.jp/dictionary/english_japanese/?block=34420&offset=1074

1759:2009/07/10(金) 01:36:47 ID:t1acHX3Q0
またまた連投失礼。レス流しちゃって申し訳ない。

■ [l]→母音 発声用単語リスト
[liːd] (lead) ttp://www.merriam-webster.com/dictionary/lead
[lɪp] (lip) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39707&offset=1516
[let] (let) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39627&offset=1478
[læk] (lack) ttp://www.merriam-webster.com/dictionary/lack
[laɪt] (light) ttp://www.merriam-webster.com/dictionary/light
[lɑːt] (lot) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39796&offset=1956
[lʌv] (love) ttp://www.merriam-webster.com/dictionary/love
[lɔːŋ] (long) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39767&offset=948
[loʊd] (load) ttp://www.merriam-webster.com/dictionary/load
[lʊk] (look) ttp://www.merriam-webster.com/dictionary/look
[luːp] (loop) ttp://www.merriam-webster.com/dictionary/loop
[lɝːn] (learn) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39586&offset=848
[ˈdɑː.lɚ] (dollar) ttp://www.merriam-webster.com/dictionary/dollar
[viˈoʊ.lə] (viola) ttp://www.merriam-webster.com/dictionary/viola
 ※発音が3通りあるが、以下のファイルを使う
 ttp://www.merriam-webster.com/cgi-bin/audio.pl?viola002.wav=viola

1769:2009/07/10(金) 01:37:25 ID:t1acHX3Q0
■ [m]→母音 発声用単語リスト
[miːt] (meet) ttp://www.merriam-webster.com/dictionary/meet
[mɪt] (mitt) ttp://www.merriam-webster.com/dictionary/mitt
[met] (met) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40066&offset=362
[mæp] (map) ttp://www.merriam-webster.com/dictionary/map
[maɪt] (might) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40099&offset=1980
[mɑːp] (mop) ttp://www.merriam-webster.com/dictionary/mop
[mʌt͡ʃ] (much) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40282&offset=1562
[mɔːɹ] (more) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40237&offset=444
[moʊd] (mode) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40183&offset=228
[mʊɹ] (moor) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40230&offset=1374
[muːv] (move) ttp://www.merriam-webster.com/dictionary/move
[mɝːd͡ʒ] (merge) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40056&offset=84
[mɚˈkeɪ.ɾɚ] (Mercator) ttp://www.merriam-webster.com/dictionary/mercator
[məˈʃiːn] (machine) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39849&offset=1472

1779:2009/07/10(金) 01:38:05 ID:t1acHX3Q0
■ [n]→母音 発声用単語リスト
[niːd] (need) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40378&offset=1482
[nɪt] (knit) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39457&offset=2038
[net] (net) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40399&offset=588
[næp] (nap) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40338&offset=352
[naɪt] (night) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40433&offset=514
[nɑːt] (not) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40500&offset=958
[nʌn] (none) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40470&offset=1086
[nɔːr] (nor) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40481&offset=704
[noʊt] (note) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40503&offset=1136
[nʊk] (nook) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40479&offset=1818
[nuːn] (noon) ttp://www.merriam-webster.com/dictionary/noon
[nɝːv] (nerve) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40394&offset=1436
[ˈɑː.nɚ] (honor) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38783&offset=300
[nəˈvæd.ə] (Nevada) ttp://www.merriam-webster.com/dictionary/nevada
 ※発音が2通りあるが、以下のファイルの方を使う
 ttp://www.merriam-webster.com/cgi-bin/audio.pl?ggneva02.wav=Nevada

1789:2009/07/10(金) 01:39:11 ID:t1acHX3Q0
■ 母音→[ŋ], [ŋ]→母音 発声用単語リスト
母音→[ŋ]: [ɪŋ] [æŋ] [ɑŋ] [ʌŋ] [ɔŋ]
[ŋ]→母音: [ŋɪ] [ŋɚ] [ŋə]

[sɪŋ] (sing) ttp://www.merriam-webster.com/dictionary/sing
[stɹeŋkθ] (strength) ttp://www.merriam-webster.com/dictionary/strength
 ※発音が2通りあるが、以下のファイルの方を使う
 ttp://www.merriam-webster.com/cgi-bin/audio.pl?streng01.wav=strength
[sæŋ] (sang) ttp://www.merriam-webster.com/dictionary/sing
[ɡɑŋ] (gong) ttp://www.merriam-webster.com/dictionary/gong
[jʌŋ] (young) ttp://www.merriam-webster.com/dictionary/young
[sɔŋ] (song) ttp://www.merriam-webster.com/dictionary/song
[ˈsɪŋ.iŋ] (singing) ttp://www.merriam-webster.com/dictionary/sing
[ˈsɪŋ.ɚ] (singer) ttp://www.merriam-webster.com/dictionary/singer
[ˈsɪŋ.ə.bəl] (singable) ttp://www.merriam-webster.com/dictionary/sing

※[əŋ]が出現するのはconcurやcongratulateのそれぞれの別発音ぐらいなので削除した

1799:2009/07/12(日) 21:14:56 ID:4QQHx89Y0
予定より1週間遅れだけど、>>156の音を録ってみました。ついでに>>158と[b]→母音一式も。
>>156を録るのに約2時間半、追加分入れて3時間でした。
外の騒音が収まるのを待つ時間がなければもっと速く収録できると思う。

この分なら 子音→母音 の全組み合わせの収録も現実的な時間に収まりそうなんで、他の子音の分も練習用単語リストを作って試しに収録してみようと思います。
単音合成の道は「原音数が多いと収録が大変すぎる」という前提で探っていたけど、練習時間が十分にとれる場合は素直に全組み合わせを録った方が見返りが大きいかも。
単音合成の場合にはなかった「母音の音質を揃える」という課題が発生するんでそううまくいかないかもしれないけど。

単音合成方式にも音源収録のための練習時間が短くて済むというメリットがあるんで、作成・利用法はまとめてみたいとは思いますが、ひとまず後回しとします。
87さんも魅亜さんも単音合成実験へのご協力ありがとうございました。子音から母音への移行音についての知見は単音合成に限らず有用だと思うんで、今後の実験にも活用させて頂きます。

以下、今回の収録のまとめ。

>>170-178のように単語で音を録るのはかなり有効。発声目標とのずれが自分で聴いててよくわかる。
 発音があやふやになった時も練習リスト順に英会話的発声を行うと目標を取り戻せる。

・[hi:::t]のように単に母音を伸ばしただけの音を練習していたけど、このままではピッチがダラ下がりでUTAU向け原音には使えなかった。
 母音を伸ばしてる最中は定ピッチだと思っていたけど、録音してみたらぐんぐんピッチが下がっていた。早めの確認重要。

・単語丸ごとを定ピッチ発声するのに試行錯誤してみたところ、OREMOの音叉窓の音みたいな機械っぽい発声になった。考えてみれば当たり前。
 英語の発音としてはすごく不自然なんだけど、UTAUでピッチやエンベロープをいじるにはこの方がいいと思う。

・発声の楽な音から先にどんどん録った方がいい。いい声の状態でとれる音が多くなるんで。

・英語を発声してると顎の裏の筋肉が凝るんで、よくほぐす

・ぬるい真水は多めに用意した方がいい。調子に乗って練習中から飲んでると本番で足りなくなる

・収録が終わったら自分にごほうびを。メンタルヘルスも重要です。寿司ウマー

180名無しさん@wavファイル作成中:2009/07/13(月) 16:23:47 ID:tBN6/lXA0
お茶ドゾー( ・∀・)つ旦

お冷と菓子もドゾー( ・∀・)つ旦 ◎●

181魅亜:2009/07/13(月) 17:12:08 ID:Cc56kiuI0
お疲れー

合計で200音くらい? それなら原音設定もすぐできそうですね。
うちはwavファイルで1,556、エイリアス入れると1,800くらいの音数なんで
全然設定が終わりません。

単子音だけなら、GenAmの全組み合わせ録っても515なので (>>160)
「英語も歌える」を目指すなら全部録っちゃってもいいと思います。
ウォーミングアップ半日、録音半日の合計一日で録れます。(録れました)

すでに認識の通り、「母音の音質を揃える」のが重要な課題になります。
二重母音をどう処理するかがポイントだと個人的には思ってます。

私も録音中に代表単語(得意な単語)で発声チェックしながら録ったので、
単語で覚えるのは大変重要だと思います。
ただ、次の項で触れられている、「普通の単語発音に引きずられてUTAU音源的に
狙った発声ができない」などの理由から、私は録音は「音素列」でやりました。
この辺は一長一短ですね。

顎の裏が凝るの、分かりますw あと頬の筋肉も痛くなりませんか?
全般にヨーロッパ言語は日本語よりずっと口を大きく動かすんで
たくさん話してると疲れますよね。
私も[A]とか[Q]とか大変でした。
腹筋の疲れとあいまって録音終盤の強敵ですね。

自分にごほうび……はやらなかったけど、自然にガッツポーズは出ました(w

1829:2009/07/13(月) 21:12:33 ID:5Wbdz5Os0
>>180
いただきます! つ旦旦 ◎●
実はその後ケーキも食べましたw

>>181
全部で184音ですね。魅亜さんのに比べたらかわいいもんですw
今回のでだいぶ慣れたと思うんで、倍の数を録っても倍は疲れないんじゃないかと楽観してます。
練習すればかなり収録スピードが上がるのがわかったのが一番の収穫です。

頬の筋肉はあんまり疲れてないんで、たぶん舌ばっかりに意識が行って口の形がおろそかになってるんじゃないかとw
音素単体での発音もまだあやふやなところが多いですしね。
[tV]-[pV]-[pV]とかの呪文で録音できるようになるためにはまだまだ修練が必要そうです。

183魅亜:2009/07/19(日) 03:23:23 ID:fkgXPe7A0
うちの音源ÑALの原音設定(暫定レベル)がようやく9割方完了。
まだエイリアス設定がだいぶ抜けてるけど、とりあえずDaisy Bellが歌えるようになりました。

http://www.voiceblog.jp/mianaito/900670.html
(今回もmod100固定、母音結合のみのベタうち)

前回と比べて同種母音がだいぶマシにつながるようになったと思いますがどうでしょうか?
'your'とか'for'はけっこううまくつながってると思うのですが。
[kr\e]がなんかおかしくなってるのは原因不明。

1849:2009/07/20(月) 14:53:10 ID:A5e4V8HI0
>>183
乙です!

だいぶ音質が揃って聞きやすくなった感じです。[eI]と[zi]のつなぎとか。

yourとかforは改めて書き込みを見直すまで全然意識してなかったぐらいなんで、かなり自然なんではないかとw

1859:2009/07/21(火) 01:07:56 ID:42.vVV2o0
アメリカ英語発音用の単語リストを全子音分揃えました。
http://ux.getuploader.com/utau_a5/download/11/utau_a5_11.txt

[ʌ]は後舌母音扱いでいいのかとか、まだ更新の必要はあるけどひとまず現状でうp。
魅亜さんのen_US light版(>>160)を収録するにはまだ子音終わりの単語が足りない。
気音入りの音もカバーできてないけど、これは[p]+[hi]とかで近似できないかなー

186魅亜:2009/07/21(火) 10:33:48 ID:WyBr.F/U0
>>184
練習リスト整備お疲れさまです。
今読んでる環境にIPAのフォントがないので文字化けがすごいことになってますがw
(だから「後舌母音」で議論になってる音も分からない、ごめん)

(日本発の)英語音源を増やしていくためにはこうした地道な
学習プログラムが重要ですよね。

「典型的日本人が」「GenAmらしく」を目的にリストを改良するなら、
・複合子音、特に無声子音の連続(間に母音を挟まないように)
・子音終わり(同上)
があるといいと思います。どっちも母音の数は削ってもいいでしょう。
口を大きく開く[A]や[V]で練習すれば他の母音でも多分できます。

帯気音入りの音については、むしろ例に挙がってる単語は全部帯気化するような気が。
(語頭でアクセントがあるときに帯気化する)
実際の録音を考えると、逆に帯気化しない方を
どうやって録るかが課題になる気がします。

指摘の通り、単体で録らなくても[h]との合成で近似できますし、
そもそも帯気化は無意識に起こる音便の一種であって
本来の発音の一部じゃないですしw

うちの録音では/p/ /t/がどうしても/p_h/ /t_h/になるのが避けられませんでした。
普通に単語や文章、歌詞で発音すれば簡単ですが、
単体ではっきり大きな声では難しいです。

1879:2009/07/22(水) 00:32:09 ID:qynbUAB60
>>186
ごめんねごめんね。[ʌ]は[V]でした。
というか自分も前に携帯からIPAが読めなくて不便だったのを忘れてたw

[V]は以下の3つの異なる音を転記するのに慣習的に同じ記号が使われてしまっていると言うことらしいんで、
練習用単語リスト上では後舌母音のシーケンスに入れるか中舌母音に入れるかで迷ったりしたのでした。
今のところ[O]の発音を基準にした差異を意識するのがよいと感じてるんで、後舌母音扱いで[O][V]の順に練習するようにしてあります。

(1) IPA的、またはcardinal vowel的な[V]
  - 後舌母音。[O]と同じ調音位置で円唇化が解けたもの

(2) GenAmの[V]
  - IPA的[V]が中舌母音寄りになったもの
  - 完全に中舌母音扱いで[@]の強母音版([3]?)と解説されている資料も複数あり

(3) RPの[V]
  →中舌母音と全舌母音の中間。[3]と[a]の間ぐらい?

この(2)の中でも「中舌母音寄り」と「完全に中舌母音扱い」という差があるんだけど、
最終的にはサンプルを聞きながら自分の耳が納得する調音位置を各人で見つけるしかないのかなと思ってます。
自分は今(1)の発音からじりじりと(2)に近づけてみてるとこです。
なんか意見のある方はぜひ。

帯気化(っていうのか)については、文全体の強勢がきた時に発生するような長い[h]音の事だと思ってたんだけど、
今単語を発音してみたら確かにピッチが急激に下がるような通常の発音では[p][t][k]の後で自然に発生してるみたい。
でもUTAU向けの定ピッチ発音だと発生してないように聞こえる。
なんか自分が「気音」の定義を誤解してる気もするんで、今度録音して聞いてみてもらった方がいいのかな。

1889:2009/07/22(水) 02:16:46 ID:qynbUAB60
先週録った音源の設定も済んでないうちにころころ目標が変わりますが、
以下の3種類の音源について中の人向けの練習・収録マニュアルを整備したいと思ってます。

 (1) 母音のみ14音の英語歌詞お助け音源
 (2) 60音程度の単音合成用音源
 (3) 500音程度のlight版音源 (>>160をベースに合流させてもらいたいです)

この他に魅亜さんが実験中の1,103音フルセット版(>>160)がありますが、こちらについてはまだ自分の
英語に関する知識や経験が追いつかなくて効果的な練習法やマニュアルが作成できないという問題があるんで、
当面は中の人任せという事で。

以下、上記3種類の音源の用途説明。いずれもアメリカ英語用です。

 (1) は日本語の歌に混じる英語歌詞をより英語っぽく発音させたり、日本語音源で英語の歌をUTAわせてるような人を
   補助するためのものです。お手軽に録れるのが利点。

 (2) は(1)のデラックス版で、二重母音と子音単音を加えたものです。魅亜さん発案の[s@]的接続音も用意して、
   厳しいながら一応英語の歌を英語としてUTAえるはずのものです。ただし[j][w][r\]等の半母音はまともに発声できません。
   (1)よりは手間がかかりますが、これもお手軽に録れるのが利点です。

 (3) は 子音→母音 と一部の 母音→子音 の組み合わせで音を録って、かなり自然に英語をUTAえるはずのものです。
   私が現在実験中の音源は(2)に子音→母音の組み合わせをいくつか追加して200音弱としたものですが、
   音源作成コストと品質の両面から見て中途半端なので、低コストの(2)と高品質の(3)に分離集約
   させるのがいいんじゃないかと考えています。

というわけで、突然ですが魅亜さんの音源仕様とのすり合わせをさせてもらえないでしょうか?
まずは母音の収録仕様を魅亜さん版と私のもので合わせたいと考えています。

と、ここまで書いたところで時間切れなのでまた後日。おやすみなさい。

1899:2009/07/24(金) 00:06:15 ID:7eKNgWR20
母音収録仕様の検討その1。面倒な話だけどちょっとお付き合いください。

■ 米音と英音の[V]の違い

「新装版 英語音声学入門」(竹林滋・斎藤弘子)より引用。X-SAMPAは引用時に付加。
> III. 母音 5. /ʌ/
> 3.3.6.1 米音と英音とではかなり違いがあり, 米音では前寄りの [ʌ] (X-SAMPA:
> [V]) の変種で中舌母音に近い [ʌ̟] (X-SAMPA: [V_+]) である。この母音は英音で
> は19世紀ごろは標準的であったが現在ではさらに低く前よりに移行して [ä]
> (X-SAMPA: [a_"]) となっている。従って厳密には/ʌ | a/のように書き分けるべ
> きだが, 本書では単に/ʌ/で表して米音と英音両者を含めることとする。米音, 英
> 音ともに弛緩母音で唇は弛唇で, 英音の方が口の開きが大きい。

CEPDで "?V?" のパターンの単語を検索して米音と英音の違いを色々聞いてみましたが、
先入観を持って聞いてる事もあってか、英音の方が確かに[a]っぽい音に聞こえます。

というわけで、[r]と[r\]の区別の前例に倣って[V]も英音と米音で原音名を分けた方がいいように思うんですが、イギリス英語に慣れ親しんでる方々、どうでしょうか。
英語と米語両対応の音源や、一つの曲中で両方の発音を使い分けるような曲で必要になる場面があるんじゃないかと。
「そんな場面滅多にないよ」と言っているとUnicodeのCJK統合漢字の二の舞になって多言語混在環境で
使いづらいものができてしまうので、風呂敷は大きく広げておいた方がいいと思います。

入力が面倒になる点は置換ツールや個々人による[V]へのエイリアス設定で対応できると考えています。

190魅亜:2009/07/24(金) 10:31:30 ID:32i5.gYM0
そのあたりも含めて発音に合わせて音名がつけられるようにX-SAMPA表記にしたのでは。
それとも「[V]という音名はリリース音源では使わないように(V..wavは存在しなくて、音名としては[V_+]か[a_"])」という提案?
だとしたら反対。

理由はUTAU音源において、意識する必要のある名前空間はその音源の中だけだから、
つまり他の音源の音名表記との互換性は「USTを流用したときもほぼ同じ発声になる」
程度でよくて、音声学的な統一がとれている必要はないからです。
そのあたり一般テキストを扱うUnicode漢字とは事情が違います。

GenAmの音源とRPの音源とで[V] (V..wav)の発音が違って、どこに不自然/不具合があるのでしょう?
それは既存の日本語音源で「が」が[ga](濁音)だったり[Na](鼻濁音)だったりまちまちでも、両方持っている音源以外は分離表記しないのと同様では?

もちろんGenAm, RP両対応で[V_+]/[a_"]両方の音が入っている場合は識別する必要があるので分ける必要があるでしょう。
私は[a_"]の発音が分からないので([a]と区別できない)V..wav = [V_+]で入れていますが。

表記の統一を図るなら、
・同一音を表す記法の統一(/n'/ /n_j/ /J/とか)
・最低限発音できる必要がある音素([E][e]は区別はともかくどちらも発音できる必要があるか?)
の路線の方が建設的だと思います。


どうでもいいけどX-SAMPA的には[r](スペイン語とかの巻き舌r)と[r\](英語の接近音r)は表記分けとかいうレベルじゃなく全然別の音ですぜ。

1919:2009/07/24(金) 23:12:37 ID:7eKNgWR20
>>190
> それとも「[V]という音名はリリース音源では使わないように(V..wavは存在しなくて、音名としては[V_+]か[a_"])」という提案?
このつもりでしたが、考えが足りてない部分があったので取り下げます。

元々の考えは「GenAm, RP両対応で[V_+]/[a_"]両方の音が入っている場合は識別する必要がある」のでそれぞれの音名を決める必要がある。
それなら片対応の音源も音名を合わせた方がいいだろう、という短絡したものでした。

しかし、音声学的な発音の区別よりも、魅亜さんの指摘通り「ある言語内で同一と見なされる音」を相対的に区別する事の方がUTAU上では重要ですね。
なので、GenAm, RPとも[V]は原音名も[V](V..wav)がよいと思い直しました。

GenAm, RP用の[V]を両方持つ音源は何らかの名前で区別する事になりますが、これはできれば標準名を決めたいところです。今すぐ必要という訳じゃないですが。
英文テキストからustへの変換ツール等を使う場合に、英音・米音それぞれ用の[V]が存在すれば自動的に使い分けられるようにしたいので。
en_US等のロケールをエンコードして音名に付加してprefixmapで対応付け、無指定の[V]にもフォールバックするようにすれば、
絶対的な発音に縛られずに各種言語や方言の音を使い分けられてust互換性の面からもいいのかなと思いました。
ただ、USとかUKとかの大雑把な地域だけじゃなくてもっと細かく方言を指定したい場合は標準化は難しいと思いますが。

> どうでもいいけどX-SAMPA的には[r](スペイン語とかの巻き舌r)と[r\](英語の接近音r)は表記分けとかいうレベルじゃなく全然別の音ですぜ。
X-SAMPAというかIPA的に別の音ということは認識してるんですが、英語のみを対象に論ずる時には[r\]を[r]と表記する慣習が広くありますよね?
[a_"]と[V]の関係もそういうものと見なしての元発言でした。

1929:2009/07/24(金) 23:14:56 ID:7eKNgWR20
> ・同一音を表す記法の統一(/n'/ /n_j/ /J/とか)

・出現頻度が高いなら判別の容易な/J/
・他の音名との表記の統一感が重要なら/n_j/
・/n'/は誤読を招きやすそうなんで避けたい

うう…これぐらいの素人一般論しか言えなくて実に情けないです。
逆に/n'/が一番いいのかもという予感がすごくします。

> ・最低限発音できる必要がある音素([E][e]は区別はともかくどちらも発音できる必要があるか?)

中の人が発音し分けられるか、そもそも別々の原音を用意するかどうかはともかく、
音源としてはどれも[E][e]の両方を再生できるべきであるかということですよね?

GenAm用に 英文テキスト→X-SAMPA の自動変換で生成したustを使用する限りは不要、
なぜなら変換用の辞書(CMUdict)が[E]に対応してないから、というのが今のところ自分の見解なんですが、
そもそも自分が[e]だと思って聞いたり発音してる音が実際には[E]寄りだったというオチもありそうなんで、
これまた情けないことに判断がつきません。

片方しか存在しない時にフォールバックするような仕様を標準とするのは問題ないと思いますが。

1939:2009/07/25(土) 15:22:48 ID:4pqMhkTk0
ちょっとだけ/J/について調べてみました。スペイン語でよく使う音なんですね。
魅亜さんの英語音源に収録されてる/Nj/とは同じものですか?
Wikipediaで[J]のサンプルを聞いてみても自分には同じような音に聞こえちゃったんで。

下の表に載ってるような、diacritic無しの専用のIPAが割り当てられてる音はそれを、
つまり[J]はUTAU向けでも[J]と表記するのがいいんじゃないかと思いました。
http://upload.wikimedia.org/wikipedia/en/5/5e/IPA_consonants_2005.png

英語用のustで[J]が使われてるとちょっとわかりにくいかもしれないけど、
そこは音源に添付する文書でちょっと説明しておけば済む話かなと思いました。

1949:2009/07/26(日) 02:05:17 ID:LuLWbGik0
母音収録仕様の検討つづき。R音性母音関連です。
これも細かい話ですいませんがお付き合いください >魅亜さん

■ R音性記号付きの母音

魅亜さんの原音リストには[3`]と[@`]以外にもR音性記号[`]付きの母音が全母音分ありますが、
これは別途リストに入っている 母音→[r\] への移行音とは何か扱いが違うんでしょうか。
IPA的には[A`]=[Ar\]だと認識してるんで、どちらか一方でいい気がするんですが。
移行音とは別に発声の最初から最後までR音性を持った原音を用意したいということならありだと思います。

[A`]と[Ar\]
[E`]と[Er\]
[I`]と[Ir\]
...
以下の音も同様。
[O`][Q`][U`][V`][e`][i`][o`][u`][{`]


■ GenAm用の[3`]と[@`]

IPAのR音性記号にはR音への移行のタイミングを示す情報は含まれませんが、GenAmの[3`](と多分[@`]も)に限っては、
発声の最初から最後まで同じ音であるとの事(IPAの規定ではなく、GenAmの特性)なので、私の方ではそのように収録しています。

魅亜さんのLHZ_20090628_2だと[3`]と[@`]は最初からR音性の音ではあるものの、最後にR音への移行が入っています。
この最後の移行は原音調整で切っちゃう予定の部分でしょうか?
それなら同一収録仕様なんで何も問題はないんですが、違う場合は仕様を合わせたいと思います。
上の「R音性記号付きの母音」とも関連しますが、RPのR linking用の音だったりしたら区別する必要がありますね。

一応参考までに、私の方はこんな感じで収録してます。

http://ux.getuploader.com/utau_a5/download/12/utau_a5_12.wav

舌の位置は[r\]の調音点で止めたままで、そのまま母音化しただけです。
これは[b3`]用の音なんで、最後の[d]への移行は原音設定で落とします。


■ /3/のR音性

これは収録仕様ではなくてLHZ_20090628_2固有の話なんですが、/3/にR音性があるように聞こえます。
フォルマントを比較してみたところ、/@/と/@`/ではF3が落ちてR音性の有無がはっきり出てるんですが、
/3/と/3`/では両方ともF3が同じぐらいに落ちてるように見えます。
これが>>142で言っていた発音の癖? と思ったんだけど、>>142では/@/もR音性になる癖のような話だったんで、一応確認まで。

上のグラフが/@/と/@`/、下が/3/と/3`/。黒点が通常母音、オリーブ色がR音性母音の方です。

http://ux.getuploader.com/utau_a5/download/13/utau_a5_13.png

195魅亜:2009/07/27(月) 11:23:14 ID:q0G4qDxo0
すいませんオフ行ってたので反応遅れました
最新版(NAL_200907)もなんとか今週中には仮リリースしたいところです。
LHZ_20090628はすでに記憶から抜け落ちてます(w

>192-193
/n'/ /n_j/ /J/は全部同じ音と思っていいです。
言語圏の違いから/J/だけ微妙に癖が違うかもしれないけど個人差未満でしょう。

たしかVOCALOIDでのニャ行の発音記号表記は[n']だったかな?
これは表記をナ行や他の口蓋化音と近くしたいことと、できるだけ短くしたいこと
(表記が長いと短い音符で見切れてしまう)
が理由と思われます。
なのでNALでも日本語部分のは[n']を採用しています。

「か」→[ka] 「きゃ」→[k'a] なのに
「な」→[na] 「にゃ」→[Ja] だったら一貫性が崩れて分かりにくいでしょう。

一方スペイン語部分ではそういった事情がないので、全く同じ音ですが
[J]表記で収録しています。[n']でいけない理由はないですけど。

>194
[R性母音のラインナップ]
収録の欄が[3`] [@`]しかYesにしてないと思いましたが違います?
全母音に[`]をつけてあるのはリストをコピペする都合です(w
音素ごとの行数が一定の方が何かと便利なので。

[[3`] [@`]の[r\]移行]
最新のNALでもそうですが、R性に限らず「母音単独」は実は録ってません。
音素としての母音単体は全て[r\]へ移行する音の末尾を切って作っています。
母音の発声ばらつきを防ぐために集約しました。
つまりir+5C.wavから[i-] [i] [ir\]の三つの音を設定します。

[[3]のR音性]
まさに>142の癖そのものです。([@]のあとに[3]も書いてます)
意識すれば[@]のR化は結構抑えられるんですが、
[3]の方は本当にだめですね……。
[e]になるか[3`]になるか声量が出せなくなるかしてしまいます。

1969:2009/07/28(火) 20:54:13 ID:9j37HbeY0
>>195
回答どうもです。いきなり細かい話ばっか振ってすいません。1月前の音源の話をするには遅かったようでw
新しい音源を聞かせてもらってからの方が話が早そうですね。

> /J/
/n'/ = /n_j/ = /J/ = /nj/ という理解でいいですかね?
前三つは同じものと理解してたんですが、nj*.wavの扱いがわからなかったのでした。
間違って/Nj/とか書いちゃったので余計混乱させちゃったかもしれません。

> R音性母音のラインナップ
light版は[3`][@`]しかyesになってないんですが、フル版の方には全母音分のR音性版とそのwavファイルがありました。
このへんの話は新音源を聞かせてもらってからの方が良さそうですね。

> [3]のR音性
[3]も[@]もR音性になる癖と聞いてたけど、[@]と[@`]はビシッと発音が分かれてる…これは一体?
というわけで聞いちゃいました。自分は[3]の音を練習してないんで、そもそも[3]を[3]と聞き分けられるかどうかも怪しいです。

ちなみに自分は今[T]と[D]の摩擦音がうまく抜けてくれなくて難儀してますw

197魅亜:2009/07/29(水) 10:22:22 ID:UNsJSUgE0
>>196
遅かった、というより同コンセプト再録に近い200907があるので記憶が上書きされてますw
20090607のほうがかえって覚えてます。
粗設定の2nd checkも[p_h]あたりまできたので、今週中には出せるはず。

遅まきながら、実は上げていた7/4録音時のリスト
(以後の差分はファイル名生成とかのバグ修正のみのはず)
http://ux.getuploader.com/utau_a5/download/10/utau_a5_10.zip

【/J/】
少なくとも私は全部同じ発音してます。少なくとも実用上困らないしw
音声学的に厳密にどうなのかは知りません。
(同発音だとして)表記面で言えば、一単語のときはともかく音便で出てくる場合
例えば 'in your' のような場合には他のではなく[nj]を使いたいです、
気分的に。(これが英語では/'/や/_j/ではなく/j/を選んだ理由)

【R性母音のラインナップ】
あー、当時[`]を「[r\]への移行」と勘違いしてたような記憶がそこはかとなく。
新録では[3`] [@`]だけで、それも[r\]つきだけ (>>195) です。
ただし[r\]部分は切り落としてるのでファイル名は3`.wav, @`.wavです。

198魅亜:2009/07/29(水) 10:26:09 ID:UNsJSUgE0
ところで、日本語の連続音で録音をすませた萌々子さんから
英語部にチャレンジです。
それは英語版の連続音対応録音リスト。

現状の知識のまま力技でリストを作ると音数(*)と「母音の発声を揃える」の
点で非現実的かと思いましたが、何かアイデアはありませんか?

(*)先行音を母音だけに限ってもフル版ベースだと14,000音、
二重子音をがっつり省略するミディ版ベースでも7,000音クラス。
ちなみに日本語連続音でトータル1,100音クラスで
ほぼ英語用単音節フル版に相当します。

1999:2009/07/30(木) 00:56:36 ID:e/zWbnEs0
>>198
おおー。さすが萌々子さん。パワフルだ。
これはお手伝いしたい…が、最近言動にアウトプットが全然ついて行ってないので無責任な約束は自重しておきます。

実は未だに「連続音」の仕様がよくわかってないんですが、こんな理解でいいんでしょうか?

 - 3音間の遷移を行うtriphoneとして原音を用意する(実際の収録シーケンスはもっと長い)
 - diphoneと同じく、無音状態も1音として数える
 - 合成に使われるのは最初の2音間のdiphone部のみ
 - 3番目の音に何が来るかによって最初の2音の質が変わるので、そのパターンを網羅するために3-gramで扱っている

特に最後の項の理解が怪しいです。また、子音の扱いについては全くわかってないです。

この理解で合ってるとしたら、基本通常のdiphone音源として、統計的によく出現する遷移、人の耳が敏感な遷移、情感の表現に重要な
遷移等に絞って追加音を入れるのが正攻法だと思います。耳ロボPの書き込みにもありましたが、全パターンを網羅するのは大変なんで。
…といったような事はとっくに検討済みとは思ったんですが、こうやって話してると誰かがツッコミ入れてくれるかもしれないんでw

200魅亜:2009/07/30(木) 01:46:11 ID:hvJAUsWs0
>>199
今回録った日本語の「連続音」は以下のコンセプトです。
・従来のdiphoneの前側にもう一音追加してV-C-V型のtrigramにする
・前側のVは[a][i][M][e][o][N\] + 無音
・合成に使われるのはV-C遷移部からC-V遷移完了まで
・目的はV-C遷移を滑らかにすること

日本語で全パターン網羅して合計1,100音くらい、5モーラずつまとめて録っているので(「ざんざんじー」です)200ファイルあまりですが、
英語だと後半のdiphone時点でそのくらいの数があるので全パターンは無理どころか、いきなりもう増やせない状態に近いです。

なので、「必要なものを見繕う」にしても相当な厳選が必要です。
もちろんミディ版以下の音数が少ないものをベースに設計すればがっつり減りますが、それだとわざわざ連続音にする意義も薄そうで。

201魅亜:2009/07/30(木) 01:48:57 ID:hvJAUsWs0
お待たせしました。(待ってたかどうか知りませんが)
日英西3ヶ国語対応のフルセットdiphone音源、ÑALをリリースします。

http://www1.axfc.net/uploader/K/so/46177.zip&key=utau

・全1,569音、アーカイブで219MB、展開すると250MBと大きいのでご注意ください。
・音素のリストや録音のコンセプトなどは中のdoc/ディレクトリ内に同梱しています。
・原音設定は目視&単音再生くらいでしかチェックしておらず、USTでは検証していないのでタイミングが怪しいものが多々あると思われます。

202名無しさん@wavファイル作成中:2009/07/30(木) 02:29:19 ID:DpKw/96A0
>>201
RARで圧縮かけたら153MBまで縮んだよ。
解凍はほとんどのアーカイバで対応してるはずだから、サイズがでかい音源はこっちの方がいいかも。

2039:2009/07/31(金) 02:02:48 ID:us7KGPSI0
>>201
乙でした! 待ってましたよw
週末にじっくり確認させて頂きます。

>>200
なるほど。V-C-Vで3-gramという事でしたか。V-Vの例で思い切り誤読してました。
これで飴屋さんの実験とも話がつながりました。解説どうもです。

という事は、triphone合成って事ですね。こりゃ英語は大変だ。

・日本語で効果の大きかったシーケンスは? 特に子音が有声・無声か、破裂・摩擦かによる一定の傾向があるか
・V-V, V-Cの音が入った事による改善と、さらにV-C-Vによる改善はそれぞれどの程度?
・V-C-Vは合成及び発声タイミングの都合上の構成で、フォルマントの遷移自体はV-CとC-Vの単体で用が足りてる?

等の情報が揃ってくると英語用のシーケンスを考える上で参考になりそうです。
裏付けをとってない主観的な優先順位はこんな感じですかね。

・F3の変化が入るR音絡みは最優先で網羅
・次がその他の移行音?
・調音位置の遠いもの同士
・無声音より有声音
・破裂音より摩擦音

それと、[N]と[4]は主要シーケンスをV-C-Vでカバーしたい気がします。

204魅亜:2009/07/31(金) 19:15:31 ID:7Nw5sWMg0
桃音再録MLにも書いた内容ですがブレストのネタとしてこちらにも投下。
>9さん、英語音素試すならテト再録よりモモ再録に来ませんかw

萌々子さんに教わったITmediaの記事
ttp://www.itmedia.co.jp/news/articles/0902/10/news036.html
から類推するに、ルカの持つ音素数はfestvoxのdiphone
ttp://festvox.org/examples/cmu_us_kal_diphone/wav/
とほぼ同等と思われます。

OREMO最新版を駆使して音をまとめていったとして、
NALのほぼ2倍、日本語連続音の3倍くらいの量になるので、
録音は前人未到の苦行になるでしょうがまだ現実的な量ではあります。

ただしUTAUの苦手とする「破裂音(固定長の音)がらみの複合子音」を
合成で作らないといけないので、今のUTAUでは
(連続音には対応したあとでも)残念なところが残るはずです。

英語部的には
(1) UTAUの追加仕様希望をまとめて飴屋さんにおねだりする
(2) 苦手なところは合成せずに原音を追加する(絶望的な数になりそう)
(3) 苦手を克服するテクを編み出す
あたりが選択肢の気がしますが如何でしょうか。

2059:2009/07/31(金) 22:53:24 ID:us7KGPSI0
>>204
さすが敏腕PL! あぶれ人員の確保もえげ^H^H抜かりないぜ!
と冗談はさておきw
たぶんここで魅亜さん相手にボケたりツッコんだりしてる方が結果的に貢献できるんじゃないかなと。

複合子音についてはまだ勉強も発音練習もしてないんで、そもそも理想像すらわかってないです。
「破裂音絡みの複合子音」を含む単語をいくつか挙げてもらえます?

ルカの記事は多分リアルタイムで読んだと思うんだけど、今読むと注目点が全然違うwww

2069:2009/08/02(日) 02:55:07 ID:OjWak6BU0
>>201
まずは母音の原音仕様合わせのためにざっと聞いてみました。
この原音数は実に実に乙です。Amazing Graceも自然にUTAえてますね。

・[@`] (GenAm用)
 これならこちらの原音仕様と同じですね。私の音源はまだ[@`-]を分けてないですけど、
 これは合わせます。ただ、原音の始め、中、末尾の表記法はちょっと考えさせて下さい。

・[3`] (GenAm用)
 切り出し位置が間違って末尾部分の移行音になってます。[@`]と同様に中部分だけにすればこれも同じ仕様。

・[AI][AU] (GenAm, RP共用)
 確かにGenAmでは1番目の音素を/A/としている資料もあるんですが、少なくとも表記の上ではGenAm, RPの双方とも
 [aI][aU]が一般的なので、これに合わせたいです。各種発音サンプルを聞いても/A/には聞こえないし。

・子音→[a]
 上記の[aI][aU]の[AI][AU]への差し替えにより消えたと思われる。

・[oU] (GenAm用)
 入ってない? 子音→[o]はある。

・[QU] (RP用)
 入ってない?

・[aI@`][aU@`] (GenAm用)
 最近発音練習を始めたんですが、きちんと三重母音として原音を用意した方が良さそうです。
 リストに入れませんか?

・母音→[r\]
 資料によってはこの音を[I@`]等の二重母音として分類してたりするし、IPAのルール的には[I`]とも
 書けるはずですが、私も魅亜さんと同じく[Ir\]式に集約した方が移行音だということが判りやすくてよいと思います。
 ただ、気になってるのが[r\]の調音位置に移行した後にそのまま母音として伸ばして歌う場合、
 例えば[I@`:::] (ear)のような音のために[r\]を伸ばした原音にするべきか?
 [r\]を母音として扱うならやっぱり[@`]と表記した方がいいのか? という事です。
 しばらく考えてみますが、RPの事情に疎い事もあるんで、ツッコミはどんどんお願いします。

2079:2009/08/02(日) 02:57:18 ID:OjWak6BU0
練習用単語リストを地味に更新しました。
http://ux.getuploader.com/utau_a5/download/15/utau_a5_15.txt

■ 更新履歴

2009/08/02
- [s][z]の練習リストを[θ][ð]の直後に配置変更(調音位置順の修正)
- 三重母音[aɪɚ][aʊɚ]用の単語を追加
- [ŋʌ]用の単語を追加
- 以下の単語を発声しやすいものに入れ替え
[aʊtʃ] (ouch) → [aʊt] (out)
[poʊl] (pole) → [poʊk] (poke)
[pɔːl] (Paul) → [pɔːɹ] (pour)
[ɡiːk] (geek) → [ɡiːs] (geese)
[jɪɹ] (year) → [jɪn] (yin)
[ˈjæŋ.ki] (Yankee) → [jæk] (yak)

208魅亜:2009/08/02(日) 04:45:37 ID:cBWwS4AM0
>>206
オフ会の四次会会場から簡単に失礼。
チェックありがとうございます。

>ミスっぽいの
修正します。

>[AI][AU]
[a]にすると日本語やスペイン語の音素と同じになるけど、そうかな? というのが分けた理由です。

>[oU][QU]
ひと塊の二重母音であります?

>[aI@`][aU@`]
この場合変音点が二つできますが、真ん中の音の長さとタイミング設定はどうしたらいいと思いますか?

>母音→[r\]
母音扱いのは[']"(バッククォート出せないので失礼)
それ以外は移行音扱いでよいかと。

RPはr化しないのでこの問題とは無縁かと。

2099:2009/08/02(日) 19:25:18 ID:OjWak6BU0
>>208
4次会てw
モモ連続音でかなり盛り上がったんでしょうね。祝宴いいなあ。

> [AI][AU]
>>189-191で議論した[V]と同じ問題ですね。
IPAもしくはcardinal vowel的な[a]は一義ですが、実際には各言語毎に異なる音を表記するために同じ記号が使い回されています。

参考: http://ux.getuploader.com/utau_a5/download/16/utau_a5_16.jpg

なので、多言語混在音源では「日本語の[a]」「英語の[a]」等の区別を付ける必要があると思います。
「英語の[a]」を[A]と表記してしまうのも一つの手ではありますが、混乱を招くので避けたいです。
言語中立に音そのものを表記する場合は _+ とか _" なんかのdiacriticsを駆使して区別する手もありますが、
これは[V]の時に結論したようにUTAU向けには採用したくないですよね。

UTAU上のエイリアスかprefixmapで音素名の後に言語タグを付けて区別するのはどうでしょう?
こんな感じで。

 a:ja
 a:en
 a:es

"a" は デフォルトでは "a:en" 等のその音源の主言語の[a]にマッピングしておいて、
他の言語向けのustを流用する場合はその都度変更すればいいんじゃないかと考えてます。

> [oU]
この辺の音に使いたいです。
[oUn] (own) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40773&offset=1610
[hoUm] (home) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38765&offset=698

> [QU]
ちょっと勘違いしてました。RP向け標準リストには含めなくて良さそうです。
LPDの解説によると、RPそのものではなくRP(の近親)のバリエーションで使われることがある発音らしいです。
そのような発音ではcoldが[k@Uld]ではなく[kQUld]になったりするんだそうで。

> [aI@`][aU@`]
[I][U]は短時間で通過するように発声して、UTAU上での扱いは二重母音に準じることを想定しています。
RP向けは[aI@][aU@]となるようですが、以下の資料によると[aI][aU]で代替することも可能ではある感じですね。

参考: http://ux.getuploader.com/utau_a5/download/16/utau_a5_16.jpg

2109:2009/08/02(日) 19:26:57 ID:OjWak6BU0
> 母音→[r\]
ちょっとRPのR音の扱いを調べてみましたよ。
やっぱり母音→[@`]とした方がいいかも? 意見下さい。

・RPでR音が出現するのは以下の場合のみ
 - 母音の前
 - linking R / intrusive R の発生時

・linking R / intrusive R は V-[r\]-V のシーケンスを形成する

・よって、RPでは[r\]への移行に伴って無音状態へ遷移する V-[r\] の原音は使われない/使いにくい

・GenAmなら V-[r\] の原音も使い途はあるが、[r\]への移行後にそのまま母音として伸ばした V-[@`] をエンベロープで落とす方がUTAU的に扱いやすいのでは?

・RPのlinking R向けに V-[r\] のフォルマント遷移が欲しい場合も、V-[@`] を途中まで使って [r\]-V につなぐ方が扱いやすいのでは

・linking R向けの最適解はもちろん V-[r\]-V を連続音(triphone)として用意する事

211魅亜:2009/08/04(火) 01:21:28 ID:VQOSrU620
まず訂正。[oU]確かに必要ですね。というか録るつもりで抜けてますねw
てっきり[OU]で録ってたと勘違いしてました。あかんがな。

>>205
・「破裂音絡みの複合子音」
[pr\] [dw] [skr\]とかですね。
特に三重子音の場合、純粋なdiphone合成でやろうとすると
- 末尾側に固定範囲のある音
- 全く伸張しない、完全固定長の音
のどちらかが必要になってくるのでUTAU的に厳しいです。

逆に、もしここが克服できれば複合子音がばっさり省略できるので
diphone部分が半減して、V-C-V triphoneに割く余裕がかなりできてきます。

>>209
・英語aは/a/か/A/か
Wikipediaでは一貫して/A/使ってるので (X-SAMPAの項や英語学、RP, GenAmの個別ページなど)それに合わせて/A/にしてます。
(といいつつよく見ると本文中の表記で/a/もあったりしますが)
英語の文献では/a/を普通使ってるのは承知してます。

言語タグは全音につけるならともかく一部につけるのはまずいと思います。
「どの音が重複してるか」なんてユーザは気にすべきではないから。
現状単音程なので言語別フォルダ分けしてるので、当面はフルパス指定で
使い分けはできます。
複数音階のときどうするかはいずれにせよ考える必要がありますが。

・三重母音 (triphthong)
うーん、やっぱりそのやり方はテンポに依存して破綻する気がします。
あと、以下の理由からも[aI-I@`]みたいにdiphthong2つの合成で扱いたいです。
- 英語のtriphthongは後半ピッチだら下がり(=ひとつの音符で扱いにくい)
- まともに三重母音となるのはもっぱら話し言葉で、歌唱ではそんなに一体化しない
- 母音がひとつ増えると音数がまた一気に増える

・R音
>>210に同意します。[3`][@`]は単独母音扱いとして、
[r\:] = [3`:]とみなして現在V-C移行音として録っている[-r\]を
V-V移行音に変更したほうが都合がよさそうですね。

・原音調整
複合子音の先行発声は通常のC-V diphoneの「Vに変わったところ」ではなく
「二つ目の子音に変わったところ」にするのがよさげ。

212名無しさん@wavファイル作成中:2009/08/04(火) 01:35:48 ID:Xnpw2ikM0
幽霊部員の1です。


原音設定いじり&ÑALくんのファイル名の、命名ルールをチェックしにやってきたんですが…

en\k_hA.wav→en\k_hA..wav?
en\k_hE.wav→設定漏れ?それともen\k_he.wav?
en\k_hI.wav→設定漏れ?それともen\k_hi.wav?
en\k_hjA.wav→en\k_hjA..wav?
en\k_hjE.wav→設定漏れ?それともen\k_hje.wav?

といった具合で、こんがらがってきましたw
ファイル名にうつ「.」の数にルールはありますか?

213魅亜:2009/08/04(火) 01:45:31 ID:VQOSrU620
>>212
あれ? 私の手元のだと(アーカイブの中身を確認しても)
k_hjA..wav, k_hE..wav, k_hI..wav, k_hjA..wav, k_hjE..wav
と全部'.'が二つある(つまり命名規則どおり)なんですが……
'.'ひとつになっちゃってます?

214名無しさん@wavファイル作成中:2009/08/04(火) 06:55:28 ID:Xnpw2ikM0
元ファイルは二つあるということでいいんですね…。うう、聞いても違いが判別できないw
フォルダ開いてみましたが、en\k_hA.wavは見当たらなかったです。


元ファイルは'.'が一つのものと、'.'2つ二つのもので、原音設定は'.'が1つのものにつき2つあるのが設定漏れ?と書いた奴(ファイル名末尾が大文字小文字で分かれてる)です。
en\k_hE.wavほかはfrq及び原音設定が無い表示になってるので、どっちも揃っているen\k_he.wavと同じものという事で良いんでしょうか?

結構数があって気になったので、報告してみました。

2159:2009/08/04(火) 21:59:21 ID:z2.pBp3g0
1さん! 1さんがいた!

うちのÑALも問題ないんで、なんとなくファイルシステムか解凍ツールの問題のような気がします。
連続ピリオドが1つのピリオドに置き換えられちゃったりしてないですか?

>>212
細かい検討乙です。ちょっと考えをまとめてから返事しますね。

216名無しさん@wavファイル作成中:2009/08/04(火) 22:56:29 ID:Xnpw2ikM0
ええと、フォルダの中身は’.WAV’のファイルと’..WAV’のファイルになってます。
2つあっていいらしい、という事は確認できましたので、原音設定ファイルの内容について確認させていただきたく…。
似た名前が3つ並んでるのでちょっと混乱してましたw

2179:2009/08/05(水) 00:41:40 ID:aL58fcsM0
>>216
あああ、また誤読してました。引っかき回してすいませんです。

>>211
> 三重母音
では入れたい人が実験的に入れることにしましょうか。
[aI@`]も[aU@`]も前後の音とつながる母音は既存のものなんで、子音との組み合わせで音が増えたりはせずに単純に2音追加だけというつもりです。

> R音
了解です。じゃあVVとして録るということで。
表記はどうしましょうね。[A@`]の方がVVという事が解りやすいけど、後半は弱勢なのか? 強勢なのか? 強勢なら口の形も[3`]と同じように横に引っ張る?
と言われると、「強勢だけど口の形は[@`]のように緩い」のが[\r]-Vの音へのつながりもよくてUTAU原音として妥当なところの気がするんで、
[Ar\][Ir\]等の表記で中身はVVというのがいい気もします。[l]も伸ばして発音するんだし。

ちなみに、音の構成を表すVVとかVCVとかCVCとかってハイフン入れないのが慣習らしいですね。
具体的な音素名を入れたdiphoneだと k-a 等のハイフンつなぎ、triphoneになると a-k+a 等と後ろ2音を+でつないで、
k+a とだけ書くと後半部の遷移のみの部分参照になるんだとか。

この辺ちゃんとまとまった教科書が欲しいなあ。

2189:2009/08/05(水) 00:43:18 ID:aL58fcsM0
>>211
> ・英語aは/a/か/A/か
複数の問題が絡まってしまったんで、個別にまとめ直してみます。

1. 英語の/a/と/A/を同じ音に集約してしまってよいのか
2. 英語の/a/を表記するIPAとしてどの文字が適切か
3. 2.で選択したIPAが他の言語で別の音を表す場合、UTAU上でどのように扱うべきか

まず大本の1.について私と魅亜さんで見解が割れてしまってますね。
ここを摺り合わせましょうか。

私は/a/と/A/を同じ音として集約するのはまずいと思います。
そうすると以下のような単語が同じ音で始まってしまうことになります。

 - [haIt] (hight) と [hA:t] (hot)
 - [raId] (ride) と [rA:d] (rod)

自分では違う音として聴いたり発音してるつもりです。

また、以下のどのページを見ても/a/と/A/はきっちり区別されてるように見えます。
フォントの問題で/a/と/ɑ/が同じ文字に見えてしまってるって事はないですか?

http://en.wikipedia.org/wiki/X-SAMPA
http://en.wikipedia.org/wiki/General_American
http://en.wikipedia.org/wiki/Received_pronunciation
http://en.wikipedia.org/wiki/File:RP_English_monophthongs_chart.svg
http://en.wikipedia.org/wiki/File:RP_English_diphthongs_chart.svg

というか、RPのこの図は参照用に便利ですね。GenAmのもあればいいのに。

2199:2009/08/05(水) 00:46:46 ID:aL58fcsM0
×[haIt] (hight)
○[haIt] (height)

orz

220魅亜:2009/08/05(水) 02:14:48 ID:Of5UeFxg0
ああ、改めて辞書 (RHD2, LDOCE) 当たってようやく誤解に気づきました。
/a/は単独母音にはなくて、二重母音でしか出てこないんですね。
別音扱いに同意します。
でも符割りの処理を考えると/a/を仮想的な単独母音として入れないといけないでしょうね。

ふう、また音数が増えますね……。

ちなみに、私自身の素の発音はBritish訛りが入ってるんで/A/→/O/になってて
根本的に違いますが、アメリカっぽく話すときは/a/に縮退しちゃってます。
(要するに/A/が存在してないw)

>R音
表記は[-r\]のほうが元のつづりに近いのでよいと思います。
VVなのはあくまで処理の都合であって、発音としては子音なわけですし。

>つなぎの表記
後半のdiphone本体は区切らずつなぎ、先行母音との区切りはスペース、というのが
なんとなくデファクトスタンダード化しつつあるみたいですね。

まあOREMOでの操作性が下がった以外は特に不満もないので従ってもいいと思います。
OREMOで再生にスペースが使えなくなったのはかなり痛いですが。
(原音調声時、左手をホームポジション固定でやれなくなる)

221魅亜:2009/08/06(木) 00:48:47 ID:hKi5Fwcw0
来週萌々子さん&小山乃さんがスタジオ録音するついでに
英語音素のお試し版も録りたいということで、一番軽い録音リストの整備が
急務となりました。

>>188の(1)相当でよいはずですが、単語で録れば同程度の数で
(2)に近いものが作れるのではないかと踏んでいます。
(beat [bi:t]を録れば[b] [bi] [i] [t]が揃う、みたいな感じで)

私のほうは仕事倍増でほとんど身動き取れないので、
どなたかリスト作成を手伝っていただけませんか?

2229:2009/08/06(木) 13:13:52 ID:xhEtx.9kO
おお、いい流れですねー
今回はお二人とも日本語収録がメインだと思うんで、もし当日時間に余裕があったらのお試しでできるようにリスト用意してみましょうか。

あまり(2)に近づける事ばかり考えると肝心の母音の質が下がってしまうんでほどほどに。

一応誤解の無いように言っておきますが、英語音源へ挑戦される全ての方に対して、自分にできそうな事はできるだけお手伝いしたいと思ってます。できるかどうかわからない事は安易に引き受けられませんが。

223魅亜:2009/08/06(木) 15:25:17 ID:hKi5Fwcw0
強引に(連続音録音用の)5モーラ区切りで録音できるように
5 syllable x 20に詰め込んでみた。発音できるかはシラネw

i I e E {
A V O o U
a u @ @` 3`
a U a I @
I e I e @
o I o U @
p_hi pI pr\e bE br\{ p
t_hA tV tr\O doU dr\o t
k_hi kI kr\e gE gr\{ k
i f@ f3` v@ v3`f
A TV DO r\oU bloT
e s@ S3` z@ Z3` s
dZi tSI tse dzE h{
u maU maI noU noI
I jeI weI lu@ NoU
O dr\u pI@ fe@ gwe b
U klU toI poI r\@` d
{ kwA swV fr\a dw@` g
V Tr\O flo blu k3` v
o gl e twi pl@ Ti N

一応[j]がらみの複合子音以外は全部のmonophoneが入ってるはず。
最初6個で単独母音、二重母音は揃う。

たたき台になるかな?

224耳ロボP:2009/08/06(木) 17:25:38 ID:Q6nCXF1E0
こんにちは。ちょっと立ち寄ったので。

>>220
確かにControl-pで再生だと左手だけでは再生しづらいですね。
解決案を書いておきます。
--------
setParamのあるフォルダに、setParam-init.tcl というファイル名の
テキストファイルを作って次の2行を入力。

bind Table <Shift-space> togglePlay
bind Table <Control-space> playFromStoE
--------

これで、Shift+スペースでwav全体再生、Control-スペースで左右ブランク間再生になります。
もしかしたら次の更新で取り込むかもしれません。

エイリアスについては、
「-」で入力しておいて後で一括して空白に書き換えるようにすることもできます。
必要なら作ります。

225名無しさん@wavファイル作成中:2009/08/06(木) 19:13:45 ID:wCsRkCT60
>来週萌々子さん&小山乃さんがスタジオ録音するついでに
>英語音素のお試し版も録りたいということで、

聞いてない(ぼそっ)。
萌々子さんは好きにしたらいいけど、もうお一方の情報を出すのは不用意すぎでわ。

226魅亜:2009/08/06(木) 19:23:18 ID:hKi5Fwcw0
ああ悪かったね、英語音素録りたいって言ってるのは萌々子さんの方で
小山乃さんの方は今回とりあえず関係ない。
誤解させてすまん。

あと、二人が一緒にスタジオ入りするのはテトスレで
議事として書かれたので公知だと判断した。

227魅亜:2009/08/06(木) 19:46:47 ID:hKi5Fwcw0
>>224
解決方法ありがとうございます。連続で音源設定していくときには左手だけで再生できるかどうかは重要だと思うので助かります。

>225の件といいちょっとケアレスミスが頻発してるのでしばらくおとなしくしてます。

228名無しさん@wavファイル作成中:2009/08/06(木) 22:13:27 ID:5tzKiV3A0
>>225
テトはわしが育てた

とでも言いたい?

229名無しさん@wavファイル作成中:2009/08/06(木) 22:46:14 ID:AlQ0EKgg0
今有志が集まって話し合って進めていることなんだが
>>228は何がいいたいの?

230名無しさん@wavファイル作成中:2009/08/06(木) 23:31:36 ID:5tzKiV3A0
小山乃さんの「英語音素を録りたい」って発言を>>225が「聞いてない」として、それを>>225が問題視する理由が分からない
小山乃さんの発言はテトスレだか>>225だかが全部管理しないといけないの?

結果として>>226の勘違いみたいだしなんでもいいが

231名無しさん@wavファイル作成中:2009/08/07(金) 00:01:27 ID:FN9XwmFg0
テトの音源方面に関する話はテトSNSあたりで動いてるので、こことも魅亜氏とも直接関わりは無いように思うけど。


>>223 先生、横からアレですがその発音のサンプルがあったらちょっと聞きに行きたいです!
さくっとチェック&日本人が(発音のコツなど付帯で)練習できる、オススメなところはありませんか?

今手元に&Ntilde;ALさんはいるんですが&hellip;彼に聞いたほうが良いんでしょうか?w

232名無しさん@wavファイル作成中:2009/08/07(金) 00:16:27 ID:vBJxH2VI0
http://lang-8.com/
日本語勉強してる人を見つけて
日本語を教えるのと交換に読み上げてもらうのがいいと思います

2339:2009/08/07(金) 00:25:41 ID:76YIOTTY0
>>224
こんばんは。OREMOの機能拡張の際はお世話になりました。

>>223
ちょっと発声してみたけど、これはきついw
まずスムーズにX-SAMPAの呪文を読み取りつつ発声に持って行くまでの脳の負荷が高すぎる。
IPAならだいぶ楽になるとは思うけど、素直にCVCの単語を100回発声する方が自分には楽でした。
あと[OI]が[oI]になってますよ。

というわけで、自分の穏健版の叩き台も出してみます。

・あくまで「ついで」「お試し」で録れるように、母音14音分の14単語のみ
・母音の質を優先し、先頭の子音は基本的に[h]で統一。各母音用の気音素材としても有用かと
・母音と離れていて切り出しやすい破裂音・破擦音を最後の子音に埋め込み。ただし入れられたのは以下の8種のみ
 [p] [t] [tS] [k]
 [b] [d] [dZ] [z]
・もう少し収録単語を増やしていいなら単音音源用の音素が揃うかな? thiefで[T]と[f]とか。

[hi:t] (heat) ttp://www.merriam-webster.com/dictionary/heat%5B1%5D
[hIt] (hit) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38733&offset=518
[hedZ] (hedge) ttp://www.merriam-webster.com/dictionary/hedge%5B1%5D
[h{tS] (hatch) ttp://www.merriam-webster.com/dictionary/hatch%5B1%5D
[haId] (hide) ttp://www.merriam-webster.com/dictionary/hide

[hu:z] (whose) ttp://www.merriam-webster.com/dictionary/whose%5B1%5D
[hUk] (hook) ttp://www.merriam-webster.com/dictionary/hook%5B1%5D
[hoUp] (hope) ttp://www.merriam-webster.com/dictionary/hope%5B1%5D
[hO:k] (hawk) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38597&offset=1662
[hVb] (hub) ttp://www.merriam-webster.com/dictionary/hub
[hA:t] (hot) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38819&offset=1742

[h3`:t] (hurt) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38873&offset=210
[p@`"mIt] (permit(v)) ttp://www.excite.co.jp/dictionary/english_japanese/?block=41001&offset=934
[h@"loU] (hello) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38659&offset=254

2349:2009/08/07(金) 00:40:43 ID:76YIOTTY0
>>231
自分もおすすめできる発音練習ガイドを探してるんですが、一長一短でなかなか決定版が見つかりません。
ひとまず>>128のサイトで各音の発声方法が動画付きで学べます。ただ、日本人向けの注意点等がないので別の資料と合わせる必要がありそうです。

とりあえず自分が学んだ中で有用だったコツを。

・[3`][@`]以外の母音では、舌先を下の歯の裏につけたまま発声する

これだけでだいぶ英語っぽい響きになります。
ソースは "SINGING and Communicating in ENGLISH" という、音声学に基づいた教科書です。

2359:2009/08/07(金) 01:17:44 ID:76YIOTTY0
>>220
[a]と[o]はVCには出てこないのがせめてもの救い。それでも多いけどw

あとは多言語混在音源での[a]の使い分けですけど、

1. 基本的に、ust中ではどの言語向けの曲でも[a]は何も修飾のない[a]として扱いたい
2. 一曲の中で複数の[a]を使い分けたい場合(多言語曲)は修飾情報を追加指定する

の2点については、魅亜さんも私も同じものを求めていると認識してます。
言語タグ案も、ユーザレベルでは単なる[a]として扱えるのが前提でした。
パス指定で言語情報を付加できるなら個別の原音にはタグは不要ですが。

ただ、明示的に言語を指定しての使い分けはパス指定でできるとしても、
デフォルトの[a]がどの言語の[a]になるかは何らかの方法で設定する必要がありますね。
これもprefixmapとかでできるんでしたっけ。
今ちょっと環境の問題でUTAUの音が出ないんで確認できてないです。すいません。

236魅亜:2009/08/07(金) 18:11:57 ID:bsPtowPI0
>>233
うん、自分でも>>233は詠めないなと思ったw NALなら詠んでくれるかもw

ただ最初の2つは前舌と後舌の母音を順番になめていく流れなので、
よく似た母音の間の相対的な関係をつかむのにはいいかと思って作った。
というか、私はこれがないと[e][E] [A][V] [Q][O]が作れないw

単語リストも乙。ナンセンスワードにこだわる私との対照が>9さんらしい。
(といいつつ>>233にも[blu: k3`v]なんて思いっきり単語になってるのがあるけど)
>>179 >>181にあるように単語の自然な発音に引きずられないようにするのが
ポイントですね。

#絶対短母音は短く詠みそうだし'whose'はピッチ下げそうだ。

>>234
というか、R性の二つ[@`][3`]以外は「舌は下顎に張りつける」感じですよね。
まあ「息を妨害しない」のが母音だから当然ではあるんですが。(日本語もそうだし)

>>235
言語別に複数のprefix.mapを用意しておいて、必要に応じてそれらを切り替えることを
意図してる? その方法ならトップ階層で言語別にフォルダ分けてあればいけそう。
[bank_root]\[lang]\[note]\*.wav
(NALの「あ」(a.wav)なら NAL\ja\C3\a.wav)
という階層構成なら複数音階もいけますね。
非デフォルトの言語から音を借りてこようと思うとすごい長さになりそうですがw

2379:2009/08/09(日) 02:32:23 ID:9TDEfdn60
未検証だけど >>233 に14単語追加収録で単音音源の音素をカバーできるようにしてみました。

・摩擦音は語頭と語末の両方への出現パターンを入れた。サンプルが少ないので研究のため
・破裂音・破擦音は語末のみ
・口が閉じた状態から[e][a][O]へのフォルマントの遷移を流用するため、[s][S]からの組み合わせを入れた(冗長気味)
・移行音は[V]への遷移中心。[@]の代替として別の母音につなげやすくするため

[fO:g] (fog) ttp://www.merriam-webster.com/dictionary/fog
[vOIs] (voice) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44263&offset=1232
[TIN] (thing) ttp://www.excite.co.jp/dictionary/english_japanese/?block=43585&offset=1530
[Der\] (there) ttp://www.excite.co.jp/dictionary/english_japanese/?block=43571&offset=170
[saUT] (south) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42889&offset=994
[sOIl] (soil) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42838&offset=588
[zu:m] (zoom) ttp://www.merriam-webster.com/dictionary/zoom
[lVv] (love) ttp://www.excite.co.jp/dictionary/english_japanese/?block=39802&offset=1172
[nVn] (none) ttp://www.excite.co.jp/dictionary/english_japanese/?block=40470&offset=1086
[SeIv] (shave) ttp://www.merriam-webster.com/dictionary/shave
[r\u:Z] (rouge) ttp://www.merriam-webster.com/dictionary/rouge
[r\Vf] (rough) ttp://www.excite.co.jp/dictionary/english_japanese/?block=42075&offset=1776
[jVN] (young) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44657&offset=136
[wA:S] (wash) ttp://www.excite.co.jp/dictionary/english_japanese/?block=44334&offset=18

2389:2009/08/09(日) 02:34:04 ID:9TDEfdn60
>>234
環境が直ったんで[a]の使い分けについて確認してみましたよ。

・直接wavファイルを指定すると、複数音を含むバンドルの一部を切り出して鳴らすタイプの原音が指定できない
・例えば ja\ja-02-vowel を指定しても、複数ある原音設定のうち、最初のエントリである i- の設定でしか鳴らせない
・prefix.mapはある音程の原音に対して一律にprefix, suffixを付加する方式なので、特定の音だけに言語情報を付加することはできない

結局、テト統合版のAct1・2切り替えのように、各言語用に用意されたoto.iniに差し替える方法しか思いつきませんでした。

oto-ja.ini
 a    → ja\a.wav
 a:ja  → ja\a.wav
 a:en  → en\a.wav

oto-en.ini
 a    → en\a.wav
 a:ja  → ja\a.wav
 a:en  → en\a.wav

239魅亜:2009/08/10(月) 11:09:43 ID:NX/rbTd60
もしかして1さん@>212の指摘はoto.ini中に対応wavファイルのない
k_hA.wavとかのエントリが入ってることを指していたのかしら?
NALの原音調整を手直ししてて気づきました。
たぶんsetParamのバグです。最後が*..wavになるパターン
(X-SAMPA音名で最後が大文字)でピリオドが全部むしられたエントリを
自動追加しちゃいますね。時間がとれたところで耳ロボPに報告します。

>>238
結局そうなっちゃいますかね。将来音階も分かれることを想定すると
差し替えるファイルが多くてスマートじゃないですが……。


NALのフォルマント遷移を眺めたりUTAUやAudacityで合成実験したりした結果、
・複合子音は接近音[j][w]がらみも含めてそこそこ合成可能
・ただし毎回合成するのはUTAU UI的にかなり手間が増えて面倒
という感触を持った。
VCVをにらむと複合子音の分解は必須といっていいので、UTAU本体の進化あるいは
録音後の音源後処理で対応して、複合子音はばらす方向で検討中。

あと発音について、英語では[3] = [@]という認識でいいのかなあ?
(GenAmは[@][@`][3`]、RPは[@][3:]のラインナップ)
IPA的には[@][3]は別音扱いだけど、発音方法見ても識別できんw

2409:2009/08/10(月) 21:08:51 ID:GYCK09Lw0
>>233,237の音を一通り収録してみました。
http://ux.getuploader.com/utau_a5/download/18/utau_a5_18.7z

録っただけでまだUTAU音源にはなってないですけど、試しに収録してみようという場合は参考にしてみて下さい。
UTAU原音向けの発声がどういうものかわかるよう、通常の英会話的発声も収録しています。
また、中の人向けに収録上の注意点などの簡単な説明も添付してあります。

>>239
>[3]と[@]
あとでちょっと調べてみますね。俺の英語シェルフが火を噴くぜ!
GenAmでも[3`]と[@`]を別々に録るか悩んだんですけど、こっちは唇の形と口の開き具合が違うと言うことで分けました。
ピッチとパワーの違いはUTAU向け原音にした時点で無くなっちゃうから、弱母音の扱いは難しいですね。
あ、これが強音源ならぬ弱音源て事か。

241魅亜:2009/08/11(火) 11:11:20 ID:2l/ePy3A0
単語収録GJ。定ピッチ発声は聞いててむずむずするなw
あと、ここから単音素を切り出すのは地味に大変そうだ。

>[@]と[3]
R性にした[@`]と[3`]ははっきり別の音(唇の緊張が顕著に違う)なんだけど
舌の位置を戻したら絶対区別できない音にw
音の差が出るまで舌や唇を調整したら今度は[e][E]になるし。 (>>142,>>194-195)
そもそもRP的には[@]=短母音、[3:]=長母音の使い分けっぽい?

>強弱
強弱が違えば声質も違うんだけど、まだ英語音源はそこを議論できる段階じゃ
ないと思ってる。最終的にエンドユーザが(UTAUなりDAWなりで)velocityいじって
強勢をつける作業は必須だし、現状の音源クオリティじゃ他の部分のあらが
先に目立つから作業の面倒くささが増えるだけだと思うw

242魅亜:2009/08/12(水) 00:17:59 ID:QehNOTq60
複合子音を分解できるかの実験。
[gjA]を[gA] + [jA]で合成してみた。UTAU 0.2.45b3 + クロスフェード最適化。
http://ux.getuploader.com/utau_a5/download/21/utau_a5_21.wav
スペクトルで見たら継ぎ目ははっきり分かるけど[j]の特徴的なパターンはあるのでごまかせないかと期待したいがどうでしょ?
http://ux.getuploader.com/utau_a5/download/20/utau_a5_20.png

あと、そういえばまだやっていなかったfestivalの付属音源KALによる
Daisy Bell。原音設定はfestivalのものを変換して移植。
変換の都合上連続音対応のresampler 8.52必須。
元がTTS、つまりHANASU用なこともあって正しくピッチ検出できてないと見えて激しく音痴ww
http://ux.getuploader.com/utau_a5/download/19/utau_a5_19.zip

現行のUTAUでもVC音素列がけっこうまともに聞こえるのが意外。
ただやっぱりCC音素列がかなり苦しい。(音符内でも接合部でも)
末尾側固定範囲や固定長の音符がほしいね。
それにしてもV-V接合の自然さは異常。

2439:2009/08/12(水) 00:19:32 ID:/038SiZQ0
>>241
弱音源を作ろう! とか 作れた! と言ってるわけじゃなくてw
弱母音は必然的に弱音源と同質で、同じ課題を解決する事になるんだなーと気づいただけで。
ピッチやパワーはどういう仕様で収録するの? とか、他の音との音質合わせとか。

[@]と[3:]の違いは長短の他には強弱(stressed/unstressed)しか言及されてない文献がほとんど。
だからどうしても「強弱とは何か」について答えを出さないといけない。
強弱とはピッチとパワーの違いである、とすると単に[3:]を調声して使えばよい事になるので、それも一つの答えとしてはありだと思う。

色々調べてみたけど、火を噴いた英語シェルフからかろうじて見つかった具体的な記述は以下だけ。
他の文献は国内・海外ともみんなさらっと「強弱」で済ませてる。

ファンダメンタル音声学 第1章 母音の発音 より:
> もっと重要な違いは、[@], [@`]では唇が丸められも横に貼られてもいないのに対し、
> [3:], [3`:]では唇が――[i]の場合度同様――横に貼られているという点である。

この著者は英国で音声学を学んでいるんで、実体験に基づいた記述だと思います。
これが「強弱」の具体的な現れの一つと言うことでしょう。

以下のビデオを見ると、確かに[3:]の時は唇を張ってるように見える。

[@] ttp://www.bbc.co.uk/worldservice/learningenglish/grammar/pron/sounds/vowel_short_5.shtml
[3:] ttp://www.bbc.co.uk/worldservice/learningenglish/grammar/pron/sounds/vowel_long_5.shtml

[@]の発音は口の開きに関しては幅があるそうなんで、この人の「緩めた」発声がこの開きと言うことなんでしょう。
それと、どうもRPの[@]はGenAmのだるそうな[@]よりはっきり発声される傾向があるような。
CEPDとLPDでいろいろ聞いてみて感じました。

上のビデオを見た限りでは確かに唇を張った響きの差があるように思えるんで、
少なくとも規格上は[@]と[3]を分けた方がいいと思います。

2449:2009/08/19(水) 00:53:56 ID:/VP6CNa20
ひさびさに現状報告など。

英語音源向けプラグインを作り始めました。
最終的には色々と必要になるけど、まずは「先頭接合」「末尾接合」の2つから。

こんな風に動く予定:

 [g  ][r\  ][e  ][eI  ][s  ]

           ↓ [g][r\][e]を選択して「先頭接合」

 [g][r\][e      ][eI  ][s  ]

           ↓ [e][eI][s]を選択して「末尾接合」

 [g][r\][e          ][eI][s]

やってる事は固定端側のノート長を原音の発声長ぴったりに合わせて隣接させ、余りを開放端側のノートに加算してるだけです。
クロスフェード的処理はこのプラグイン単体では一切無し、だから結合じゃなくて接合。
ただし、以下のように先行発声やオーバーラップでの浸食分も計算に入ってるんで、そこでの重ね合わせは発生します。

 固定端側ノート長 = 原音発声長 - 次のノートのオーバーラップ + 次のノートの先行発声

いまのとこ単体のプログラムとしては意図した通り動作してるように見えるけど、
Windows上でのexe化やUTAUプラグインとしての動作確認はこれからなんで、もうちょいかかります。
それと原音長を取得するために右ブランクの設定値が左ブランクからの相対値(連続音のoto.iniで使ってるやつ)になってる事が必要なんで、
setParamをいじってoto.iniのフォーマット変換ができないか試してみるつもりです。

>>242
というわけでこのプラグインを発展させて子音結合を扱えないかなーと思ってます。
追加した方が良さそうな仕様とかあります? oto.iniには無いパラメータを各原音に追加したいとか。
>>242の実験結果の確認はすいませんがまた後日。
結構まじめに時間かけて考察しちゃう方なんで、プラグイン開発に一区切りつけてからにさせて下さい。

中の人向けの資料作成や発音ガイド探しも大事だけど、ひとまず>>240でお茶を濁しておきます。
音源作っても、簡単にUTAわせられる環境がないと意味ないしね。

245魅亜:2009/08/19(水) 11:39:11 ID:MQSdVaR.0
>>244
おお、なかなかにGJです。疑似的にVCやCC(固定長)音素列を扱えるようにするのですね。
私はunixスクリプト屋でUTAUのプラグインは作れないのでうらやましいです。
ちなみに最初携帯から見たらスペースが縮退してて意味不明でしたw

ところでノート長の計算、符号が逆 (note = note_orig - pre + ovl) では?

気になるところ
・「発声長」=「固定範囲長」? それとも左ブランク〜右ブランク間の全体?
前者が適切だと思うけど確認。
ただ、この場合でも二重母音の固定範囲設定が悩ましいね。
後ろが母音の場合と子音の場合で設定を分けないといけなくなるかな?

>>244の処理では[eI]の固定範囲は[I]に変わった瞬間に設定すべきだが、
それだと母音結合する音(接近音、鼻音、母音)との相性が良くない。

・「CV diphone2つをずらして重ねる」は対応可能?
こんなの。
[ge] + [r\e] -> [gr\e] ([ge]の[e]部分はエンベロープで0に落とす)

背景は>>242の実験で、母音部分を揃えたdiphoneを重ねた方が
子音単体をつけたよりも自然だったこと。(たぶん口の形が揃うのが理由だと思う)

[ge]に対して
ノート長=固定範囲 or 先行発声
エンベロープ:先行発声まで100、そこから0に落とす
と処理すればできると推測。エンベロープを落とす傾きと、
[r\e]の先行発声/オーバーラップの処理がちょっと面倒だけど。


こちらの方ではNALに追録/再録を行って一応の完成形にしました。

全体一式:
ttp://www1.axfc.net/uploader/K/so/47346.zip&key=utau
rev. 2009-07-15 to rev. 2009-08-12差分
ttp://www1.axfc.net/uploader/Sc/so/26648.zip&key=utau
rev. 2009-08-12 to rev. 2009-08-15差分
ttp://www1.axfc.net/uploader/Li/so/42252.zip&key=utau

2469:2009/08/20(木) 01:24:08 ID:fkXu7E9s0
>>245
ああー
ダミー母音付きの原音の事忘れてた。突っ込みありがとうございます。
「発声長」 = 左ブランク〜右ブランク のつもりだったけど、ちょっと再検討します。

>>244の式も間違ってました。本当はこう。

 固定端側ノート長 = 原音発声長 - 原音先行発声 - 次のノートのオーバーラップ + 次のノートの先行発声

「原音発声長」の全体を鳴らすため、次のノートの先行発声がはみ出してきたらその分前に逃げてダミーのしっぽを削らせるようにしてます。

>「CV diphone2つをずらして重ねる」
エンベロープが固定パターンでいいなら多分作れます。
原音毎に異なったエンベロープを使いたいとなると、どっかに設定を保存できる仕組みが必要ですね。

どうもUTAUの固定範囲の仕様を勘違いしてるような気がするんで、後日ちょっと確認してみます。
今週末は用事で作業ができないんで来週になっちゃうかもですが。

音源更新も乙でした。
プラグインが動くようになったらありがたく実験台に使わせて頂きます。

ちなみに今回のプラグインはSchemeで書いてLinux上で開発してるんで、UNIX系スクリプトと言えなくもないw
Windowsをまじめにサポートしてるスクリプト言語は大体exe化の仕組みがあるみたいですね。
耳ロボPのところでもPerlのexe化の話題が出ていたし。

2479:2009/09/27(日) 20:04:13 ID:MBwO0O5k0
すっかり遅くなってしまったけど、先頭接合と末尾接合のプラグインを置いときます。
http://ux.getuploader.com/utau_a5/download/23/utau_a5_23.7z

実験にはNALを活用させてもらいました。正式デビューおめでとうございます。

子音結合に使うにはもうちょっとなんとかしないとなんともならない。

248名無しさん@frqファイル作成中:2009/09/27(日) 21:19:52 ID:8lzZxpn60
>>247
Failure: cannot load DLL
c:\Program Files\PLT\lib\libmzsch3m_6nc9yg.dll

というエラーが出て動きませんでした。

2499:2009/09/29(火) 02:17:31 ID:ZZi2vVhQ0
>>248
報告ありがとうございます。
exe化の手順がまずくて必要なdll等が同梱されていなかったので、修正版をリリースしました。

http://ux.getuploader.com/utau_a5/download/24/utau_a5_24.7z

250名無しさん@frqファイル作成中:2009/10/03(土) 16:34:30 ID:uqFxDwk.0
>>249さん 初めまして。このスレではずっとROMしていた者です。
早速ですが使わせて頂いてみました。英語調声初めてで失礼します。こんな風になりました。
http://www1.axfc.net/uploader/Sc/so/41811.mp3
地ク音を使いました。少し聞き取りにくくてすみません。
「とりあえずテストだからそれっぽく作るか」だったので、発音は適当です。

便利ですね。子音の接合はもとより、二重母音(と、いうのかな)を作ったりするのにもいいです。
一つ質問です。このプラグインで結合した際、たまに少し後の音がズレるのは仕様ですか?
できれば選択した範囲でのみ処理してほしいなあと思いました。

251名無しさん@frqファイル作成中:2009/10/03(土) 16:38:50 ID:uqFxDwk.0
>>249さん 初めまして。このスレではずっとROMしていた者です。
早速ですがプラグインを使わせて頂いてみました。英語調声初めてで失礼します。こんな風になりました。
http://www1.axfc.net/uploader/Sc/so/41811.mp3
地ク音を使いました。少し聞き取りにくくてすみません。
「とりあえずテストだからそれっぽく作るか」だったので、発音は適当です。

便利ですね。子音の接合はもとより、二重母音(と、いうのかな)を作ったりするのにもいいです。
一つ質問です。このプラグインで結合した際、たまに少し後の音がズレるのは仕様ですか?
できれば選択した範囲でのみ処理してほしいなあと思いました。期待しています。

(一応、歌詞)
It's a joke,it's a joke,it's all lies What I told were all,but fibs
It's a joke,it's a joke,it's all lies You are an idiot!Hey it's a joke.
Elvis is alive! It's a joke.MJ is alive! It's a joke.
T.Rex is back,Blues Brothers is back,Beatles is... It's a joke.
原曲は「重音テトの嘘八百」です。

252250:2009/10/03(土) 18:27:10 ID:uqFxDwk.0
あれ、うわ、今見たら二十書き込みになっている。無駄遣いしてすみません。

2539:2009/10/04(日) 16:14:21 ID:ajCVZke.0
>>251
お試しありがとうございます。
この曲英語に合いますねw 好きな曲なんで嬉しいです。

後ろの音がずれるのはバグなので修正します。
デバッグ用のログが出力されるようになっているので、不具合が出た直後の以下のフォルダの内容を全部もらえますか?

C:\Program Files\UTAU\eigobu-tools\log\

一時的にうpろだにでも置いてもらえればOKです。
ただし ust-src.txt と ust-out.txt の先頭の方には各種フォルダ名が絶対パスで入っているので、
フォルダ名に個人名などの情報が含まれている場合はその部分を削除しておいて下さい。

254250:2009/10/04(日) 16:47:50 ID:hFABDC2Y0
>>253さん
どうもありがとうございます。こちらこそ好きと言って頂けて嬉しいです。
あ、申し遅れましたが私その曲の作者のアンダーソンと申します。
>不具合が出た時のログ
あ、すみません、ふざけて作った物なのでustまるごと消してしまいました。
なので、今適当に作ったのをうpさせて頂きます。詳しくはzip内の説明をお読み頂きたいです。
http://www1.axfc.net/uploader/Sc/so/42413
では、修正期待しています。宜しくお願いします。

2559:2009/10/05(月) 03:03:03 ID:C5K422Sc0
>>254
グロイさん本人でしたか。いつも楽しませて頂いてます。
ログありがとうございました。調べてみますのでしばらくお待ちを。

2569:2009/10/06(火) 01:55:19 ID:6vcP5ZXU0
>>254
どう見てもおかしな動作なんですが、調べてみたらこれは現時点では仕様通りの動作でした。
書いた自分でも忘れててすいません。

備忘録を兼ねて仕様を解説してみます。

今回頂いた以下のようなデータに対して末尾接合をかけると、「せ」「う」のノート長を合計した150msを末尾側に寄せて分配しようとします。

■ ust上のノート
せ: 固定範囲 75ms (60 tick @ bpm100)
う: 固定範囲 75ms (60 tick @ bpm100)

■ 原音設定
せ: 固定範囲 138ms (110.4 tick @ bpm100)
う: 固定範囲 49ms (39.2 tick @ bpm100)

※ 1 beat = 480 tick で変換

この際まず末尾側の「う」が原音設定の固定範囲である 49ms の長さに調整されます。
残りの 101ms を全て「せ」に割り当てるのが通常の動作ですが、「せ」の固定範囲は 138ms あるのでこのままでは固定範囲全体を鳴らせません。
このプラグインは英語の音素を合成する事を想定して作ったので、
ノート長が足りない場合は最低限必要な長さに伸ばして音素全体が鳴るように作ってあります。すっかり忘れてましたが。
というわけで、この場合は両原音の固定範囲を合計した 138ms + 49ms = 187ms にノート長が変更され、後ろのノートが 37ms ずれてしまいます。
両ノート長の合計が187ms以上あればずれないはずです。「せ」を90 tickに伸ばしてみたら通常動作になりました。

作った本人でも不具合にしか見えないのはあんまりなので、せめて警告メッセージを出すようにしたいと思います。

257魅亜:2009/10/06(火) 14:00:05 ID:B4wYOzSI0
>>256
ご無沙汰してます。
新プラグインもぜひ試したいのですが、フェスが終わるまではなかなか時間が取れそうも。

> このプラグインは英語の音素を合成する事を想定して作ったので、
> ノート長が足りない場合は最低限必要な長さに伸ばして音素全体が鳴るように作ってあります。すっかり忘れてましたが。

この仕様だと単体の摩擦音(連続発声可能な子音)で難しい原音設定を迫られそう。
特に[s][f]あたりは複合子音の部品として、必要な長さだけ切り抜いて使うことを想定していて、現在NALでは固定範囲をかなり長くとった設定にしています。
しかし現在のプラグイン仕様に合わせると、「使い得る最短の長さ」に合わせて設定しないといけないことになりますが、これって算出可能なのかな?と疑問になります。

もう一つ現行の仕様でまずいことになりそうなのが>>242のケース、つまり意図的に原音を切り詰めて鳴らしたい場合です。
(CV diphoneはVに変わり切って安定するまでが固定範囲)
NALは二重子音まではおおむねカバーしているのでまだマシですが、手間的に単独子音しか持たないケースの方が多数派になろうかと思うので。

> 作った本人でも不具合にしか見えないのはあんまりなので、せめて警告メッセージを出すようにしたいと思います。

「ノート長が修正されて全体がずれる」のと「一部の音がおかしくなったり抜けたりする」のだと後者の方が発見、修正しやすいので、動作は(ユーザが明示的に指定している)ノート長優先、固定範囲が切り詰められたときに警告、としてもらえると使いやすいかと思います。

258250:2009/10/06(火) 19:28:11 ID:PMSF3K5Q0
>>256さん
そういう事でしたか。固定範囲に影響されてしまうのですね。納得です。
おいらの使ったケンタは発音優先の為に固定範囲を元配布時より長くしてあります。
プラグイン用に別のエイリアスを追加して、色々なパターンを用意するといいのかなあ。
ともあれご調査どうもありがとうございました。これからも期待しています。

2599:2009/10/07(水) 02:55:53 ID:r8Oa7MW60
>>257
どうもお久しぶりです。
こちらも英語音源いじりはゆっくりペースになってるんで、気が向いた時にでも試してみて下さい。

現在のプラグイン仕様は「作ってみた」レベルでしかないので、本格的に子音結合を行う時にはもっとうまい仕組みが必要と思います。
英語音源用に原音設定を拡張してパラメータを増やしてみるとか。
延び延びになってて申し訳ないですが、そのうち>>242の実験をもとに検討してみたいと思います。

警告の件も了解です。確かにノート長変えちゃうのはよろしくないですね。

>>258
現状のプラグインでも、発声始め用の子音、発声終わり用の子音とかで原音設定を変えたものを用意してやれば使える場面はあると思います。
こんなクオリティでよければまた機会があった時に遊んでみて下さい。

260しるくはっと:2009/10/31(土) 00:03:00 ID:jXRXQ6Vk0
こんにちは、ギロカクから誘導されました。wikiを英語で書いているのですが、問題がありませんでしょうか?
『UTAU unofficial@wiki』>>http://www20.atwiki.jp/silkhat


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板