したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

UTAU@英語部

61名無しさん@wavファイル作成中:2009/05/28(木) 00:21:58 ID:TrEv8GbEo
うーん、すでに定着してると思われるvoice bankは動かしたくないような…。

62名無しさん@wavファイル作成中:2009/05/28(木) 01:25:18 ID:QVElradA0
流れを無視して悪いけど、英文テキスト→発音記号の変換がそれっぽく動くようになったんでUnicode書き込みテスト

発音辞書とか音声学の本を色々読んでみたけど同じIPAを使ってても表記の揺れはどうしてもあるんで、
音源作者さん、UTAUユーザ、英語関連ツール作成者それぞれの立場からの擦り合わせは必須だと思った
そのうち暫定の母音・子音セット案をまとめてみたいと思うけど、既に作ってる人がいたりしたら晒してくれると嬉しい

下の変換出力で使ってる記号は暫定も暫定なんでそのつもりで。でも気になるところがあったら突っ込みよろしく。おやすみー

[ə m | ˈeɪ z | ə ŋ] [ˈɡ r eɪ s].
[ˈh aʊ] [ˈs w iː t] [ð ə] [ˈs aʊ n d].
[ˈð æ t] [ˈs eɪ v d] [ə] [ˈr e tʃ] [ˈl aɪ k] [ˈm iː].
[ˈaɪ] [ˈw ʌ n s] [ˈw ɑː z] [ˈl ɔː s t]
[ˈb ʌ t] [ˈn aʊ] [ˈæ m] [ˈf aʊ n d]
[ˈw ɑː z] [ˈb l aɪ n d]
[ˈb ʌ t] [ˈn aʊ] [ˈaɪ] [ˈs iː].

63名無しさん@wavファイル作成中:2009/05/28(木) 01:28:19 ID:0SCQRyvc0
voice bankの元は、sound bank(soundfontとかの)なのかな?

原音→voice sample(s)

UI用の訳は、同じ日本語でも画面によって異なる意味で使っている場合があるので、
画面か意味を付けておいたほうがよいかも。
(リソースを全部リストアップ+インデックス付けするのも手ですが・・・)

64名無しさん@wavファイル作成中:2009/05/28(木) 01:46:18 ID:0SCQRyvc0
>>62
乙です〜
うには環境(フォント)によって出ない文字がありませんか?
歌詞の打ちやすさや、ファイル名に使えるかも気になるところ。

(あと、ネイティブな話者が発音記号を覚えてるのかもw 国によって発音が変わるし・・)

英語以外の言語が増えないなら、(英語で)発音できない文字を識別用に挟むと良いのかも。
(日本語だとlとかxを小文字用に使う感じで)

65シン:2009/05/28(木) 02:56:42 ID:.6TsJO0E0
>>62
 X-SAMPA を使った方が、VOCALOIDユーザーにとっては都合か良いです。
[{ m eI z I N] [gh r eI s] [h aU] [s w i: t] [D @ s aU n d]
 Amazingを例にすると、[{][m e][eI][z I][I N]これらに分けられます。
問題なのは[I N]で、これは伸張しないで発声させた方が良さそうです。

66Kirk:2009/05/28(木) 19:12:07 ID:WKVPJwa20
もはや何の役にも立たないKirkです。

今、休憩時間です。
1徹で朦朧としている現実に、もう年だと自覚させられています。
昔は3徹でも平気だったのに…。

>>魅亜様

>それにしてもKirk氏は同業者だったのか(w

おやおや、貴兄もですか?

>「UTAU本体で完結すべき」という方針は同意します。ただ、…
>                    :
> 「セットに含まれる全音を使うUSTを作って、それをレンダリングしろ」
> でいいのでは?

確かに、そうなのかもしれません。
先日、新人の前でコマンドプロンプトを出して操作していたら、「それ何の
アプリですか?」ですからね…。

愚痴はともかく、全ての音を含んだ譜面を作れというのも、酷な話ですよね…。
既に音声ファイル作成で、地獄を見ている訳ですから…。
仰る通り、UTAUの隠し機能を使う路線に、切り替えるべきかもしれません。

> また、oto.ini, prefix.mapともエディタ直接編集の必要はなく…
>                    :
> テンプレをあらかじめ準備する必要はないと思います。

こちらは、私がその機能を存じておりませんでした。調査の上、その路線に
切り替えようと思います。でも、そうすると魅亜様や皆様の訳が無駄になり
そうで…。

>(そもそも単音程の場合prefix.map書きようがないのでは。)

全部、prefix,suffix無しという記述で良いのではないでしょうか?
尤も、UTAUで作れるのなら、それに任せる事にしましょう。

>> 皆様

原音(ファイル単体)→voice piece
は如何でしょう?

67名無しさん@wavファイル作成中:2009/05/29(金) 01:12:45 ID:205/8RFc0
反応どもです

>>64
フォントと文字コードには十分注意が必要ですね。Unicodeは表示時の見やすさが主目的で、
直に打ち込む事はあんまり想定してません。英文テキストやX-SAMPAからの変換を考えてます
自分的には英語以外のUTAUloidsもどんどん増えそうな気がするw

>>65
テーブルを切り替えればX-SAMPAも出力できるようになってます。まだ組み込んでませんが
[{][m e][eI][z I][I N]は>>32の原音パターンですか? すごい参考になります


とりあえず暫定のUTAU音源向け発音記号一覧をまとめてみたんで、ツッコミよろしくです
これだけ区別すれば英語に聞こえそうというだけで、これをそのまま原音にしてUTAえるかは未知数
実験の叩き台としてどうぞ

68名無しさん@wavファイル作成中:2009/05/29(金) 01:13:49 ID:205/8RFc0
■ 母音 (アメリカ英語)

短母音: ɪ e æ ʌ ʊ
長母音: iː uː ɑː ɔː
二重母音: eɪ aɪ ɔɪ oʊ aʊ
R音性母音: ɝː ɚ
弱母音: ə

※怪しい素人分類だからそのつもりでね!
※母音は資料により表記の揺れが激しい
※英語圏では i と ɪ 、 u と ʊ は区別して表記されるようになった。日本もそのうち追従するんじゃないかと
※ e は ɛ と表記される事もあるが、古いやり方らしい(Kenyon and Knott式?)
※ ɝː は hurt の ur で ɚ は mother の er
※短母音とは言うけど、UTAU向けには長い発声の原音が必要?
※二重母音とR音性母音は発声の終盤で音が変わるので、UTAUで使うには工夫が必要
※ aɪ aʊ の a はアホ毛付きのエー(ASCIIのa)
※ ɑː の ɑ は小文字のアルファ(ɑ U+0251 LATIN SMALL LETTER ALPHA)

69名無しさん@wavファイル作成中:2009/05/29(金) 01:23:09 ID:205/8RFc0
■ 子音 (アメリカ英語)

無声子音1: p t k tʃ f θ s ʃ
有声子音1: b d ɡ dʒ v ð z ʒ

無声子音2: h
有声子音2: r l j w
有声子音3: m n ŋ

※子音1は無声と有声でペアになっているもの。それ以外は単独。3は鼻音。勝手な分類だからそのつもりでね!
※子音は資料による表記のぶれはほとんどない。後述のrとフラップtが変わるぐらい
※英語の r は本当はIPA的には ɹ という音らしい。多言語対応を考えると ɹ と表記した方がいい? 要調査検討
※発音辞書では上記以外にフラップt (waterのtがrに変化した時の音)も区別されてる。要実験?
※ tʃ と dʒ は最新?のIPAでは t͡ʃ d͡ʒ と書くのが正しいらしい(上にスラーが付いてる)
※ ɡ は下側が釣り針型に開いた字形。o型に閉じた字形は認められない。必ずこの字形になる事を保証
 するために、専用の文字コード ɡ (U+0261 LATIN SMALL LETTER SCRIPT G)が用意されている。
 つまり、ASCIIのgでこの発音を表すのはアウト(X-SAMPAの場合はOK)

70名無しさん@wavファイル作成中:2009/05/29(金) 01:24:06 ID:205/8RFc0
■ 参考資料

CAMBRIDGE English Pronouncing Dictionary 17th ed.
LONGMAN Pronunciation Dictionary 3rd ed.
The CMU Pronouncing Dictionary (ttp://www.speech.cs.cmu.edu/cgi-bin/cmudict)
ファンダメンタル音声学
A COURSE IN PHONETICS 5th ed.
日本人のための英語音声学レッスン
新装版 英語音声学入門 (竹林滋・斎藤弘子)
英語音声学入門 (松坂ヒロシ)

※「ファンダメンタル音声学」は発音教本としても非常におすすめ。「この音を出すには舌や唇をどう
 コントロールしたらいいか」を理路整然とさっくり説明してくれる。自分でも発音し分けられそうな気がした

※発音辞書は上二つのどちらも一長一短あり。発音記号も一部違う。すまんがどちらが英語部の目的に
 合うかまだ判断がつかない。EPDの方は以下のPDFで発音記号の解説と本文サンプルが読める
 ttp://assets.cambridge.org/97805218/62301/frontmatter/9780521862301_frontmatter.pdf
 ttp://assets.cambridge.org/97805218/62301/excerpt/9780521862301_excerpt.pdf

71名無しさん@wavファイル作成中:2009/05/29(金) 01:49:18 ID:4kHNly1M0
>>66
> 全ての音を含んだ譜面を作れというのも、酷な話
いや、譜面というほどのこともなく、「あいうえおかきくけこ……」の歌詞で
音程も関係なく音符を羅列したUSTをレンダリングするだけだし。

もっと言えば、原音設定した時点で普通は.frqできてると思うしw

> 魅亜様や皆様の訳が無駄になりそう
いや、実は図のほうを差し替えるだけでほとんど大丈夫だったりw

>>67-70
よく調べたなあ、乙。
うちは実は英語歌わせないから(英語部にいるのにw)
ここまでは調べてなかった。

'r'は/r/にとっといてほしいな、そっちで使ってるからw
でもUTAU/Vocaloid的には/r`/の連打で代用できるからなくても大丈夫か。

……方言専用の音源ってのも面白いとか唐突に思いついた。
ラ行が巻いてる江戸っ子な音源とか(w

72シン:2009/05/29(金) 03:44:16 ID:oZx/cDZk0
>>67
 [i:]が抜けていました。正しくは、[{][m e][eI][z I][I][I N]です。とにかく面倒でした。
 具体的には[{]と[m e]が別な音符で[m e]が伸びて[eI]、[z I][i:][I N]と音符三つに割り振られます。
 基本的に一つの音符に一つの母音になります。場合によっては二重母音を二つの音符に分けなければならない事もあります([aI]などです)。


 日本語の発音は、
母音:a i M e o
子音:k k' K s S t tS ts n J h C p\ m m' j 4 4' w(M\) N N\ g g' dz dZ d d' b b' p p'
この他にも"i"や"M"の無声化"_i"、"_M"があります。
 ちなみに"M"(非円唇後舌狭母音)とは"u:"(円唇後舌狭母音)ではありません。

73名無しさん@wavファイル作成中:2009/05/29(金) 23:05:25 ID:ft7RSjow0
とりあえず紹介だけしてみようそうしよう。

http://www.nicovideo.jp/watch/sm3814210
日本語の発音(記号)を使って、(ボカロ1でしか使えないパラメータ弄って)英語を歌わせたもの
ボーーカロイドMIDIが公開されているので、参考になるといいなあ…
↑これで使ってる口の形を変化させる(縦方向と横方向)パラメータはないけど、原音を選んで(エンベロープを弄って)英語っぽく歌わせる事は出来ると思っているのだがどうだろう… う→rとか。
Cadenciiってボカロ1対応してたっけ?
一応試用版メイコさんhttp://www.crypton.co.jp/mp/do/prod?id=25220#

日本語部:http://www.nicovideo.jp/watch/sm1983881
初音の発音(発音記号の検証)
日本…語……部?http://www.nicovideo.jp/watch/sm3994128
英語部は見当たんなかったです><

http://www.nicovideo.jp/watch/sm6015683
拙作。 発音記号をtxtにしてみた:http://u9.getuploader.com/utaou/download/66/%E3%81%82%E3%81%84%E3%81%9A%E3%81%8A%E3%82%93%E3%81%BF%E3%83%BC%E3%80%80%E7%99%BA%E9%9F%B3%E8%A8%98%E5%8F%B7%E7%89%88.txt
英語版ボカロの真髄は、エディタに出てこない(でもおそらく搭載されてる)英語の単語集だと思われ

見易さを優先して、1つのノートに乗せているものは m-aI のようにくっつけた 
= で結んだものは別個のノートで1単語の発音をさせているもの (参考:http://www.vocaloid.com/jp/index.html

UTAU海外組にもし英語用音源を作ってもらうとしたら、子音全部+母音全部+特定の子音と結合すると発音の変わる母音の組み合わせ、となるような気がするんだがそれでおkかな?

74名無しさん@wavファイル作成中:2009/05/29(金) 23:46:43 ID:4kHNly1M0
ちょうどタイムリーに英語用音源きたよ(w
>>41にも書いた3ヶ国語音源、Camila Melodiaが公開されました。
http://camilamelodia.blogspot.com/

表記はIPA系じゃなくて英語・ローマ字系ですが、単音程なのに378音もあります。
ちなみに>>72の/M/と/u:/が両方入ってます。
よく中の人これ全部発音できたな……

75名無しさん@wavファイル作成中:2009/05/30(土) 02:17:30 ID:eCC/H6FE0
>>74
ざっと聞いてみました。
3カ国同時だと、作っているうちに言葉が混ざってしまうみたいですね^^

日本語のうち、おそらくローマ字で覚えた部分(だ行のあたり)が、予想した発音と異なるようです。
このあたり、海外組みに頼む時、説明が難しいかも。
(あと、は行のあたりが。)

76Kirk:2009/05/30(土) 22:33:28 ID:TBf2emtA0
やっと、徹夜勤務から開放されたKirkです。
共同開発していた某社のX氏が突如逃亡。しかも、補充要員が病欠と言う悪夢…。
これだから、共同開発は嫌なんだ…。まぁ、何とか間に合わせましたけど…。

それはさておき、"How to create your own Voice bank Rev.0.4"を目下作成中です。
魅亜様が仰ったとおり、UTAUの最新機能で設定ファイル群を作成する様、方針転換
する事にしました。

一応、私もUTAU Ver 0.2.41を導入していたのですが、「いつの間にこんな機能が?」と
いう状態です。流石は飴屋/菖蒲氏です。原作執筆当時にこの機能があったら、話は
もっと楽だったのですが…。

と言う訳で、今暫く時間を下さいませ。
でき次第、またアップロード致しますので…。

77Kirk:2009/05/31(日) 03:02:23 ID:XOl4RmXA0

お待たせ致しました。(誰も待っていなかったりして…)
"How To Create your own UTAU voice bank rev0.40"が出来ました。

線路にアップ致しましたので、DRCをよろしく御願い申し上げます。
ttp://u9.getuploader.com/utaou/download/72/How+To+Create+your+own+UTAU+voice+bank+rev0.40.pdf

78魅亜:2009/06/01(月) 22:28:41 ID:.xddhBd60
すいませんあと1月半の間に2製品テープアウトという修羅場なんで
他の方お願いしますー (国際共同開発、私はPJL)

79Kirk:2009/06/01(月) 23:29:03 ID:9ISRDCwA0
>>魅亜様

何と、今度は魅亜様が修羅場ですか?
お疲れ様です…。

>>皆様

今回は、かなり変更しておりますので、支援を宜しく御願い申し上げます。

80名無しさん@wavファイル作成中:2009/06/02(火) 00:29:28 ID:sksR2Cvs0
diff1を書いた者です
俺もちょっと今忙しいけど人手がないようなら近日中に見ますよー

81名無しさん@wavファイル作成中:2009/06/02(火) 00:41:44 ID:aCe.KlPE0
>>71
とりあえず/r/使い分けの需要がある事は了解です。何語音源ですかw

>>72-74
皆さん乙です。今は自分にやれる実験の方を優先してますが、そのうち参考にさせていただきます。

>>77
おつかれさまです。本当に申し訳程度ですが反応だけ。

・step indicator -> range indicatorとかの方がわかりやすいかも?
・you may use -> 別の柔らかい表現に
・these phoneme identifiers correspond to the note names you wrote in the lyricsとか何とか
・UI画面の説明には「ミリ秒」-> msecとかも付けてあげた方がよいかと
・Pre-UtteranceとOverlapの図と説明はすごくわかりやすくなりました。乙です

あとは voice bank は voicebank にしちゃった方が一般的な概念としての
voice bank と誤解されなくて無くてよいかと。

82魅亜:2009/06/02(火) 16:36:10 ID:5JvqRQac0
英語リソース、0.2.43対応。
ttp://u9.getuploader.com/utaou/download/73/res_EN_2.0.43_20090602.zip

・訳語あんまり見直せてないごめん。
 そもそもUTAU本体もまだ入手できてないので未検証。
・下線引く文字(正式名称知らない)はできるだけ日本語を保存しようとしたけど一部変えてる

83名無しさん@wavファイル作成中:2009/06/03(水) 01:00:45 ID:ow4fTTGc0
今日は実験用に>>68-69の41音を自分で録音してみた。
これは大変だわ…

まず普段は単語全体で音にしているものを単音で奇麗に発音するという事自体が難しい。短母音はなおさら。
それから子音のwは単体で録音したものを母音と合成しても英語っぽくなりそうにない気がした。
"with"のwiとか。エンベロープをうまくいじればいけるかもしれないけど。

母音・子音単音の合成で英語っぽくUTAう事は可能か? という問題以前に、
単音の収録自体が普通の日本人には難しいという事がわかったんで報告まで。
音節単位やdiphone合成用の呪文の方が発声は楽かもしれない。収録時間は長くなるけど。

84名無しさん@wavファイル作成中:2009/06/03(水) 01:10:54 ID:RantWn.I0
>>83
Wooo 的な発音でリトライ頼む
「う」 ではなくて「Wo」 の音が英語には欲しいと思っている

「Wo」+「Wi」+「th」とつなげて(エンベ弄って)使うので、それぞれの音が存在してればいける。

85魅亜:2009/06/03(水) 21:11:41 ID:RcKdSHg60
>>82の英語リソース、海外ユーザに試用してもらったんですが
「下線がつく文字がどれか分からないので日本語版のような()入りのほうがいい」
というフィードバックがありました。
(確かにAlt押すまで下線が出ないので分かりにくい)

一般のWindowsの英語版アプリなんかだと()なしみたいなんでそれに倣ったんですが、
どっちがいいですかね?

86名無しさん@wavファイル作成中:2009/06/04(木) 00:27:08 ID:o3A3xt9Y0
とりあえず>>83の音声一式をトリミングだけして上げときました
http://u9.getuploader.com/utaou/download/76/9loid-monophone-20090603.7z

正直、発音し分けられてない音とか別の音になっちゃってるのが多いですが
まあ何かの実験に使えれば。

>>84
一応録音時に唇は丸めてたんだけど、聞き直してみたらちょっと弱いかも。
次に録る時はちょっと頑張ってみる

発音指南・実験報告等してもらえると嬉しいです。

87名無しさん@wavファイル作成中:2009/06/04(木) 01:37:31 ID:vhsUGNvQ0
>>85
(Altで下線が出る文字を)Capitalizeするなどの方法もあると思います。
逆に、日本語は大文字が無いので()になったのかと。

途中の文字を選ぶと、大文字化は難しいかもしれませんが・・・

>>86
乙です。

ざっと聞いてみました。
・b、d、・・・はいい感じだと思います。
・母音に日本語の音が乗っているように感じます。
 響きの部分なので、日本語話者だとどうしても出てしまう部分かも・・
・fが、日本語の「ふ」に近いかも。息を一気に押し出す感じ?で行くと良いかもしれません。
・hも、日本語の「ほ」に近く聞こえます。これも単音だと難しいかも。イメージ的には、「ふ」を少し「ほ」にして強くした感じ???
 母音と組んで、切り出すorそのままも手かもしれません。

 は行の音は、国によってかなり変わるようですね。(フランス語だとhを発音しなかったりしますし)
 英語話者にとって、日本語の「は行」は難敵だったり。難易度は、おそばをすすれないのと同じレベルかも。

・ŋは伸ばせない音かと思います。

・m、nの音が、もう少し大きく録音できると良いかも。

・余裕があったら、rの音も入れて置くと良さげです。
(ヨーロッパの言語や、メキシコあたりの言葉が混ざると出てくるかも。)
>>71氏の江戸っ子音源にも使えるかも^^


とは書いてみたものの、大変な作業をさらに増やしてる気が。

88魅亜:2009/06/04(木) 10:56:02 ID:.C33GQUU0
>>87
全部先頭文字が選べてたら苦労はなかったりする……w
どんなソフトにもありそうなところでも(とりあえず例はMozilla Seamonkey)
E(x)it, Cu(t)/(C)opy/(P)aste/(D)elete
ですからねえ。

Altなしの状態で下線が出てれば(普通出てるもんだと思ってた)
どうということはないのですが。


印欧語だけに限っても発音が多彩になるアルファベットはrとjですねえ。
英語、ドイツ語、フランス語、スペイン語あたりでも全部違うw
(だからCamilaさんにはrが3種類ある。
でもザ行がサ行になってるあたりスペイン語圏らしいw)

中の人が日本人なら多少Engrishな音源でもいいんじゃね?とか思ったり。
そういや誰かアジア言語とかやってる人いないのかな?

89名無しさん@wavファイル作成中:2009/06/05(金) 00:17:08 ID:zOUaci6I0
あー朝鮮語とかは相性がよさそうだよなあ
漢語やタイ語の系統もそうかな

でも声調言語はピッチのプリセットとかがないと厳しいのかな

90名無しさん@wavファイル作成中:2009/06/05(金) 00:17:45 ID:zOUaci6I0
あーいや普通に声調をつけておいてmod100で使えばいいのか

91名無しさん@wavファイル作成中:2009/06/05(金) 01:20:39 ID:Xoyo0JsY0
>>86でUTAわせてみた。原音調整のみのベタ打ち。
http://u9.getuploader.com/utaou/download/77/9loid-amazing-grace.mp3

テラロボ声w
だけど英語の歌を歌っている事はわかる(よね?)
ちゃんとした原音を用意して調声すれば単音合成でも結構いけそうな気がしてきた!

>>87
聞いてくれてありがとうございます。
自分じゃ気付かない事も多いんで大変参考になりました。次に録音する時はその辺注意してみます。

92シン:2009/06/05(金) 16:59:51 ID:mp0D3ruU0
 "r"の発音は、そのままだと休符になりますね。例えば発音はじめは"r-"、発音終わりは"-r"とすれば良さそうです。
 同様に、その他の子音についても複製してエイリアスではじめと終わりを区別して原音設定すると良いです。基本的に、子音部分は固定の方が良いですね。

93名無しさん@wavファイル作成中:2009/06/05(金) 20:02:42 ID:Xoyo0JsY0
>>92
最初休符で変な音が出た時は何事かと思いましたw

原音設定参考になります。ありがとうございます。
単音合成だとオーバーラップの設定が命のようなので
発音し始めと終わりで設定を変えるのは使い勝手が良さそうですね。

今のところ有声子音は母音と同様に先頭のみ固定、無声子音はほぼ全期間固定の方向で
設定を進めてるんですが、他にも注意した方が良い事とかありますか?

94シン:2009/06/06(土) 00:51:31 ID:gg8nZfHk0
>>93
 基本的な設定はそれで問題ないです。
 私の設定方法は、母音、m、n、lなどの発音はじめと発音中にあまり違いが無い場合、発音の安定している所まで左ブランクを移動させます。右ブランクも安定している所まで移動させます。こうすると母音結合が良くなります。
 無声子音は、VOCALOID LOLAを使っている関係で、子音の終わりにアヤと言うか、そんなのがあるのがわかるのです。英語が苦手なのでうまく説明できませんが(ルカはアヤが少ないです)、子音終わりの場合は、固定部分を長めにすると良さそうです。音符が短い場合は、途切れるだけですし。
 子音はじめも、例えばsとかの摩擦音は、原音設定で長めに固定する場合と短めに固定する場合があると表現力が広がります。

 単音合成は私も考えていたのですが、調声が難しくなりますね。でもそれは、腕の見せ所です。VOCALOIDのように辞書登録できれば楽なんですけど。例えば"gra"という単語を登録すると一つの音符を三つに分けてそれぞれ割り当てる、割り当て割合も指定でき、結合方法、エンベロープも設定できる、みたいな機能があると便利です。

95魅亜:2009/06/06(土) 01:12:52 ID:hf20nVLQ0
>>94
子音は単音合成でもいけるけど、
二重母音はdiphoneしないと厳しいんじゃないかと思ってるんだけどどう?

96名無しさん@wavファイル作成中:2009/06/06(土) 20:15:11 ID:7AbCmWbE0
UTAU用音源できたよー
http://u9.getuploader.com/utaou/download/78/9loid-monophone-20090606.zip

Amazing Graceのustも同梱してみたんで、お手軽に実験してみて下さい。

>>94
おおー。いつも参考になります。どうもです。
ツールで解決する部分は望むところです。

>>95
二重母音は今のところ悲惨の一言に尽きるw
音の長さ合わせに工夫が必要なのは当然として、原音のピッチが終点に向かって
下がってるんで、ピッチ変更で悲惨な音になりやすい。

一定ピッチのまま二重母音を発音できるようになればマシになるのかも含めて、
色々実験してみないとダメそう。

97シン:2009/06/06(土) 20:19:56 ID:gg8nZfHk0
>>95
 デフォ子の母音結合のサンプルを作ってありますので聴いてみて下さい。
http://shin20070212.up.seesaa.net/music/aeiueoao-defuo_Mix.mp3
これで十分と判断するなら単音合成でも良いでしょう。ただ、英語には音素として二重母音があるし、数もそんなに多くないので発音が達者な中の人には頑張って欲しいです。

 ちなみにこのデフォ子の母音結合サンプルは、母音同士の結合に難あるとして試行錯誤されている方たちのサンプルを聴いて、デフォ子なら母音結合だけでも滑らかに繋がるのではと、先の原音設定方法を用いて作りました。

 普段使っているOperaでは無くて、Geckoエンジンのシーモンキー派生版Syleraからの投稿ですので、もしかしたらIDが変わるかも知れませんが、同一人物ですよ。

98魅亜:2009/06/06(土) 20:33:20 ID:hf20nVLQ0
>>96
仕事はやっ。
ありがたく試させてもらいます。

二重母音は後半でどうしてもピッチが下がるのは頭が痛い問題ですねえ。

>>97
さすがは機械音声、つながりは滑らかですが「二重母音」じゃないですねw

私はdiphone必須派なので、>>13ベースでどこまで.wavファイル数を減らせるか試行錯誤してました。
……かなり削ってもまだ644音あります……

http://u9.getuploader.com/utaou/download/79/mjg-diphones-text.zip

試しに録ってみようかと思ってたのですがこの数はハードル高いですw

99シン:2009/06/06(土) 22:23:16 ID:gg8nZfHk0
>>96
 早速調声してみました。
http://shin20070212.up.seesaa.net/image/amazing_Mix.mp3
 1オクターブ上げました。"b"は64分音符にしました。思ったより仕上がりが良かったです。

100名無しさん@wavファイル作成中:2009/06/07(日) 16:54:25 ID:Zomxs1gw0
>>99
実験ありがとうございます。これは無調整のとは全然違いますねー
二重母音のところもちゃんと対策してもらったようで歌になってますね。
何度も聞いて課題の確認に使わせてもらいました。

>>98
なんと、diphone検討してたんですか。すごく乙です。

自分はここの原音をいくつか聞いてみてフルdiphone合成はひとまず目標から外しました。
ttp://festvox.org/examples/cmu_us_kal_diphone/wav/

これはナンセンスワードというよりお経だよなあ… 日本人に発音できるのか?
           ↓
お経なら四六時中聞いてれば門前の小僧メソッドでマスターできるんじゃ?
           ↓
音声認識ライブラリを使って音ゲーを作ればお経の発声練習も楽しくなるんじゃね?
           ↓
でもkal先生の発声は正直お手本としてはきついなあ…
           ↓
ひとまず単音合成を実験してみるか ←今ここ

101名無しさん@wavファイル作成中:2009/06/07(日) 16:55:43 ID:Zomxs1gw0
今回の 9loid-20090606 による母音・子音単音合成の実験結果をまとめてみました。
漏れてる点などあったらご指摘よろしく。

■ 全般的な評価

・主観だけど、想像していたよりはずっと英語の歌に聞こえる
・子音+母音の結合はオーバーラップを調整するだけでもかなりうまくいく
・母音+子音の結合も、うまく調整すれば結構いける (>>99)
・子音+子音の結合も、うまく調整(ry (>>99の gr\eIs, saUnd)
・二重母音はそのままでは悲惨な音になる。何か対策が必要

102名無しさん@wavファイル作成中:2009/06/07(日) 16:57:14 ID:Zomxs1gw0
■ 合成方法の課題

・二重母音
 原音と音符の長さが合っている場合にはそれっぽく聞こえる事もあるけど、
 ピッチ変更がうまくかからなかったり、二重母音+子音の時に単母音用の
 オーバーラップのままではうまくつながらなかったりする。

 大まかな問題点は以下の3つ?

  - 長さ調整
  - ピッチ調整
  - 次の音とのつなぎ

103名無しさん@wavファイル作成中:2009/06/07(日) 16:58:08 ID:Zomxs1gw0
■ 原音の課題

h → 「ほー」になってる。ha や h@ が ほアー になってしまっている
f → 「ふー」という息を連続して吐く音が主体になってしまっている
O: { → 変な力が入って他の母音と響きが違う
N → 全然だめ
m n → 母音とのつながりが悪く感じる。発音時の力の入れ方や音量が他の音と合ってないから?
l → la とか lO のつながりが悪く感じる。発音終わりのlを意識して録音したのがよくなかった?
破裂音全般 → 勢いが強すぎで「tッ」的にボフっとした音が入ってしまっている
二重母音全般 → 素材として音の長さや雰囲気は統一した方がよい。OIだけやけに怖いw

>>87で指摘してもらった点は大体その通りの問題が発生してました。
これらは指摘が頭にあったから気付きやすかったですが、他の問題点もまだまだあると思います。

似たような音、関連のある音はひとまとめにして一気に録音した方が一貫性を出しやすいかも。
母音全部、二重母音全部、破裂音、摩擦音、子音の有声と無声のペア、など。

104名無しさん@wavファイル作成中:2009/06/07(日) 16:59:01 ID:Zomxs1gw0
■ 要確認点

・高い声の原音でもうまく合成できるか?
 今回の実験は思っていたよりうまく合成できたけど、これは低音のロボ声だから
 たまたま違和感が少ないだけでは? もっと高い声、特に女声、具体的にはテトの声でも
 うまく単音合成できるか?

・既存のノウハウがないか?
 単音ではうまく合成できない音や二重母音の扱いについて、既に確立済みの
 ノウハウがないか? まずは>>73から漁ってみるといいのかな。

105魅亜:2009/06/07(日) 17:21:48 ID:1GH5XaEw0
>>100
今日頑張って全部録ったよ! エイリアスの重複があったりで英語は結局621音だった。
そして今は原音設定前のファイル掃除中……

原音設定が終わる気がしないww

106名無しさん@wavファイル作成中:2009/06/07(日) 17:43:02 ID:Zomxs1gw0
>>105
ブーーーーーッ(AA略)
頑張りにもほどがあるwww すごくすごく乙です。期待してます。

そして>>103の入れ忘れ。
w → "wo" "wi" 的な音のタメ?が弱い

107名無しさん@wavファイル作成中:2009/06/07(日) 19:11:35 ID:Zomxs1gw0
今他のスレを読んでたら、原音間のつなぎで位相がずれてるとUTAUではそのまま加算されて
音が小さくなる等の影響が出るとあった。耳ロボPが研究してるそうな。

UTAU側で位相合わせとかしてくれるのかなーとか思いつつ何も調べてなかったけど、
原音調整時にはその辺も気にした方がよさそう。

9loid-20090606では各種設定点は基本的に全部位相0度(正側へのゼロクロス点)に
設定してあったんで、それが効いてうまくつながってる部分もあるのかも。

108魅亜:2009/06/08(月) 11:41:42 ID:P9CfjAOs0
原音設定すらしてない(自動推定が効いた音も一部にある、程度)ものを
母音結合、ピッチ調整すらないべた打ちUSTで。

http://u9.getuploader.com/utaou/download/80/daisy.mp3

思ったより崩壊しなかったんで面白みがないw

ちなみに1オクターブ下げて原音に近い音程でUTAわせると
某映画の計算機みたいになりました。

109名無しさん@wavファイル作成中:2009/06/08(月) 23:42:41 ID:mDOn16V.0
>>108
おおー。diphoneしてますね。乙です。
調整終わったらかなり滑らかにつながりそう。
UTAUの調声機能を総動員したらdiphone合成がどこまで行けるのかすごく興味あります。

110名無しさん@wavファイル作成中:2009/06/09(火) 00:40:22 ID:lJ2AiEVE0
今日は>>104の確認のために、テトで単音合成を試してみた。
自分にとってはテトが英語で歌えるようになるかが最重要なんで。

とりあえずテトの声で単音合成がうまくいくか確認できればいいんで、
新Lite20081222から あいうえお の母音、英語歌詞お助け音源から p2 s sh2 fo(のf部分)
の子音を持って来てUTAUでD4に並べてみたけど、「あ」と「お」が全然つながらない…
「い」は割とよくつながる。「え」も何とか。

タイミングがシビアなのかと思ってAudacityでつながりの位置を微調整してみたけど、
子音と母音が別々の音にしか聞こえない。何でだー

原因は気になるけど、テトでも単音合成は可能とわかったのできっと解決可能と信じて進んでみます。
次は二重母音の実験かな。

111魅亜:2009/06/11(木) 15:01:40 ID:CAhRaimM0
>>101-104に倣ってこちらのdiphone合成もまとめ。

まず多少原音設定した現状はこんな感じ。
ttp://db4.voiceblog.jp/data/mianaito/1244650144.mp3
オーバーラップ調整してないけど、あとは日本語と基本的に同じはず。

◆録音対象
-各音素単音
-母音→母音(異種)=二重母音 (diphthong)
-破裂音→母音
-鼻音→母音
-破擦音→母音
-子音→子音

◆録音して分かったこと
・口蓋接近音 (glide)の/j/ /w/は後ろに母音が続かないと発音が難しく、前音素が子音の場合はさらに厳しい
・/N/は実質母音のあとにしか来られない
→これらに母音をつないで各個準備するとそれぞれ数が16倍に……。
(/N/→glideのパターンは両端に母音をつなぐと256倍)

◆使って分かったこと
・母音が英語用になっているだけで結構それらしく聞こえる
・同種母音同士の声質を揃えるのがかなり大変
・UTAUでは原音終端は必ず可変部なので、音節終端の子音(たいてい弱く短い)を上手に表現するのが面倒(特に破裂音の場合)
・/l/ /r\/でも自然な連結が可能かと思っていたが案外きれいにつながらなかった
・とにかく音の種類数が膨大なので原音設定が無間地獄


>>110
実際の発声では口の形が母音に変わり切る前から声が出始めるので
中間音がはっきり出るからじゃないかな?

1129:2009/06/13(土) 23:53:37 ID:/S1HVAWA0
話の流れ追いにくいかもしれないんで、数字コテ付けてみます。

>>111
乙です。母音とのつなぎのところすごく参考になります。
もう少しこの辺の知識を貯えたらテト単音合成に再挑戦してみます。

最近読んでる本によると、以下の子音はどうも後続の母音とセットで発音しないとだめな感じ。/m/もそうかもしれない。
唇の形を後続の母音の形に保てとか、調声器官の動きに伴って発生する音だから単音で伸ばす事はできないとか書いてある。

 /h/ /j/ /w/ /r\/ /n/ /N/

ただ、/N/の前後にくる母音を発音辞書で調べてみたら実際の英語で使われているパターンはかなり限られてるようなんで、
256通りの音は録らなくて済みそう。うまくいけば10数通りぐらいに収まる感じ。

上記の本は "SINGING and Communicating in ENGLISH" というやつなんだけど、これは音源を作る人にも調声をする人にもおすすめ。

それぞれの発音をIPAや調声器官の図で解説してくれるんだけど、全ての情報が「歌として奇麗に発声するには」という観点でまとめられてるのでありがたい。
@を伸ばすときに他の母音で置き換えるためのルールとか、半母音の前に母音を補うテクニックとか、暗いlは歌の中では使われないとかの情報も豊富。
CDは付いてないけど、各解説に対応したmp3がコンパニオンwebサイトで配布されてる(本に記載のパスワードが必要)。

ただし、日本人を対象とした発音の勘所の解説としては「ファンダメンタル音声学」の方がおすすめ。
本気で英語音源に取り組む人は両方買っちゃって損は無いと思う。

113momoko:2009/06/14(日) 17:58:52 ID:quvj6k2M0
桃音モモ音源の萌々子です。こちらのスレッドでははじめまして。
外国語対応の音を追加できるように、ここを読んで勉強させていただいているので
お礼が言いたくて来ました。

参考にさせてもらうばかりで、役立てることを書き込めなさそうですが、
このスレッドを応援しているのでこれからもときどき読みに来ますね。
実験や検証をされている方、おつかれさまです、ありがとうございます!

114魅亜:2009/06/14(日) 18:53:43 ID:bwRoY9qM0
萌々子さん英語部へようこそw

私のほうのdiphone英語音源も粗いながら一応原音設定つけたので
リリースしますね。
二重母音類とか、本当は音節頭、中、末尾で別の設定が必要なんですが
その辺までまだ追いついてません。

ttp://www1.axfc.net/uploader/Al/so/10058.zip&key=utau
(暫定版なので6/29 0:00までの限定配布)
ご意見・ご指導願います。

1159:2009/06/15(月) 00:02:18 ID:/90K0pNM0
>>113
いつもUTAU関連の精力的な活動おつかれさまです。
テトスレに続いてこちらにも助っ人に来てくれて大変心強いです。ありがとうございます。

収音とか発声について色々と教えてもらえるとすごく助かりますんで、時間のある時にでも来て頂けると嬉しいです。

差し当たっては二重母音関連の実験のためにピッチや声質を一定に保って発声できるようになりたいんですが、
何かおすすめの練習法や参考資料などがあったら教えてもらえないでしょうか。

>>114
設定乙です。
ありがたく実験に使わせて頂きます。

11687:2009/06/15(月) 05:35:22 ID:599/fe7k0
9氏に習って、数字ハンドルを。
>>113
モモさん、いらっしゃいませ〜

>>112
英語の音は耳で覚えた派なので、理論には弱いのですが・・

・子音にはデフォルトでつながる母音がある(ように感じる)
→子音自体のイメージは、このあたりから生まれているのかも

・後続母音によって、子音自体の音が少し変わる
→発音記号の意味が無いと言われそうですがw

この辺りを意識して作ると良いかもしれません。

>>114
乙です。
今、修羅場中なので、あまりじっくりとは聞けませんが、気になった所を。
・日本語母音の英語化
・pから始まる音が、他の音と録音状態が異なる?

それにしても、この数。すごいですね。

117魅亜:2009/06/15(月) 08:16:23 ID:WDft91oo0
めっちゃ修羅場中です。

>>112
紹介いただいた書籍の購入も検討してみます。
そろそろ理論の座学も必要な気がしてきました。


>>116
もしや同じプロジェクトの一員ではあるまいなw

・日本語
普段日本語で歌うときと同じ出し方のつもりだったんだけど……。
もしかしてもともと英語っぽいのか?
もっとも「おまけ」的に手を抜き気味だったのと何より疲れてたのは事実。
休憩抜いた正味録音時間でも4時間くらいかかりました。まさに一日仕事。

・p音
鋭い。そのあたりでいったん録音を中断してます。
ファイルの命名規則に穴が見つかって、ルールを再考したりしなきゃいけなかったので。

個人的な今の検討課題筆頭は二重母音。
固定範囲が音の先頭にしか設定できないUTAUにおいて、適切な原音とタイミング設定はどうすべきなのか?
(/A:i/なのか/A:i:/なのか/Ai:/なのか?)

次点は子音単体(末尾子音を含む)のような、原音全体を固定範囲(つまり固定長の音符)にしたいようなものをどうするのか?

11887:2009/06/16(火) 03:53:22 ID:xBBK/f/w0
>>117
>同じプロジェクト
も、もしかして、隣の席の と一瞬思ったり。

同業ではないので、きっと大丈夫です。

録音状態は、こんな感じで良いのでしょうか・・
という事で、色々実験。ライブラリ用に何を録音するか考え中。
http://ux.getuploader.com/utau_a5/download/2/utau_a5_2.zip

119名無しさん@wavファイル作成中:2009/06/16(火) 20:54:27 ID:so7JMRG.0
>>115
9さん

>ピッチや声質を一定に保って発声

私は、まず基準になる声質、声色、強さで音を録って
それを途中何度も聞いて確認して真似をするようにしながら録っています。
基準になる声のサンプルがしっかりしていれば大量の録音でもブレにくくなると思います。
ピッチを安定させるには基本的なボイトレが一番のようです。
あと、いきなり録ろうとするのではなくて、普段から練習しておくのと
録音当日は半日くらいかけて声を出して
喉をストレッチして慣らしてから録りに入るといいかもしれないです。
でも私も素人なので、なかまだ思うようにはいかないんですけど。
いい資料とか思い当たらなくてごめんなさい、参考になりそうなものがあれば
紹介できるようにしてみますね。

120119:2009/06/16(火) 20:56:27 ID:so7JMRG.0
名前入れ忘れました〜 >>119は萌々子でした

121魅亜:2009/06/16(火) 23:15:09 ID:IM2gamks0
「3ヶ国語対応」とか大口たたいときながら
スペイン語音素がだいぶ足りてないことに気づいて涙目。
/x/とか/L/とか入れてないじゃんorz (後者は/z\/で代用すりゃいいけど)
おかしな音とか録り直すときに追加するか……。

>>118
猫ワロタww なぜこれを録ろうと思ったw
でもけっこう発音明瞭で綺麗だな。/si/と/e/に癖がある?

私も素人だけど聞いてみた録音状態の印象。実験用途なら十分だと思う。
曲を歌わせて投稿する「実用」観点から見るとこんな印象。

バックグラウンドノイズが少ないのは◎
こもらずきびきび明瞭な発音なのも◎ (このスレでの実験用だと不明)
破裂音で息がマイクに当たるポップノイズがあるのは×
壁?筐体?に反響してる金属っぽい残響音があるのは△ (オケで消せる)

あと、"R.wav"はUTAUじゃ扱えないぞw


>>119
「基準になる声質、声色、強さ」のイメージをきっちり固めるのが肝ですかね。
どうしても発音する音が変わると「同じ」の感触がつかみにくくて。

122キハ22:2009/06/16(火) 23:23:29 ID:xxVFmaPE0
>>117
「UTAU交流掲示板」でお世話になりました。英語はダメダメな人ですが……

>固定範囲が音の先頭にしか設定できないUTAUにおいて、
>適切な原音とタイミング設定はどうすべきなのか?
>(/A:i/なのか/A:i:/なのか/Ai:/なのか?)

/A:i:/ アーイーと長く録って、アーが固定部、イーの遷移完了後の区間が可変部、
UTAわせる時 stp= でアーの先頭を適宜切り落として /Ai:/ と聴かせる、とか。
もしくは、エンベロープの _/ ̄\ の形(出だしの無音化)と
先行発声・オーバーラップの組合せでも遷移タイミングの微調整は利くと思います。

ベタ打ち用に数種類の異なる長さの左ブランクで アー の先頭を切り落とした
エントリーを用意する手もあるかもですが、録音自体は /A:i:/ が後で融通が利く
と思います。


>子音単体(末尾子音を含む)のような、原音全体を固定範囲(つまり固定長の音符)
>にしたいようなものをどうするのか?

録ったWAVファイルを加工して 子音+無音区間+母音 に、
resamplerは母音を手がかりに周波数表(*.frqファイル)を生成、
原音設定は、子音部を固定部に、無音区間を可変部に、母音は全て右ブランクで除外、
という手はあると思います。

原音設定で各音の先行発声の値を決めるとき基準にする Click.wav の設定と同じ手です。
参考) http://www10.atwiki.jp/utau2008/pages/20.html#id_7aa5ba2a

12387:2009/06/17(水) 00:35:37 ID:tvKjkYmU0
>>121
ありがとうございます。
猫はデフォですw
実験してみると、英語猫は、小さな声が出せないみたいです。
練習すれば出せるのかな??

ポップ対策:ウインドスクリーンを作って入れてみます。

金属っぽい残響音:環境ノイズ(PCファンとかの名残)+マイク自体の音+録音ソフトの音+マザーボードの音源のピン検出信号の複合体のようです。
PCを隔離するか、アナログ録りして入れるか・・・少し考えて見ます。

録音ソフトで付加された音は、デジタルの0dbオーバーか、ディザ(24bit→16bit)あたりな気がします。
(音が死ぬのがいやで途中でコンプを外したので、アルファベット以外は薄くオーバーしてるかも)
少し小さめに録音すれば、抜ける予感がするので、試してみます。

ファンの音に慣れすぎて、中の人にもノイズフィルターがかかってる気がしてきましたw
慣れって怖いですね。

1249:2009/06/17(水) 01:37:50 ID:H1Dto6Hs0
>>116
おお>>87さん。発音指導頼りにしてます。
特に母音につられて変化しやすい子音とかありますかね?
次回の録音ではとりあえず /j/ /w/ /r\/ + 母音の各音と以下の「二重母音」を追加してみようと思ってるんですが

E@r I@r O@r U@r A@r

>>119
なるほどー
自分の声で基準音を作るわけですね。ためになります。ありがとうございます。
そして普段からのボイトレも了解しました。まずは発音練習ぐらいは毎日続けてみようと思います。
今日実験してみてわかったんですが、安定して息が続かないのが今一番の弱点っぽいんで何とか改善を試みてみます。

>>121
イメトレ了解。iTunes StoreでAmazing Graceを色々聴いてみたらちょっと発声の目標がはっきりした気がする。
スペイン語対応って言ってたっけw

>>122
いらっしゃいませ。キハ22さんのトリトンでテトの本気を見たおかげで今こんな活動をしてたりします。
無声子音onlyの話は「息.wav」とかを扱うためのテクニックとして飴屋さんのblogでも読んだ気がするんですが、ちょっとすぐに記事が出てきませんでした。

二重母音の方はちょうど自分も /A:i:/ 的な音を実験してみたところです。
>>112の本によると「二重母音は後半でピッチが下がりやすいけど、頑張って最後まで一定のピッチで声出せ」だそうなんで、それを目標にしました。

普通の英会話的二重母音はこんな風にピッチもパワーもダラ下がり。
http://u9.getuploader.com/utaou/download/84/diphthong-bOI.png

頑張ってピッチとパワーを維持してみるとこんな感じ(今はこれが精一杯)
http://u9.getuploader.com/utaou/download/85/diphthong-OI.png

下の画像のような音で、 /O:I:/ の /I:/ の発音が安定すれば、前を切っても後ろを切ってもUTAU的には扱いやすいんじゃないかと。
これがうまく行けば>>102の課題は解決できそうな気がする。
それが歌として聴けるものになるかどうかはまた別の話なんで、とにかく色々実験するよ!

125魅亜:2009/06/17(水) 10:46:06 ID:gyJeKxm60
>>122
こちらこそお世話になってます。DOS/Windowsの世界にはとても疎いので助かりました。
MacやUnix系なら慣れてるのですが。

>二重母音
ああ、stpの存在をすっかり忘れてましたよ!
これで音符ごとでの先頭カットができましたね。

ただ、あれからもうちょっと考えた結果、
今は単体の/A/と滑らかにつながる/Ai:/が作れれば、(←実はとても難しい)
ユーザーの使い勝手的にはその方が簡単なんじゃないかと思っています。

この場合(音節先頭以外なら)
・先行発声=遷移完了時
・オーバーラップ=遷移開始直前
と設定しておけばノート長の設定だけで自在にタイミングコントロールできるので。

#LHZ 2009-6-13の原音調整も基本的にこれに近いコンセプト。

>子音終わり
無音後にダミー母音を入れるのは無声子音単体とか息とかでもうすでに大量に使ってますw
気にしているのはたとえば/iS/ ('finish'の'ish')みたいなやつで、
譜割りの上では「/i:/で伸ばしてノートの最後に/S/」になってほしいパターンです。
原音がどうあれ音符単位の各種調整で作れるのは作れるんですが、一番いい原音はどういう形かなあと。

>>123
ちなみに私はSM57に洗濯ネットかぶせて斜め上から当てました。
ケーナ録る時のマイクの当て方で、声に正面から当ててないのはNGですが
そのへんは声量でカバーw

>>124
>声の安定
男性なら(肺活量と腹筋があるから)腹からちゃんと声出すだけでそこそこ安定すると思いますよー。

>スペイン語
readme.txtが読まれてないということはよく分かりましたw

>二重母音
ピッチ/パワー維持に集中し過ぎて弱母音が強い音に化けないように注意だ!
弱母音と短母音をUTAU向きに長く発声するのはすごく大変だ!(少なくとも私には)


……なんか「英語部」というより「音源のための発声練習スレ」になってる気がしてきたw

126キハ22:2009/06/17(水) 23:21:35 ID:uau/rZkc0
>>125
>気にしているのはたとえば/iS/ ('finish'の'ish')みたいなやつで、
>譜割りの上では「/i:/で伸ばしてノートの最後に/S/」になってほしいパターンです。
>原音がどうあれ音符単位の各種調整で作れるのは作れるんですが、一番いい原音はどういう形かなあと。

ああ、なるほどです。そのパターンは日本語の歌でも「てしま〜う」の「う」を丁度いいタイミングに
するなどの場合に微調整が要るので、まして末尾が子音となると手間が省けないだろうな、と思います。

このパターンを簡単にするには、将来のバージョンのUTAUで、前が可変部・後が固定部、
先行発声とオーバーラップのタイミングを右ブランクからの時間で指定する音符が使える
ようになるのに期待、という感じでしょうか。


それと、ついでというか、将来、休符もUSTファイルの
  [#SETTING]
セクションに指定されたシンボルが休符を表す、指定が無ければ「R」が休符、みたいな
仕様に変われば、「R」以外でも、その歌の中に出てこないシンボルを選択してセットする
ことで休符を表現できるようになるかも知れません。

今のUTAUは休符が「音源に R.wav が無いことによる音抜け」に近かった初期の仕様を
一部ながら引き継いでいて、最新の 0.2.43でも音源に R.wav を置けば休符が鳴ります。
でも将来は「休符はシンボルに対応する音源が存在しても無音」に変わるかも知れません。
そのタイミングで「R」以外のシンボルを休符に使えるようになればいいかもです。

このあたり、音源の仕様検討などと対応したかたちで、英語部から飴屋/菖蒲さんに将来の
バージョンのUTAUの仕様を要望するのはやってもいいように思います。

1279:2009/06/20(土) 22:28:28 ID:mgFOGmv60
/a:I:/ 的な定ピッチ定パワーの二重母音で音源更新してみました。
音質が揃わなくなるんでよくないやり方だけど、お手軽に一部の原音のみ再収録差し替えで。

 ttp://u9.getuploader.com/utaou/download/90/9loid-monophone-20090620.zip

遷移位置の調整は>>122で教えて頂いたstpで。とりあえずAmazing Graceを歌わせてる限りでは
特に破綻無く他の音とつながってくれる感じ。

 ttp://u9.getuploader.com/utaou/download/91/9loid-20090620-amazing-grace.mp3

速いテンポの曲向けには速い遷移の原音が必要なのか? とか、stp設定自動化とか発声練習法とかの問題は残ってるけど、
UTAUで二重母音を扱うための方式としての有効性自体は確認できたと思うんで、他の課題に行ってみます。

今のとこ、以下の順に進める事を考えてます。
全部片付いたら英語音源作成マニュアルとかまとめてみたいなあ(気が早い)

・テトで単音合成の再実験。「さ」と「s + あ」の違いを波形等で確認してみる
・/@r/と/3r:/のR音声母音も/aI/等の二重母音と同じように扱ってみたけど、これで問題ないか?
・/j/ /w/ /r\/ + 母音の合成で、単音合成とdiphone合成でどれぐらい差が出るか確認
・/N/の実験色々
・/h/ /m/ /n/ + 母音の合成で、単音合成とdiphone合成でどれぐらい差が出るか確認

12887:2009/06/21(日) 01:41:45 ID:6C9jY7r.0
>>124
私も「正確な」発音ができるとは限らないので、その点はご了承を。
(間違って覚えている単語もありますし・・・)

>母音につられる子音
どの子音も、若干の変化があると思いますが、iが後ろに来ると、引きずられやすいかも。

せっかくなので、意識して同じ音が出せるか試してみました。
あ、か、さ・・・と試してみると、k絡みの音だけは、頑張っても同じ発音ができないようです。
他は意識すれば同じ音が出せそうです。

あと、/r\/は普通に発音すると、変化しやすい感じがします。

>>127
音源更新分について、音リストで、似たような音を順に、ぷちぷちとクリックしながら聞いてみました。
以下、気になったところを。

単母音と二重母音で、少し音が変化している気がします。
・aI→少しε寄りのようです
・OI、(I)→少しu寄りのようです
・aU、oU→uに近いようです

その他
・T→日本語の「つ」が混ざっているようです

>>125
>発声練習スレ
確かに。でも重要なことですし。


スクリーンはストッキングで作るのが良いらしいですね。

とりあえず手近なところで、スピーカーグリル(メッシュの)を外してきて、
手持ちで試してみました。2枚重ねで、ある程度ポップは消えるようです。
気を抜くと、マイクに擦ってしまうのが難点w

あと、たまにはマイクを分解清掃したほうが良いみたいですね。
金属っぽい音と聞いて、もしや・・とばらしてみたら、砂鉄らしきものが。
どこから入ったのかは謎ですが、音は復活した感じです。


>>中の人
発音記号が思い出せなくなった時用に張ってみたり。
wiki(X-SAMPA、文字一覧)
http://ja.wikipedia.org/wiki/X-SAMPA
Phonetics: The sounds of American English
http://www.uiowa.edu/~acadtech/phonetics/english/frameset.html

1299:2009/06/21(日) 23:00:37 ID:GL/nSqLg0
>>128
毎度参考になる情報ありがとうございます。
特に/k/はノーマークだったんで、今後の実験の時に気にしてみますね。

発音確認もどうもです。やっぱり全体的に日本語の楽な発音に引きずられてる音が多いですね。
ひとまず /bu:::t/ と /bU:::k/ 、 /hi:::t/ と /hI:::t/ あたりで発音し分けと短母音伸ばしの練習を続けてみます。

130魅亜:2009/06/22(月) 15:48:00 ID:PEso9IM20
>>126
なるほど、休符に使う記号をUST内で指定できるように拡張するというのは
悪くないアイデアですね。
表示や内部処理で微妙な問題はありそうな気がしますが、
(違う文字を休符に指定したUSTを続けて開いたときとか)
提案してみる価値はありそうです。

私の方は「音名に使えない文字」の逆用で' '(スペース)を休符に、とか
なんとなく考えてましたw

>>128
>母音につられる子音
母音の違い=口腔内の容積と形状の違い なので、
口腔より奥(=喉)で発音し、かつ発音時点ですでに口腔が母音形状になっている
破裂音が一番影響を受ける、と理由をこじつけてみましたが信じないようにw

日本語の場合イ段の子音は硬口蓋化音に変化するから、その癖が残ってると
ますますイ段だけ違う子音になってしまうと思います。

週末に追加録音しようと思ったもののあまりにも声が別人だったので
diphoneの方は進展なしですー。

1319:2009/06/22(月) 22:18:06 ID:hmS0ajtc0
"Handbook of the International Phonetic Association" を読んでたら、
今まで疑問だった事がさらっと説明されてたんで引用。

PART 1 Introduction to the IPA より:
> 4 The phonemic principle
> ...
> In general, the symbol for a phoneme will be an unmodified letter of the
> IPA, but letters may also be combined to make a phoneme symbol (for
> instance /tʃ/, as at the beginning and end of English church;
> if necessary the phonological unity of the two segments can be shown by
> a tie bar: /t͡ʃ/).

「必要なら」/t͡ʃ/と書いてもいいよとの事なんで、UTAU関連では/tʃ/と書くほうがいいかな。
発音辞書や音声学関係の本でもほとんど見かけない表記だし、X-SAMPAとの相互変換も簡単な方がいいかと。


Appendix 1 "The Principles of the International Phonetic Association" より:
> 6 The Association recommends that a phonetic transcription should be
> enclosed in square brackets []. A transcription that notes only
> phonological contrasts may be enclosed in slanted lines or slashes //.

こっちはこのスレに来てる人には常識だったかもしれないけど、自分はなかなか定義が見つけられなかった。
音声学的な発音の差を論じる場合のみ//で囲み、音や単語をIPAで表現したいだけなら[h]や[hi:t]のように[]で囲むのが正しいと。
同じ本の中で[]と//が使い分けられてたりする理由がやっとわかったよ。
…今調べたら"A COURSE IN PHONETICS"の方にも同じような説明があったw

132名無しさん@wavファイル作成中:2009/06/22(月) 22:42:44 ID:PEso9IM20
>>131
前者は「複数文字で1音素」なものについて「ここはまとめて1音素」マークするための規則ですね。
本当に必要な場合としてはドイツ語のentschuldigen (許す)あたりが該当します。
この単語、ent-で切れるので、[ent-Suldigen](エントシュルディゲン)なんですが、[entSuldigen]としてしまうと[ent-\Suldigen](エンチュルディゲン)と区別できません。
(余談ですがドイツ語の発音規則でも'tsch'は/tS/なので切れ目を知らないと読み違えます。)

後者はonlyのかかり先がずれてるような。notesじゃなくてphonologicalにかかるから、
「音声学的な発音の差だけを問題にしている場合には//もあり」
かと。
このスレ的にはほとんど//になるんじゃないかなと思います。

1339:2009/06/22(月) 23:45:04 ID:hmS0ajtc0
>>132
うわはずかしい。訂正ありがとうございました。
タイが必要な場面も言われてみればなるほどですね。音素ばかり見てると思い当たりませんでした。

1349:2009/06/24(水) 01:33:17 ID:W4CeuaTQ0
テト単音合成を再度実験してみましたよ。

前回うまく合成できなかった「s + あ → さ」について、「さ.wav」と波形を比べたり切り貼りしてみたところ、
摩擦音の「s」の発声が終わった後から「あ」の安定した発音に移行するまでのつなぎ部分の期間の母音が重要な模様。

具体的にはLite081222版音源の「さ」の41ms地点から70.5ms地点間の音を「s」と「あ」の間に
切り貼りしてやると「さ」に聞こえるようになった。
これは摩擦音が終わった直後に出始めた母音の、F0で数えて10波分ぐらいの音。
単体で聞くと「ら」と「た」の中間のような音に聞こえる。

「s」は英語歌詞お助け音源の s.wav を適当に切り出してボリューム調整しただけ。
「あ」もLite081222版から安定部分の音を切り出しただけ。
これ以外は何もせずAudacityで切り貼りしただけなんで、ピッチ調整やオーバーラップ等もなし。

やっぱり>>111で言われたように中間音が必要なのか、それともエンベロープやピッチでごまかせるのかはまだ不明。
単音合成の限界を見極めるためにも重要なんで、もうちょっと実験してみます。

135魅亜:2009/06/24(水) 10:44:55 ID:A3R/Lxpw0
>>134
まだ思いつき段階なんだけど、ニュートラルな曖昧母音[@]をくっつけた
[s@]となら強母音[a][o]もちょっとはマシにつながらないかな?
[i][M][u][e]あたりについては母音部分をカットしちゃう方向で。

こっちはこれを音素数を減らす手段として検討中。
前回の仮録音での実験結果を踏まえて全部音素準備したら1,300音コースになったのでw

13687:2009/06/24(水) 19:05:17 ID:S13vlXAA0
>>134
日本語の「さ」→「す」の最初の部分+「た」(最初を少しフェード)で作ってみました
試作品:
http://ux.getuploader.com/utau_a5/download/5/utau_a5_5.zip

・最初から母音と組んである方が楽かも
とはいっても、組み合わせ数が・・・

>>118
6/15版はリサンプラーにはじかれていたようなので、
原音を保存しなおしてみました。
ヌコ:
http://ux.getuploader.com/utau_a5/download/3/utau_a5_3.zip

実験してみた感想
・長い音は危険
・周波数を平らに維持したほうが良いかも(ロボ声の原因)


母音の実験:
http://ux.getuploader.com/utau_a5/download/4/utau_a5_4.zip

・アクセントをどう扱うか、考えたほうが良い?
・通常の発音からすると、周波数をフラットに維持するのは不自然かも
・短めの音の方が、UTAU上で扱いやすい気がしてきました

137魅亜:2009/06/25(木) 23:48:29 ID:QB/uToos0
この週末に英語(を中心とした外国語)の音素を再録して、
diphone音源の試作品part2を作ろうと思っています。

前回と同じものを作っても意味がないので、今回は今のところ次のような方針を
考えています。(Wikipedia: 英語学を参照した結果)

前回 (>>114) の試作音源をテストしてくださった方が
どれくらいいらっしゃるか分かりませんが、
再録音に当たってコメント・アドバイスなどありましたらいただけると
大変ありがたいです。

- 日本語音素についてもX-SAMPAファイル名
-- どんなものか見てもらうため、あえて日本語の使い勝手を捨ててみます。
- 単母音は可能な限り長母音で録音
- 単母音は13種 ([i] [e] [E] [{] [I] [@] [U] [V] [u] [o] [O] [A] [Q])
- 二重母音は8種 ([eI] [@U] [AI] [AU] [OI] [I@] [e@] [U@])
- 二重母音は両方長音で録り前をカット
- 子音→二重母音は廃止(二重母音の変音タイミングが制御できない)
-- 単母音→二重母音がしっかりつながることが前提
- 鼻音からの[-j]は単母音13種展開?
- 破裂音・摩擦音・破擦音からの[-r] [-j]は単母音13種展開?
-- 全部やったら1000音コース (+300) だったので、とりあえず[-ju]のみ入れる
- 破擦音単体を追加
- 母音→子音は母音も長く録っておく(将来末尾固定ができるようになったとき
のため)
-- これも全子音でやったら1000音コース (+260) なのでやめておく
-- 従前通り接近音[-l] [-r] [-j] [-w]のみ
-- [-l]は強引に長音化する
-- [-r]は[-r@]で録り後ろをカット
-- [-j]は[-ji]で録り後ろをカット
-- [-w]は[-wu]で録り後ろをカット
-- [-N]は後半に無音を入れてそこを可変部に

ちなみに現在のところ収録予定の音数は970あります。喉もつのか心配w

138名無しさん@wavファイル作成中:2009/06/26(金) 00:17:42 ID:CSq295Ao0
ほほう、首実験超乙。

っ ぬるい真水
っ リップクリーム
っ (始める前と終わった後にのど飴)

自分は単語⇔発音の変換とかがないと、試作音源テストも出来ないので、指を咥えて眺めてますね(´・ω・`)

1399:2009/06/26(金) 12:50:37 ID:m5oUbLPwO
ドナーktkr
いま母音の練習用にまとめてる単語集があるんで、帰ったら詳細出しますね。
よかったら使用感教えて下さい。

そして魅亜さんも乙です。
帰ったらまた書きますが、/@`/ /3`/ の扱いはどうする予定ですか?

140魅亜:2009/06/26(金) 19:19:07 ID:GLzHbfYk0
せっかく萌々子さんが数多くても頑張るって言ってくれてるのに
実験台が音数けちってどうする、と思い直して接近音がらみの二重子音とか
ちゃんと展開して全部録ることにしました。調音不能なのだけ除外。
絶対英語になさそうな音がいっぱいあるけど、前回よりは読みやすいw

現在英語だけで999音。いい数だ。
(これでもfestvoxのところ>>100にあるサンプル数1,349よりはだいぶ少ない)

ちなみに日本語は184、スペイン語は240です。もはや誤差だw
やっぱゲルマン語すげえ。ドイツ語がどうなるかは考えたくもない。
(単体母音が14種、さらに英語よりはるかに二重子音が多い)

>>139
母音+接近音は語末にくることが多いので、後ろに無音入れて切っちゃう予定です。
[@`]なら[@] + [r\] + 無音、という感じで。
こうすれば(前のノートの)ノート長を調整するだけで正しい位置に
音の変化タイミングが持ってこれるはず。

リエゾンとかでR性母音のあとにさらに母音がくるパターンは非対応です。
2回変音するので、適切なタイミングが取れません。
[r\]で接続できればいいんですが、>>111に書いたようにうまくいかない。
([l][w][j]も同様)

1419:2009/06/27(土) 02:10:02 ID:XsRAOCV20
>>140
/@`/ は /3`/ みたいな単体の母音扱いでは収録はしない?
自分はつい最近までR音性母音を二重音だと誤解してたんで、まだ明確に必要性を判断できるレベルじゃないんですが。

それからGAの発音の解説を見てると /ɨ/ (daisy, duty, carryのy) と /tˬ/ (waterのt、tの真下に修飾記号が来る。本当は/ɾ/が正しい?)が
よく入ってるんですが、実験用のおまけ的に適当なシーケンスで一音づつぐらい収録してもらえないでしょうか?

あとは英語で実際に使われてる /N/ の前後の母音の組み合わせとかについて前に調べた情報を補足しようと思ってたんですが、
男前の全部入り仕様では不要ですねw 無理せず頑張れ!

142魅亜:2009/06/27(土) 12:13:26 ID:NmRuocqo0
録音リストの最新版を上げてみました。
(OpenOffice原版、Excelエクスポート、OREMO用reclist.txt)
http://ux.getuploader.com/utau_a5/download/6/utau_a5_6.zip

>>141
自分の発音の癖からして、/@:r\/ = /@`(r\)/, /3:r\/ = /3`(r\)/みたいになって
前半切り取ればR性母音になってると思いますw

/1/は難しそう。絶対にアクセントのないほとんど無声の短母音で子音の直後にしかこないので……
ちょっと考えてみます。
"flap t"は日本語のラ行のひとつで入れてる/4/じゃだめですか?
この音で発音してるんですけどw

/N/は後ろが母音でありさえすればただの鼻濁音なので、/g/と/j/+母音と合わせればいいかなと。

今日録音するには最大の敵は気温だ、たぶん。(空調なしで部屋閉め切るから)

1439:2009/06/27(土) 14:40:45 ID:XsRAOCV20
>>141
録音リスト見てみました。これだけ/4/がサポートされてれば申し分ないですw
その他の発音についても了解しました。/1/は自分がどんな音だか把握できてないだけなんで、
他の作業に差し支えるようだったら無視しちゃって下さい。
今頃録音中ですかねー。体調に気をつけて。

>>139で書いた母音練習用リストもまとめてみたけど、よく見たら>>138の人は中の人としての
献体志望じゃなくてustいじりの事を言ってただけですね。早とちりすいません。

でもせっかく作ったんで貼ってみますよ。
いずれは中の人向け音源作成資料としてまとめてみたいんで、感想なんかあったらお願いします。
普段英語を話さない人でも、ある程度使える英語音源を作れるようになる事を目標にしてます。
まだ自分が実証できてないんで説得力ないですが、一週間ほど練習を続けてみた感触は悪くないです。

1449:2009/06/27(土) 14:41:55 ID:XsRAOCV20
■ 前母音→中央母音
[hiːːːt] (heat) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38630&offset=18
[hɪːːːt] (hit) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38733&offset=518
[heːːːd] (head) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38604&offset=1928
[hæːːːt] (hat) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38580&offset=168
[haːːːɪd] (hide) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38697&offset=984
[hɑːːːt] (hot) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38819&offset=1742
[hʌːːːm] (hum) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38851&offset=16
[hɝːːːt] (hurt) ttp://www.excite.co.jp/dictionary/english_japanese/?block=38873&offset=210

■ 後母音→中央母音
[buːːːt] (boot) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35395&offset=1818
[bʊːːːk] (book) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35386&offset=1916
[boːːːʊn] (bone) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35379&offset=772
[bɔːːːt] (bought) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35419&offset=1760
[bɑːːːr] (bar) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35050&offset=1060
[bʌːːːs] (bus) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35579&offset=560
[bɝːːːd] (bird) ttp://www.excite.co.jp/dictionary/english_japanese/?block=35257&offset=1660

1459:2009/06/27(土) 14:42:40 ID:XsRAOCV20
・最初の「子音+母音」の部分で母音間の発音の差と伸ばした発声を練習するためのもの
・音の違和感に気付きやすくし、発音の目標を示すため、よく聞く機会のある実在の単語で構成
・リスト順に発声を繰り返す事で、隣り合った調音位置の母音を発音し分ける練習をする
・最初は英会話的に普通の単語として発音を練習し、慣れてきたら母音の後をだんだん[ːːː]のように伸ばして原音向けの安定発声練習も兼ねる

・各単語に付記してあるURLからサンプル音声をダウンロードし、リスト順に再生されるようにプレイリスト等を作成する
・無料でサンプル音声のダウンロードが可能で、比較的安定した発音の辞書サイトを選んだ
・なるべく似た声の人がサンプル音声を担当している単語を選んだ
・本当は [boːːːʊn] (bone) ではなく [boːːːʊt] (boat) を使いたかったけど、この辞書だとサンプル音声が女声になって一貫性がなくなるんで断念
・耳でお手本を聴きながら同時発声すると、発音ミスに気付きやすい
・手間かけられる人は、無音期間追加等で一定間隔で発音されるようにするとリズミカルになっていいかも

・後母音を/b/始まりにしているのは、唇の丸めに移行しやすくするため
・前母音を/h/始まりにしているのは、予め唇を開いて母音の調声位置にしておくのと、息をうまく吐く練習のため
・子音始まりの単語を使っているのはglottal attack(日本語だと何て言うの?)の抑制も兼ねる
・弱母音と二重母音は別途練習した方がいいと思われるので含めていない
・[haːːːɪd] (hide) と [boːːːʊn] (bone) は二重母音を含んでいるけど、始めの母音を練習するのが目的なので、母音間の遷移には神経質にならなくてよい
・/e/ と /ɛ/ の発音を区別している辞書が有償・無償とも見つからなかったので、 /e/ に統合。アメリカ英語はこれで大丈夫らしい?

146魅亜:2009/06/27(土) 22:34:26 ID:NmRuocqo0
実はまだ録ってなかったりw
窓閉め切ったら生命の危険を感じる室温になったので。
(PCのファンの音も大きくなってマイクに入るようになったし)

明日は気温が下がる予報なので、それに備えて主に母音のチェック中。
>>144-145は実に乙であります。ちなみに私は普段からLDOCE愛用なのでそこの発音サンプルを参考にしてます。
http://www.longmanwebdict.com/

[e]と[E]は円唇側のペア[2]と[9]でははっきり違うので(ドイツ語öの短母音と長母音)
そこからの類推で違いは分かるのですが[E]が[e]と[{]の間で安定しませんー。
(これで区別する単語があるとは思えないから縮退させてもいい気がする)
同様に[V][O]もなかなか同じ発声にならないですね。[Q]なら安定するのにw
人間が喋る分には問題ないですがUTAU音源としては致命的。

>[1]
LDOCE onlineとかヰキペディアのサンプル聴いても、dutyのyってこの音じゃない気がするんですがw
http://ja.wikipedia.org/wiki/%E9%9D%9E%E5%86%86%E5%94%87%E4%B8%AD%E8%88%8C%E7%8B%AD%E6%AF%8D%E9%9F%B3
自分は丁寧に読んだら[i]、早く読んだら[I]で発音してるっぽい。

>flap t
英語のflap tって後続[@][3`]だけのような印象があるけど他あるかな?

本来は(母音→母音がつながる前提で)「母音(一瞬)→子音→母音(長)」の
音素列で録るのがベストなんじゃないかと思い始めたけど
最適化しても現実的な数になる気がしないw

147魅亜:2009/06/28(日) 19:45:38 ID:YlWy6mys0
一日かけても録音おわんねーw

喉の調子がよくなくて音質は前回にもまして残念なことになってます、すいません。

1489:2009/06/28(日) 20:33:14 ID:BuyvWQNk0
おつかれさまです。さすがに1000音はしんどそうですねw
こんな時こそのど飴?

>>146
そこのサイトだと一部の単語しか音声が聞けないみたいですね。残念。
音声自体は手元にあるLPDのCD-ROMに収録のものと同一だった。
自分は検索アプリの出来がちょっとだけマシなCEPDの方をよく使うんだけど、
そのうちちゃんと比較評価してみた方がいいかな。

>/1/
ますますわかんなくなったw
サンプルとして挙げた単語は>>112の本に書いてあったんだけど、歌うとき特有の置き換えなのかも?

>flap t
[4I]はCEPDのアプリが音を上げるぐらいには大量にある模様。
あとは[4V][4A][4O]が数個だけ(getupとかcutoffとか)。[43`]は無かった。
単音合成版の方に追加収録するとしたら[4@][4@`][4I]だけかな。
[4V]を含むgetupとsetupはよく歌詞に出てきそうな上に英語っぽさの決め手になりそうなんだけど、
[4@]のエンベロープいじりでなんとかなるかなと。

149魅亜:2009/06/28(日) 22:51:32 ID:YlWy6mys0
終わりがようやく見えてきたところで時間切れ。
日英合わせて290MB録って終わらないってどんだけww
ここから多少削っても一日で録り切るのかなり厳しい量ですね。
喉が絶好調ならなんとかいけるかな……?

母音(>>148のflap tやR性含む)で終わるパターンは全部入ってて、残りは子音で終わるパターンの半分くらいという状態ですが、
この状態でも需要あります? (前回のと合わせれば数だけはだいたい揃う)
追録して残りが揃うのは早くて来週末、原音設定はさらに先になっちゃうので。

#今回母音ごとに束ねて録ってるので、1ファイルに複数音入ってます。

1509:2009/06/29(月) 00:05:44 ID:ujV2Hse60
>>149
乙です

自分は各音をファイルに切り出した段階で一度出してもらえると実験に使えてありがたいです。
以下の各音は単音合成版の音源でもdiphoneとして扱わないと厳しいか? の判定に使いたいんで。
原音設定は無くてOKです。

 /4/ /r\/ /w/ /j/ /N/ /h/

ほかにも課題は山ほどあるんで、自分は特に急ぎというわけではないです。
作業を進めてて出せる段階になったらの話でお願いしますー

1519:2009/06/29(月) 00:28:30 ID:ujV2Hse60
>>136
反応遅くなってすいません。「すた」で見事に「さ」に聞こえますね。
「た」そのものをsにつなげてみる発想は無かったんですごく参考になりました。

じゃあその「た」の最初の部分てどんな音なの?
というわけで、「すた」「さ」「た」「あ」の各音のスペクトラムを比較してみました。
選択部分が>>134で言ってる部分の音です。
http://ux.getuploader.com/utau_a5/download/7/utau_a5_7.png

粗くて見づらいけど、選択部分に存在する2k付近のフォルマントが、安定した「あ」になると4k付近に移行している?
このフォルマントの移行が無いと「さ」に聞こえない?
テトの「あ」は結構急速に立ち上がるけど、このエンベロープは影響しているのか?
9loidではなぜ[s]+[V]等が直結でもうまくいく?

と、これぐらい調べてみれば色々謎も解けるんじゃないかと。

152魅亜:2009/06/29(月) 01:55:59 ID:m7ohCVUc0
>>150
とりあえず録音生データ&音リスト&OREMO用reclist群を公開。
(〜7/13 0:00)
ttp://www1.axfc.net/uploader/K/so/44003.zip&key=utau
大変大きい (229MB) ので注意。

複数音収録のもの(ファイル名がX-SAMPAじゃないもの)は先頭にダミーで母音が一回入れてある。(発音などを揃えるためのリファレンス)
たまに発音し忘れてるのがあるので注意w

英語のほうは区切って発音してるので、WavDividerで簡単に切り出せるはず。

/4/は英語用はもともと単音で切れてる、日本語用はja-flap01*.wav
/r\/は単体子音としてはen-approximant01*.wav、ほかに破裂音と複合子音扱いでen-plosive*.wavにほぼ全部いる。
/w/ /j/も同様に単体子音としてはen-approximant01*.wav
/N/はen-nasal02*.wav
/h/(英語用)はen-fricative05*.wavの最後にいる。

明日以降時間が取れたら切り出しもやってみるかも。

153魅亜:2009/06/29(月) 02:05:20 ID:m7ohCVUc0
音リスト一覧部分だけここのロダに上げました。
http://ux.getuploader.com/utau_a5/download/8/utau_a5_8.zip

154魅亜:2009/06/30(火) 23:07:03 ID:LcJ9TkH60
連投スマソ 切り分け完了しました。
ttp://www1.axfc.net/uploader/B/so/41030.zip&key=utau
(184MB)

英語1,002音、日本語205音の合計1,207音あります。

ただし日本語は連続発声してる箇所が多いので分割位置が怪しいです。
また、声質がひどいので不足分の追録はしません。(改めて録り直します)

1559:2009/07/01(水) 01:50:40 ID:FRWU4m5k0
>>154
乙です
ちょうどダウンロード終わったとこで新版リリースw
ありがたく使わせて頂きます。

[wO]の波形を見ながら色々部分再生してみたところ、

・3波目までのエンベロープが無いと英語っぽい[w]にならない(「ぅお」的な意味で)

・4波目〜9波目ぐらいまではもう後続の[o]と同じぐらいの振幅になっているけど、
 4波目以降だけを再生しても一応[wO]には聞こえる。10波目ぐらいからだと[o]になる。
 したがって、人間の耳はエンベロープだけでなくフォルマントの違いも聞き取って[wO]と認識している

・[wO][w@][wI]の波形を比べてみると、どうも2波目ぐらいの時点でもう後続の母音の波形
 (F0とF1あたり?)が現れてるっぽいので、やっぱり半母音は母音との組み合わせで録らないと厳しい?

と簡単に調べてみたとこで時間切れ。またあした。

1569:2009/07/02(木) 01:26:10 ID:dFsbOgVA0
>>154
[j] [w] [ɹ]始まりの各音の波形を見たり部分再生したりして、大いに参考にさせてもらいました。ありがとうございました。
こいつらはやっぱり単音合成じゃ難しそうなんで、diphoneとのハイブリッド構成を試してみようと思います。

今週末あたりに以下のような音を収録しようと考えてます。何か気付いた点などあったらぜひご指摘を。

■ 今回録音の目標
・[j] [w] [ɹ] [h] を子音→母音のdiphoneとして効果を確かめる
・[l] [m] [n] は単音合成できているが、子音→母音のdiphoneとして違いを確かめる
・[ŋ] は 母音→子音 及び 子音→母音 のdiphoneとして効果を確かめる。ただし実際に英語で使われている組み合わせに限る
・原音のキーが低くてごまかされてる部分がありそうなので、少し音程を上げてみる

■ monophones
母音(14): i ɪ e æ a u ʊ o ɔ ɑ ʌ ɝ ə ɚ
破裂・摩擦系無声子音(8): p t k tʃ f θ s ʃ
破裂・摩擦系有声子音(8): b d ɡ dʒ v ð z ʒ
半母音等(4): j w ɹ h
鼻音等(4): l m n ŋ
計38音

■ diphones
二重母音1(5): eɪ aɪ aʊ oʊ ɔɪ
半母音等→母音(4*14): j w ɹ h
鼻音等→母音(3*14): l m n
母音→鼻濁音(1*7): ɪŋ æŋ ɑŋ ʌŋ ɔŋ eŋ əŋ
鼻濁音→母音(1*3): ŋɪ ŋɚ ŋə
計113音

■ 発音練習不足なので今回は録らない
二重母音2(5): ɪɚ ɛɚ ʊɚ ɔɚ ɑɚ
flap t→母音(1*4): ɾɪ ɾɚ ɾə ɾʌ
計9音

157魅亜:2009/07/02(木) 01:57:09 ID:O1C2UZHI0
あんな音源でも役に立てているようでありがたいです。
diphoneから減らしていく私のアプローチとmonophoneから増やしていくそちらのアプローチ、どこかで出会うといいですね。

こっちで音数を激増させている大きな要因は「子音+接近音」の複合子音なので、
そこが分離できるならインパクトが大きいと思います。
なので[pr]とか[kl]とか[sw]とか、そのへんが行けそうかどうかチェックしてはどうでしょうか。

あとは>>135で触れた、[s@] + [a]で[sa]が作れないか?もそちらには意味があるのではないでしょうか。
(こっちは最初から[sa]用意しちゃうので意味がない)

1589:2009/07/02(木) 20:30:14 ID:dFsbOgVA0
>>156から削ったメモの出番が来た!

--------
・[s] を 子音→母音 及び 母音→子音 のdiphoneとして録り、各種実験に使う(>>135とか)

■ 実験用diphones
摩擦音→母音(1*14): s
母音→摩擦音(1*14): s
計28音
--------

これは今回の音源作成とは同時にやらなくてもいいだろと思ったんで、また別の日に録るつもりです。
>>135はナイスアイディアなんで心の実験予定リストにはバッチリ入ってますw 反応薄くてすいません

・「い」がよくつながる
・「え」もなんとかつながる
・「あ」と「お」がつながらない

という現象も、[s]との調音位置が遠いほど長く特徴的な中間音が発生していると考えれば、辻褄は合いますね。
実際、自分で「さ」をすごくゆっくり発声してみると、「すぇあ」みたいな音になるんで、[s@]方式には期待してます。

音源方式は調和できるといいですねえ。気軽に作れる簡易版と、高品質な本格版である程度互換がとれると嬉しいですね。
ひとまず音素名やファイル名を魅亜さん式に合わせてみますよ。

15987:2009/07/02(木) 23:58:37 ID:Kh7Nknnw0
>>151
反応遅くなりました。

す+た=さ の件
「さ」を部分再生すると、す+た+あ になると思います。
た→あ の移行は放っておいても成立するので、
「す」と「た」を繋げると「さ」になります。
「た」が現れるのは、日本語の場合なので、英語だと異なる組み合わせかも。
(録音してばらしてみるのが早いですが)

「すぇあ」→San FranciscoのSanですね。

・テトの場合
英語音源の「s」がホワイトノイズ状態(色が着いていない)ので、
人間の耳には、音声として識別されにくいのだと思います。
→「す」を使った理由

「あ」は、立ち上がりが強いので、す+あ とすると、
2音として認識されると思います。

2音として認識されてしまうのは、よく聞こえる帯域(4KHz付近)が強いのもあるかもしれませんね。
→等ラウドネス曲線
http://ja.wikipedia.org/wiki/%E7%AD%89%E3%83%A9%E3%82%A6%E3%83%89%E3%83%8D%E3%82%B9%E6%9B%B2%E7%B7%9A

この4KHz付近がテト声の特徴だったり、英語と相性が良かったりするのですが、
母音同士の結合や、子音との結合が難しくなる原因にもなっていると思います。

ということで、2重母音等を作る場合は、立ち上がりの弱い、結合専用の母音を置くと良いのかも
しれません。
(3KHz付近を落としたら行けるかもしれませんが、歌用の音にはならなそうなので)

160魅亜:2009/07/03(金) 10:51:42 ID:8fQbg4Og0
>>158
音素名/ファイル名などはこちらもまだ試行錯誤中なんで
アドバイスや提案いただけると助かります。

今はen/ja/esで共通しているため重複する音をどこにどう置くかなどが課題です。
(母音の発声を揃えるため個別に録ってるのでダブる。混ぜるのは危険か?)
単音程ならディレクトリ分ければいいですが、ここにさらに音程分けが入るとNG。

英語の音数はフルセット1,103(GenAmに限定して[e][E]縮退させれば951)、
複合子音を省略したミディ版で515に落ち着いてきました。
(複合子音の単体をどれだけ入れるかで多少増減)
>9さんのが最終的に200〜250音前後に落ち着いてくれば
数の面ではいい感じに住み分けられそうですね。

>>159
> 「さ」を部分再生すると、す+た+あ になると思います。
あれ?そうなの? と思ってしばらく試してみたけど、
もしかして>87氏は「さ」を[Ta]か[tsa]っぽく発音してるのかな。
私は(録音聞けば分かるけど)[sa]で発音してるからゆっくりにすると
[s-@-a]か[s-z-@-a]みたいになります。
>9氏は[s-{-a]になるようですね。
ニホンゴムツカシイネ

この辺中の人の癖に合わせたチューニングが必要だと大変なので
そうならないといいですね。

#話ずれるけど、こうした子音バリエーションを複数入れてるからうちの音リストは
日本語がなぜか200音超えてます。「さ」は[sa]だけですがw

> 立ち上がりの弱い、結合専用の母音
>>94あたりでも触れられてますが、多くの音で音節先頭用と中間/末尾用で
複数の原音設定を準備する必要があると思っています。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板