したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

UTAU@英語部

1 ◆MXLuneV63k:2009/05/11(月) 23:42:45 ID:ZPReuwhc0
深いこと考えずに、英語の歌を歌わせたりとか、UIの英語への翻訳とか、放り投げてくといいよ!

2 ◆MXLuneV63k:2009/05/11(月) 23:50:49 ID:ZPReuwhc0
というわけで唐突に始めました。

とりあえず有志によるUIフロントエンド英語翻訳版
http://u9.getuploader.com/utaou/download/23/utaou_uljp00157.txt

英語の母音・子音一覧
http://www.linkage-club.co.jp/entry/hatsuonkigo.html

さっき拾ったアルファベット70音メソッド
http://www.hatsuonkigou.com/

英語版ボカロ「MIRIAM」デモページ ※発音できる音の制限等がありますが英語部のヒントになれば。
http://www.crypton.co.jp/mp/do/prod?id=24930

後何があればいいんだ?

3名無しさん@wavファイル作成中:2009/05/12(火) 00:29:38 ID:yLiYxqxk0
耳ロボPが英語詞にチャレンジした曲、重音テト tries to sing a short fairy tale が参考になるかな?
サイトでustも公開してるし。

重音テト tries to sing a short fairy tale
http://www.nicovideo.jp/watch/nm4279726

4名無しさん@wavファイル作成中:2009/05/12(火) 00:51:46 ID:1seVbvn60
英語圏のユーザとの交流についてもこのスレで?

5名無しさん@wavファイル作成中:2009/05/12(火) 01:07:41 ID:kARxNqW.0
英語圏の人をここに招いてってこと?

通訳・翻訳職人さんがくるなら出来るんじゃね?
でもなければ、エキサイト先生VS海外のエキサイト的な先生とのセッションの場になるような気がしないでもないwww

それはそれでカオスになりそうだけど、やってみようかwwwwww

6名無しさん@wavファイル作成中:2009/05/12(火) 11:25:23 ID:9ioyPm0U0
それなら「訳文をつけていただいて結構ですが、英語も添えるようにして下さい」って注釈を付けておかないと大惨事になる予感ww

こんな感じ?
When you post here, please don't forget to write in English. Though you can append Japanese translation, in many cases computer-translated Japanese is hard to understand. so, your post written only in (computer-translated) Japanese may get incomprehensible...
ここに書き込む際は、英語で書き込むことを忘れないで下さい。和訳を付けても構いませんが、偉大なるエキサイト大先生の訳した日本語は分かりにくいことが多いです。なので、(エキサイト先生の訳した)日本語の書き込みは理解不能になるかも知れません。


……あ、でもそもそも英語ネイティブでない人が、海外のエキサイト先生に訳してもらった英語を持ち込んでくることも考えないといけない?w

7名無しさん@wavファイル作成中:2009/05/12(火) 13:50:25 ID:k4ttOVg2O
や、流石にそこまではカバーしなくて良いでしょw

一応これでも日本による海外支援とかの関係で、外国語に日本語を勉強する国もあることだし。このスレは英語部だしw

8名無しさん@wavファイル作成中:2009/05/13(水) 00:25:48 ID:jXKt/LE20
まあ英語であればだれか読めるでしょう。
スラングとか専門用語山盛りでない限り。

9名無しさん@wavファイル作成中:2009/05/13(水) 21:06:56 ID:kE2zpRoc0
お邪魔します。英語部ができたとテトスレで聞いてきました。

テトに英語で歌ってもらうにはどうしたらいいのか調べ始めたところなんで、
よかったらここで情報交換させてください。門外漢なんで基本的な事がわかってません。

とりあえず今はこの文書で英語音声合成の基本を雰囲気だけ勉強中です。難しい。
http://www.festvox.org/festvox/festvox_toc.html

10名無しさん@wavファイル作成中:2009/05/13(水) 22:01:23 ID:WJ/JBm2s0
合成エンジンと入力I/Fが現行のUTAUだという前提だと、
音声合成理論を追求してもあまり役に立たないかも(w
支援プラグイン作るには有用か……

SNSのほうでもちょっと話題も出てるけど、
「どんな音素を揃えたらいいのか」と同じくらい
「その音素をどんな名前で表記・入力したらいいのか」が難題だったりするw

11名無しさん@wavファイル作成中:2009/05/13(水) 22:04:58 ID:jXKt/LE20
すでに日本語でもだいぶ揺れがあるもんな鼻濁音とか無声化音とかで

一個のシンガーだけを使うなら、わかりさえすれば何でもいいんだろうけど
ustを使いまわすようなことを考えると統一がとれてるほうが便利だよな

12名無しさん@wavファイル作成中:2009/05/13(水) 23:58:01 ID:kE2zpRoc0
ああよかったちゃんと部員がいた。先輩方よろしくw

確かにustの共通化は大事だね。でもまずはどうすれば英語っぽい歌声を合成できるかを
絞り込めるといいなあ。先人の築き上げた財産から頂けるものは頂きたい。
根気が続けば実験ぐらいまではやってみたいなあ。

13名無しさん@wavファイル作成中:2009/05/13(水) 23:59:10 ID:kE2zpRoc0
というわけで今日のお勉強結果まとめ。

・英語音声合成は基本的に、補助情報無しのテキストから自然な読み上げを実現する事を目的に
 している。UATUとかVocaloidから見ると全自動HANASUジェネレータ的なちょっとオーバー
 スペックな技術。いかに文脈を汲んだニュアンスを自動付加するかが重要視されてるっぽい。
 でも英語テキストから発音記号とかへの変換には流用できそう。

・英語音声合成にも色々方式が有るけど、UTAU的なソフトで扱うにはdiphone合成という方式が
 向いてるような気がする。これは2つの音素のつながり部分の音を断片として持っておいて、
 それを切り貼りする事で滑らかな音を実現するらしい。

 参考:
 http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90#.E9.80.A3.E7.B5.90.E7.9A.84.E5.90.88.E6.88.90
 ttp://coral.lili.uni-bielefeld.de/Classes/Winter98/ExPhon/GourlayList/HTML/index.html

・diphone合成に必要な断片のセットは、数時間のナンセンスワードの収録と、切り出し支援
 プログラムを使った数時間の調整でとりあえずは揃うらしい。ほんとか?

 参考:
 ttp://www.festvox.org/festvox/c3610.html

14名無しさん@wavファイル作成中:2009/05/13(水) 23:59:58 ID:kE2zpRoc0
まずは既存のdiphone合成用の断片から歌声っぽいものを生成できるかの実験が必要なのかな。

先人は結構実用的な英語歌声合成プログラムを作り上げたようだけど、研究資金が尽きて
ソース未公開のまま終了してしまったらしい。残念すぎる…

Flinger
ttp://cslu.cse.ogi.edu/tts/flinger/

デモ曲ページ
ttp://speech.bme.ogi.edu/cgi-bin/flinger/show_jukebox.pl?all

15名無しさん@wavファイル作成中:2009/05/14(木) 00:53:07 ID:UnbNClO60
>>13
見てて思ったんだけど、このナンセンスワード、日本人が区別して発音するのムリじゃね?www

16名無しさん@wavファイル作成中:2009/05/14(木) 00:58:40 ID:mny0bhrI0
>>15
UTAUを使っているのも中の人をやっているのも日本人だけじゃないわけで・・・

17名無しさん@wavファイル作成中:2009/05/14(木) 01:02:41 ID:UnbNClO60
>>16
まあそうだけど、たとえば>>13の人は>>9
>テトに英語で歌ってもらうには
って書いてる訳だし。

勿論英語でUTAUための手法を確立すれば英語圏の中の人が収録して本格的英語音源ができるって流れも期待できるけど、既存の(日本人)音源の拡張としてとらえると難しそうじゃないですかね?w

18名無しさん@wavファイル作成中:2009/05/14(木) 08:03:12 ID:E2JvkgZkO
>>16

オールではないにしろ、作者は日本語を使う(おそらく)日本人だし
使い手でここにくる多数派も日本人

テキストみてめまいがしたのは私だけじゃないはずだww

19シン:2009/05/14(木) 16:05:41 ID:J84e6jtc0
 子音+母音+子音の英語を発声させるためには、今のUTAUでは子音+母音と子音+母音で発声させて、最後の母音を消すしか方法が無い。
 伸縮させない領域が音声の終わり部分にもあれば簡単なんですけどね。
 英語音声ライブラリの製作には、膨大な時間がかかるけど。
http://brettkessler.com/RelSoundLetMono/OVC-alignments
 英語の音節は、此処が参考になります。

20名無しさん@wavファイル作成中:2009/05/14(木) 22:22:42 ID:oX.aNDNg0
固定範囲が頭に固定なのは仕様らしいので無理。

21名無しさん@wavファイル作成中:2009/05/14(木) 22:43:22 ID:l2xN1QjM0
音素の組み立てを人力で行うUTAUの場合、子音単体の音素を用意しておけば
実用的には問題ないんじゃないかな>末尾子音
純粋なdiphone合成として自動化・一般化しようとすると大変だけど。

22名無しさん@wavファイル作成中:2009/05/14(木) 22:55:51 ID:lJ/WFsJs0
流れ的には、英語を発音できるライブラリの作成。
英語の歌詞を入力→音素に分解
UTAUに流し込む
後は今と一緒
こんな感じかな。
子音+母音+子音なんかも子音だけの音素があれば、母音のあとに子音を
結合してやればOK。
やっぱりネックは、ライブラリの作成とUTAUにもっていったあとの仕上げの
部分。英語の発音を聞き取れないと歌わせるの無理ww

http://u9.getuploader.com/utaou/download/42/%E3%81%92%E3%81%99%E3%81%A8%E3%81%82%E3%81%99%E3%81%8D%E3%81%99.mp3

これでいいのか判断がつかないww

23名無しさん@wavファイル作成中:2009/05/14(木) 23:54:50 ID:oWNs.caA0
賑わってるw

>>19
ですよね。日本語でも「あーふれだーす」とUTAわせる時には「す」の母音を消して「あs」的な音を
作ったりしてたのを後から思い出しました。でも自分にはかなり面倒だったんで、事前に合成済みの
「あs」が欲しいと思ったりしました。

思いつきだけど、母音+子音を全部固定範囲にしたらそれっぽく使えないですかね?
例えば "good" を伸ばして歌わせる時は gooooo(母音引き伸ばし) + od(全固定) とかで。

資料もどうもです。参考になります。これ全部辞書に音声入ってるかな…

>>22
英語っぽいど
UTAU編集画面のスクショ希望

24名無しさん@wavファイル作成中:2009/05/15(金) 00:08:42 ID:0FEq/.qU0
全部固定範囲は長さが足りないとエラー起こすから調節が難しい。
ついでにgoodは「od」じゃなくて「ud」じゃ?

2523:2009/05/15(金) 00:22:12 ID:5gBM6Nrc0
>>24
なるほど。そうそううまくいかないか。
発音記号はまだよくわかってないんで見逃してください…

2622:2009/05/15(金) 00:29:58 ID:ZkzyBjpc0
>>23

http://u9.getuploader.com/utaou/download/43/%E3%81%92%E3%81%99%E3%81%A8%E3%81%82%E3%81%99%E3%81%8D%E3%81%99.jpg

夢こわして悪いけど、英語は次の単語につながる発音になるから単語そのまま
一音にしてもだめだと思う。
goodとgood-dayはおんなじgood使えない。

2726:2009/05/15(金) 22:12:23 ID:ZkzyBjpc0
すまん
歌だとgood dayで2音にしてるほうが多いね。
っていうかGood dayを1音にしちゃうのはオーストラリア訛りでした。
26の発言は忘れてくだされ。

28名無しさん@wavファイル作成中:2009/05/18(月) 16:07:29 ID:RozJI1Tw0
英語は単語単位で考えると意味が通じなくなるかも。
(聞くほうは、フレーズ単位で区切ると思うので)

同じ単語でも、地域とか訛りとかニュアンスとかで発音が変わってくるかと。
good dayだと、
ぐぅ〜〜でぇぃ (男の人とかが、親しい人に)
ぐっ でぃ (元気に)
ぐ(っ)だぁぃ(オーストラリア訛りっぽく)
ぐぅー(で)ぇぃ (女の人が、優しく 「で」のあたり、弱めで)

イメージ伝わるといいけど・・・・

原音に発音記号補正っぽい何か(↓とか↑みたいなもの)を入れておくのが良いかも。

29シン:2009/05/19(火) 16:28:44 ID:022TU0Lg0
 カタカナ英語13の法則
http://www.geocities.jp/anishigu2003/hatuon2.html
 これなんか参考になる。発音記号で考えていた事の大半が表現されている。

30名無しさん@wavファイル作成中:2009/05/19(火) 17:35:00 ID:mDRA.IZw0
「英語の発音は皆目だめ」な人が(特にUTAUのI/Fと日本語音源で)それっぽく歌わせるには
いい参考にできそうだね。
……しかし、弱母音系(/@/とか)の表現は相当無理してるなw

私もデフォ子に"there"って言わせようとしてどえらく苦労した挙げ句挫折したが。

31名無しさん@wavファイル作成中:2009/05/19(火) 21:10:31 ID:whO2HwYs0
そういえば常識かもしれないが、子音同士も母音結合風にくっつけられるよ。
俺は前「ちゃ」の音がない音源の「ち」と「や」混ぜて「ちゃ」って言わせた事があります。
どうしても間延びしちゃう時はテンポを結合する音だけ短くするとかで解決します。
英語の微妙な発音とかも、それでわりと作れるんじゃないかな。

32シン:2009/05/20(水) 03:21:22 ID:/4wWNNFI0
 以前から研究していた、FL Studio 8 のスピーチシンセを音声ライブラリとしてUTAUに歌わせる実験、結構良い感じに仕上がりました。
http://shin20070212.up.seesaa.net/music/UTAU_FLStudio8_AmazingGrace.mp3
こんな感じ。この歌だけのライブラリを用意して歌わせた。
 基本的には>>19方式です。

3323:2009/05/22(金) 01:11:40 ID:0RSGd9mM0
>>26-28
混乱させちゃってすまんです。自分はdiphone合成の方向を探ってるんで[go][od]と2つの
断片をくっつけるイメージだったんだけど、その断片がどういう発音記号で表されるかが
わかってなかったのでした。ちゃんと書かなきゃ伝わらないですね。
発音と英語表記が一致しないとこまでは理解大丈夫です。

英語部に来といて発音記号わかりませんというのも情けないんで、ちょっと勉強してまとめてみました。
付け焼き刃の知識なのと、わかりやすさ優先で用語が不正確なところがあるんで注意。
間違ってたら突っ込みよろしく。

3423:2009/05/22(金) 01:12:13 ID:0RSGd9mM0
・英語の発音記号の種類
 伝統的に辞書によってまちまちの表記だったけど、徐々に標準規格のIPAに移行している。
 どの記号がどの音を表すかはサンプルの単語をいくつか挙げて示す事が多い。
 http://en.wikipedia.org/wiki/Pronunciation_respelling_for_English

・IPA (International Phonetic Alphabet, 国際音声記号)
 あらゆる言語の音声を表記可能な発音記号。英語ではそのうちの一部だけを使う。
 http://en.wikipedia.org/wiki/International_Phonetic_Alphabet
 http://en.wikipedia.org/wiki/Help:IPA_for_English

・X-SAMPA (Extended Speech Assessment Methods Phonetic Alphabet)
 IPAで定義されている各発音記号をASCII文字だけで代替表現するための表記ルール。
 ユニコードが使える環境なら基本的にはIPAを使った方が便利だけど、ASCII文字だけの方が
 入力や判別が楽な場合があるので使われる。
 http://en.wikipedia.org/wiki/X-SAMPA

・日本で使われている発音記号
 >>2の母音・子音一覧が日本では一般的な気がするけど、bookのuとかは一般的な英語のIPA表現とは非互換。
 手元の辞書ではプログレッシブ英和・和英中辞典が>>2と同じ感じの表記。
 研究社英和・和英中辞典はIPAのアルファベットに>>2と同じアクセント表記を組み合わせたもの。
 ちなみにPCに入ってるNew Oxford American Dictionaryは伝統的な発音記号とIPAを選択可能だった。

 アクセント記号は、IPAでは ,into'nation (発音は無視してアクセントだけ見てね)
 みたいな感じでアルファベットと独立した文字として表記されるんで、アルファベットの上に
 アクセント記号が載ってるのを見慣れてると違和感覚える人もいるかも。

3523:2009/05/22(金) 01:13:05 ID:0RSGd9mM0
英語テキストから発音記号への変換用辞書とか、将来的に英語LOIDが実現可能になった時のための
発音記号セットの標準化とかの話題もあるんだけど、ひとまず今日はここまでで。おやすみなさい。

>>32
なめらかですねー
専用ライブラリというのは、他の歌を歌わせるには原音の種類が足りないって事ですか?

36シン:2009/05/22(金) 07:23:35 ID:5XQVE6EE0
>>32
 その通りです。ただ、追加するなら、最初から作るより楽になります。
 手元にスピーチシンセサイザーがある人向けです。

37名無しさん@wavファイル作成中:2009/05/22(金) 12:15:20 ID:lY7qry/w0
>>34-35
そこは私が先々週あたりに通った道だ! (近いな)

やってみると分かるけど、
・(事実上)音素名=ファイル名の制約がある
・音のリストはファイル名の辞書順
を解決しないと、ちょっと実用に耐えない状態になるよ(w

38名無しさん@wavファイル作成中:2009/05/22(金) 15:38:15 ID:n4sURWlIO
>>37

っ エイリアスで、一括したIPAの指定
っ 原音ファイル名の頭にナンバリング


そう言うわけで
>>35
一括して日本語音素→IPA エイリアス指定のみ済んだoto.iniのテンプレとか
並び替え用ファイル名一覧とかあればいいかも試練と言って見るテスト

39名無しさん@wavファイル作成中:2009/05/22(金) 16:12:56 ID:lY7qry/w0
>>38
それじゃ上手くいかない、と思ってから気づいたが、もしかして
・日本語のかな部分はそのまま「あ.wav」みたいに残す
・日本語にない音だけIPA系の表記
というやり方を想定してる?
(だとすると最終文が逆な気もするが)

私は日本語の音素も全部IPA系で作る前提で話してたから食い違ってるかも。

・1原音に設定できるエイリアスは1つ→IPA (X-SAMPA)表記をエイリアスに使うとかなで使えなくなる
 (個人用途なら複製すればいいが、配布用となると原音設定で混乱する元になる)
・どのIPA音素にどの番号を振るべきなのか?
 (そもそも「正しい」順序は何なのか?)

がネックになると考えた。

試験的に作ってみたものは手元にある。X-SAMPA表記で、以下のルールで作成。
・かな−IPAマッピングはボーカフォネティック(たしかAnn)準拠
ttp://vocaphonetic.web.fc2.com/index.html
・ファイル名がX-SAMPA
・ファイル名に使えない文字があるので、記号類一括して"+" + ASCIIコードでエンコード

ついでに日本語ファイル名の音素にX-SAMPAエイリアス設定したのもつけて
(ボーカフォネティックのファイルからスクリプトで生成)上げてみた。
ttp://u9.getuploader.com/utaou/download/53/oto_X-SAMPA.zip

40名無しさん@wavファイル作成中:2009/05/22(金) 23:52:25 ID:0RSGd9mM0
>>37
先輩乙っす!
とりあえずそう変な方向に進んでない事がわかって安心したw

今こっちはFestivalというフリーの音声合成ソフトを使って英文テキストから
発音記号への変換ができるようになってきたとこです。アクセントとか音節の
区切り情報も付けられるんで、お手軽に英語っぽく歌わせるのに役立つかも

41魅亜:2009/05/23(土) 14:16:25 ID:.LkPTxvw0
そういえば報告するのを忘れていました。
飴屋氏ブログに掲載されたUTAUメニューのリソースを英訳したものを
互助会ロダに置かせていただきました。

ttp://u9.getuploader.com/utaou/download/54/res_EN.zip
(互助会内ならh抜く必要はないか……)

添削歓迎。

ちなみに海外だけど日英西3ヶ国語対応を目指してる音源があるので個人的に応援中。
ttp://www.youtube.com/user/gaticaeitan
まさかの「描いてみた」出身音源(w

42Kirk:2009/05/23(土) 17:15:13 ID:EonzGg6w0
皆様はじめまして。
不注意から、告知無しで互助会のアップローダーを使用してしまいました。

問題点(ソースという単語の取り違え等々)山積みの状態ですが、私的に
作成しておりましたパンフレットを投稿致しております

ttp://u9.getuploader.com/utaou/download/58/How+To+Create+your+own+UTAU+voice+data+set+Rev0.3.pdf

これは、オリジナルの"UTAU"音源データセットの作り方を書いた(つもり)の
パンフレットです。
翻訳ソフトの力を借りた、超下手糞な英文もどきですが、完成すれば海外の
同好の方々のお役に立てると思います。

諸先輩方の、暖かい御指導を賜りたく存じます。
どうか宜しく御願い申し上げます。

43Kirk:2009/05/23(土) 19:44:45 ID:EonzGg6w0
先刻御知らせ致しました、"UTAU"音源データセットの作り方パンフレットを若干修正致しました。
未完成ですので、他所のアップローダーに上げました。
評価を宜しく御願い申し上げます。

http://www1.axfc.net/uploader/File/so/24011.pdf&key=utau

44名無しさん@wavファイル作成中:2009/05/24(日) 23:58:56 ID:Gi4qktkw0
>>43
おつかれさまです。力作ですね。
大した協力もできませんがさらっとだけ見てみました。

・"precedence utterance" → "preutterance"の方がいいかもです

・overlapは[Te][To]の[To]側のパラメータだと強調するとUTAU初心者に優しいと思います

・先行発声とオーバラップを両方使ったら[Te]が[To]側に食い込むケースも載せると理解しやすいかもです

あとはファイル作成ステップの各タイトルはcreateよりmakeぐらいのほうが大変な作業な感じが減るかもしれません

45魅亜:2009/05/25(月) 00:13:37 ID:GEeSINT60
ごめんちょっとリアルの方が忙しくてあまりじっくり腰を据えて読めそうにないんだが、メニュー項目や各種UTAU用語の翻訳をすり合わせたい。
例えば音源(ファイルセット)はvoice bankと呼ばれてることの方が多いっぽいとか。(Google調べ)

このスレでやるとスレの私物化みたいに見られそうな危惧もあるけど
直メールでやった方がいい?
(それはそれで「陰でやるな」と言われそうだ)

46名無しさん@wavファイル作成中:2009/05/25(月) 00:49:03 ID:80O2WXpw0
このスレでやらんでどうするの

むしろついでに海外の動向とか知れてありがたい
スペイン語音源ができてるなんて全然知らなかったし。UTAUすげえなあ

47Kirk:2009/05/26(火) 00:05:40 ID:BYaz2CY20
>>44

>・"precedence utterance" → "preutterance"の方がいいかもです

確かに!短くて良いですね!

>・overlapは[Te][To]の[To]側のパラメータだと強調するとUTAU初心者に優しいと思います

なるほど…、ぱっと見分かりにくいかもしれません。
一応、先行発音とオーバーラップを併用している例も有るのですけど、図が分かり辛いですね。
早速、図の改良に取り掛かりましょう。

あと、create -> makeの件も感謝です。そこまでは頭が回りませんでした。

>>魅亜様と46様

語彙の件は同感です。
"UTAU"の専門用語やダイアログ名を事前に統一した方が良さそうです。
訳者ごとに言葉が違ったら、読まれた方々が混乱してしまいますしね…。

46様が仰るとおり、この機会にここでオープンに用語を統一してそれを公開出来れば、皆様が
他のマニュアルやパンフレット(調声テクニック等々)を作成される時に有効活用できます。
それに、専門用語をどう訳すかで時間を浪費する分を、もっと有意義な作業に回せます。

今回のパンフは、"UTAU"の調声どころか英語もろくに出来ない私が、海外に出来た友人の為、
ネット上で調査して作った物が元になっています。(重音テトの話題がきっかけで…)ですから、
私は二重の意味で初心者です。用語の誤解等も多々ある物と思われます。ですから、今後の
サポートも伏して御願い申し上げます。

今後のバージョンには、この掲示板の名を書き加えようと思います。そういえば…、この掲示板…、
英語名…どうしましょう?

48名無しさん@wavファイル作成中:2009/05/26(火) 00:55:01 ID:KXFSWWQo0
>>43
おつかれさまです。
まだ拾い読み状態ですが、気になるところを。(細かくてすみません)

・Warning
All "UTAU" user has to observe
→All "UTAU" users have to follow ...

observeだと、見るだけ(で守らなくて良い)と解釈されるので。
英語圏に拠点を置く法人の、TOS(Terms of service)やEULA(End user license agreement)を参考にすると良いかもしれません。

requestも「守って欲しい」(絶対ではない)になるので、整合性を持たせたほうが良さそうです。
real singer's ...の部分は、人間の声を使ってはいけない感じがするので、without permissionなどを付けると分かりやすいかも。

・let's begin →let's start

・Step1. Create “~.wav” files.
→()の中身がタイトルに使われているので、Step1. Create phoneme wave files の方が良いのでは?

・dataとdatum
細かい所ですが、data:複数形、datum:単数形の使い分けが必要かも。

・milli second → millisecond(ひとつの単語)

・日本語の文字の使用:フォントを埋め込むか、画像で

・This is all fictitious information...
→Data in this example are dummies. Don't take them seriously. あたりで。

・Finally your voice data set was accomplished.
→Finally your voice data set are (now) accomplished.


>>45
glossaryがあるとよいかと。
単語なら、みんなで整備しやすいはず。

49魅亜:2009/05/26(火) 22:01:01 ID:GU1s1QfQ0
ちょっと時間が取れたので手を入れてみた。
思うままに書き直していったら残った部分のほうが少ない勢いになったw

http://u9.getuploader.com/utaou/download/61/UTAU_voice_bank_HOWTO.txt
迷ったところや分からなかったところ、大幅に変えた箇所の変更理由などは全部文中に()で書き込んだ。
参考になるだろうか。

中に書かなかったコメントは「本文中のパラメータ名はslantにするなどして分かりやすく」くらいかな。

あと、UTAUに""つけるかどうかはこんな風に使い分けてみた。
"UTAU" → UTAU.exe + 音源(+ユーザー文化)
UTAU → UTAU.exe本体


>>48
こんな感じで用語を考えてみたがどうだろう?

日本語 → English

音源・原音ファイルセット → voice bank
原音ファイル → phoneme (wave) file
原音・音素 → phoneme(厳密には違う。moraのほうが近いがこれも正確ではない ex. 君は実に馬鹿だな.wav)
中の人 → voice (bank) owner
先行発声 → pre-utterance
オーバーラップ → (voice) overlap
詞 → lyric
キー → note number / step / tone(どれがいい?)
音量 → velocity
長さ(音符の) → gate

音符のパラメータ系はMIDIのパラメータ名とできるだけ合わせようとしたんだが、本文中で使うときの自然さとの兼ね合いが悩ましい。

50名無しさん@wavファイル作成中:2009/05/26(火) 23:40:55 ID:9cYOJMZ60
>>49
乙です

原音はvoice fragment (file)ぐらいの低レベル表現に留めておいた方が何にでも当てはまっていいかも
phonemeとかmoraとか言い出すと、その単位で音を作らなきゃいけないと誤解されるかもしれん

51名無しさん@wavファイル作成中:2009/05/26(火) 23:58:26 ID:9cYOJMZ60
あとvoice bankは配布単位を指すならvoice package、1個の歌手としての識別が重要ならsinger add-onとか
考えてみたけど、voice bankってもうかなり定着してるっぽいね

52名無しさん@wavファイル作成中:2009/05/27(水) 01:19:43 ID:6BnHGLfI0
>>49
おおーお疲れ様です。
俺も気になっていたのだけど手がつけられなかった。

>>47
乙でした
えと、>>49氏のリライトをベースに、全体的な構成とかは精査できてないけど
ひとまず上から素読みして気付いたところだけチェック入れてみました
http://u9.getuploader.com/utaou/download/62/utau-voice-bank-howto-diff1.txt
行数は>>49氏のテキストでの行数です
※UTF-8N、改行コードLFなので、見れない人もいるかも?

>>49氏の指摘と合わせて、何か参考になれば。

53名無しさん@wavファイル作成中:2009/05/27(水) 01:33:20 ID:6BnHGLfI0
音量はUTAU的にはIntensity?
長さはDurationだっけ?

原音はvoice file、voice tip、single voiceとかもありそう?

54Kirk:2009/05/27(水) 02:20:45 ID:4LgNbz4Y0
魅亜様、そして匿名の皆様方、有難う御座います。
今、終電で帰宅したばかりで、十分に把握できておりませんが、近日中に更新しようと思います。

>>48

>まだ拾い読み状態ですが、気になるところを。(細かくてすみません)

いえいえ、ドンドン突っ込んで下さいませ。
私のは、英文ですらないのですから…。(^_^;)
その点、魅亜様は(良い意味で)大胆です。
細かいニュアンスの違いが、恐ろしい差になりますね…。
やはり、私がやるべきではなかった様で…。orz....

一応、日本語フォントを埋め込む設定の筈だったのですが…、失敗した様です。
次回もう一度設定を見直してみます。

>>魅亜様

ほぼ完全に別物ですね。(勿論、良い意味でです。)
機械翻訳を手修正しただけの私とは、次元が違います。
いっその事、私の名を削除して、魅亜様の作品にしてしまった方が良いのかも…。Orz.....
実際、その方が読み易そうです。

ところで、このパンフレットを作成した当時の私のポリシーは、以下の様なものでした。

・自分が理解できていない操作や機能は書かない。
・なるべく、プラグイン等に頼らず、"UTAU"単体でできる手段を用いる。
・隠し機能は使わない。(∵いつかその機能が無くなるかもしれない)

今、"UTAU"に挑戦されている海外の方々は、読めないUIと格闘されている
事でしょう。それならば、初心者である私と同程度の操作しかできないだ
ろうと踏んだ訳です。ですから、慣れている方なら便利なプラグインや隠し機能で
華麗にできる操作であっても、敢えて回りくどくダサい方法で処理しております。
また、回路図であれ、Verilogであれ(私の本職は電子回路設計です)、エイリアスは
使用法を誤ると始末に終えません。"UTAU"であっても、慣れないうちは使わせない
方が良いと考えておりました。

"prefix.map"の(意図不明。なぜ?)については、データ作成者自身もしくは利用者が、
そのデータセットを改良する時に、そのテンプレートと言うか叩き台として使えるのでは?と
思ったからです。

あと、"Introductory notes."は、「凡例」の訳語として、翻訳ソフトが出した物です。
恐らく、不適切な訳と思われます。

>(文意不明。両方指定するのはごく普通のことだと思うので、別のことを言わんとしている?)
これは、私自身がprefixとsuffixを同時に併用した事が無く、どうなるか自身をもてなかった
からです。

それ以外の数多くの御指摘についても、感謝致しております。

ところで、語彙についての私からの逆提案ですが、以下の物は如何でしょうか?
私自身がMIDI以前のCV/Gate方式の感覚を引きずっておりますので、現代の解釈とは合わないかもしれませんが…。

キー → note name (note No.では、数字表現を連想してしまうのでは?)
長さ(音符の) → (note) Length (gate timeでは、Step time中の実発音時間の意味になると思われます。)
中の人 → voice donner (中の人が、データ作者とは限らないので…。例えば、娘の声を親がデータ化とか…。)

55名無しさん@wavファイル作成中:2009/05/27(水) 02:37:26 ID:6BnHGLfI0
>>54
乙です。
gate timeについては、自信がなかったので黙っていましたが
私も同感です。やっぱりそうですよね。

56名無しさん@wavファイル作成中:2009/05/27(水) 06:27:32 ID:oh7zVf.g0
>>54
お言葉に甘えて、第2弾
>>49氏のリライト、>>52氏のdiff1にチェックを入れてみました。
(まだStep1までです)
http://u9.getuploader.com/utaou/download/63/utau-voice-bank-howto-diff2.txt

後半のtheとaの使い分けなど、気になる部分もありましたが、また今度。


日本語も混ざりそうですが、
キー(音名の意味で)→note name
キー(音高の意味で)→pitch とすると、ピッチエディターで苦労しそう・・・
キー(調の意味で)→tone

note# → MIDIではないので・・
step → ステップ入力など、時間方向のイメージが


中の人 → provider of voice ?
・ownerだと、voice bankの所有者(=UTAUユーザ)になるかも。
 ownerは、「物を」所有するイメージが強いので。
・donorだと、臓器提供者のような響き。

>>50氏の
原音(ファイル)→voice fragment (file) も良さげ(使いやすそう)


diff2に入れましたが、こんなページがありました。
(既出だったらごめんなさい)
http://utau.wikia.com/wiki/UTAUloids

57魅亜:2009/05/27(水) 12:26:34 ID:izZKV8r60
執筆者責任ということでコテハンご容赦。
それにしてもKirk氏は同業者だったのか(w

>HOWTO
>>52, >>56
校正感謝。やっぱり見直しせず書きっぱなしのリリースは駄目ですね。
だいたい指摘通りに直していいと思います。
diff1, l.346のユーザー側からの要望としてのreadme.txtは自分でも過去に同趣旨の発言をしてるのにすっかり失念してました。
ただdiff1, l.63-64の(↑↓などの音程表記について)"pitch"を当てるのは異議ありです。
>>56にもあるとおり、1音符/音素内のピッチ変動やピッチエディタでこの単語を使いたいので。

>oto.ini, prefix.mapの編集方法など
「UTAU本体で完結すべき」という方針は同意します。ただ、そのために.frq生成でバッチファイル作れというのは今どきのwindowsユーザにはハードル高すぎると思います。
隠し機能を使わないなら、
「セットに含まれる全音を使うUSTを作って、それをレンダリングしろ」
でいいのでは?

また、oto.ini, prefix.mapともエディタ直接編集の必要はなくUTAUの通常メニューとして編集できるので、そちらベースに直した方がいいと思います。
prefix.map編集ツールも充分直感的だと思うので、テンプレをあらかじめ準備する必要はないと思います。
(そもそも単音程の場合prefix.map書きようがないのでは。)


>glossary
ご意見多謝。
音量、長さは>>53のintensity, durationが誤解の余地なく簡潔で好きかな。

メニューの表記に使うので、訳語の長さにも配慮してくれると嬉しいです。
「キー」「原音」で特に悩んでる理由の一端がこれで、
短い上に登場回数が多いというw

#ボタン名やダイアログボックスなど、サイズ制約のある場所にもあちこち。


>UTAUloids
キャラ名/解説の微妙なずれっぷりが面白いw エイーチ!!

58名無しさん@wavファイル作成中:2009/05/27(水) 18:39:29 ID:rKVVWc3so
原音セット→voice bank
(1つの)原音→voice banknote
とか思い付きを言ってみる

59名無しさん@wavファイル作成中:2009/05/27(水) 20:08:12 ID:TYoKy.p60
>>57
UIの事は全然考えてなかった。すまんです

vocal fragment か phonic fragment あたりで frag とか phon を略称にするのはどうだろう
phonemeだと学術的な意味がかっちり固定されちゃうけど、phonicなら割と曖昧なまま使えそうだよ

60名無しさん@wavファイル作成中:2009/05/27(水) 23:37:49 ID:oh7zVf.g0
>>58
思いつきでよいなら、
原音セット→voice set
原音→voice
とか。
他に、(original) voice data, voice sourceなど。
(UIに使う場合、ユーザ環境で文字のDPI調整が入っていると、2単語だと文字が切れるかも・・・)

キー→key freq.、central freq.

>>59
fragは、flag、freqの誤記と間違われる可能性大かと。


英語は意外と圧縮率の低い言語なので、文字数が増えて困りますねw

61名無しさん@wavファイル作成中:2009/05/28(木) 00:21:58 ID:TrEv8GbEo
うーん、すでに定着してると思われるvoice bankは動かしたくないような…。

62名無しさん@wavファイル作成中:2009/05/28(木) 01:25:18 ID:QVElradA0
流れを無視して悪いけど、英文テキスト→発音記号の変換がそれっぽく動くようになったんでUnicode書き込みテスト

発音辞書とか音声学の本を色々読んでみたけど同じIPAを使ってても表記の揺れはどうしてもあるんで、
音源作者さん、UTAUユーザ、英語関連ツール作成者それぞれの立場からの擦り合わせは必須だと思った
そのうち暫定の母音・子音セット案をまとめてみたいと思うけど、既に作ってる人がいたりしたら晒してくれると嬉しい

下の変換出力で使ってる記号は暫定も暫定なんでそのつもりで。でも気になるところがあったら突っ込みよろしく。おやすみー

[ə m | ˈeɪ z | ə ŋ] [ˈɡ r eɪ s].
[ˈh aʊ] [ˈs w iː t] [ð ə] [ˈs aʊ n d].
[ˈð æ t] [ˈs eɪ v d] [ə] [ˈr e tʃ] [ˈl aɪ k] [ˈm iː].
[ˈaɪ] [ˈw ʌ n s] [ˈw ɑː z] [ˈl ɔː s t]
[ˈb ʌ t] [ˈn aʊ] [ˈæ m] [ˈf aʊ n d]
[ˈw ɑː z] [ˈb l aɪ n d]
[ˈb ʌ t] [ˈn aʊ] [ˈaɪ] [ˈs iː].

63名無しさん@wavファイル作成中:2009/05/28(木) 01:28:19 ID:0SCQRyvc0
voice bankの元は、sound bank(soundfontとかの)なのかな?

原音→voice sample(s)

UI用の訳は、同じ日本語でも画面によって異なる意味で使っている場合があるので、
画面か意味を付けておいたほうがよいかも。
(リソースを全部リストアップ+インデックス付けするのも手ですが・・・)

64名無しさん@wavファイル作成中:2009/05/28(木) 01:46:18 ID:0SCQRyvc0
>>62
乙です〜
うには環境(フォント)によって出ない文字がありませんか?
歌詞の打ちやすさや、ファイル名に使えるかも気になるところ。

(あと、ネイティブな話者が発音記号を覚えてるのかもw 国によって発音が変わるし・・)

英語以外の言語が増えないなら、(英語で)発音できない文字を識別用に挟むと良いのかも。
(日本語だとlとかxを小文字用に使う感じで)

65シン:2009/05/28(木) 02:56:42 ID:.6TsJO0E0
>>62
 X-SAMPA を使った方が、VOCALOIDユーザーにとっては都合か良いです。
[{ m eI z I N] [gh r eI s] [h aU] [s w i: t] [D @ s aU n d]
 Amazingを例にすると、[{][m e][eI][z I][I N]これらに分けられます。
問題なのは[I N]で、これは伸張しないで発声させた方が良さそうです。

66Kirk:2009/05/28(木) 19:12:07 ID:WKVPJwa20
もはや何の役にも立たないKirkです。

今、休憩時間です。
1徹で朦朧としている現実に、もう年だと自覚させられています。
昔は3徹でも平気だったのに…。

>>魅亜様

>それにしてもKirk氏は同業者だったのか(w

おやおや、貴兄もですか?

>「UTAU本体で完結すべき」という方針は同意します。ただ、…
>                    :
> 「セットに含まれる全音を使うUSTを作って、それをレンダリングしろ」
> でいいのでは?

確かに、そうなのかもしれません。
先日、新人の前でコマンドプロンプトを出して操作していたら、「それ何の
アプリですか?」ですからね…。

愚痴はともかく、全ての音を含んだ譜面を作れというのも、酷な話ですよね…。
既に音声ファイル作成で、地獄を見ている訳ですから…。
仰る通り、UTAUの隠し機能を使う路線に、切り替えるべきかもしれません。

> また、oto.ini, prefix.mapともエディタ直接編集の必要はなく…
>                    :
> テンプレをあらかじめ準備する必要はないと思います。

こちらは、私がその機能を存じておりませんでした。調査の上、その路線に
切り替えようと思います。でも、そうすると魅亜様や皆様の訳が無駄になり
そうで…。

>(そもそも単音程の場合prefix.map書きようがないのでは。)

全部、prefix,suffix無しという記述で良いのではないでしょうか?
尤も、UTAUで作れるのなら、それに任せる事にしましょう。

>> 皆様

原音(ファイル単体)→voice piece
は如何でしょう?

67名無しさん@wavファイル作成中:2009/05/29(金) 01:12:45 ID:205/8RFc0
反応どもです

>>64
フォントと文字コードには十分注意が必要ですね。Unicodeは表示時の見やすさが主目的で、
直に打ち込む事はあんまり想定してません。英文テキストやX-SAMPAからの変換を考えてます
自分的には英語以外のUTAUloidsもどんどん増えそうな気がするw

>>65
テーブルを切り替えればX-SAMPAも出力できるようになってます。まだ組み込んでませんが
[{][m e][eI][z I][I N]は>>32の原音パターンですか? すごい参考になります


とりあえず暫定のUTAU音源向け発音記号一覧をまとめてみたんで、ツッコミよろしくです
これだけ区別すれば英語に聞こえそうというだけで、これをそのまま原音にしてUTAえるかは未知数
実験の叩き台としてどうぞ

68名無しさん@wavファイル作成中:2009/05/29(金) 01:13:49 ID:205/8RFc0
■ 母音 (アメリカ英語)

短母音: ɪ e æ ʌ ʊ
長母音: iː uː ɑː ɔː
二重母音: eɪ aɪ ɔɪ oʊ aʊ
R音性母音: ɝː ɚ
弱母音: ə

※怪しい素人分類だからそのつもりでね!
※母音は資料により表記の揺れが激しい
※英語圏では i と ɪ 、 u と ʊ は区別して表記されるようになった。日本もそのうち追従するんじゃないかと
※ e は ɛ と表記される事もあるが、古いやり方らしい(Kenyon and Knott式?)
※ ɝː は hurt の ur で ɚ は mother の er
※短母音とは言うけど、UTAU向けには長い発声の原音が必要?
※二重母音とR音性母音は発声の終盤で音が変わるので、UTAUで使うには工夫が必要
※ aɪ aʊ の a はアホ毛付きのエー(ASCIIのa)
※ ɑː の ɑ は小文字のアルファ(ɑ U+0251 LATIN SMALL LETTER ALPHA)

69名無しさん@wavファイル作成中:2009/05/29(金) 01:23:09 ID:205/8RFc0
■ 子音 (アメリカ英語)

無声子音1: p t k tʃ f θ s ʃ
有声子音1: b d ɡ dʒ v ð z ʒ

無声子音2: h
有声子音2: r l j w
有声子音3: m n ŋ

※子音1は無声と有声でペアになっているもの。それ以外は単独。3は鼻音。勝手な分類だからそのつもりでね!
※子音は資料による表記のぶれはほとんどない。後述のrとフラップtが変わるぐらい
※英語の r は本当はIPA的には ɹ という音らしい。多言語対応を考えると ɹ と表記した方がいい? 要調査検討
※発音辞書では上記以外にフラップt (waterのtがrに変化した時の音)も区別されてる。要実験?
※ tʃ と dʒ は最新?のIPAでは t͡ʃ d͡ʒ と書くのが正しいらしい(上にスラーが付いてる)
※ ɡ は下側が釣り針型に開いた字形。o型に閉じた字形は認められない。必ずこの字形になる事を保証
 するために、専用の文字コード ɡ (U+0261 LATIN SMALL LETTER SCRIPT G)が用意されている。
 つまり、ASCIIのgでこの発音を表すのはアウト(X-SAMPAの場合はOK)

70名無しさん@wavファイル作成中:2009/05/29(金) 01:24:06 ID:205/8RFc0
■ 参考資料

CAMBRIDGE English Pronouncing Dictionary 17th ed.
LONGMAN Pronunciation Dictionary 3rd ed.
The CMU Pronouncing Dictionary (ttp://www.speech.cs.cmu.edu/cgi-bin/cmudict)
ファンダメンタル音声学
A COURSE IN PHONETICS 5th ed.
日本人のための英語音声学レッスン
新装版 英語音声学入門 (竹林滋・斎藤弘子)
英語音声学入門 (松坂ヒロシ)

※「ファンダメンタル音声学」は発音教本としても非常におすすめ。「この音を出すには舌や唇をどう
 コントロールしたらいいか」を理路整然とさっくり説明してくれる。自分でも発音し分けられそうな気がした

※発音辞書は上二つのどちらも一長一短あり。発音記号も一部違う。すまんがどちらが英語部の目的に
 合うかまだ判断がつかない。EPDの方は以下のPDFで発音記号の解説と本文サンプルが読める
 ttp://assets.cambridge.org/97805218/62301/frontmatter/9780521862301_frontmatter.pdf
 ttp://assets.cambridge.org/97805218/62301/excerpt/9780521862301_excerpt.pdf

71名無しさん@wavファイル作成中:2009/05/29(金) 01:49:18 ID:4kHNly1M0
>>66
> 全ての音を含んだ譜面を作れというのも、酷な話
いや、譜面というほどのこともなく、「あいうえおかきくけこ……」の歌詞で
音程も関係なく音符を羅列したUSTをレンダリングするだけだし。

もっと言えば、原音設定した時点で普通は.frqできてると思うしw

> 魅亜様や皆様の訳が無駄になりそう
いや、実は図のほうを差し替えるだけでほとんど大丈夫だったりw

>>67-70
よく調べたなあ、乙。
うちは実は英語歌わせないから(英語部にいるのにw)
ここまでは調べてなかった。

'r'は/r/にとっといてほしいな、そっちで使ってるからw
でもUTAU/Vocaloid的には/r`/の連打で代用できるからなくても大丈夫か。

……方言専用の音源ってのも面白いとか唐突に思いついた。
ラ行が巻いてる江戸っ子な音源とか(w

72シン:2009/05/29(金) 03:44:16 ID:oZx/cDZk0
>>67
 [i:]が抜けていました。正しくは、[{][m e][eI][z I][I][I N]です。とにかく面倒でした。
 具体的には[{]と[m e]が別な音符で[m e]が伸びて[eI]、[z I][i:][I N]と音符三つに割り振られます。
 基本的に一つの音符に一つの母音になります。場合によっては二重母音を二つの音符に分けなければならない事もあります([aI]などです)。


 日本語の発音は、
母音:a i M e o
子音:k k' K s S t tS ts n J h C p\ m m' j 4 4' w(M\) N N\ g g' dz dZ d d' b b' p p'
この他にも"i"や"M"の無声化"_i"、"_M"があります。
 ちなみに"M"(非円唇後舌狭母音)とは"u:"(円唇後舌狭母音)ではありません。

73名無しさん@wavファイル作成中:2009/05/29(金) 23:05:25 ID:ft7RSjow0
とりあえず紹介だけしてみようそうしよう。

http://www.nicovideo.jp/watch/sm3814210
日本語の発音(記号)を使って、(ボカロ1でしか使えないパラメータ弄って)英語を歌わせたもの
ボーーカロイドMIDIが公開されているので、参考になるといいなあ…
↑これで使ってる口の形を変化させる(縦方向と横方向)パラメータはないけど、原音を選んで(エンベロープを弄って)英語っぽく歌わせる事は出来ると思っているのだがどうだろう… う→rとか。
Cadenciiってボカロ1対応してたっけ?
一応試用版メイコさんhttp://www.crypton.co.jp/mp/do/prod?id=25220#

日本語部:http://www.nicovideo.jp/watch/sm1983881
初音の発音(発音記号の検証)
日本…語……部?http://www.nicovideo.jp/watch/sm3994128
英語部は見当たんなかったです><

http://www.nicovideo.jp/watch/sm6015683
拙作。 発音記号をtxtにしてみた:http://u9.getuploader.com/utaou/download/66/%E3%81%82%E3%81%84%E3%81%9A%E3%81%8A%E3%82%93%E3%81%BF%E3%83%BC%E3%80%80%E7%99%BA%E9%9F%B3%E8%A8%98%E5%8F%B7%E7%89%88.txt
英語版ボカロの真髄は、エディタに出てこない(でもおそらく搭載されてる)英語の単語集だと思われ

見易さを優先して、1つのノートに乗せているものは m-aI のようにくっつけた 
= で結んだものは別個のノートで1単語の発音をさせているもの (参考:http://www.vocaloid.com/jp/index.html

UTAU海外組にもし英語用音源を作ってもらうとしたら、子音全部+母音全部+特定の子音と結合すると発音の変わる母音の組み合わせ、となるような気がするんだがそれでおkかな?

74名無しさん@wavファイル作成中:2009/05/29(金) 23:46:43 ID:4kHNly1M0
ちょうどタイムリーに英語用音源きたよ(w
>>41にも書いた3ヶ国語音源、Camila Melodiaが公開されました。
http://camilamelodia.blogspot.com/

表記はIPA系じゃなくて英語・ローマ字系ですが、単音程なのに378音もあります。
ちなみに>>72の/M/と/u:/が両方入ってます。
よく中の人これ全部発音できたな……

75名無しさん@wavファイル作成中:2009/05/30(土) 02:17:30 ID:eCC/H6FE0
>>74
ざっと聞いてみました。
3カ国同時だと、作っているうちに言葉が混ざってしまうみたいですね^^

日本語のうち、おそらくローマ字で覚えた部分(だ行のあたり)が、予想した発音と異なるようです。
このあたり、海外組みに頼む時、説明が難しいかも。
(あと、は行のあたりが。)

76Kirk:2009/05/30(土) 22:33:28 ID:TBf2emtA0
やっと、徹夜勤務から開放されたKirkです。
共同開発していた某社のX氏が突如逃亡。しかも、補充要員が病欠と言う悪夢…。
これだから、共同開発は嫌なんだ…。まぁ、何とか間に合わせましたけど…。

それはさておき、"How to create your own Voice bank Rev.0.4"を目下作成中です。
魅亜様が仰ったとおり、UTAUの最新機能で設定ファイル群を作成する様、方針転換
する事にしました。

一応、私もUTAU Ver 0.2.41を導入していたのですが、「いつの間にこんな機能が?」と
いう状態です。流石は飴屋/菖蒲氏です。原作執筆当時にこの機能があったら、話は
もっと楽だったのですが…。

と言う訳で、今暫く時間を下さいませ。
でき次第、またアップロード致しますので…。

77Kirk:2009/05/31(日) 03:02:23 ID:XOl4RmXA0

お待たせ致しました。(誰も待っていなかったりして…)
"How To Create your own UTAU voice bank rev0.40"が出来ました。

線路にアップ致しましたので、DRCをよろしく御願い申し上げます。
ttp://u9.getuploader.com/utaou/download/72/How+To+Create+your+own+UTAU+voice+bank+rev0.40.pdf

78魅亜:2009/06/01(月) 22:28:41 ID:.xddhBd60
すいませんあと1月半の間に2製品テープアウトという修羅場なんで
他の方お願いしますー (国際共同開発、私はPJL)

79Kirk:2009/06/01(月) 23:29:03 ID:9ISRDCwA0
>>魅亜様

何と、今度は魅亜様が修羅場ですか?
お疲れ様です…。

>>皆様

今回は、かなり変更しておりますので、支援を宜しく御願い申し上げます。

80名無しさん@wavファイル作成中:2009/06/02(火) 00:29:28 ID:sksR2Cvs0
diff1を書いた者です
俺もちょっと今忙しいけど人手がないようなら近日中に見ますよー

81名無しさん@wavファイル作成中:2009/06/02(火) 00:41:44 ID:aCe.KlPE0
>>71
とりあえず/r/使い分けの需要がある事は了解です。何語音源ですかw

>>72-74
皆さん乙です。今は自分にやれる実験の方を優先してますが、そのうち参考にさせていただきます。

>>77
おつかれさまです。本当に申し訳程度ですが反応だけ。

・step indicator -> range indicatorとかの方がわかりやすいかも?
・you may use -> 別の柔らかい表現に
・these phoneme identifiers correspond to the note names you wrote in the lyricsとか何とか
・UI画面の説明には「ミリ秒」-> msecとかも付けてあげた方がよいかと
・Pre-UtteranceとOverlapの図と説明はすごくわかりやすくなりました。乙です

あとは voice bank は voicebank にしちゃった方が一般的な概念としての
voice bank と誤解されなくて無くてよいかと。

82魅亜:2009/06/02(火) 16:36:10 ID:5JvqRQac0
英語リソース、0.2.43対応。
ttp://u9.getuploader.com/utaou/download/73/res_EN_2.0.43_20090602.zip

・訳語あんまり見直せてないごめん。
 そもそもUTAU本体もまだ入手できてないので未検証。
・下線引く文字(正式名称知らない)はできるだけ日本語を保存しようとしたけど一部変えてる

83名無しさん@wavファイル作成中:2009/06/03(水) 01:00:45 ID:ow4fTTGc0
今日は実験用に>>68-69の41音を自分で録音してみた。
これは大変だわ…

まず普段は単語全体で音にしているものを単音で奇麗に発音するという事自体が難しい。短母音はなおさら。
それから子音のwは単体で録音したものを母音と合成しても英語っぽくなりそうにない気がした。
"with"のwiとか。エンベロープをうまくいじればいけるかもしれないけど。

母音・子音単音の合成で英語っぽくUTAう事は可能か? という問題以前に、
単音の収録自体が普通の日本人には難しいという事がわかったんで報告まで。
音節単位やdiphone合成用の呪文の方が発声は楽かもしれない。収録時間は長くなるけど。

84名無しさん@wavファイル作成中:2009/06/03(水) 01:10:54 ID:RantWn.I0
>>83
Wooo 的な発音でリトライ頼む
「う」 ではなくて「Wo」 の音が英語には欲しいと思っている

「Wo」+「Wi」+「th」とつなげて(エンベ弄って)使うので、それぞれの音が存在してればいける。

85魅亜:2009/06/03(水) 21:11:41 ID:RcKdSHg60
>>82の英語リソース、海外ユーザに試用してもらったんですが
「下線がつく文字がどれか分からないので日本語版のような()入りのほうがいい」
というフィードバックがありました。
(確かにAlt押すまで下線が出ないので分かりにくい)

一般のWindowsの英語版アプリなんかだと()なしみたいなんでそれに倣ったんですが、
どっちがいいですかね?

86名無しさん@wavファイル作成中:2009/06/04(木) 00:27:08 ID:o3A3xt9Y0
とりあえず>>83の音声一式をトリミングだけして上げときました
http://u9.getuploader.com/utaou/download/76/9loid-monophone-20090603.7z

正直、発音し分けられてない音とか別の音になっちゃってるのが多いですが
まあ何かの実験に使えれば。

>>84
一応録音時に唇は丸めてたんだけど、聞き直してみたらちょっと弱いかも。
次に録る時はちょっと頑張ってみる

発音指南・実験報告等してもらえると嬉しいです。

87名無しさん@wavファイル作成中:2009/06/04(木) 01:37:31 ID:vhsUGNvQ0
>>85
(Altで下線が出る文字を)Capitalizeするなどの方法もあると思います。
逆に、日本語は大文字が無いので()になったのかと。

途中の文字を選ぶと、大文字化は難しいかもしれませんが・・・

>>86
乙です。

ざっと聞いてみました。
・b、d、・・・はいい感じだと思います。
・母音に日本語の音が乗っているように感じます。
 響きの部分なので、日本語話者だとどうしても出てしまう部分かも・・
・fが、日本語の「ふ」に近いかも。息を一気に押し出す感じ?で行くと良いかもしれません。
・hも、日本語の「ほ」に近く聞こえます。これも単音だと難しいかも。イメージ的には、「ふ」を少し「ほ」にして強くした感じ???
 母音と組んで、切り出すorそのままも手かもしれません。

 は行の音は、国によってかなり変わるようですね。(フランス語だとhを発音しなかったりしますし)
 英語話者にとって、日本語の「は行」は難敵だったり。難易度は、おそばをすすれないのと同じレベルかも。

・ŋは伸ばせない音かと思います。

・m、nの音が、もう少し大きく録音できると良いかも。

・余裕があったら、rの音も入れて置くと良さげです。
(ヨーロッパの言語や、メキシコあたりの言葉が混ざると出てくるかも。)
>>71氏の江戸っ子音源にも使えるかも^^


とは書いてみたものの、大変な作業をさらに増やしてる気が。

88魅亜:2009/06/04(木) 10:56:02 ID:.C33GQUU0
>>87
全部先頭文字が選べてたら苦労はなかったりする……w
どんなソフトにもありそうなところでも(とりあえず例はMozilla Seamonkey)
E(x)it, Cu(t)/(C)opy/(P)aste/(D)elete
ですからねえ。

Altなしの状態で下線が出てれば(普通出てるもんだと思ってた)
どうということはないのですが。


印欧語だけに限っても発音が多彩になるアルファベットはrとjですねえ。
英語、ドイツ語、フランス語、スペイン語あたりでも全部違うw
(だからCamilaさんにはrが3種類ある。
でもザ行がサ行になってるあたりスペイン語圏らしいw)

中の人が日本人なら多少Engrishな音源でもいいんじゃね?とか思ったり。
そういや誰かアジア言語とかやってる人いないのかな?

89名無しさん@wavファイル作成中:2009/06/05(金) 00:17:08 ID:zOUaci6I0
あー朝鮮語とかは相性がよさそうだよなあ
漢語やタイ語の系統もそうかな

でも声調言語はピッチのプリセットとかがないと厳しいのかな

90名無しさん@wavファイル作成中:2009/06/05(金) 00:17:45 ID:zOUaci6I0
あーいや普通に声調をつけておいてmod100で使えばいいのか

91名無しさん@wavファイル作成中:2009/06/05(金) 01:20:39 ID:Xoyo0JsY0
>>86でUTAわせてみた。原音調整のみのベタ打ち。
http://u9.getuploader.com/utaou/download/77/9loid-amazing-grace.mp3

テラロボ声w
だけど英語の歌を歌っている事はわかる(よね?)
ちゃんとした原音を用意して調声すれば単音合成でも結構いけそうな気がしてきた!

>>87
聞いてくれてありがとうございます。
自分じゃ気付かない事も多いんで大変参考になりました。次に録音する時はその辺注意してみます。

92シン:2009/06/05(金) 16:59:51 ID:mp0D3ruU0
 "r"の発音は、そのままだと休符になりますね。例えば発音はじめは"r-"、発音終わりは"-r"とすれば良さそうです。
 同様に、その他の子音についても複製してエイリアスではじめと終わりを区別して原音設定すると良いです。基本的に、子音部分は固定の方が良いですね。

93名無しさん@wavファイル作成中:2009/06/05(金) 20:02:42 ID:Xoyo0JsY0
>>92
最初休符で変な音が出た時は何事かと思いましたw

原音設定参考になります。ありがとうございます。
単音合成だとオーバーラップの設定が命のようなので
発音し始めと終わりで設定を変えるのは使い勝手が良さそうですね。

今のところ有声子音は母音と同様に先頭のみ固定、無声子音はほぼ全期間固定の方向で
設定を進めてるんですが、他にも注意した方が良い事とかありますか?

94シン:2009/06/06(土) 00:51:31 ID:gg8nZfHk0
>>93
 基本的な設定はそれで問題ないです。
 私の設定方法は、母音、m、n、lなどの発音はじめと発音中にあまり違いが無い場合、発音の安定している所まで左ブランクを移動させます。右ブランクも安定している所まで移動させます。こうすると母音結合が良くなります。
 無声子音は、VOCALOID LOLAを使っている関係で、子音の終わりにアヤと言うか、そんなのがあるのがわかるのです。英語が苦手なのでうまく説明できませんが(ルカはアヤが少ないです)、子音終わりの場合は、固定部分を長めにすると良さそうです。音符が短い場合は、途切れるだけですし。
 子音はじめも、例えばsとかの摩擦音は、原音設定で長めに固定する場合と短めに固定する場合があると表現力が広がります。

 単音合成は私も考えていたのですが、調声が難しくなりますね。でもそれは、腕の見せ所です。VOCALOIDのように辞書登録できれば楽なんですけど。例えば"gra"という単語を登録すると一つの音符を三つに分けてそれぞれ割り当てる、割り当て割合も指定でき、結合方法、エンベロープも設定できる、みたいな機能があると便利です。

95魅亜:2009/06/06(土) 01:12:52 ID:hf20nVLQ0
>>94
子音は単音合成でもいけるけど、
二重母音はdiphoneしないと厳しいんじゃないかと思ってるんだけどどう?

96名無しさん@wavファイル作成中:2009/06/06(土) 20:15:11 ID:7AbCmWbE0
UTAU用音源できたよー
http://u9.getuploader.com/utaou/download/78/9loid-monophone-20090606.zip

Amazing Graceのustも同梱してみたんで、お手軽に実験してみて下さい。

>>94
おおー。いつも参考になります。どうもです。
ツールで解決する部分は望むところです。

>>95
二重母音は今のところ悲惨の一言に尽きるw
音の長さ合わせに工夫が必要なのは当然として、原音のピッチが終点に向かって
下がってるんで、ピッチ変更で悲惨な音になりやすい。

一定ピッチのまま二重母音を発音できるようになればマシになるのかも含めて、
色々実験してみないとダメそう。

97シン:2009/06/06(土) 20:19:56 ID:gg8nZfHk0
>>95
 デフォ子の母音結合のサンプルを作ってありますので聴いてみて下さい。
http://shin20070212.up.seesaa.net/music/aeiueoao-defuo_Mix.mp3
これで十分と判断するなら単音合成でも良いでしょう。ただ、英語には音素として二重母音があるし、数もそんなに多くないので発音が達者な中の人には頑張って欲しいです。

 ちなみにこのデフォ子の母音結合サンプルは、母音同士の結合に難あるとして試行錯誤されている方たちのサンプルを聴いて、デフォ子なら母音結合だけでも滑らかに繋がるのではと、先の原音設定方法を用いて作りました。

 普段使っているOperaでは無くて、Geckoエンジンのシーモンキー派生版Syleraからの投稿ですので、もしかしたらIDが変わるかも知れませんが、同一人物ですよ。

98魅亜:2009/06/06(土) 20:33:20 ID:hf20nVLQ0
>>96
仕事はやっ。
ありがたく試させてもらいます。

二重母音は後半でどうしてもピッチが下がるのは頭が痛い問題ですねえ。

>>97
さすがは機械音声、つながりは滑らかですが「二重母音」じゃないですねw

私はdiphone必須派なので、>>13ベースでどこまで.wavファイル数を減らせるか試行錯誤してました。
……かなり削ってもまだ644音あります……

http://u9.getuploader.com/utaou/download/79/mjg-diphones-text.zip

試しに録ってみようかと思ってたのですがこの数はハードル高いですw

99シン:2009/06/06(土) 22:23:16 ID:gg8nZfHk0
>>96
 早速調声してみました。
http://shin20070212.up.seesaa.net/image/amazing_Mix.mp3
 1オクターブ上げました。"b"は64分音符にしました。思ったより仕上がりが良かったです。

100名無しさん@wavファイル作成中:2009/06/07(日) 16:54:25 ID:Zomxs1gw0
>>99
実験ありがとうございます。これは無調整のとは全然違いますねー
二重母音のところもちゃんと対策してもらったようで歌になってますね。
何度も聞いて課題の確認に使わせてもらいました。

>>98
なんと、diphone検討してたんですか。すごく乙です。

自分はここの原音をいくつか聞いてみてフルdiphone合成はひとまず目標から外しました。
ttp://festvox.org/examples/cmu_us_kal_diphone/wav/

これはナンセンスワードというよりお経だよなあ… 日本人に発音できるのか?
           ↓
お経なら四六時中聞いてれば門前の小僧メソッドでマスターできるんじゃ?
           ↓
音声認識ライブラリを使って音ゲーを作ればお経の発声練習も楽しくなるんじゃね?
           ↓
でもkal先生の発声は正直お手本としてはきついなあ…
           ↓
ひとまず単音合成を実験してみるか ←今ここ


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板