[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
| |
生成AIについて
1
:
ポロシャツ ブランド
:2025/11/28(金) 07:40:45 ID:0sPKpFTE0
多分、動きを混ぜるのはあまり面白い映像にならない。
生成AIにはよく学習された「得意な単語」と、よく知らない単語がある。
たとえば、「着物」はよく知っているから「日本の伝統的な衣装で〜」とか足さなくてもそれらしいものを描いてくれる。
しかし、最近の若者がたまに着ている短い丈の着物は、よく知らない。「丈が短い着物で〜」「着物とミニスカートを足した感じで〜」とか言っても、作務衣のようなものを描くかもしれないし、結構何度も描き直してもらわないとどこか違和感の残るものなる。
そして何より、こういった細かい指定を足せば足すほど、AIは整合性を合わせるのが大変になり、どこかポリゴンチックな、偽物っぽい絵になる。
個人的に楽しむだけならこれでも良いのだけど、映像としてyoutubeにあげるとなると、見る人の目を引かない。
一昔前に流行った、ガラスをナイフで切る映像は、多分プロンプトは短い。あえて細かい指定しないで、良いものが出来上がるまで何度か描き直していると思う。
ガラスも切ることもAIにとって分かりやすいので、細かく指定しなくても大外れにはならない組み合わせ。あとは作品として出してよいものが出来上がるまで何度かやってみるだけ。
不自然にならないようにAIが整えてくれる。
この、不自然にならないように整える、というのが時に曲者で、
たとえば「時速100kmで走る一般男性」と指定しても、多分普通に走るおじさんが「うおおお!100キロだ!」とか言うだけ。
これは"人は時速100kmでは走れない"という一般的な感覚を足して、全体の整合性を保とうとするため。
「この男性は特殊な訓練を受けている」「この男性は特殊なシューズを履いている」などと指定するほど、画はポリゴンチックに、嘘くさくなっていく。
背中にジェットを背負っていることにすれば、高速移動する男性は描けるかもしれないが、趣旨が違ってくる。
凄まじいスピードで疾走する人間の映像は、多分諦めることになる。
細かい部分にいちいち指定が必要な、風景を見せるタイプの動画も同様。AIからすれば、余計な指定が多すぎる。
一枚絵であれば、"迷う部分が少ない"と、詳細なプロンプトの方が好まれる場合もあるかもしれないけど、
動画の場合は、プロンプトは短くても済むのであればその方がいいと思う。必要最低限を伝えて、しっくりくるものが出来上がるまで何度かやり直す。
今youtubeでよく再生されている動画でも、食べ物に生命を持たせるとか、珍しい生物を見せる(おそらく、複数の生物を掛け合わせている)が、比較的上手くいっている気がする。
まず発想ありきでそれにAIを合わせようとしている動画は、全体を暗くしたり、昭和の映像ということにして、粗を目立たなくしている。
風景を見せる系は、一番高い有料プランに入っているか、編集ソフトで上手く掛け合わせているのだと思う。
そうであったとしても、"道"が設定されていたり、よく動くオブジェクト数は限られていたりと、「これ以上指定するとAIが描いてくれないんだろうな」という部分はやはり見て取れる。
2
:
ポロシャツ ブランド
:2025/11/28(金) 21:48:30 ID:0sPKpFTE0
生成AIはレゴブロック遊びに似ている気がする。
AIにとって分かりやすい単語、よく学習された単語がブロック。
それ以外の単語も扱えなくはないが、細かい指定が必要になり、
細かく指定するほど、余計なリソースを食ってイマイチな絵になる。
AIが容易に描画できるブロックをいくつか組み合わせて、
現実にはあり得ないものを、さもあるかのようにふるまわせる。
どういう組み合わせにするかが、人間の腕の見せどころ。
ストーリーを組むのは、現時点では多分悪手。
AIは長時間整合性を保てないため。
ただ、10秒程度の短い動画の寄せ集めはyoutubeで収益対象になり難いし、
見ている方もぼちぼち飽きてきていると思う。
3
:
ポロシャツ ブランド
:2025/11/28(金) 22:01:28 ID:0sPKpFTE0
おそらく、今の生成AIだと、
・AIにとって分かりやすい単語をいくつか組み合わせ、
実際には無いものをさもあるかのように見せる
・短尺でも違和感の無いもの
が向いている。
架空CMの動画がかなり増えたけど、生成AIの得意分野ズバリだと思う。
景色を見る系の場合でも、夢とか異世界とか、奇形でぶつ切りでも違和感のない舞台設定になる。
逆に、
・現実的
・ストーリー性を持つ
は悪手。AIが苦手なので、どうしても行き詰りやすい。
生成時のリソース不足が原因のなので、徐々に解決されてくると思う。
今、夢とか架空CMの動画が多いけど、「今考えるとあれが当時のAIの限界だった」と振り返るのだと思う。
4
:
ポロシャツ ブランド
:2025/11/29(土) 15:51:13 ID:0sPKpFTE0
sora2が一日30本だったのが、5本とか9本とか、安定しなくなってきた。
open AI の設定次第でどうにでもなる?課金してもこんな感じなのだろうか。
課金するならveo3のほうがよさげな気もするけど、
一日何本までとか、解像度に関する情報が、公式ですら「制限がある」とかぼんやりした書き方しかしていない。
なんで?
5
:
ポロシャツ ブランド
:2025/11/29(土) 15:53:51 ID:0sPKpFTE0
何回も出力し直してなんぼみたいなところがあるから、回数制限はかなり窮屈に感じる。
月3万円のプランをスタンダードにしたいのが本音だと思う。
6
:
ポロシャツ ブランド
:2025/11/29(土) 15:57:46 ID:0sPKpFTE0
しかしAI生成の動画で月3万以上稼ぐのは結構ハードルが高いと思う。
多分、「AIがなくても稼げる動画は作れるけどAIがあると投稿ペースを早くできる」といった、本当のクリエイターのみ。
youtubeでも、クオリティから考えて、おそらく3万円払っているだろうというチャンネルは結構見かけるし、
チャンネルを伸ばそうと思ったらそのくらい必要経費なのはわかるけど、
そういったチャンネルももう飽きられ始めている。
月3万だと、万単位の再生数の動画を毎回出さないと厳しいだろうけど、もう1000回を切り始めているのがちらほら。
多分、AIに払った3万円の1割も回収できてないと思う。
7
:
ポロシャツ ブランド
:2025/11/29(土) 17:12:43 ID:0sPKpFTE0
Google AI Studio というものがある。googleの開発環境のようなものが一般公開されている。
veo2は無料で使えるっぽい?
出力に成功したが、音が付いていない、
そういえば、少し前のAIは無音が普通だった気がする。
映像自体は今のsora2より精緻なのがすごい。
8
:
ポロシャツ ブランド
:2025/11/29(土) 18:22:32 ID:0sPKpFTE0
veo2はすっかり過去のものみたいな扱いになっているけど、
ブログを見ると「veo2すげええええ!」と言ってるのはまだ今年の初めくらい。
そんなに進化が早いのか…!
プロンプトの解釈プロセスはveo2も3も似ているらしいので、
veo2でプロンプトを練り上げてからveo3で本番、というのが良いと思う。
9
:
ポロシャツ ブランド
:2025/11/29(土) 18:43:59 ID:0sPKpFTE0
どうなんだろう。なんどか試したが、やはり映像自体はsora2よりveo2のほうがリアル。
音がないことへの違和感は視聴者はどのくらい気づくのだろうか。
一昔前のAI動画はBGMで誤魔化していたと思う。
veo3にしたほうが映像のクオリティもあがるけど、veo2は本数の制限がないのがすごく快適。
10
:
ポロシャツ ブランド
:2025/11/29(土) 18:48:20 ID:0sPKpFTE0
veo2の作成可能本数が明記されていないのは、「クレジット」という単位だかららしい。
一日何本までという決め方ではなく、その動画を作るのに割いた計算リソースによって管理するらしい。
月3000円のPROプランで毎月1000クレジットもらえるらしいけど、10秒程度の動画で約100クレジット。
月に9本か10本使ったら一旦終わり。
追加でクレジットを買おうとすると、後払い制になるらしい。高確率で使いすぎるやつ。
11
:
ポロシャツ ブランド
:2025/11/29(土) 18:49:04 ID:0sPKpFTE0
veo3だった。
12
:
ポロシャツ ブランド
:2025/11/29(土) 19:03:21 ID:0sPKpFTE0
ああ、veo2でも回数制限あった。
13
:
ポロシャツ ブランド
:2025/11/30(日) 12:33:40 ID:0sPKpFTE0
見た目や動きを逐一指定すると上手くいかない気がする。
少し一歩引いて、"なぜその見た目や動きになるのか"だけを指定して、細かい部分はAIに解釈させる方がいい気がする。
特に動画生成AIは。
逆に言うと、細かい指示は意外とあまり得意ではないのかもしれない。
整合性を保つのに精いっぱいで、なぜそういう指示を出されるのかはイマイチ把握していない気がする。
14
:
ポロシャツ ブランド
:2025/11/30(日) 13:38:21 ID:0sPKpFTE0
おそらく、AIにとってよく知っている言葉、よく知らない言葉は、
外観だけでなく、動きや動きの動機、人の感情などにも及んでいるのだと思う。
一昔前のAIが指や指の動きを上手く描けなかったのは、学習がまだ進んでいなかったから?
若い人がたまに着ている短い丈の着物は、AIにとってまだ馴染みがないので、
どうしても描いてもらおうと思ったら、逐一その特徴を伝えないといけない。
しかし、これは整合性を保つので精いっぱいで、結局は上手くいかない。
対して、普通の着物は、AIもよく学習しているので、
細かい部分を伝えなくても、むしろ細かく伝えずにAIに全体のバランスを整えてもらう方が上手くいく。
動きや動きの動機、ストーリー、感情などについても同様で、
AIにとって馴染みがないものを無理に描かせようとすると、いずれ頓挫し、
AIがよく知っているものをいくつか組み合わせるのであれば、むしろ細かく伝えなくてもそれを描いてくれたりする。
15
:
ポロシャツ ブランド
:2025/11/30(日) 15:50:46 ID:0sPKpFTE0
複数のものをできる限り矛盾なく組み合わせるのが得意なので、新しく奇異なものを作るように感じられるけど、
学習量が膨大で理解が安定しているものの方が断然得意な「安定型」がAIだと思う。
たとえば、「高度な技術を持つ未来人を描いて下さい」というのはあまり良くない。
いわゆるステレオタイプな未来人が出てくるだけ。
既にあるごくありふれたものをいくつも組み合わせて、未来人らしきものを作れば、
ステレオタイプではなく、かつどこか説得力のある画になる。
しかし、その組み合わせを考えるのはまだ人間。
16
:
ポロシャツ ブランド
:2025/11/30(日) 16:05:35 ID:0sPKpFTE0
外観に関するワードをいかに出さないで、思い通りの外観にしあげてもらうか、というのも面白いかもしれない。
AIに「あなたは民俗学者です」「あなたはたまたま通りかかった観光客です」と役割を伝えるのも有効な気がする。
対して、AIを単なる道具だと見なして、あらゆる外観を事細かに指定し、それで極める人もいると思う。
AIを何と捉え、どう付き合うかで、既に道が分かれているのだと思う。
AIが既に文化になっていくのを感じる。
17
:
ポロシャツ ブランド
:2025/11/30(日) 16:17:40 ID:0sPKpFTE0
多分、「一度描かせてみて、どこを描きかえるか後から考えよう」というのはあまり上手くいかない。
細部を書き換えたり、書き足したりを繰り返すと、
AIはそれらの整合性を保つために余計なリソースを食うだけ。
現実の仕事でも、最初いい加減な指示を出して、後から後から注文を足してくる人がいるけど、
段々かたちがいびつになっていくし、どうしてもケアレスミスが出てきて、
あまり綺麗にはならない。注文している方からすればこだわっているつもりなのだろうけど。
奇しくも似ている。
18
:
ポロシャツ ブランド
:2025/12/02(火) 21:37:21 ID:0sPKpFTE0
sora2にしてもveo3にしても、一日に生成できる動画数には制限がある。
いずれ拡張されていくのだろうけど、今はまだ計算リソース不足の時代。
copilotの画像生成AIであれば、まだはっきりした回数制限はないようなので、
動画を作る前に、copilotで傾向を掴んでからsora2なりveo3にいったほうがいいと思う。
19
:
ポロシャツ ブランド
:2025/12/04(木) 22:15:07 ID:0sPKpFTE0
youtubeで音声が尻切れの動画が沢山あがっている。
そういう仕様だと思ってたけど、単に文章が長過ぎっぽい。
絶対ではないけど、文章を短め、動画を長めにすると、納まる確率が上がる。
20
:
ポロシャツ ブランド
:2025/12/04(木) 22:38:29 ID:0sPKpFTE0
解像度がカメラで撮った映像より低いので、どうしても粗く見える。
AI系の投稿者がほとんど編集しないで投稿しているのは、これ以上画質を落としたくないということ?
21
:
ポロシャツ ブランド
:2025/12/06(土) 23:18:49 ID:0sPKpFTE0
任天堂の採用担当だったか、「ゲームオタクは採らない」みたいなことを言っていた気がするけど、
感覚的に少し理解した気がする。
実体験から練り上げた面白さみたいなものがないと、優れた道具だけ持っていても、見ている人に響かない。
22
:
ポロシャツ ブランド
:2025/12/09(火) 07:34:04 ID:0sPKpFTE0
特に動画の場合、何かしら違和感が残る。
特に動きやセリフ。
このため、夢やフィクションなど、変な部分が多少あっても大丈夫な世界観しか馴染まない。
たとえば「現実の台北を再現しました」みたいなのは、ほぼ無限に再生成することになる。
23
:
ポロシャツ ブランド
:2025/12/09(火) 22:15:58 ID:0sPKpFTE0
生成AIは意外とまだ制限が多い気がする。使い方次第なのかもしれないけど。
自分が作りたいものを無理にAIに作らせるのではなく、
AIが得意な範囲の中で、自分の作りたいものを見つけていく方が早いと思う。
ただ、この方向でいくと、大体その完成形がもうyoutubeにあがっている。
24
:
ポロシャツ ブランド
:2025/12/10(水) 00:04:19 ID:0sPKpFTE0
プロンプトはシンプルであるほどいい。
細かく指定すると、AIが可能な限り全ての整合性を保とうとして余計な計算リソースを使うため。
逆に、プロンプトがシンプルであるほど、作品の品質にリソースを割いてくれて、いい感じになる。
極端に言えば、一生懸命書いた100行より、必要最低限の1行の方が断然良い。
なんだか、そういう時代になっていくんだろうなと感じる。
25
:
ポロシャツ ブランド
:2025/12/11(木) 23:18:07 ID:0sPKpFTE0
偶然だろうか、
英文のプロンプトに、一行だけ日本語を入れると、映像がリアルになった気がする。
ほんの一行、ほんのひと単語、
ある要素の説明の全体に占める割合、
文章の順番、継ぎ目など、
本当にちょっとしたことで生成される動画の質が変わる。
いいプロンプトが出来たら、それは資産として保存しておく価値があると思う。
26
:
ポロシャツ ブランド
:2025/12/12(金) 23:51:57 ID:0sPKpFTE0
AIが生成した動画は、音声が入ると途端に(悪い意味で)AIっぽくなる。
これはyoutubeのコメント欄でもちょくちょく書かれている。
veo2も最初の頃は音無しだった。
この原因をcopilotに聞いてみたけど、まず、
・映像と音声の同期が難しいこと
があげられる。
また、もっと重要なことで、考えてみると当たり前なのだけど、
・映像と比べ、音声は学習がずっと難しい
というのがあげられる。
音声はそもそも学習材料が少ない。白黒映画の時代あたりは音声がまだないから学習しようがないし、
最近の、学習材料が比較的増えてきた時代のものでも、
良い教師役をつくるのが映像と比べて難しい。
たとえば、映像の場合、人間に写真を見せて、「どこに何が写っていますか?」と聞くことで正確な学習材料を得られる。
しかし、音声はその量が少ないし、教師役の人に何をどう聞けばいいのかが難しい。
たとえば、動画生成時に「10m離れて録音しています」みたいなことを書いても、AIはおそらく無視する。
これは、そういったものに関してはほぼ何も学習していないため。
録音時に何m離れていたかなんて撮影者も知らないし、その時のカメラの設定なんかも分からない。
学習材料もその教師もほぼ0なのだから、描いてと言われてもやりようがない。
27
:
ポロシャツ ブランド
:2025/12/13(土) 00:10:06 ID:0sPKpFTE0
そう思うと、今、動画生成AIに音声が付いているだけでも凄いと思う。
おそらくAIは、音声を学習する際は、テレビCMなど、既に編集済のものから学習している。
情報が多く手に入る上に、音が調整済で聞き取りやすいため。
聞き取りやすい音量に調整済の音なのだけど、あえて言うなら近景だろうか。
動作の粗を隠すために遠景の動画を作ろうかと思ったが、
音声に限って言うと、近景というか、テレビの街頭インタビューみたいな距離感の方が上手くいくと思う。
生成動画で音に違和感がある時は、映像が遠景など、画と音が合っていない時だと思う。
画をどのように描いたとしても、音声はCMなどの距離感となる。
28
:
ポロシャツ ブランド
:2025/12/13(土) 00:14:13 ID:0sPKpFTE0
学習できない部分に関しては、似たようなものの学習記録を引用しているはず。
たとえば、1960年代の電車の音声なんて学習材料がほとんどないだろうけど、
2000年の電車の音であれば、比較的多い。これを引用している。
少し前に、ガラス製の色々なものをナイフで切る動画が流行ったけど、
こういったものは、この似たようなものを引用する仕組みを、極端に利用したものだと思う。
29
:
ポロシャツ ブランド
:2025/12/13(土) 12:55:19 ID:wgFnU2C60
あるサイトで、プロンプトは次の順番で書くと良いと書いてあった:
[被写体]+[状況設定]+[動作]+[セリフ]+[カメラ設定]+[照明・色調]+[効果音]
動画全般で言えばそうなのだろうけど、照明・色調というか、天気に関してはもっと前、
なんなら一番前でも良い気がする。
生成AIは特に指定されていないことに関しては、他の条件から推測して埋めてくれるので、
「快晴・コントラスト強め」と「曇り・くすんだ色調」では、
単に明るさだけでなく、人々の表情やしぐさ、場合によっては季節まで自動補正され、全く異なる動画になる。
光の強さや色調は、動画全体の方向性を決める上でかなり影響力大だと思う。
逆に言うと、「人々は明るく笑い、お互いに助け合いながら生きている」などと細かい情報を後から付け足しても、
整合性を保とうとして描画が粗くなったり、その行は無視されたりする。
30
:
ポロシャツ ブランド
:2025/12/13(土) 12:58:57 ID:wgFnU2C60
全体の方向性から、細かい指示。
必須で無いなら、細かい指示はむしろ無い方が良い。整合性を保とうとして無理な動画になるだけ。
何についてプロンプトの行を割いているのか、
その順番は、
といったことが非常に大事。
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板