したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が900を超えています。1000を超えると投稿できなくなるよ。

技術的特異点/シンギュラリティ【総合】避難所 39

930名無しさん (ワッチョイ 49ed-9f8b):2025/09/13(土) 13:43:21 ID:96xCwOEg00
>>927
これ、「9.11と9.9どっちが大きい?」みたいな簡単すぎる問題をツール(やコード実行)を使わず間違えてしまうのと同じか
Really Simple Licensingって言葉が自明なものに見えて、わざわざ調べるまでもないと判断してしまう
ただこれはGemini 2.5の推論を無効(thinkingBudget=0)にしてあるから、有効にした場合はまた違う判断をするだろう(というか元々レアケースだし)

回避策としては、ツールを有効にするだけではなく、必ず使うように指示するとか、APIのツールに頼らず、アプリやサービスが用意してるURLフェッチ機能を使ってプロンプトと一緒に入力してしまえばいいが、自分の場合はLLMの可能性の探索と観察が目的だからどうでもいい

931名無しさん (ワッチョイ a0a1-b556):2025/09/13(土) 14:32:30 ID:RN038U4g00
>>929
ネタバレはいかんだろ

932名無しさん (ワッチョイ b769-ba8f):2025/09/13(土) 15:14:01 ID:TaqKPAqQ00
ネタバレなんてAIは聞かれないと答えないでしょ
あのシーンどういう事?って質問者は既に見てるし問題無い

933名無しさん (ワッチョイ 49ed-9f8b):2025/09/13(土) 16:09:39 ID:96xCwOEg00
>>915
米国向けローカライズをGemini CLIに依頼、一発で完了
ロトくじ予想機能がちゃんとPowerballとかMega Millionsになってるのを確認
英語だとボードがスッキリしていい
https://moai.xrea.jp/mr-snail.html
ゲイリー・マーカス気に入ってくれるかな

934名無しさん (ワッチョイ 78c4-c7f3):2025/09/13(土) 16:13:33 ID:co/3.aUY00
自分の専門分野(普通の人は知らないような知識)に関する問題を出題してAIがどの程度答えられるかを確かめているんだけど、o3は正答率7割程度だったのに対してGPT-5はほぼ100%
どうやってここまで性能向上できたのか不思議

935名無しさん (アウアウ 0faf-6906):2025/09/13(土) 16:48:53 ID:0yafESvkSa
>>931
「ネタバレ込みで/ネタバレ無しで」って聞き方すれば良いだけだろ。

936名無しさん (ワッチョイ 04ee-5acc):2025/09/13(土) 16:50:44 ID:zXGC1eB600
わい:「あのシーン、どういうことだったの?」
AI:「あれは、トリックが露見しそうになった犯人が、証拠を隠そうとした行為ですね。」
わい:「あ・・ なるほど、そういうことかあ(涙」


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板