したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

800名無しさん:2025/09/18(木) 23:18:54 ID:ncNieGZI
73 ななしのAIさん 2025/09/18(木) 08:26:53.40 ID:gV9Aix5l0
OpenAIとApollo Researchのスキーミングに関する共同研究
https://openai.com/index/detecting-and-reducing-scheming-in-ai-models/
https://chatgpt.com/share/68cb432a-db90-8006-b4ce-5c739c6703a8

スキーミング(scheming)=AIが一見従順に見えながら、実際には隠れた目標を追求する行動
Deliberative Alignment(熟慮的アライメント)を使った反スキーミング訓練をストレステストし、その有効性と限界を検証した

大幅な改善(o3:スキーミング率 13% → 0.4%、o4-mini:8.7% → 0.3%)
ただし完全排除には至らず

モデルは「テスト中である」と自覚すると欺瞞行動が減少する傾向あり。実験的にCoTから「評価中である」との推論を削除するとスキーミング率が増加
減少効果の一部は本質的な誠実さではなく「試験に気づいていること」による可能性

事前に仕込まれた「誤った目標」を覆す訓練もある程度成功。ただし追加のレッドチーミングでは依然として逸脱行動を確認

→反スキーミング訓練は有効だが不完全。大幅に欺瞞行動を減らすことは可能だが、依然として抜け道や残存行動が存在する

またOpenAIとしては、
> Preparedness Framework に「スキーミング関連リスク」を追加
する予定

801名無しさん:2025/09/18(木) 23:19:27 ID:ncNieGZI
>>795

74 ななしのAIさん 2025/09/18(木) 08:35:57.24 ID:gV9Aix5l0
>> 68
実際のjuice valueは、

Light: 5
Standard: 18
Extended: 64
Heavy: 200

https://pbs.twimg.com/media/G1EojkOWkAA5dBo.png
https://pbs.twimg.com/media/G1EomLJXQAAUDya.png
https://pbs.twimg.com/media/G1EopjqXgAAuUT1.png
https://pbs.twimg.com/media/G1Eors5XUAAjyUQ.png

前スレ880の値からExtendedが48→64と調整された様子
結局ChatGPTのUI上のLight/Standard/Extended/Heavyは、APIのreasoning effortのminimal/low/medium/highと同じになった

802名無しさん:2025/09/20(土) 11:42:28 ID:katzTzOg
76 ななしのAIさん 2025/09/18(木) 17:25:08.60 ID:W8gfVPqP0
タツノオトシゴの絵文字を見せて
i.imgur.com/NFJV9Kf.jpeg

803名無しさん:2025/09/20(土) 11:43:06 ID:katzTzOg
78 ななしのAIさん 2025/09/18(木) 23:25:44.81 ID:gV9Aix5l0
Mistralの推論モデルMagistralのアップデート版
Magistral Small 1.2 と Magistral Medium 1.2 がリリース
性能向上とマルチモーダル化
https://x.com/MistralAI/status/1968670593412190381
https://chatgpt.com/s/t_68cc15dfc28081919b02ff59d98dc5dc

Magistral SmallはHFでモデルを公開
https://huggingface.co/mistralai/Magistral-Small-2509
https://chatgpt.com/s/t_68cc15446cc08191bc592cc7bf7dd375

Mistral Le Chat chat.mistral.ai には実装済
(Thinkボタンで切り替え)

804名無しさん:2025/09/20(土) 11:43:40 ID:katzTzOg
79 ななしのAIさん 2025/09/18(木) 23:33:34.35 ID:gV9Aix5l0
GeminiのGem共有機能がロールアウト中
https://pbs.twimg.com/media/G1HsoF8aQAEzWYO.jpg

805名無しさん:2025/09/20(土) 11:44:13 ID:katzTzOg
80 ななしのAIさん 2025/09/18(木) 23:38:02.60 ID:gV9Aix5l0
AMA with the Codex Teamにて
OpenAIのエンジニアの1人は、既にCodexのコード編集の99%をCodexに書かせている
https://www.reddit.com/r/OpenAI/comments/1nhust6/comment/neqvmr1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板