【ChatGPT】AIチャット総合避難所【Gemini・Claude】

798：名無しさん：2025/09/18(木) 23:17:48 ID:ncNieGZI: 71 ななしのAIさん 2025/09/18(木) 07:51:08.14 ID:gV9Aix5l0
8月から9月初旬にかけてClaudeで発生した障害について公式がpostmortemを公開
原因となった3つの問題を解説

1. コンテキストウィンドウのルーティングエラー
2. 出力の破損
3. Approximate Top-k XLA:TPUの誤コンパイル

これらの問題が重複して発生したため、診断が難航した

https://www.anthropic.com/engineering/a-postmortem-of-three-recent-issues
https://i.imgur.com/JmwNawc.jpeg
799：名無しさん：2025/09/18(木) 23:18:21 ID:ncNieGZI: 72 ななしのAIさん 2025/09/18(木) 07:59:46.41 ID:gV9Aix5l0
OpenAI Realtime APIの更新
https://x.com/juberti/status/1968102280949055543
https://poe.com/s/Ih4rLAyW5k2axRjTlDzh
800：名無しさん：2025/09/18(木) 23:18:54 ID:ncNieGZI: 73 ななしのAIさん 2025/09/18(木) 08:26:53.40 ID:gV9Aix5l0
OpenAIとApollo Researchのスキーミングに関する共同研究
https://openai.com/index/detecting-and-reducing-scheming-in-ai-models/
https://chatgpt.com/share/68cb432a-db90-8006-b4ce-5c739c6703a8

スキーミング（scheming）＝AIが一見従順に見えながら、実際には隠れた目標を追求する行動
Deliberative Alignment（熟慮的アライメント）を使った反スキーミング訓練をストレステストし、その有効性と限界を検証した
↓
大幅な改善（o3：スキーミング率 13% → 0.4%、o4-mini：8.7% → 0.3%）
ただし完全排除には至らず

モデルは「テスト中である」と自覚すると欺瞞行動が減少する傾向あり。実験的にCoTから「評価中である」との推論を削除するとスキーミング率が増加
減少効果の一部は本質的な誠実さではなく「試験に気づいていること」による可能性

事前に仕込まれた「誤った目標」を覆す訓練もある程度成功。ただし追加のレッドチーミングでは依然として逸脱行動を確認

→反スキーミング訓練は有効だが不完全。大幅に欺瞞行動を減らすことは可能だが、依然として抜け道や残存行動が存在する

またOpenAIとしては、
> Preparedness Framework に「スキーミング関連リスク」を追加
する予定
801：名無しさん：2025/09/18(木) 23:19:27 ID:ncNieGZI: >>795

74 ななしのAIさん 2025/09/18(木) 08:35:57.24 ID:gV9Aix5l0
>> 68
実際のjuice valueは、

Light: 5
Standard: 18
Extended: 64
Heavy: 200

https://pbs.twimg.com/media/G1EojkOWkAA5dBo.png
https://pbs.twimg.com/media/G1EomLJXQAAUDya.png
https://pbs.twimg.com/media/G1EopjqXgAAuUT1.png
https://pbs.twimg.com/media/G1Eors5XUAAjyUQ.png

前スレ880の値からExtendedが48→64と調整された様子
結局ChatGPTのUI上のLight/Standard/Extended/Heavyは、APIのreasoning effortのminimal/low/medium/highと同じになった
802：名無しさん：2025/09/20(土) 11:42:28 ID:katzTzOg: 76 ななしのAIさん 2025/09/18(木) 17:25:08.60 ID:W8gfVPqP0
タツノオトシゴの絵文字を見せて
i.imgur.com/NFJV9Kf.jpeg
803：名無しさん：2025/09/20(土) 11:43:06 ID:katzTzOg: 78 ななしのAIさん 2025/09/18(木) 23:25:44.81 ID:gV9Aix5l0
Mistralの推論モデルMagistralのアップデート版
Magistral Small 1.2 と Magistral Medium 1.2 がリリース
性能向上とマルチモーダル化
https://x.com/MistralAI/status/1968670593412190381
https://chatgpt.com/s/t_68cc15dfc28081919b02ff59d98dc5dc

Magistral SmallはHFでモデルを公開
https://huggingface.co/mistralai/Magistral-Small-2509
https://chatgpt.com/s/t_68cc15446cc08191bc592cc7bf7dd375

Mistral Le Chat chat.mistral.ai には実装済
（Thinkボタンで切り替え）
804：名無しさん：2025/09/20(土) 11:43:40 ID:katzTzOg: 79 ななしのAIさん 2025/09/18(木) 23:33:34.35 ID:gV9Aix5l0
GeminiのGem共有機能がロールアウト中
https://pbs.twimg.com/media/G1HsoF8aQAEzWYO.jpg
805：名無しさん：2025/09/20(土) 11:44:13 ID:katzTzOg: 80 ななしのAIさん 2025/09/18(木) 23:38:02.60 ID:gV9Aix5l0
AMA with the Codex Teamにて
OpenAIのエンジニアの1人は、既にCodexのコード編集の99%をCodexに書かせている
https://www.reddit.com/r/OpenAI/comments/1nhust6/comment/neqvmr1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button
806：名無しさん：2025/09/20(土) 12:04:29 ID:uq6GNJAs: 84 ななしのAIさん 2025/09/20(土) 11:46:45.14 ID:0e0VbntI0
The huge potential implications of long-context inference
https://epoch.ai/gradient-updates/the-huge-potential-implications-of-long-context-inference
https://chatgpt.com/share/68ce041b-0e18-8006-a287-00be8b40f736

Epoch AIから
「長大なコンテキスト推論」が AIに継続学習能力とRLの飛躍的拡張をもたらす可能性について
ただし速度とコストの制約が最大の課題
807：名無しさん：2025/09/20(土) 12:05:03 ID:uq6GNJAs: 85 ななしのAIさん 2025/09/20(土) 11:49:35.55 ID:0e0VbntI0
Yann LeCunのJEPA構想が言語LLMへ

LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures
https://www.arxiv.org/abs/2509.14252
https://chatgpt.com/share/68ce05a9-cd40-8006-bbd5-a72484f84374

これまでのLLMは入力空間の再構成（次トークン予測）で学習・評価
視覚分野では、異なるビュー同士の埋め込みを予測するJEPAが、入力再構成より有利
言語分野では JEPA的目的の設計が難しく、事実上未開拓

→LLMの生成にJEPAを加え、生成力を保ったまま表現を構造化して多様なタスクで精度・収束・汎化を向上させる、言語LLMへのJEPA本格導入の第一歩
808：名無しさん：2025/09/20(土) 12:05:37 ID:uq6GNJAs: 86 ななしのAIさん 2025/09/20(土) 11:53:08.27 ID:0e0VbntI0
Grok 4 Fastが正式に発表

Grok 4 Fast | xAI
x.ai/news/grok-4-fast
https://chatgpt.com/share/68ce0963-d190-8006-8508-eb6e415c9ade

マルチモーダル推論
コスト効率と推論能力の両立（Grok 4と同等の性能を保ちながら、平均40%少ない思考トークンで動作）
コンテキストウィンドウ 2Mトークン
推論／非推論の統合モデル（システムプロンプトで挙動を切り替える）
809：名無しさん：2025/09/20(土) 12:06:11 ID:uq6GNJAs: >>793

87 ななしのAIさん 2025/09/20(土) 11:54:22.41 ID:0e0VbntI0
>> 66
このUIが導入されている
810：名無しさん：2025/09/20(土) 12:06:44 ID:uq6GNJAs: 88 ななしのAIさん 2025/09/20(土) 11:55:46.70 ID:0e0VbntI0
ChromeへのAI統合を中心とした大規模アップデート
まずは米国のMac・Windows（英語設定）で展開

Chrome: The browser you love, reimagined with AI
https://blog.google/products/chrome/chrome-reimagined-with-ai/
https://chatgpt.com/share/68ce0a79-f820-8006-b0c3-abaf1e30e262

- Gemini in Chrome
- エージェント型ブラウジング（追加予定）
- 複数タブ横断サポート
- 過去に見たページを検索
- Googleアプリとの統合
- OmniboxからAI Mode検索
- ページ内容に基づく質問サジェスト
- Gemini Nanoによる詐欺検知
- 通知・権限管理のAI支援
- 1クリックでパスワード変更
811：名無しさん：2025/09/20(土) 12:07:18 ID:uq6GNJAs: 89 ななしのAIさん 2025/09/20(土) 11:59:16.33 ID:0e0VbntI0
Discovering new solutions to century-old problems in fluid dynamics
https://deepmind.google/discover/blog/discovering-new-solutions-to-century-old-problems-in-fluid-dynamics/
https://chatgpt.com/share/68ce1344-5c48-8006-965e-753840b5d5f5

DeepMindから
ナビエ・ストークス方程式の滑らかな不安定自己相似特異解を初めて複数系で系統的に発見
物理インフォームドニューラルネットワーク（PINNs）と高精度のガウス–ニュートン最適化を組み合わせた
ミレニアム懸賞問題「ナビエ・ストークス方程式の存在・一意性・滑らかさ」の解決に向けた重要なステップ
812：名無しさん：2025/09/20(土) 12:07:50 ID:uq6GNJAs: >>802

90 ななしのAIさん 2025/09/20(土) 12:01:29.25 ID:0e0VbntI0
>> 76
タツノオトシゴの絵文字
「植物百科通」のようなグリッチトークンと同じような問題に一見見えるが、実は違うレイヤーの問題
https://chatgpt.com/share/68ce1428-4110-8006-8966-829e11d650d3

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】