>>39
2月13日の OPENAI ROADMAP UPDATE FOR GPT-4.5 and GPT-5 の時は、 https://x.com/sama/status/1889755723078443244
"In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3."
「ChatGPTでもAPIでも、GPT-5をo3などの技術を統合したシステムとしてリリースする予定」
↓
5月16日の AMA with OpenAI Codex team の時は、 https://www.reddit.com/r/ChatGPT/comments/1ko3tp1/comment/mso344o/
"jerrytworek: GPT-5 is our next foundational model that is meant to just make everything our models can currently do better and with less model switching."
「GPT-5は、現在モデルが実行できるすべての機能を向上し、モデルの切り替えを減らすことを目的とした、次世代の基盤モデル」
Grok 4
"Our latest and greatest flagship model, offering unparalleled performance in natural language, math and reasoning, the perfect jack of all trades."
「最新かつ最高峰のフラッグシップモデル。自然言語、数学、推論において比類なき性能を発揮する、万能型の決定版。」
Grok 4 Code
"A model purpose built to be your coding companion. Ask it questions about your code or embed directly into your code editor."
「コードの相棒として特化して作られたモデル。コードに関する質問をしたり、コードエディタに直接組み込んで使うことができます。」
"Flagship model with deep domain knowledge."
「深いドメイン知識を持つフラッグシップモデル」
"Excels at enterprise use cases like data extraction, coding, and text summarization."
「データ抽出、コーディング、テキスト要約など、エンタープライズ用途において優れた性能を発揮します。
金融、医療、法律、科学といった分野における深いドメイン知識を備えています。」
@elonmusk
Big jump in capability when we finish training our V7 foundation model (Grok 4 is V6), which has much better image/video understanding and our video gen model
「CoTの監視がAI安全性向上に役立つが、最適化圧で容易に破壊されうる」という既知の知見の整理、内容的にはそれほど目新しさは無い
ただし、OpenAI, Anthropic, Google DeepMindなどの大手AI企業、Apollo Research, UK AI Security Instituteなどの研究機関が同じ評価プロトコルを適用し、「この問題は業界共通リスク」という認識を公式に揃えたという点での意義がある
@sama
woke up early on a saturday to have a couple of hours to try using our new model for a little coding project.
done in 5 minutes. it is very, very good.
not sure how i feel about it...
https://x.com/ilyavaliant/status/1954548709930553566
Key difference: auto-Thinking ≠ manual GPT-5 Thinking.
When you pick Thinking manually, the system gives it a bigger “thinking budget.”
Auto-Thinking is shorter and faster — adaptive (and more cost-efficient) reasoning.