Grok 4
"Our latest and greatest flagship model, offering unparalleled performance in natural language, math and reasoning, the perfect jack of all trades."
「最新かつ最高峰のフラッグシップモデル。自然言語、数学、推論において比類なき性能を発揮する、万能型の決定版。」
Grok 4 Code
"A model purpose built to be your coding companion. Ask it questions about your code or embed directly into your code editor."
「コードの相棒として特化して作られたモデル。コードに関する質問をしたり、コードエディタに直接組み込んで使うことができます。」
"Flagship model with deep domain knowledge."
「深いドメイン知識を持つフラッグシップモデル」
"Excels at enterprise use cases like data extraction, coding, and text summarization."
「データ抽出、コーディング、テキスト要約など、エンタープライズ用途において優れた性能を発揮します。
金融、医療、法律、科学といった分野における深いドメイン知識を備えています。」
@elonmusk
Big jump in capability when we finish training our V7 foundation model (Grok 4 is V6), which has much better image/video understanding and our video gen model
「CoTの監視がAI安全性向上に役立つが、最適化圧で容易に破壊されうる」という既知の知見の整理、内容的にはそれほど目新しさは無い
ただし、OpenAI, Anthropic, Google DeepMindなどの大手AI企業、Apollo Research, UK AI Security Instituteなどの研究機関が同じ評価プロトコルを適用し、「この問題は業界共通リスク」という認識を公式に揃えたという点での意義がある
@sama
woke up early on a saturday to have a couple of hours to try using our new model for a little coding project.
done in 5 minutes. it is very, very good.
not sure how i feel about it...
https://x.com/ilyavaliant/status/1954548709930553566
Key difference: auto-Thinking ≠ manual GPT-5 Thinking.
When you pick Thinking manually, the system gives it a bigger “thinking budget.”
Auto-Thinking is shorter and faster — adaptive (and more cost-efficient) reasoning.