レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 36
2045年頃に人類は技術的特異点(Technological Singularity)を迎えると予測されている。
未来技術によって、どのような世界が構築されるのか?人類はどうなるのか?
などを様々な視点から多角的に考察し意見交換するスレッド
■技術的特異点:収穫加速の法則と半導体微細化の進歩曲線に基づいて予測された、
生物的制約から開放された知能[機械ベース or 拡張脳?]が生み出すとされる
具体的予測の困難な時代が到来する起点
■収穫加速の法則:一つの発見が新たな技術を生み出し、その技術が他の発明を生み出すという連鎖的な反応が、科学技術全体を進歩させるという仮説
★関連書籍・リンク・テンプレ集(必修)
https://singularity-2ch.memo.wiki/
★特異点アンケート
https://forms.gle/c6ZLjnheCEZftYgg9
※前スレ
技術的特異点/シンギュラリティ【総合】避難所 35
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1748512611/
※不老技術の動向と医学関連はこちら
不老不死(不老長寿)を目指すスレ 避難所
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1669450079/
次スレは>>950 が立てること 立てられない場合は早急に他者に依頼するか951以後の者が早急に立てること
誰も次スレを立てずに議論に没頭して落としたり次スレにフライングレスしないこと
未来技術板のURLは書かないし、あちらから誘導もしないこと
セーラー服おじさん居ないと物足りない感じするな
セーラー服おじさんがシステムは一番詳しかったから残念
どんな分野でも、完全に使いこなしている人であれば、わずかな違いの中にでも『これはすごい』と感じるだろうさ
例えばわいがメタバースは停滞していると感じていても、ヘビーユーザーからは反論あるでしょうよ
停滞くんは完全に見てるだけなんだろうな
下手したら見てすらいないな
>>769
スタンミショックとやらが起きてユーザー流入が起こったらしいな
やっぱAIは人間の知能とは似て非なるもので下手したら人間の知能を圧倒的に凌駕する可能性を秘めてるのかもしれんなぁ
【結論から"逆算"するAI、誕生。】
AIが文章を理解する方法は、左から右へ、が常識でした。
しかし北京大学などが開発した「LEDOM」は、世界で初めて文章を"お尻から頭へ"と逆向きに学習します。
この逆転の発想は、結論から原因を探る後方推論に独自の力を発揮。
さらに順方向モデルと組み合わせれば、AI自身の論理エラーを"自己検証"できるかもしれません。
逆向きに思考するAIは、どこまで論理の壁を打ち破れるのか?
https://x.com/compassinai/status/1942527489424908416
ウナギ稚魚の生産コストが4万円→1800円に 約20分の1以下に削減 水産研究・教育機構が大型水槽を開発 - jnnavi
https://x.com/JapanNNavi/status/1942511620443496844
🚨更新:GROK 4は20万基のGPUで学習済みです。 GROK 4は、コーディングにおいて圧倒的なパフォーマンスを発揮し、これまでにない比類なき知能を備えていると言われています。 ただ優れているだけでなく、恐ろしいほど優れています。〜xAIチーム
https://x.com/amXFreeze/status/1942579307940823331
ウナギを安く食べられるようになるのかなϵ( 'Θ' )϶
それはともかくハルシネーション以外にポチョムキン理解っていう新たな問題が出てきたそうだ
>>773
サンキュー!
>>773
ウナギが牛丼並みの値段で食べられる日も違いか?
Grok4がもうすぐ出るならchatGPTも早そうだね、絶対対抗してくるだろうし
LLMにおける「ポチョムキン理解」は、人間としての概念理解を偽装しつつ、実際の適用段階で不合理な誤りを犯す現象。アーキテクチャレベルの対策としては(1)自己検証・自己整合性モジュールの導入、(2)ニューラル‐シンボリック統合、(3)モジュラ―MRKLシステムの活用、(4)論理的一貫性を強制する学習目標、(5)知識グラフ・オントロジーによる概念の形式的検証、(6)ポチョムキン検出用の動的ベンチマーク整備が考えられる。これらを組み合わせることで、表面的な正答と内在的な理解の乖離を縮小し、真の概念適用能力を向上させることが期待される。
だからGPT-5で統合するんだろ
GPT-5発表前に慌てて論文出してきたんだろ
ここ数年のパターンだと、若干の停滞感があった後に、すごいのが立て続けに一気にくるというパターンを繰り返してる気がする
すごいものがリリースされないから停滞していると言うのは表面的な話であって開発現場で何が起きてるか分からないからな
Tsubame @Tsubame33785667
ハードウェアは十分、あとは頭脳を与えるだけ。10年前のロボットがテレオペレーションなら完璧に動けたという話。本当に足りないのは知能。AIロボティクス、これからが本番だ。
カロル・ハウスマン「よくある誤解として、『ロボット工学の分野全体がハードウェアによってボトルネックになっている』というものがありますが、私はそうは思いません。10年以上前に行われた有名なデモがあって、PR1という古いロボットが家庭内を移動しながら片付けをしていて、素晴らしい成果を出していました。今でも最先端のヒューマノイドロボットのデモとして通用するレベルです。そして実際にきちんと機能していました。ただし注意点として、それはテレオペレーションによるもので、つまり人間が背後で脳を使って操作していたということです。これは、ハードウェア自体はずっと以前から十分に存在していたという証拠だと思います。
そして私たちは実際にそれを日常的に見ています。比較的シンプルなロボットでも、テレオペレーションによって驚くようなことが可能になります。
だからこそ、ボトルネックは明らかに『知能』なんです。人間がロボットをテレオペレートするときに使っているのと同じレベルの知能をロボットが持っていれば、あらゆる場所で様々な作業をこなすロボットが既に普及していたでしょう。ハードウェアが障害になるとは思っていません」
2025年07月09日 09:27
[動画] https://twitter.com/i/status/1942742408208474174
https://x.com/Tsubame33785667/status/1942742408208474174
人間のスピードでぬるぬる動き続けるにはロボの方にもまだ制限あるかもしれんが
人間の作業させるならまだ足りてないのは間違いなく頭脳部分だからな
メ
https://i.imgur.com/K8bwcad.png
>>783
今俺が発表されているレベルのロボットの体になったとしても
ドアも開けられるだろうし
階段も登れるし荷物も持てる。
出来ない事はもうほとんどないだろうしな。
結局知能さえあれば多少不自由な身体でもすぐに最適な動作の仕方を見つけて何とかしてしまうんだよな。
発達障害が増えたからだろうな
最近よく思うが、「1歩先」が見えない人があまりにも多い。例えば、AIを駆使した新技術なんかを紹介すると、「こんなの使い物にならない」「〜までは出来ても〜の部分は結局人間が...」といったような、現状の性能や環境だけに限定して批判する人だらけ。
新技術の話をする時なんかは、数年後の進化展望まで見据えた上での可能性を加味するべきであって、現状だけを馬鹿正直に見て批判する事には何の意味もない。
新技術は今後の未来を作る「タネ」のようなものであって、「完成品」ではないということをわざわざ伝えないといけないようだ。
特に今のような加速の早い時代では、未来を見据えることが最低限の思考ラインであって、現状目線だけで批判する人間は人類の足を引っ張るだけである。
https://x.com/sutoroveli/status/1942183881467474227
実際に分母が増えたの?
今までは見逃されてただけかと思ってた
>>785
細かいものを壊さず適切にピッキングとかまだ無理でしょ
そのあたりはまだ人間有利だし
ロボットが出来るように作業場を組むしか無いのでは?
今年の土用の丑は7月19日と7月31日か
去年はウナギの養殖によるニュースでウナギュラリティを感じたが
そろそろ人工ウナギが今年に販売されるくらいか
割高ではありそうだけど需要と供給は満たせそうやね
スーパーでいっぱい売ってそう
ウナギュラというなら骨を超取りやすく太くするか、そもそも骨のないウナギにしてもらいたい
うな重千円で食いたい
鰻の成瀬って店舗があるんだけど、職人にやらせてた焼きを自動化したことで2000円台でうな重食えるんだけどまぁまぁ美味いよ
>>788
高齢出産が増えたのが影響してそうだが、今までは居ても社会に抑圧されて目立ちにくかったのかもしれんな
【Teslaの自動運転はここまで来た】自動運転FSDで街中を走ってみた【ロボタクシーはどうなる?】
https://youtu.be/AOnzG0SANkk
GPT-5が期待外れだった場合のおまえらの反応予想
否認: 「正しく評価されていない」「マスゴミの偏向報道のせいだ」といった形で、現実を直視せず責任転嫁をする。
混乱: 現実を受け入れられず、スレ民への個人攻撃やスレを荒らしたりする。
怒り: 本来、過度な期待を煽ったアルトマンやSNSの驚き屋に怒りを向けず、なぜか停滞君など慎重な意見を述べた人に怒りを表明する。
受容: 最終的にはGPT-5は無かったことにし、GPT-6に切り替えていく。
結果はどうであれ話題をGPT-6に切り替えていくのは事実だな
それが未来を語るこのスレの役割でもあるからな
>>787
何でもいいから新しいものは叩く人間とか、後は騙されることを異常に恐れる人間も多いな
自分のよく知らないところでされている話は、それが良い話でも悪い話でも信じない
どんな話でも全ては嘘でポジショントークで利権の隠れ蓑、みたいに思って叩こうとする、
普通に病的な奴がネットにはいっぱいいる
多分頭が悪くて家庭環境も悪いんだろうな
世の中のことが何一つ理解も出来ず信じられもしないから、とにかく世の中の何もかもを
「嘘松」とレッテル貼って自分の自我を守ろうとしている。嘘だ嘘だと言ってるうちは他人に
騙されることはないからな
まあ残念ながら、こういう人間が一番陰謀論にハマって盛大に騙されるわけだが
>>796
ゲイリーマーカスが勝利宣言してそれに発狂するやつがたくさん出てきそう
>>745
うざいから規制したよ
>>766
喧嘩別れしたからな
>>789
まあ今はそうなんだけど後は頭脳さえ出来れば
身体は今のレベルでも充分対応出来るって話ね。
人間の頭脳は多少不自由な体でもリハビリをする事である程度の動作が可能になるという万能性があるからなあ。
>>798
〉「嘘松」とレッテル貼って自分の自我を守ろうとしている。嘘だ嘘だと言ってるうちは他人に
騙されることはないからな
〉まあ残念ながら、こういう人間が一番陰謀論にハマって盛大に騙されるわけだが
ここらへんなんか分かる。なぜかそういう輩って一部の支配者だけがテクノロジーを独占して不老不死になって大衆を支配するって陰謀論はすぐ信じるよな
ソフトが停滞しようがどうしようがハードの進化はどんどん続くし>>795 で普段乗りしている中島さんが自動運転は99.5%は出来上がってるって言ってるんだから、ロボ技術は今後急速に進むのは間違いないからロボ派の俺はそれだけでも十分満足だわ
日本は特攻なんてバカげたものを組織的に作り出した国だぞ?
仕事なんかなくなるわけない
働かざる者食うべからずは永遠に続く
今年中にウナギが牛丼並みの値段で食べられるようになったらGPT5が糞でも許せるわ
2040年なら逆じゃねえかな?
哲学とか歴史とか文学はずっとうんちゃらかんちゃら言ってられるけど、理系はほとんど自動化するんじゃないかな🤔
【文系人材、2040年35万人余剰に】
私大理系への助成金引き上げ
国はAIやロボットへのニーズが高まり、理系人材は107万人不足すると試算。理工農系学部の教員への補助金を増やし、理系学部の新設や拡充を促します。
https://x.com/nikkei/status/1942698011445829924
>>807
今はもう少子化過ぎて日本人だけでは定員割れしており海外からの留学生(もちろん補助金で)で穴を埋めている状況だしなあ。
正直大学職員の利権が目的としか見えないよな。
Grok 4だいぶ前倒しだったんだな
これは取る気まんまんだな
Grok 4の期待される強化とリリース時期予測
https://grok.com/share/bGVnYWN5_eb0a659f-a8e0-4d27-8703-96ab2a611b6a
Grok 4のリリースは以下の範囲が妥当と考えられます:
早ければ:2025年10月〜12月(Grok 3から8〜10ヶ月後)
xAIのColossusGPUクラスター今は20万基だけど今年中に100万基まで持っていく気だろうか?
xAI、新たに60億ドルの資金調達で100万GPU体制の大規模拡張を計画 https://xenospectrum.com/xai-plans-major-expansion-to-1-million-gpus-with-6-billion-in-new-funding/
イーロンの強みは例えソフト面で劣っていたとしても金と物の物量作戦でゴリゴリ行けるとこなんだよな
ということで、NVIDIA時価総額が世界初の4兆ドル突破
NVIDIA時価総額、世界初の4兆ドル突破 AI成長期待で
https://x.com/nikkei/status/1942945663026941992
イーロンがGPUを買う→NVIDIAが儲かる→AIの性能が上がる→xAIの価値が上がる→さらにGPUを買うの無限ループ
>>796
これだな
受容: 事前情報通りの性能だったな。ただ無料ユーザーには大きいんじゃないか?o4やGPT-6に切り替えていく。
2025年7月10日の最新AI情報
以下、直近24時間以内に確認できたAI分野の主なトピックを、カテゴリ別にまとめました。
概要
本日(2025年7月10日)のAI関連では、生成AIモデルの次期バージョンに関する噂が相次いで報じられたほか、ロボティクスや大規模メモリ管理に関する研究成果が公開されました。また、主要ベンダーからは新たなロボットハードウェアの発売動向や、企業戦略の一環としてオープンウェイトモデル提供に向けた動きが伝えられています。法規制分野の新たな発表は本日時点で見当たりませんでした。
*生成AI
[ウワサレベル] GPT-5が“今月中”リリースか?期待の機能とは
Tom’s Guideによると、OpenAIの次期大型言語モデル「GPT-5」は2025年7月中のリリースが有力視されており、特に長文処理能力やカスタマイズ性の大幅強化が予想されています。ユーザーインターフェースの拡張やマルチメディア対応の拡充も盛り込まれる見込みです (トムズガイド)
[ウワサレベル] OpenAI初の「オープンウェイトモデル」、来週公開か
The Vergeは、OpenAIがGPT-2以来初となるオープンウェイト型のモデルを来週にも公開予定と報道。Microsoft Azureに加え、Hugging Faceなど複数クラウドでのホスティングが可能となり、企業の利用ハードルが下がる可能性があります (The Verge)
*AI研究
[ウワサレベル] 「MemOS」:AIに“人間のような記憶”を与える初のOS
VentureBeatは、中国の研究チームが発表した「MemOS」を紹介。人間の長期記憶を模倣できるAIメモリ管理システムで、複数タスク間の知識共有を高速化する技術として注目されています (VentureBeat)
*AIチップ・ハードウェア
[ウワサレベル] Hugging Faceが$299の家庭用ロボットを発売
VentureBeatによれば、Hugging Faceは家庭向けロボット「HF-Bot」を税込$299でリリース。Gemini系モデルを搭載し、音声対話や簡易物体認識、クラウド同期による継続学習機能を実装しています (VentureBeat)
*法規制
本日時点で、AIに関する新たな法規制やガイドラインの発表は確認できませんでした。
*企業動向
[信頼性の高い情報源] OpenAI、新モデルのクラウド独立運用を推進
The Verge報道によれば、OpenAIは次期オープンウェイトモデルのリリースに伴い、Microsoft依存を緩和し、複数プラットフォームで自由に運用できる体制を整備中です (The Verge)
[ウワサレベル] Sam Altman、AGI実用化のタイムラインを再提示
Business Insiderによると、OpenAI CEOのSam Altman氏は近くAIエージェントが一般業務に参入し始めると改めて予測。2025年内には「業務自動化」の第一波を迎える見通しと述べています (Business Insider)
Andrew Curran @AndrewCurran_
ロイターは、OpenaiがAI駆動のWebブラウザをリリースして、「消費者がWebを閲覧する方法を根本的に変える」Chromeと直接競合しようとしていると報告しています。
2025年07月10日 03:06
https://pbs.twimg.com/media/Gvb0WptWkAAS7Y8.png
https://x.com/AndrewCurran_/status/1943008960803680730
ITmedia NEWS @itmedia_news
画像生成AI「Stable Diffusion」、性的コンテンツでの利用を禁止に 開発会社が規約改定へ
https://www.itmedia.co.jp/news/articles/2507/09/news076.html
2025年07月09日 11:50
https://x.com/itmedia_news/status/1942778247584137290
TestingCatalog News @testingcatalog
BREAKING : Gemini 3 reference has been spotted in the Gemini-CLI commit!
gemini-beta-3.0-pro
2025年07月10日 00:19
https://pbs.twimg.com/media/GvblP6qX0AAAHXn.jpg
https://pbs.twimg.com/media/GvbN7tbWYAAtiGx.jpg
【引用ツイート】
Samuel
Another siting of Gemini 3.0 pro
https://pbs.twimg.com/media/GvbN7tbWYAAtiGx.jpg
https://x.com/SamuelSurfboard/status/1942966907742671267/photo/1
https://x.com/testingcatalog/status/1942992358565413332
これマジか?もう何を信じていいか分からんな
・みんな極端な見方をしている
・数十年かかる話
・リモートワークレベルですら難しい
Cursor作った天才が見据えるAIへの冷静な視点
https://youtu.be/ChowioO7-RY?t=938
>>819
15分40秒くらいから
ポッと出の「25歳の天才」とやらよりも、
ビッグテック技術系頂点であるイリヤ・サスケヴァやデミス・ハサビスを信用しますやん
xAI @xai
The Grok 4 livestream will begin soon. Stay tuned.
2025年07月10日 12:01
https://x.com/xai/status/1943143406072705466
>>819
これか、お前がしっかりしろよw
顧客サポートAIが暴走してコードエディターAI「Cursor」開発企業の評判がガタ落ちに
https://gigazine.net/news/20250506-ai-glitch-chatbot/
自分ところのAIがダメなだけですやん草
>>819
新井紀子と全く同じパターンじゃないか?
Grok4のデモ見てるけど、音声モードすごいな。
向こうが明確に時期を指定してモデルリリースを予告したからGPT5も早めに出さないとキツイな
競争はまだ続く
Grok 4 Heavy(マルチエージェントシステム)でHLEの50%が解けるんだってすごいわね。
今年始めが一桁台だったのを考えると凄すぎる進歩
ポチョムキン理解をどれだけ克服してるかの度合いを図るテストの開発が待たれる
イーロンの有言実行ぶりはすごいな。xAIとか主要AI組織の中で1番新参なのに
>>819
この人のcursorはあと数年でプログラミング自動化されたら商売あがったりだからアンチ側の意見発信してるんじゃね?
Greg Kamradt @GregKamradt
24時間前に@xaiから電話がありました
「Grok 4をARC-AGIでテストしたい」
噂は聞いていました。良いモデルになるだろうと思っていました。ARC-AGIでNo.1の公開モデルになるとは思っていませんでした。
テストの経緯とその結果の意味は次のとおりです。
昨日、xAIチームのJimmyと話をしました。彼らはGrok 4のスコアを検証してほしいと依頼してきました。彼らはARC-AGI-1とARC-AGI-2の公開評価セットで独自のテストを行いました。
彼らのスコアを検証し、過剰適合の可能性を測定するために、私たちは半プライベートな評価セットで新しいモデルを自己テストしました。
私たちはテストポリシーについて説明しました。
* データ保持なし
* モデルチェックポイントは一般公開を目的としている必要があります
* バースト試験の速度制限の一時的な増加
彼らは賛成してくれたので、私たちは始めました
当初、通常のリクエストでタイムアウトエラーが発生したため、ストリーミングに切り替えました。これにより問題は解決しました。
では、これらの結果は何を意味するのでしょうか?
まず事実から:Grok 4は現在、ARC-AGIで公開されているモデルの中で最高のパフォーマンスを発揮しています。これは、Kaggleに投稿された専用ソリューションよりも優れたパフォーマンスです。
第二に、ARC-AGI-2は現在のAIモデルにとって難しい課題です。高得点を得るには、モデルは一連のトレーニング例からミニスキルを学習し、テスト時にそのスキルを発揮する必要があります。
以前の最高スコアは約8%(Opus 4)でした。10%未満はノイズが多いです。
Grok 4は15.9%のノイズバリアを突破し、ゼロではないレベルの流動性知能を示している。
しかし、ミッションはまだ終わっていません。ARC-AGI-2を解決するには新たなアイデアが必要です。規模だけでは解決できません。
ARC-AGIに一緒に取り組んでみませんか?
2025年07月10日 13:42
https://pbs.twimg.com/media/GvdtoLQXUAEV4oY.jpg
【引用ツイート】
ARC Prize
Grok 4 (Thinking) achieves new SOTA on ARC-AGI-2 with 15.9%
This nearly doubles the previous commercial SOTA and tops the current Kaggle competition SOTA
https://pbs.twimg.com/media/GvdtoLQXUAEV4oY.jpg
https://x.com/arcprize/status/1943168950763950555/photo/1
https://x.com/GregKamradt/status/1943169631491100856
お前らこのパズル解けるか?俺には分からん
ARC-AGI-2の問題例。
https://pbs.twimg.com/media/GveKuQEakAMGaCg?format=png&name=orig
これはGPT5も対抗して出してくる流れじゃ?
早く出して俺がこのままchatGPTに課金し続けるか他のAIに乗り換えるか決めさせて欲しいわ
>>832
なんとなく分かるけど全然自信ないわw
6月
Appleの研究者「現在のアプローチでは、推論能力で根本的な限界に直面している可能性がある!」
7月10日
xAIの研究者たち「Grok4を発表!推論でさらに性能向上しました!」
https://x.com/jaguring1/status/1943226456802459996
イーロン・マスク
Grok 4は、巧妙に敵対的な問題でない限り、数学や物理学の試験問題を基本的に間違えないレベルに達しています。
問題の誤りや曖昧さを特定し、その誤りを修正したり、曖昧な問題のバリエーションごとに解答したりすることができます。
https://x.com/elonmusk/status/1943230468519788551
Anthropicがついに公式に科学技術政策局 (OSTP) にノーベル賞受賞者と同等の強力なAIが26年後半/27年初頭に出現すると予想していると勧告。米政府に技術的リーダーシップを維持するために断固たる行動(安全保障テスト、輸出管理、ラボセキュリティ強化、経済影響への備え)を取る必要を訴える。
https://x.com/bioshok3/status/1897607079910658078
Grok4をテスラ車やオプティマスに組み込む用意もできてるみたいだから楽しみだな
ふむ、これは凄いな
以前の Deep Search が専用の学習をせずツールを使っていたのに対し、Grok 4 の学習時にはツールを学習そのものに組み込み、ツールを使う際の能力を大幅に向上。
現状、有限要素解析(FEM)や数値流体力学(CFD)などのシミュレーションと比較するとかなり劣るが、今後正確な物理シミュレーションを使えるようにする予定。たとえば、ヒューマノイドを介して現実世界と対話する能力を持つようになったり。いずれ、現実を強化学習ループに組み込んで、車やロケットの設計を改善したり、新薬を開発、それがうまくいっているか検証したり。
Grok 4 は Grok 3 と比較して、リーズニングに使用するコンピューティングリソースが 10 倍。ツールを学習の中に組み混んでいる。
https://share.google/qiVa7y8CFuPVSzHEA
ARC-AGI-1で 66.7%
ARC-AGI-2 で15.9%
AGIにかなり近づいて来たな
grokってハードウェアのゴリ押しと思ってたわ
なんかアルトマンGPT-5に対して「体感は4.5とそんなに違いが分からないかも」とか日を増すごとにトーンダウンしてないか?流石に3.5→4の衝撃は超えてくれないと萎えるぞ
>>832
3✕3なわけないだろ問題作ったやつバカか
>>832
うーん、眺めてたら法則性がわかった。
上から現れた色の順序で左に枠のみと右側に塗りつぶしを並べているだけだわ。ただそれをどうやって3x3のグリッドに収めるのか不明だけど。
最低でも縦に16グリッド、横に8グリッドは必要なはず。
そういやYコンビネーターのインタビューでイーロン・マスクが語ってたが、普通に業者に依頼してデータセンターを作ろうとすると2年以上掛かってしまいその分競合に遅れを取ってしまうので既にあった建屋を活用したり電気の配線も数GW耐えられるものを用意する苦労や冷却装置もアメリカ中から取り寄せて無理したと言っていた。
「Grok 4 Code」どのくらい進化してるのか楽しみだな
“世界最強”の最新鋭AIモデル「Grok 4」をxAIが発表 〜他社モデルを圧倒する性能
https://share.google/Rogkeg5jAt1vnEk8J
米xAIは7月9日(現地時間)、最新のAIモデル「Grok 4」を発表した。前モデルである「Grok 3」の10倍のパフォーマンスを誇り、“世界最強”を謳っている。
「Grok 4」は同社の最新かつ最高のフラッグシップモデルで、自然言語、数学、推論で比類のないパフォーマンスを提供するという。コンテキストウィンドウの長さは256,000トークン。各種ベンチマークにおいても、OpenAIの「o3」、Anthropicの「Claude 4」、Googleの「Gemini 2.5 Pro」といった他社モデルを凌駕する性能を実現していることが示されている。
今後はコーディング専用モデル「Grok 4 Code」のリリース、マルチエージェント(テキスト・画像・ビデオ)への対応、ビデオ生成のサポートなどが予定されているとのこと。
>>842
そこ気になるわ
AI関連の未来予測自体は変えてないんだよな
>>846
✗マルチエージェント
○マルチモーダル
マルチエージェント自体はGrok 4 Heavy
>>846
5ヶ月で10倍なら年末には年初の100倍の性能になってるのも夢じゃないな
100%ってあるんだ
様々なベンチマークにおけるGrok 4のスコア(Grok 4 heavy)
大学院レベルの物理学・化学・生物学のベンチマークであるGPQAで88.9%(ツール使用なしで87.5%)
AIME25でGrok 4 heavyが100%(ツール使用なしで91.7%)
など
https://x.com/jaguring1/status/1943170077336928765
しかし、生成AIも型番の数字だけが増えるような似た製品ばかりになってて、
ジャンルの末期状態に近づいているように見えるなw
>>847
これか、俺でもちょっと信じ難いようなロードマップだなこりゃ
サム・アルトマンのインテリジェンス時代へのロードマップ(2025〜2027年) 上院公聴会でさりげなく提示された、これまでで最も衝撃的なタイムライン。
2025年 — スーパーアシスタントの台頭 AIがあなたの第二の脳になる。
•AIは読み書き、スケジュール管理、交渉を行う。
•人間よりも賢いパーソナルアシスタント。 •検索は不要。質問する。委任する。
•知識労働が一夜にして変革する。
•地球上のすべての人が、ポケットの中に参謀を持つ。
2026年 — 科学的発見が飛躍的に進む AIが実験を開始する。単なる補助ではなく、主導する。
•モデルが仮説を生成し、実験を設計し、結果をシミュレーションする。
•かつては何年もかかっていた研究サイクルが、数日に短縮される。
•医学、物理学、材料…あらゆる分野でブレークスルーが起こる。 •科学的手法がソフトウェアアップデートされる。
2027年 — 物理現実の自動化 AI搭載ロボットの時代が到来。
•ロボットが物流、介護、家事といった定型的な労働を担う。
•ロボットは状況を理解し、即座に適応し、常に進化する。
•人間の時間は創造性、繋がり、探求のために解放される。
私たちは単に仕事を自動化するだけではない。「働く」ことの意味を再定義するのだ。 アルトマンは未来を予言しただけではない。 彼は未来にタイムスタンプを刻んだのだ。 そして、それは今始まる。
https://x.com/VraserX/status/1920546772675416299
日本経済新聞 電子版(日経電子版) @nikkei
NVIDIA時価総額、世界初の4兆ドル突破 AI成長期待で
https://www.nikkei.com/article/DGXZQOGN098R70Z00C25A7000000/?n_cid=SNSTW001&n_tw=1752069315
2025年07月09日 22:55
https://x.com/nikkei/status/1942945663026941992
>>831
中の人がxAIとのやりとり教えてくれるの面白いなw ARC2でopus4の倍のスコアとってるのすごいわ
>>845
金持ってても普通のルートじゃ無理なことやってるんだな
このへんの工夫できるのがイーロンらしい
>>854
1日でも早く世界一になりたいって、がっついてるのがイーロンらしいよな
もう専門家のコメンテーターいらんやん
イーロン「学問的な質問に関して言えば、Grok 4はどの分野でも人間の博士レベルを超えてる。例外はない。」
https://x.com/kajikent/status/1943169863423500713
🚨AI、古代バビロニアの法板解読で98%の精度を達成 研究者たちは、機械学習を用いて、ハンムラビ王朝時代の3,700年前のバビロニアの粘土板の文字化に成功しました。数千の楔形文字を学習させたAIモデルは、楔形文字の98%を正確に識別し、数万枚の類似の粘土板の翻訳に大きな可能性を示しました。これは、考古学、言語学、人工知能の融合分野における大きな進歩です。
https://x.com/HistContent/status/1943036264933974196
話題沸騰中のロックバンド、実は100%「AI」だったと発覚
今年6月からSpotify上に突如として現れ、瞬く間に月間75万リスナーを超えたバンド「The Velvet Sundown」。しかし最近、彼らが架空のAIバンドであることが発覚したのです。
https://x.com/NazologyInfo/status/1943143641230299411
「豚の臓器で自動ロボット手術に成功」
・ 軟部組織を切断、切り取り、掴むツールを備えたAI訓練を受けたロボットが人間の助けを借りずに豚の胆嚢の除去に成功
・ 8件の手術を100%の成功率で実施
・ 10年以内に人間を対象に自動手術を試験できる可能性
https://x.com/CeoImed/status/1943261886289707145
イーロン・マスク
ARC-AGI-3を楽しみにしています。
https://x.com/elonmusk/status/1943192643439337753
xAIの完全宣戦布告に対してOpenAIもだけどGeminiもClaudeも次の一手が楽しみだねぇ
イーロン・マスクは、最初の本格的なAIビデオゲームが来年登場すると予想しています。
・AIはコードを書くだけでなく、アセットの調達を自動化する
・AIは「ツール」としてUnreal EngineやUnityなどのグラフィックエンジンを活用する
・AIが生成したゲームを、AIが自分でプレイし評価・改善する
https://x.com/d_1d2d/status/1943209111619014711
IMO(国際数学オリンピック)は来週開催されます。
AIの金メダルは単なる出来事に終わる可能性もあれば、重要なブレークスルーとなる可能性もあります。
AIシステムが創造的な問題解決能力を発揮するかどうかにかかっています。
https://x.com/EpochAIResearch/status/1943045667896631673
イーロン・マスクがマルチエージェント「Grok 4 Heavy」について語る
・「Grok 4 Heavy」は複数のエージェントを並行して起動する
・それらのエージェントは各自独立して作業を進める
・作業後、それぞれの結果を比較し、どれが最善かを判断する
・単純な多数決ではなく、あるエージェントが問題の本質やトリックを見抜けば、その解決策を他のエージェントと共有する
・エージェント同士が実質的にノートを突き合わせて、最終的な答えを導き出す
・推論時の計算量を約1桁増やし、複数のエージェントに同じタスクを取り組ませ、結果を比較・検討した上で最良の回答を提出させる
・Grok 4はシングルエージェント版であり、Grok 4 Heavyはマルチエージェント版
https://x.com/d_1d2d/status/1943226184864796752
Shengyang Sun @ssydasheng
We built 200k-GPU clusters;
We scaled up & curated higher-quality data;
We scaled compute by 100x;
We developed training & test-time recipes;
We made everything RL native;
We stabilized infrastructure and speeded up;
That's how you turn RL into the pre-training scale.
Yet I am always amazed by this figure everytime I see it.
Try Grok-4 and Grok-4-Heavy.
2025年07月10日 14:23
https://pbs.twimg.com/media/GveMF7jX0AAoCGF.jpg
https://x.com/ssydasheng/status/1943179313345409302
Grok4微妙って報告多いな
なんかもうベンチマークも信用できないよなあ
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板