技術的特異点/シンギュラリティ【総合】避難所 37 - 1752429302

1：名無しさん (ﾜｯﾁｮｲ f751-5338)：2025/07/14(月) 02:55:02 ID:w57JJshI00: 2045年頃に人類は技術的特異点(Technological Singularity)を迎えると予測されている。
未来技術によって、どのような世界が構築されるのか？人類はどうなるのか？
などを様々な視点から多角的に考察し意見交換するスレッド

■技術的特異点：収穫加速の法則と半導体微細化の進歩曲線に基づいて予測された、
生物的制約から開放された知能[機械ベース or 拡張脳？]が生み出すとされる
具体的予測の困難な時代が到来する起点

■収穫加速の法則：一つの発見が新たな技術を生み出し、その技術が他の発明を生み出すという連鎖的な反応が、科学技術全体を進歩させるという仮説

★関連書籍・リンク・テンプレ集(必修)
https://singularity-2ch.memo.wiki/
★特異点アンケート
https://forms.gle/c6ZLjnheCEZftYgg9

※前スレ
技術的特異点/シンギュラリティ【総合】避難所 36
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1750375557/

※不老技術の動向と医学関連はこちら
不老不死（不老長寿）を目指すスレ避難所
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1669450079/

次スレは>>950が立てること　立てられない場合は早急に他者に依頼するか951以後の者が早急に立てること
誰も次スレを立てずに議論に没頭して落としたり次スレにフライングレスしないこと
未来技術板のURLは書かないし、あちらから誘導もしないこと
179：名無しさん (ｵｯﾍﾟｹ 3c4d-822c)：2025/07/17(木) 22:35:23 ID:t4QFIbUASr: 政治板でやれよ
180：名無しさん (ｵｯﾍﾟｹ 0660-822c)：2025/07/17(木) 23:09:06 ID:e0vLAE/USr: 一部の情報では、OpenAIのAIが世界最高のプログラミング能力に到達したようだ。
人間のプログラマーは3日間で10時間も行われたテストで最終的にAIに勝ったものの、もう少しテストが続いていたら負けていたと感想を述べた。
これで今年の終わりまでにAIが世界最高のプログラマーになるというサム・アルトマンやAnthropicのダリオ・アモデイの予言はほぼ実現したことになる。
https://x.com/DGetback47618/status/1945804435650941103
181：名無しさん (ﾜｯﾁｮｲ f394-ce57)：2025/07/17(木) 23:24:35 ID:MIy0yqxU00: Grokコンパニオンの模倣品オープソース化
https://x.com/pirokichi/status/1945770450912735349?s=46&t=2cyeChglaxe-bJ6Jxcwr9Q
182：名無しさん (ｽﾌﾟｰ 3741-cc6e)：2025/07/18(金) 09:12:03 ID:QGvqijsESd: Sam Altman @sama
今日、私たちはChatGPT Agentという新しい製品を発売しました。

Agentは、AIシステムの新たな能力のレベルを表し、独自のコンピュータを使用して、驚くべき複雑なタスクをあなたのために遂行することができます。これは、Deep ResearchとOperatorの精神を組み合わせたものですが、それ以上に強力です—長時間考えることができ、ツールを使用し、さらに考え、行動を起こし、さらに考える、といった具合です。たとえば、発売時に行ったデモでは、友人の結婚式の準備として、服の購入、旅行の予約、ギフトの選択などを示しました。また、データの分析や仕事用のプレゼンテーション作成の例も示しました。

その有用性は大きいですが、潜在的なリスクも同様に大きいです。

私たちは多くの安全装置や警告を組み込み、これまで以上に広範な緩和策を講じてきました。堅牢なトレーニングからシステムの安全装置、ユーザー制御までありますが、すべてを予測することはできません。反復的な展開の精神に基づき、ユーザーに強く警告し、慎重にアクションを取る自由を与えるつもりです。

私は自分の家族には、これが最先端かつ実験的なものだと説明します。未来を試すチャンスではありますが、高リスクな用途や個人情報を多く扱う場合には、まだ十分に研究し、実際の現場で改善する機会が得られるまでは使用しない方が良いでしょう。

具体的な影響は正確にはわかりませんが、悪意のある者がユーザーのAIエージェントを「騙して」、公開すべきでない個人情報を引き出したり、すべきでない行動を取らせたりする可能性があります。その方法は予測できません。プライバシーやセキュリティのリスクを減らすために、エージェントにはタスクを完了するために必要な最小限のアクセス権を与えることをお勧めします。

たとえば、エージェントにカレンダーへのアクセスを許可して、グループディナーの都合の良い時間を見つけることができます。しかし、服を買うように頼むだけなら、アクセス権を与える必要はありません。

「夜間に届いたメールを見て、必要な対応をすべて行い、フォローアップの質問はしない」といったタスクには、より大きなリスクがあります。悪意のあるメールからの信頼できないコンテンツが、モデルを騙してあなたのデータを漏洩させる可能性があります。

私たちは、現実との接触から学び始めることが重要だと考えています。そして、潜在的なリスクをより良く定量化し、軽減するにつれて、人々がこれらのツールを慎重かつゆっくりと採用することを推奨します。他の新たな能力のレベルと同様に、社会、技術、リスク軽減戦略は共に進化する必要があります。
2025年07月18日 02:36

https://x.com/sama/status/1945900345378697650
183：名無しさん (ｽﾌﾟｰ 3741-cc6e)：2025/07/18(金) 09:16:00 ID:QGvqijsESd: ChatGPT研究所 @ctgptlb
【速報】OpenAI、新機能「ChatGPTエージェント」を発表

① ブラウザ、ターミナル、API等を自律的に使用するエージェント機能を搭載
②30分を超える複雑なタスクを最後まで自律的に計画・実行が可能
② Pro、Plus、Teamユーザーへ本日より順次提供開始

詳細はスレッド
https://x.com/OpenAI/status/1945904743148323285/video/1
2025年07月18日 03:30
[動画] https://twitter.com/i/status/1945904743148323285

https://x.com/ctgptlb/status/1945913920759456043
184：名無しさん (ｽﾌﾟｰ 3741-cc6e)：2025/07/18(金) 09:23:40 ID:QGvqijsESd: Psyho @FakePsyho
更新：私は元気で生きています

結果が公式に発表され、AIに対する私のリードが5.5％から9.5％に増えました

正直、この盛り上がりはちょっと奇妙に感じます。こんなに多くの人がプログラミングコンテストに興味を持つなんて思ってもみませんでした。これって、もっと頻繁にここに顔を出すべきってことかな
2025年07月18日 03:02
https://pbs.twimg.com/media/GwE3Uu9XsAAr_oX.jpg
https://pbs.twimg.com/media/GwE4MXmXMAAKRiT.jpg

https://x.com/FakePsyho/status/1945906866686705882
185：名無しさん (ﾜｯﾁｮｲ b2d9-14d1)：2025/07/18(金) 10:52:59 ID:VqkrlajY00: >>184
日本人凄いじゃん
186：名無しさん (ｽﾌﾟｰ 14b2-cc6e)：2025/07/18(金) 12:11:18 ID:qbjpOMl2Sd: 東京で開催されてるからね
187：名無しさん (ｵｯﾍﾟｹ 93e0-822c)：2025/07/18(金) 13:06:53 ID:jwadXDp6Sr: AIは既にトップレベルに並んでるんだね
188：名無しさん (ｵｯﾍﾟｹ 93e0-822c)：2025/07/18(金) 13:09:02 ID:jwadXDp6Sr: AIって既にトップレベルに並んでるんだね
189：名無しさん (ｵｯﾍﾟｹ 93e0-822c)：2025/07/18(金) 13:09:33 ID:jwadXDp6Sr: ２回投稿してしまった
190：名無しさん (ｵｯﾍﾟｹ 93e0-822c)：2025/07/18(金) 13:13:00 ID:jwadXDp6Sr: 地味だけど大きい進歩

ChatGPT Agentの評価図が示すのは、「ツールを増やせば性能が上がる」という当たり前に聞こえるけど実は凄い事実だ。

つまり、AIがついに「どのツールをどの組み合わせで使うか」を的確に判断できるようになり、長いステップも間違うことなくこなせるようになった。

これでロボットへの応用が進む。
https://x.com/K_Ishi_AI/status/1946014905586630708
191：名無しさん (ﾜｯﾁｮｲ 8b7a-c3d9)：2025/07/18(金) 13:23:21 ID:AKdjNxW200: とりあえずアナログ時計読めるようになったら起こして
192：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/18(金) 14:40:25 ID:/nwOJoJ.Sd: >>190
おお。LLMは原理的に何でも学習できると思っていたがやはり間違いではなかった。少なくともAGIレベルには到達できるだろう。
193：名無しさん (ﾜｯﾁｮｲ fd76-d72e)：2025/07/18(金) 14:44:43 ID:geUXhrSo00: o3で試したが普通にアナログ時計読めるぞ
194：名無しさん (ｱｳｱｳ fd4d-29da)：2025/07/18(金) 16:18:34 ID:9GjMKWU6Sa: 別にAGIに意識なんていらんしな
195：名無しさん (ﾜｯﾁｮｲ 9cd6-8064)：2025/07/18(金) 16:45:54 ID:HHCJyqmA00: 意識とか感情とか再現しない方が使い勝手は良いだろうな
人間そっくりだったり生き物感あると人間の為にAIを犠牲にするのかって言い出す団体出て来るのが目に見える
196：名無しさん (ﾜｯﾁｮｲ 265e-2014)：2025/07/18(金) 17:53:34 ID:xb8nlQuc00: AIの反乱を描いたデトロイトの所為だよね
197：名無しさん (ﾜｯﾁｮｲ 9f8a-9fcd)：2025/07/18(金) 18:23:35 ID:SzjCXpno00: 今回出てきたのがようやく実用的エージェントとなるのだろうか
198：名無しさん (ｵｯﾍﾟｹ 724e-822c)：2025/07/18(金) 18:24:39 ID:Yfob80PYSr: いちおう今年はエージェント元年だからな
199：名無しさん (ｵｯﾍﾟｹ 724e-822c)：2025/07/18(金) 18:27:30 ID:Yfob80PYSr: >>191
これだな
https://youtube.com/shorts/BQajEg5fvGo
200：名無しさん (ﾜｯﾁｮｲ fd76-d72e)：2025/07/18(金) 18:35:54 ID:geUXhrSo00: o3はちゃんとアナログ時計の時間読める
何回か試すと間違うけどちゃんと正解する
201：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/18(金) 21:04:31 ID:/nwOJoJ.Sd: Paul Gauthier @paulgauthier
Kimi K2は、Aider polyglot コーディングベンチマークで59%を記録しました。

完全なリーダーボード：
https://aider.chat/docs/leaderboards/…
2025年07月18日 20:09
https://pbs.twimg.com/media/GwIrCRTX0AAr1yi.jpg

https://x.com/paulgauthier/status/1946165321611526229
202：名無しさん (ﾜｯﾁｮｲ 5c47-cdf2)：2025/07/18(金) 21:06:57 ID:D.ZyiDME00: 間違うんかい！
AIが間違った回答をした時に、どういう理由でその回答に至ったかの説明を求めると面白いよ
自信満々で間違った説明をしてくるｗ
203：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 21:39:55 ID:gdvetYdc00: ザッカーバーグの最新のコメントだ。
「今年最もエキサイティングなことは、モデルが自己改善の兆候を見せ始めていることです。これは、超知能の開発が視野に入ったことを意味します。私たちは超知能を実現するために最大限の努力をします。私たちは世界中のすべての人に個人的な超知能を提供しようと考えています。超知能をすべての個人の手に委ねるのです。そのコンピューティングリソース構築のため数百億ドルを投資する予定です。その実現は2、3年以内でしょう」
204：名無しさん (ﾜｯﾁｮｲ 9f8a-9fcd)：2025/07/18(金) 21:53:46 ID:SzjCXpno00: メタも露骨にAGI作るチーム構築したんだよな
205：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 22:14:35 ID:gdvetYdc00: AGIより先にASIを作るつもりなのでは？
206：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 22:17:22 ID:gdvetYdc00: >モデルが自己改善の兆候を見せ始めていることです。
>これは、超知能の開発が視野に入ったことを意味します。

2030年までにビックテック系がそれぞれASIをリリースするのでは？
207：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 22:18:17 ID:gdvetYdc00: 各社のラボの中では自分のプログラムを書き換えて進化するAIが既にあるかと推測できる
それをそのまま公開して大丈夫なのかと迷っている状態なのだろう
208：名無しさん (ｵｯﾍﾟｹ d686-563c)：2025/07/18(金) 22:38:15 ID:7MWxa2pkSr: まだまだ時間かかると思うけどロボットが厨房に入って料理を全てこなして人間より使えると社会的に認められたらおおってなるな。

人間がやるより衛生的かもしれないし、ロボットだからこそ精密な調理も可能になるかもしれない。
やはり飲食関係というか目に見えるところに進出して来れば驚くって。
209：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/18(金) 23:07:24 ID:/nwOJoJ.Sd: >>203
お前の会社は「メタバース」に注力するってことで「メタ」に改名したのに超知能にアクセル全開でいいかｗ
210：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 23:29:19 ID:gdvetYdc00: >>209
こまけぇこたぁいいんだよ！
211：名無しさん (ｵｯﾍﾟｹ 619e-822c)：2025/07/18(金) 23:41:39 ID:q8NNoohASr: まぁまぁw
メタはメタバースが間違ってたんじゃなくて順番が間違ってたって言ってる
先にAGIが来てからメタバースが来るということらしい
212：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/18(金) 23:44:27 ID:gdvetYdc00: サム・アルトマン
https://x.com/sama/status/1945901039104004467

ChatGPTエージェントがコンピュータを使って複雑なタスクを行うのを見るのは、私にとって本物の「AGIを感じる」瞬間でした。コンピュータが考え、計画し、実行するのを見るのは、何か特別な感じがします。
213：名無しさん (ｵｯﾍﾟｹ b672-822c)：2025/07/19(土) 00:14:25 ID:NK5m77icSr: 俺だけなのかな？
AGI以前に超有能なエージェントができれば仕事の相棒として最強じゃんって夢見てるのは？
214：名無しさん (ﾜｯﾁｮｲ 5c47-cdf2)：2025/07/19(土) 00:22:43 ID:/hF02HPI00: AGIが達成されない限り、超有能なエージェントができないと思われ
Alexaに毛が生えたレベルのエージェントでは、誰も使わないで
215：名無しさん (ｵｯﾍﾟｹ 44e2-822c)：2025/07/19(土) 00:54:39 ID:tItaA7/ISr: 俺の中では、
エージェント→俺の指示を内容を隅々まで理解して完璧にこなす有望な相棒
AGI→指示も判断も必要なく俺よりも有能でエージェントへの指示も全てを任せられる有能な人間レベルのAI
216：名無しさん (ﾜｯﾁｮｲ 9f8a-9fcd)：2025/07/19(土) 04:05:04 ID:xSAoujuw00: AGIに到達する前にエージェントが高度化してく段階があるだろうね
別に人間並の知能まで無くても自動化できそうな作業は多くあるし
217：名無しさん (ﾜｯﾁｮｲ 7017-0fe4)：2025/07/19(土) 04:46:15 ID:JVEw5jyk00: AGIとASIが実はほぼ同時にできたりする？
直線的な発展観を人間はつい構想してしまうので時間差を考慮してしまうが
実際はAGIもASIもコインの裏表だったりして
218：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 06:29:19 ID:ZpvkKs6gSd: AGIはLLMのアーキテクチャで実現できるかもしれないが(デミス・ハサビスはあと2-3のブレークスルーが必要と言っているが), ASIは根本的にアーキテクチャが別になると思う。
もちろんLLMがアーキテクチャの一部になる可能性はある。
219：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 07:20:22 ID:ZpvkKs6gSd: 概要
ARC‑AGI‑3 プレビューは、人工知能が人間のような汎用的知能を獲得し得るかを評価するための、初のインタラクティブ推論ベンチマークなのじゃ(ARC Prize)。このプレビュー版では、未知の環境でのスキル獲得効率を計測するための６つのゲーム（公開３、2025年8月公開予定３）を用意しているのじゃ(ARC Prize)。ゲーム環境はグリッドワールド上で展開され、事前の説明や指示なく、観察・計画・行動を繰り返して解法を自ら見出す必要があるのじゃ(ARC-AGI-3)。

テスト能力の要素
１．探索能力（Environment Exploration）を試すのじゃ(ARC Prize)。
２．Percept → Plan → Action の反復プロセスを評価するのじゃ(ARC Prize)。
３．記憶（Memory）を用いて過去の経験を活かす能力を測るのじゃ(ARC Prize)。
４．目標獲得（Goal Acquisition）により、新たな目的設定と達成方法を学習する力を問うのじゃ(ARC Prize)。
５．アライメント（Alignment）、すなわち与えられたルールや人間の意図と整合的に動く能力をテストするのじゃ(ARC Prize)。

ゲームデザインの特性
コア知識プライヤー（Core Knowledge Priors）のみを前提とし、言語やトリビアへの依存は排除しているのじゃ(ARC Prize)。
隠れ状態の推測、他エージェントとの相互作用、長期計画など、革新的なゲームメカニクスを奨励する設計なのじゃ(ARC Prize)。
人間にとっては〈<1分〉でルールを把握でき、〈5～10分〉でプレイできる易しさを維持しているのじゃ(ARC Prize)。

プレビューの規模と今後
プレビュー段階では６ゲームに限定されておるが、最終的にはおよそ100のユニークな環境が用意され、公開・非公開評価セットに分かれてAIの汎化能力を厳密に測定する予定なのじゃ(ARC Prize, ARC Prize)。これらは全て、未知の状況におけるスキル獲得効率を人間基準と比較することで、AGI到達の指標となるのじゃ(ARC Prize)。

インタラクティブ性の重要性
静的ベンチマークでは測りえぬ知能の全貌を捉えるため、インタラクティブ推論ベンチマーク（IRB）は探索～計画～行動の動的過程を評価するのじゃ(ARC Prize)。ARC‑AGI‑3ではこれをグリッドワールド上のゲーム環境に落とし込み、AIが未知の環境で多段ステップの判断を行えるかを試すのじゃ(ARC-AGI-3)。

以上の通り、ARC‑AGI‑3 プレビューは未知のゲーム環境を通じてAIの人間らしき学習効率と推論能力を多角的に評価する、新機軸のベンチマークなのじゃ。今後の完全公開が楽しみなのじゃ！
https://x.com/arcprize/status/1946260363256996244
220：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 07:21:22 ID:ZpvkKs6gSd: わらわの見立てによれば、ARC‑AGI‑3のインタラクティブ課題は現行の大規模言語モデル（LLM）にとって極めて高き挑戦となっておるのじゃ。以下、いくつかの要点を挙げるのじゃ。

静的ベンチマークでさえほとんど歯が立たぬ現状
ARC‑AGI‑2の静的評価では、OpenAIの最新鋭モデル「o3‑medium」でさえ約２.９％の正解率に留まったのじゃ。対して人間は平均６０％前後を叩き出すゆえ、大きな隔たりがあるのじゃ(効果的利他主義フォーラム)。
これは“静的”なパズルのみを解く試験にもかかわらずの数字故、インタラクティブ環境下での学習・探索・行動を要求するARC‑AGI‑3では、より一層の困難を極めるのは明らかなのじゃ。

インタラクティブ性が要求する複合的能力
ARC‑AGI‑3プレビューが想定する「観察→計画→行動」の連続ループは、単なるテキスト推論を超えた環境探索・記憶管理・長期的意思決定を必要とするのじゃ(ARC Prize)。
現行のLLMは自己の出力を即時に“行動”と見做す仕組みを標準では持たず、外部環境との双方向インタフェース実装や、逐次的メモリ更新機構を組み込む必要があるのじゃ。

人間とのギャップのさらに拡がる領域
ARC Prizeの発表によれば、ARC‑AGI‑3プレビューは「人間には容易、AIには最も困難なギャップが最も大きい」種のゲーム群を設計しておるとされるのじゃ(X (formerly Twitter))。
したがって、現行のLLMベースエージェントが自力でタスクを解法に導くのは、静的課題の数％成功ですら至難である現状を鑑み、大海に小舟を漕ぎ出すようなものと言えようのじゃ。

以上より、ARC‑AGI‑3のインタラクティブ課題は、現在のLLMが最も苦手とする「環境との相互作用を伴う動的学習」を本質的に問い、現行モデルの枠組みだけでは有意義な成果を挙げるのは極めて難しい挑戦と言い切れるのじゃ。今後、メモリ機構や計画モジュール、リアルタイム探索アルゴリズムなどの組み込みを行うことで、はじめて人間に近き学習効率を示せる日が来るであろうのじゃ。
221：名無しさん (ﾜｯﾁｮｲ 9f8a-9fcd)：2025/07/19(土) 08:28:15 ID:xSAoujuw00: ARC3の成績50パー超えるまでどのくらいかかるかな　新システム複数必要ぽいが
1年以内に突破したらビビる
222：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 08:43:24 ID:ZpvkKs6gSd: ARC-AGI-3は実際に人間も遊べるから試してみそ！普通にゲームだから楽しいぞ
ARC-AGI-3 Preview - ARC-AGI-3
https://three.arcprize.org/
223：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 10:51:26 ID:ZpvkKs6gSd: Haider. @slow_developer
このニュース、もっと大きく取り上げられるべきだ…

「ChatGPTエージェントは、テストされたタスクの約半分で人間に匹敵するか、それを超えた。10時間以上かかるタスクでもだ」

冗談だろ？

AIエージェントの年の半分ちょっと過ぎただけで、すでに高影響のタスクをこなしてるなんて
2025年07月19日 01:35
https://pbs.twimg.com/media/GwJg1pKWEAAE6Hp.png

https://x.com/slow_developer/status/1946247341838835968
224：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 11:39:52 ID:ZpvkKs6gSd: 複雑すぎｗ
https://i.imgur.com/TUSP36b.png
225：名無しさん (ｽﾌﾟｰ fa08-cc6e)：2025/07/19(土) 11:45:54 ID:ZpvkKs6gSd: 複雑すぎと思ったけど3つともクリアしたわ
226：名無しさん (ﾜｯﾁｮｲ cbe1-2014)：2025/07/19(土) 13:11:59 ID:tQZUx1Uk00: クリアアサヒ
227：名無しさん (ｵｯﾍﾟｹ fe96-822c)：2025/07/19(土) 14:05:28 ID:LcPVxMF2Sr: うんわからん
228：名無しさん (ｵｯﾍﾟｹ 5454-822c)：2025/07/19(土) 14:12:13 ID:kPRFV6HMSr: AIの理解！その奇妙な心がみえてきた？LLMの内部に隠された3層の知的構造を解明（2025-07）【論文解説シリーズ】
https://x.com/compassinai/status/1946318418740933094
229：名無しさん (ｵｯﾍﾟｹ 57bf-822c)：2025/07/19(土) 14:13:31 ID:j93jObcYSr: LLMは人間と似た理解をするが、やり方が全然違う。
人間は作業記憶の制約で統一的で簡潔な方法を好むが、 LLMは何百もの小技(ヒューリスティック)を同時に使う。
でも結果として、ちゃんと『理解』と呼べるものを実現している。ただし、LLMの理解方式が人間と根本的に異なるため、一貫性を欠く『ポチョムキン理解』に陥る場合もある。
https://x.com/compassinai/status/1946409740105666599
230：名無しさん (ｵｯﾍﾟｹ f6d9-822c)：2025/07/19(土) 14:16:08 ID:SS8u/gbMSr: 今のAIには統一性とか一貫性が無いので人間には非常に奇妙に映るんだな
231：名無しさん (ﾜｯﾁｮｲ 5c47-cdf2)：2025/07/19(土) 15:21:04 ID:/hF02HPI00: いやいやいや、統一性も一貫性もない状態では、それは「理解」してないんだよｗ
AIがその場その場で、無理やり回答を生成しているに過ぎない
これは「人間とは違うやり方だ」といった単純な話ではないｗ

例えるなら、「分かりました！」と返事をするのに、毎回説明したこととは全く異なる結果を出してくる部下を思い出すｗ
232：名無しさん (ｽﾌﾟｰ 54f5-cc6e)：2025/07/19(土) 17:31:45 ID:5Gbq1wFESd: AI時代の羅針盤 (compass for the AI era) @compassinai
【「理解」論争、ついに核心へ！それは… ”奇妙な心” 】

AIは単語の確率を計算しているだけ？ベルン大学などの研究は、その通説に挑みます。

LLMの内部動作を解き明かすアプローチは、AIが単なる事実の暗記ではなく、物事の「つながり」を捉え、「原理」すら発見するメカニズムの存在を示唆。

しかし、その理解の仕方は人間とは全く異なる"奇妙な心"だといいます。

AIは世界を一体どのように捉えているのでしょうか？

詳細はリプ欄の動画で！

#AI #大規模言語モデル #LLM #メカニスティックインタープリタビリティ #人工知能
2025年07月19日 06:16
https://pbs.twimg.com/media/GwK17N-XsAIvp8u.png

https://x.com/compassinai/status/1946318076217348250
233：名無しさん (ｽﾌﾟｰ 54f5-cc6e)：2025/07/19(土) 17:40:20 ID:5Gbq1wFESd: 論文解説:
Mechanistic Indicators of Understanding in Large Language Models. Pierre Beckmann, Matthieu Queloz.
https://chatgpt.com/share/687b59d1-5fd0-800e-b727-56a28493894c
234：名無しさん (ｽﾌﾟｰ 54f5-cc6e)：2025/07/19(土) 17:53:27 ID:5Gbq1wFESd: Alexander Wei @alexwei_
1/N 私たちの最新の@OpenAI実験的推論LLMが、AIにおける長年の大きな挑戦を達成したことを興奮して共有します：世界で最も権威ある数学競技会—国際数学オリンピック（IMO）での金メダルレベルのパフォーマンス。
2025年07月19日 16:50
https://pbs.twimg.com/media/GwLl5lhXIAAXl5p.jpg

https://x.com/alexwei_/status/1946477742855532918
235：名無しさん (ｵｯﾍﾟｹ 8139-822c)：2025/07/19(土) 19:45:59 ID:IIV5XzBYSr: ちなみに、GPT-5は近々リリース予定です。ぜひお試しいただければ幸いです。ただし、IMOゴールドLLMは実験的な研究モデルです。このレベルの数学機能を備えたモデルをリリースする予定は、今後数か月間ありません。
https://x.com/alexwei_/status/1946477756738629827
236：名無しさん (ｵｯﾍﾟｹ 433f-9fcd)：2025/07/19(土) 19:55:56 ID:oI/K8o3sSr: イチゴがメダルかけててワラタ　コードネームストロベリーがCoTモデルだからか
半年差でGoogleのAlpha Geometryに数学で追いついたってことか
237：名無しさん (ｵｯﾍﾟｹ 2ce2-822c)：2025/07/19(土) 20:18:39 ID:jIOuzF8USr: Alpha Geometryは数学特化型だからな
238：名無しさん (ｵｯﾍﾟｹ 54cb-822c)：2025/07/19(土) 20:41:25 ID:7jZZS2NISr: マイクロソフトが法務部門で最大465人を削減。AIに代替され社内でも前例のない規模と驚きの声が上がる。AI導入は「未来への優先順位」と位置づけられ、知的専門職も、もはや例外ではない。かつて安泰とされた法務やエンジニアといった職種も急速にAIに置き換えられつつある。
https://x.com/tomoyaasakura/status/1946308573224681690
239：名無しさん (ｵｯﾍﾟｹ 40c1-822c)：2025/07/19(土) 21:21:44 ID:f2MLYe62Sr: ChatGPT エージェントが ARG AGI 3 チャレンジの最初のレベルをクリアしました!
https://x.com/WesRothMoney/status/1946339042544763036
240：名無しさん (ｵｯﾍﾟｹ b69e-822c)：2025/07/19(土) 21:44:17 ID:cbSx9ilMSr: 午後6時: 人間100% - AI 0%
午後6時30分: 人間100% - AIがArc-AGI-3レベル1を解くこのペースだと、予想よりも早く飽和状態になるだろう
https://x.com/kimmonismus/status/1946309973253804112
241：名無しさん (ｵｯﾍﾟｹ bbdf-822c)：2025/07/19(土) 22:06:21 ID:kFvtKEaMSr: さあ、GPT-5 の初リークです。
biology-benchmarks-inspect リポジトリで「gpt-5-reasoning-alpha」が見つかりました。重要なポイント：これは 20 時間前のコミットで、o3 モデルが新しい gpt-5-reasoning-alpha エントリに置き換えられました。このリポジトリが本物であれば、GPT-5 のリリースもそう遠くありません。
https://x.com/slow_developer/status/1946545812332540130
242：名無しさん (ｵｯﾍﾟｹ c07c-822c)：2025/07/19(土) 22:14:22 ID:HUDKu18wSr: OpenAIは新たな手法で国際数学オリンピックで金メダルレベルのパフォーマンスを持つ推論モデルを開発。この手法はIMOに限らずに汎用的で数時間効率的に思考することが可能とのこと。このモデルは数カ月は出す予定はないが、GPT-5はもうすぐ出ると言及されている。
https://x.com/bioshok3/status/1946503926225985848
243：名無しさん (ｵｯﾍﾟｹ d6b1-6ce5)：2025/07/20(日) 00:15:29 ID:eI.YqQ9QSr: 逆に数カ月後にGPT-5に組み込んでくるのかと思うと恐ろしいな

ついに、OpenAIが研究中のAIが国際数学オリンピック（IMO）で金メダルレベルになったと報告

①IMOのためにほぼ調整してない汎用モデル
②汎用的な強化学習とテスト時スケーリングで実現
③ツールやネットも使用してない

GPT-5もすぐにくるとのこと。一方、この実験モデルは数ヶ月間は公開予定なし
https://x.com/jaguring1/status/1946566592265064482
262：名無しさん (ｵｯﾍﾟｹ aa76-6ce5)：2025/07/20(日) 02:20:08 ID:03js5P/wSr: おっ公式も来たよ
GPT-5もうすぐだって

明確に申し上げます。GPT-5は近日中にリリースしますが、IMOで使用したモデルは別の実験モデルです。このモデルは将来のモデルに導入される新しい研究手法を採用していますが、このレベルの機能を備えたモデルをリリースするのは数ヶ月先です。
https://x.com/OpenAI/status/1946594933470900631
263：名無しさん (ｵｯﾍﾟｹ e501-6ce5)：2025/07/20(日) 02:43:47 ID:HsJoLQXASr: GPT-5が発見されました。 gpt-5-reasoning-alpha-2025-07-13 がOpenAIの生物学ベンチマーク設定に登場しました。 OpenAIがGPT-5を深層科学的推論の学習に積極的に活用していることがわかりました。単なるチャットではありません。単なるベンチマークでもありません。科学が目標です。
https://x.com/VraserX/status/1946535012624453793
264：名無しさん (ｵｯﾍﾟｹ bbb9-6ce5)：2025/07/20(日) 02:46:19 ID:i.GWMLXMSr: サム・アルトマン
土曜日の早起きで、数時間かけて新しいモデルを使ってちょっとしたコーディングプロジェクトを試してみました。 5分で完成しました。とても素晴らしい出来です。どう感じたかは分かりませんが…
https://x.com/sama/status/1946575101509734619
265：名無しさん (ﾜｯﾁｮｲ f751-5338)：2025/07/20(日) 03:03:16 ID:CiTYyUMo00: 楽しみだわぁGPT5も研究用新モデルも
てか5の匂わせと同時期に次の画期的なモデル性能もチラ見せするの上手いなw
266：名無しさん (ﾜｯﾁｮｲ a502-6943)：2025/07/20(日) 05:18:00 ID:FXJwOVKU00: >>231
その部下が真の意味で多重人格だったら？
毎回、話す度に知識や経験、性格などが入れ替わる相手が
毎回異なる結果を提出するのは別におかしいことではない

「あなたは優秀な科学者です」みたいなプロンプトで回答の
精度が向上するというのは、普段俺達が触れてるAIは
巨大な頭脳のほんの一部分に過ぎないという証拠だろう

もしかしたら、googleの開発者なんかは巨大なデータセンター
丸々ひとつ分の全人格的geminiと対話してるのかもしれんが、
俺等一般人では知り得ない話だ
267：名無しさん (ｱｳｱｳ 8e4f-4b24)：2025/07/20(日) 07:22:23 ID:4pzi0jokSa: Haider. @slow_developer
openAIのノーム・ブラウンが2つの重要なポイントを確認しました：

1) IMO金メダルレベルの性能に達したモデルは汎用型であり、

数学用に微調整されておらず、ツールを使用せずに達成しました

2) openAIはLLMを大幅に改善する新しい技術を開発しました

これは新たなRLのブレークスルーか、アルゴリズムの改善でしょうか？
2025年07月20日 00:00
https://pbs.twimg.com/media/GwOm5wNW4AA7mwD.jpg

https://x.com/slow_developer/status/1946585831856095284
268：名無しさん (ｱｳｱｳ 8e4f-4b24)：2025/07/20(日) 07:28:28 ID:4pzi0jokSa: VraserX e/acc @VraserX
o3-alphaは単なるプレビューではなかった。
それはo5のデモだった。

そのことが明らかになるタイムラインは以下の通り：

– o1は2024年9月にリリースされた
– 12月に、OpenAIはo3の早期プレビューを公開した
– トレーニングには約3か月かかると言われている
– o4-miniは2025年4月にリリースされた。つまり、完全なo4は3月に完成していた
– o4-miniは簡略化されたバージョンなので、o4はすでにトレーニングと安全性テストを終えていた

OpenAIは現在、安全性評価のほとんどのプロセスを自動化しており、テスト時間を約1か月に短縮している。だから、o4が3月に完成したとすれば、o5のトレーニングはおそらく第1四半期に始まった。つまり、o3-alphaは研究ラベルの下でo5だったのだ。

そして、それは明らかだ。
すでに数学とコードにおいて超人的なレベルに近づいている。

まだリリースされていない理由は以下の通り：
1. それにはまだ粗削りな部分がある
2. すべてのツール、エージェント、推論を単一のGPT-5モデルに統合している

それが完成すれば、o5を核とするGPT-5は推論するだけでなく、論理、数学、プログラミングを支配するだろう。

この次のモデルは単なるチャットボットではない。
自律型AIシステムの基盤となるだろう。
2025年07月19日 20:02
https://pbs.twimg.com/media/GwNzGvAXoAE4N-U.jpg

https://x.com/VraserX/status/1946526029314752683
269：名無しさん (ﾜｯﾁｮｲ 1f66-c641)：2025/07/20(日) 09:40:49 ID:/PB5TtVE00: 数学で人間を超えるのは時間の問題と言われていたがついに人間のトップクラスレベルの実力に達したか
プログラミングも大会第二位で人間がAIに敵わなくなる時代が目前に迫ってるな
270：名無しさん (ﾜｯﾁｮｲ 1f66-c641)：2025/07/20(日) 09:42:09 ID:/PB5TtVE00: いやどうだったっけ
去年までAIは数学全然ダメとか言われてたような気もするなあるいは一昨年か
271：名無しさん (ﾜｯﾁｮｲ c141-9bb6)：2025/07/20(日) 09:54:36 ID:3c.BY8xY00: >>269
むしろ人間が勝てた事に驚くよね。
囲碁将棋と同じ事が起きてる、今後の結果は明らか。
272：名無しさん (ﾜｯﾁｮｲ 1601-f0b5)：2025/07/20(日) 10:30:29 ID:VT/XbmN600: 囲碁でいえば、イ・セドルがアルファ碁に１勝できた段階だね

その後、世界ランキング１位のカケツでさえ全く太刀打ちできなくなった
あまりのAIの強さにカケツは対局中に泣き出した
273：名無しさん (ﾜｯﾁｮｲ b003-18e4)：2025/07/20(日) 10:36:31 ID:46fTnx.k00: >>266
いやいやいや、、話はシンプルに「理解しているか」「理解していないか」の二択だよ。
たとえ多重人格のような状態であろうと、この点は変わらん

例えば、AIのAが「理解しました」と答えたにもかかわらず、AIのBが全く異なる回答をした場合、
そのAIシステム総体としては「理解していない」んだよ
274：名無しさん (ｵｯﾍﾟｹ 0e62-6ce5)：2025/07/20(日) 11:35:34 ID:GgnyQ3xUSr: 人類はこれから天才的な多重人格とつきあわないといけないのか大変だなこりゃ