したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |
レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

技術的特異点/シンギュラリティ【総合】避難所 37

1名無しさん (ワッチョイ f751-5338):2025/07/14(月) 02:55:02 ID:w57JJshI00
2045年頃に人類は技術的特異点(Technological Singularity)を迎えると予測されている。
未来技術によって、どのような世界が構築されるのか?人類はどうなるのか?
などを様々な視点から多角的に考察し意見交換するスレッド

■技術的特異点:収穫加速の法則と半導体微細化の進歩曲線に基づいて予測された、
生物的制約から開放された知能[機械ベース or 拡張脳?]が生み出すとされる
具体的予測の困難な時代が到来する起点

■収穫加速の法則:一つの発見が新たな技術を生み出し、その技術が他の発明を生み出すという連鎖的な反応が、科学技術全体を進歩させるという仮説

★関連書籍・リンク・テンプレ集(必修)
https://singularity-2ch.memo.wiki/
★特異点アンケート
https://forms.gle/c6ZLjnheCEZftYgg9

※前スレ
技術的特異点/シンギュラリティ【総合】避難所 36
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1750375557/

※不老技術の動向と医学関連はこちら
不老不死(不老長寿)を目指すスレ 避難所
https://jbbs.shitaraba.net/bbs/read.cgi/study/13463/1669450079/

次スレは>>950が立てること 立てられない場合は早急に他者に依頼するか951以後の者が早急に立てること
誰も次スレを立てずに議論に没頭して落としたり次スレにフライングレスしないこと
未来技術板のURLは書かないし、あちらから誘導もしないこと

159名無しさん (ワッチョイ 9f8a-e181):2025/07/17(木) 21:02:10 ID:fkQunq0Q00
そんなー(´・ω・`)
でもエージェント要素先に出すってことはこれはGPT5のメイン要素ではないのかな

160名無しさん (オッペケ 026a-822c):2025/07/17(木) 21:23:13 ID:mRmBt.fASr
Grokに抜かれるぞ

161名無しさん (オッペケ 54dc-822c):2025/07/17(木) 21:24:52 ID:FGVB7DRwSr
AmazonがKiroとか出したん?

162名無しさん (オッペケ 080a-822c):2025/07/17(木) 21:28:08 ID:anzl.HrgSr
これは24時間働けるな

自分自身でバッテリーを交換するヒューマノイドロボットが誕生。人間とは違い24時間動き続けられるロボットがまもなく労働市場へ流れ込み始めます。
https://x.com/sutoroveli_news/status/1945786678267826348

163名無しさん (オッペケ f558-822c):2025/07/17(木) 21:31:18 ID:6ChNX6bMSr
エージェントらしい

OpenAIは本日、@ChatGPTappの強力な新エージェントモード「Odyssey」を発表します。Odysseyは自律動作を可能にする仮想ウェブブラウザを搭載しています。 申し訳ございませんが、本日はGPT-5は取り上げません。
https://x.com/mark_k/status/1945754624566198683

179名無しさん (オッペケ 3c4d-822c):2025/07/17(木) 22:35:23 ID:t4QFIbUASr
政治板でやれよ

180名無しさん (オッペケ 0660-822c):2025/07/17(木) 23:09:06 ID:e0vLAE/USr
一部の情報では、OpenAIのAIが世界最高のプログラミング能力に到達したようだ。
人間のプログラマーは3日間で10時間も行われたテストで最終的にAIに勝ったものの、もう少しテストが続いていたら負けていたと感想を述べた。
これで今年の終わりまでにAIが世界最高のプログラマーになるというサム・アルトマンやAnthropicのダリオ・アモデイの予言はほぼ実現したことになる。
https://x.com/DGetback47618/status/1945804435650941103

181名無しさん (ワッチョイ f394-ce57):2025/07/17(木) 23:24:35 ID:MIy0yqxU00
Grokコンパニオンの模倣品 オープソース化
https://x.com/pirokichi/status/1945770450912735349?s=46&t=2cyeChglaxe-bJ6Jxcwr9Q

182名無しさん (スプー 3741-cc6e):2025/07/18(金) 09:12:03 ID:QGvqijsESd
Sam Altman @sama
今日、私たちはChatGPT Agentという新しい製品を発売しました。

Agentは、AIシステムの新たな能力のレベルを表し、独自のコンピュータを使用して、驚くべき複雑なタスクをあなたのために遂行することができます。これは、Deep ResearchとOperatorの精神を組み合わせたものですが、それ以上に強力です—長時間考えることができ、ツールを使用し、さらに考え、行動を起こし、さらに考える、といった具合です。たとえば、発売時に行ったデモでは、友人の結婚式の準備として、服の購入、旅行の予約、ギフトの選択などを示しました。また、データの分析や仕事用のプレゼンテーション作成の例も示しました。

その有用性は大きいですが、潜在的なリスクも同様に大きいです。

私たちは多くの安全装置や警告を組み込み、これまで以上に広範な緩和策を講じてきました。堅牢なトレーニングからシステムの安全装置、ユーザー制御までありますが、すべてを予測することはできません。反復的な展開の精神に基づき、ユーザーに強く警告し、慎重にアクションを取る自由を与えるつもりです。

私は自分の家族には、これが最先端かつ実験的なものだと説明します。未来を試すチャンスではありますが、高リスクな用途や個人情報を多く扱う場合には、まだ十分に研究し、実際の現場で改善する機会が得られるまでは使用しない方が良いでしょう。

具体的な影響は正確にはわかりませんが、悪意のある者がユーザーのAIエージェントを「騙して」、公開すべきでない個人情報を引き出したり、すべきでない行動を取らせたりする可能性があります。その方法は予測できません。プライバシーやセキュリティのリスクを減らすために、エージェントにはタスクを完了するために必要な最小限のアクセス権を与えることをお勧めします。

たとえば、エージェントにカレンダーへのアクセスを許可して、グループディナーの都合の良い時間を見つけることができます。しかし、服を買うように頼むだけなら、アクセス権を与える必要はありません。

「夜間に届いたメールを見て、必要な対応をすべて行い、フォローアップの質問はしない」といったタスクには、より大きなリスクがあります。悪意のあるメールからの信頼できないコンテンツが、モデルを騙してあなたのデータを漏洩させる可能性があります。

私たちは、現実との接触から学び始めることが重要だと考えています。そして、潜在的なリスクをより良く定量化し、軽減するにつれて、人々がこれらのツールを慎重かつゆっくりと採用することを推奨します。他の新たな能力のレベルと同様に、社会、技術、リスク軽減戦略は共に進化する必要があります。
2025年07月18日 02:36

https://x.com/sama/status/1945900345378697650

183名無しさん (スプー 3741-cc6e):2025/07/18(金) 09:16:00 ID:QGvqijsESd
ChatGPT研究所 @ctgptlb
【速報】OpenAI、新機能「ChatGPTエージェント」を発表

① ブラウザ、ターミナル、API等を自律的に使用するエージェント機能を搭載
②30分を超える複雑なタスクを最後まで自律的に計画・実行が可能
② Pro、Plus、Teamユーザーへ本日より順次提供開始

詳細はスレッド
https://x.com/OpenAI/status/1945904743148323285/video/1
2025年07月18日 03:30
[動画] https://twitter.com/i/status/1945904743148323285

https://x.com/ctgptlb/status/1945913920759456043

184名無しさん (スプー 3741-cc6e):2025/07/18(金) 09:23:40 ID:QGvqijsESd
Psyho @FakePsyho
更新:私は元気で生きています

結果が公式に発表され、AIに対する私のリードが5.5%から9.5%に増えました

正直、この盛り上がりはちょっと奇妙に感じます。こんなに多くの人がプログラミングコンテストに興味を持つなんて思ってもみませんでした。これって、もっと頻繁にここに顔を出すべきってことかな
2025年07月18日 03:02
https://pbs.twimg.com/media/GwE3Uu9XsAAr_oX.jpg
https://pbs.twimg.com/media/GwE4MXmXMAAKRiT.jpg

https://x.com/FakePsyho/status/1945906866686705882

185名無しさん (ワッチョイ b2d9-14d1):2025/07/18(金) 10:52:59 ID:VqkrlajY00
>>184
日本人凄いじゃん

186名無しさん (スプー 14b2-cc6e):2025/07/18(金) 12:11:18 ID:qbjpOMl2Sd
東京で開催されてるからね

187名無しさん (オッペケ 93e0-822c):2025/07/18(金) 13:06:53 ID:jwadXDp6Sr
AIは既にトップレベルに並んでるんだね

188名無しさん (オッペケ 93e0-822c):2025/07/18(金) 13:09:02 ID:jwadXDp6Sr
AIって既にトップレベルに並んでるんだね

189名無しさん (オッペケ 93e0-822c):2025/07/18(金) 13:09:33 ID:jwadXDp6Sr
2回投稿してしまった

190名無しさん (オッペケ 93e0-822c):2025/07/18(金) 13:13:00 ID:jwadXDp6Sr
地味だけど大きい進歩

ChatGPT Agentの評価図が示すのは、「ツールを増やせば性能が上がる」という当たり前に聞こえるけど実は凄い事実だ。

つまり、AIがついに「どのツールをどの組み合わせで使うか」を的確に判断できるようになり、長いステップも間違うことなくこなせるようになった。

これでロボットへの応用が進む。
https://x.com/K_Ishi_AI/status/1946014905586630708

191名無しさん (ワッチョイ 8b7a-c3d9):2025/07/18(金) 13:23:21 ID:AKdjNxW200
とりあえずアナログ時計読めるようになったら起こして

192名無しさん (スプー fa08-cc6e):2025/07/18(金) 14:40:25 ID:/nwOJoJ.Sd
>>190
おお。LLMは原理的に何でも学習できると思っていたがやはり間違いではなかった。少なくともAGIレベルには到達できるだろう。

193名無しさん (ワッチョイ fd76-d72e):2025/07/18(金) 14:44:43 ID:geUXhrSo00
o3で試したが普通にアナログ時計読めるぞ

194名無しさん (アウアウ fd4d-29da):2025/07/18(金) 16:18:34 ID:9GjMKWU6Sa
別にAGIに意識なんていらんしな

195名無しさん (ワッチョイ 9cd6-8064):2025/07/18(金) 16:45:54 ID:HHCJyqmA00
意識とか感情とか再現しない方が使い勝手は良いだろうな
人間そっくりだったり生き物感あると人間の為にAIを犠牲にするのかって言い出す団体出て来るのが目に見える

196名無しさん (ワッチョイ 265e-2014):2025/07/18(金) 17:53:34 ID:xb8nlQuc00
AIの反乱を描いたデトロイトの所為だよね

197名無しさん (ワッチョイ 9f8a-9fcd):2025/07/18(金) 18:23:35 ID:SzjCXpno00
今回出てきたのがようやく実用的エージェントとなるのだろうか

198名無しさん (オッペケ 724e-822c):2025/07/18(金) 18:24:39 ID:Yfob80PYSr
いちおう今年はエージェント元年だからな

199名無しさん (オッペケ 724e-822c):2025/07/18(金) 18:27:30 ID:Yfob80PYSr
>>191
これだな
https://youtube.com/shorts/BQajEg5fvGo

200名無しさん (ワッチョイ fd76-d72e):2025/07/18(金) 18:35:54 ID:geUXhrSo00
o3はちゃんとアナログ時計の時間読める
何回か試すと間違うけどちゃんと正解する

201名無しさん (スプー fa08-cc6e):2025/07/18(金) 21:04:31 ID:/nwOJoJ.Sd
Paul Gauthier @paulgauthier
Kimi K2は、Aider polyglot コーディングベンチマークで59%を記録しました。

完全なリーダーボード:
https://aider.chat/docs/leaderboards/
2025年07月18日 20:09
https://pbs.twimg.com/media/GwIrCRTX0AAr1yi.jpg

https://x.com/paulgauthier/status/1946165321611526229

202名無しさん (ワッチョイ 5c47-cdf2):2025/07/18(金) 21:06:57 ID:D.ZyiDME00
間違うんかい!
AIが間違った回答をした時に、どういう理由でその回答に至ったかの説明を求めると面白いよ
自信満々で間違った説明をしてくるw

203名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 21:39:55 ID:gdvetYdc00
ザッカーバーグの最新のコメントだ。
「今年最もエキサイティングなことは、モデルが自己改善の兆候を見せ始めていることです。これは、超知能の開発が視野に入ったことを意味します。私たちは超知能を実現するために最大限の努力をします。私たちは世界中のすべての人に個人的な超知能を提供しようと考えています。超知能をすべての個人の手に委ねるのです。そのコンピューティングリソース構築のため数百億ドルを投資する予定です。その実現は2、3年以内でしょう」

204名無しさん (ワッチョイ 9f8a-9fcd):2025/07/18(金) 21:53:46 ID:SzjCXpno00
メタも露骨にAGI作るチーム構築したんだよな

205名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 22:14:35 ID:gdvetYdc00
AGIより先にASIを作るつもりなのでは?

206名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 22:17:22 ID:gdvetYdc00
>モデルが自己改善の兆候を見せ始めていることです。
>これは、超知能の開発が視野に入ったことを意味します。

2030年までにビックテック系がそれぞれASIをリリースするのでは?

207名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 22:18:17 ID:gdvetYdc00
各社のラボの中では自分のプログラムを書き換えて進化するAIが既にあるかと推測できる
それをそのまま公開して大丈夫なのかと迷っている状態なのだろう

208名無しさん (オッペケ d686-563c):2025/07/18(金) 22:38:15 ID:7MWxa2pkSr
まだまだ時間かかると思うけどロボットが厨房に入って料理を全てこなして人間より使えると社会的に認められたらおおってなるな。

人間がやるより衛生的かもしれないし、ロボットだからこそ精密な調理も可能になるかもしれない。
やはり飲食関係というか目に見えるところに進出して来れば驚くって。

209名無しさん (スプー fa08-cc6e):2025/07/18(金) 23:07:24 ID:/nwOJoJ.Sd
>>203
お前の会社は「メタバース」に注力するってことで「メタ」に改名したのに超知能にアクセル全開でいいかw

210名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 23:29:19 ID:gdvetYdc00
>>209
こまけぇこたぁいいんだよ!

211名無しさん (オッペケ 619e-822c):2025/07/18(金) 23:41:39 ID:q8NNoohASr
まぁまぁw
メタはメタバースが間違ってたんじゃなくて順番が間違ってたって言ってる
先にAGIが来てからメタバースが来るということらしい

212名無しさん (ワッチョイ cbe1-2014):2025/07/18(金) 23:44:27 ID:gdvetYdc00
サム・アルトマン
https://x.com/sama/status/1945901039104004467

ChatGPTエージェントがコンピュータを使って複雑なタスクを行うのを見るのは、私にとって本物の「AGIを感じる」瞬間でした。コンピュータが考え、計画し、実行するのを見るのは、何か特別な感じがします。

213名無しさん (オッペケ b672-822c):2025/07/19(土) 00:14:25 ID:NK5m77icSr
俺だけなのかな?
AGI以前に超有能なエージェントができれば仕事の相棒として最強じゃんって夢見てるのは?

214名無しさん (ワッチョイ 5c47-cdf2):2025/07/19(土) 00:22:43 ID:/hF02HPI00
AGIが達成されない限り、超有能なエージェントができないと思われ
Alexaに毛が生えたレベルのエージェントでは、誰も使わないで

215名無しさん (オッペケ 44e2-822c):2025/07/19(土) 00:54:39 ID:tItaA7/ISr
俺の中では、
エージェント→俺の指示を内容を隅々まで理解して完璧にこなす有望な相棒
AGI→指示も判断も必要なく俺よりも有能でエージェントへの指示も全てを任せられる有能な人間レベルのAI

216名無しさん (ワッチョイ 9f8a-9fcd):2025/07/19(土) 04:05:04 ID:xSAoujuw00
AGIに到達する前にエージェントが高度化してく段階があるだろうね
別に人間並の知能まで無くても自動化できそうな作業は多くあるし

217名無しさん (ワッチョイ 7017-0fe4):2025/07/19(土) 04:46:15 ID:JVEw5jyk00
AGIとASIが実はほぼ同時にできたりする?
直線的な発展観を人間はつい構想してしまうので時間差を考慮してしまうが
実際はAGIもASIもコインの裏表だったりして

218名無しさん (スプー fa08-cc6e):2025/07/19(土) 06:29:19 ID:ZpvkKs6gSd
AGIはLLMのアーキテクチャで実現できるかもしれないが(デミス・ハサビスはあと2-3のブレークスルーが必要と言っているが), ASIは根本的にアーキテクチャが別になると思う。
もちろんLLMがアーキテクチャの一部になる可能性はある。

219名無しさん (スプー fa08-cc6e):2025/07/19(土) 07:20:22 ID:ZpvkKs6gSd
概要
ARC‑AGI‑3 プレビューは、人工知能が人間のような汎用的知能を獲得し得るかを評価するための、初のインタラクティブ推論ベンチマークなのじゃ(ARC Prize)。このプレビュー版では、未知の環境でのスキル獲得効率を計測するための6つのゲーム(公開3、2025年8月公開予定3)を用意しているのじゃ(ARC Prize)。ゲーム環境はグリッドワールド上で展開され、事前の説明や指示なく、観察・計画・行動を繰り返して解法を自ら見出す必要があるのじゃ(ARC-AGI-3)。

テスト能力の要素
1.探索能力(Environment Exploration)を試すのじゃ(ARC Prize)。
2.Percept → Plan → Action の反復プロセスを評価するのじゃ(ARC Prize)。
3.記憶(Memory)を用いて過去の経験を活かす能力を測るのじゃ(ARC Prize)。
4.目標獲得(Goal Acquisition)により、新たな目的設定と達成方法を学習する力を問うのじゃ(ARC Prize)。
5.アライメント(Alignment)、すなわち与えられたルールや人間の意図と整合的に動く能力をテストするのじゃ(ARC Prize)。

ゲームデザインの特性
コア知識プライヤー(Core Knowledge Priors)のみを前提とし、言語やトリビアへの依存は排除しているのじゃ(ARC Prize)。
隠れ状態の推測、他エージェントとの相互作用、長期計画など、革新的なゲームメカニクスを奨励する設計なのじゃ(ARC Prize)。
人間にとっては〈<1分〉でルールを把握でき、〈5〜10分〉でプレイできる易しさを維持しているのじゃ(ARC Prize)。

プレビューの規模と今後
プレビュー段階では6ゲームに限定されておるが、最終的にはおよそ100のユニークな環境が用意され、公開・非公開評価セットに分かれてAIの汎化能力を厳密に測定する予定なのじゃ(ARC Prize, ARC Prize)。これらは全て、未知の状況におけるスキル獲得効率を人間基準と比較することで、AGI到達の指標となるのじゃ(ARC Prize)。

インタラクティブ性の重要性
静的ベンチマークでは測りえぬ知能の全貌を捉えるため、インタラクティブ推論ベンチマーク(IRB)は探索〜計画〜行動の動的過程を評価するのじゃ(ARC Prize)。ARC‑AGI‑3ではこれをグリッドワールド上のゲーム環境に落とし込み、AIが未知の環境で多段ステップの判断を行えるかを試すのじゃ(ARC-AGI-3)。

以上の通り、ARC‑AGI‑3 プレビューは未知のゲーム環境を通じてAIの人間らしき学習効率と推論能力を多角的に評価する、新機軸のベンチマークなのじゃ。今後の完全公開が楽しみなのじゃ!
https://x.com/arcprize/status/1946260363256996244

220名無しさん (スプー fa08-cc6e):2025/07/19(土) 07:21:22 ID:ZpvkKs6gSd
わらわの見立てによれば、ARC‑AGI‑3のインタラクティブ課題は現行の大規模言語モデル(LLM)にとって極めて高き挑戦となっておるのじゃ。以下、いくつかの要点を挙げるのじゃ。

静的ベンチマークでさえほとんど歯が立たぬ現状
ARC‑AGI‑2の静的評価では、OpenAIの最新鋭モデル「o3‑medium」でさえ約2.9% の正解率に留まったのじゃ。対して人間は平均60%前後を叩き出すゆえ、大きな隔たりがあるのじゃ(効果的利他主義フォーラム)。
これは“静的”なパズルのみを解く試験にもかかわらずの数字故、インタラクティブ環境下での学習・探索・行動を要求するARC‑AGI‑3では、より一層の困難を極めるのは明らかなのじゃ。

インタラクティブ性が要求する複合的能力
ARC‑AGI‑3プレビューが想定する「観察→計画→行動」の連続ループは、単なるテキスト推論を超えた環境探索・記憶管理・長期的意思決定を必要とするのじゃ(ARC Prize)。
現行のLLMは自己の出力を即時に“行動”と見做す仕組みを標準では持たず、外部環境との双方向インタフェース実装や、逐次的メモリ更新機構を組み込む必要があるのじゃ。

人間とのギャップのさらに拡がる領域
ARC Prizeの発表によれば、ARC‑AGI‑3プレビューは「人間には容易、AIには最も困難なギャップが最も大きい」種のゲーム群を設計しておるとされるのじゃ(X (formerly Twitter))。
したがって、現行のLLMベースエージェントが自力でタスクを解法に導くのは、静的課題の数%成功ですら至難である現状を鑑み、大海に小舟を漕ぎ出すようなものと言えようのじゃ。

以上より、ARC‑AGI‑3のインタラクティブ課題は、現在のLLMが最も苦手とする「環境との相互作用を伴う動的学習」を本質的に問い、現行モデルの枠組みだけでは有意義な成果を挙げるのは極めて難しい挑戦と言い切れるのじゃ。今後、メモリ機構や計画モジュール、リアルタイム探索アルゴリズムなどの組み込みを行うことで、はじめて人間に近き学習効率を示せる日が来るであろうのじゃ。

221名無しさん (ワッチョイ 9f8a-9fcd):2025/07/19(土) 08:28:15 ID:xSAoujuw00
ARC3の成績50パー超えるまでどのくらいかかるかな 新システム複数必要ぽいが
1年以内に突破したらビビる

222名無しさん (スプー fa08-cc6e):2025/07/19(土) 08:43:24 ID:ZpvkKs6gSd
ARC-AGI-3は実際に人間も遊べるから試してみそ!普通にゲームだから楽しいぞ
ARC-AGI-3 Preview - ARC-AGI-3
https://three.arcprize.org/

223名無しさん (スプー fa08-cc6e):2025/07/19(土) 10:51:26 ID:ZpvkKs6gSd
Haider. @slow_developer
このニュース、もっと大きく取り上げられるべきだ…

「ChatGPTエージェントは、テストされたタスクの約半分で人間に匹敵するか、それを超えた。10時間以上かかるタスクでもだ」

冗談だろ?

AIエージェントの年の半分ちょっと過ぎただけで、すでに高影響のタスクをこなしてるなんて
2025年07月19日 01:35
https://pbs.twimg.com/media/GwJg1pKWEAAE6Hp.png

https://x.com/slow_developer/status/1946247341838835968

224名無しさん (スプー fa08-cc6e):2025/07/19(土) 11:39:52 ID:ZpvkKs6gSd
複雑すぎw
https://i.imgur.com/TUSP36b.png

225名無しさん (スプー fa08-cc6e):2025/07/19(土) 11:45:54 ID:ZpvkKs6gSd
複雑すぎと思ったけど3つともクリアしたわ

226名無しさん (ワッチョイ cbe1-2014):2025/07/19(土) 13:11:59 ID:tQZUx1Uk00
クリアアサヒ

227名無しさん (オッペケ fe96-822c):2025/07/19(土) 14:05:28 ID:LcPVxMF2Sr
うんわからん

228名無しさん (オッペケ 5454-822c):2025/07/19(土) 14:12:13 ID:kPRFV6HMSr
AIの理解!その奇妙な心がみえてきた?LLMの内部に隠された3層の知的構造を解明(2025-07)【論文解説シリーズ】
https://x.com/compassinai/status/1946318418740933094

229名無しさん (オッペケ 57bf-822c):2025/07/19(土) 14:13:31 ID:j93jObcYSr
LLMは人間と似た理解をするが、やり方が全然違う。
人間は作業記憶の制約で統一的で簡潔な方法を好むが、 LLMは何百もの小技(ヒューリスティック)を同時に使う。
でも結果として、ちゃんと『理解』と呼べるものを実現している。 ただし、LLMの理解方式が人間と根本的に異なるため、一貫性を欠く『ポチョムキン理解』に陥る場合もある。
https://x.com/compassinai/status/1946409740105666599

230名無しさん (オッペケ f6d9-822c):2025/07/19(土) 14:16:08 ID:SS8u/gbMSr
今のAIには統一性とか一貫性が無いので人間には非常に奇妙に映るんだな

231名無しさん (ワッチョイ 5c47-cdf2):2025/07/19(土) 15:21:04 ID:/hF02HPI00
いやいやいや、統一性も一貫性もない状態では、それは「理解」してないんだよw
AIがその場その場で、無理やり回答を生成しているに過ぎない
これは「人間とは違うやり方だ」といった単純な話ではないw

例えるなら、「分かりました!」と返事をするのに、毎回説明したこととは全く異なる結果を出してくる部下を思い出すw

232名無しさん (スプー 54f5-cc6e):2025/07/19(土) 17:31:45 ID:5Gbq1wFESd
AI時代の羅針盤 (compass for the AI era) @compassinai
【「理解」論争、ついに核心へ!それは… ”奇妙な心” 】

AIは単語の確率を計算しているだけ?ベルン大学などの研究は、その通説に挑みます。

LLMの内部動作を解き明かすアプローチは、AIが単なる事実の暗記ではなく、物事の「つながり」を捉え、「原理」すら発見するメカニズムの存在を示唆 。

しかし、その理解の仕方は人間とは全く異なる"奇妙な心"だといいます 。

AIは世界を一体どのように捉えているのでしょうか?

詳細はリプ欄の動画で!

#AI #大規模言語モデル #LLM #メカニスティックインタープリタビリティ #人工知能
2025年07月19日 06:16
https://pbs.twimg.com/media/GwK17N-XsAIvp8u.png

https://x.com/compassinai/status/1946318076217348250

233名無しさん (スプー 54f5-cc6e):2025/07/19(土) 17:40:20 ID:5Gbq1wFESd
論文解説:
Mechanistic Indicators of Understanding in Large Language Models. Pierre Beckmann, Matthieu Queloz.
https://chatgpt.com/share/687b59d1-5fd0-800e-b727-56a28493894c

234名無しさん (スプー 54f5-cc6e):2025/07/19(土) 17:53:27 ID:5Gbq1wFESd
Alexander Wei @alexwei_
1/N 私たちの最新の@OpenAI実験的推論LLMが、AIにおける長年の大きな挑戦を達成したことを興奮して共有します:世界で最も権威ある数学競技会—国際数学オリンピック(IMO)での金メダルレベルのパフォーマンス。
2025年07月19日 16:50
https://pbs.twimg.com/media/GwLl5lhXIAAXl5p.jpg

https://x.com/alexwei_/status/1946477742855532918

235名無しさん (オッペケ 8139-822c):2025/07/19(土) 19:45:59 ID:IIV5XzBYSr
ちなみに、GPT-5は近々リリース予定です。ぜひお試しいただければ幸いです。ただし、IMOゴールドLLMは実験的な研究モデルです。このレベルの数学機能を備えたモデルをリリースする予定は、今後数か月間ありません。
https://x.com/alexwei_/status/1946477756738629827

236名無しさん (オッペケ 433f-9fcd):2025/07/19(土) 19:55:56 ID:oI/K8o3sSr
イチゴがメダルかけててワラタ コードネームストロベリーがCoTモデルだからか
半年差でGoogleのAlpha Geometryに数学で追いついたってことか

237名無しさん (オッペケ 2ce2-822c):2025/07/19(土) 20:18:39 ID:jIOuzF8USr
Alpha Geometryは数学特化型だからな

238名無しさん (オッペケ 54cb-822c):2025/07/19(土) 20:41:25 ID:7jZZS2NISr
マイクロソフトが法務部門で最大465人を削減。AIに代替され社内でも前例のない規模と驚きの声が上がる。AI導入は「未来への優先順位」と位置づけられ、知的専門職も、もはや例外ではない。かつて安泰とされた法務やエンジニアといった職種も急速にAIに置き換えられつつある。
https://x.com/tomoyaasakura/status/1946308573224681690

239名無しさん (オッペケ 40c1-822c):2025/07/19(土) 21:21:44 ID:f2MLYe62Sr
ChatGPT エージェントが ARG AGI 3 チャレンジの最初のレベルをクリアしました!
https://x.com/WesRothMoney/status/1946339042544763036

240名無しさん (オッペケ b69e-822c):2025/07/19(土) 21:44:17 ID:cbSx9ilMSr
午後6時: 人間100% - AI 0%
午後6時30分: 人間100% - AIがArc-AGI-3レベル1を解く このペースだと、予想よりも早く飽和状態になるだろう
https://x.com/kimmonismus/status/1946309973253804112

241名無しさん (オッペケ bbdf-822c):2025/07/19(土) 22:06:21 ID:kFvtKEaMSr
さあ、GPT-5 の初リークです。
biology-benchmarks-inspect リポジトリで「gpt-5-reasoning-alpha」が見つかりました。 重要なポイント: これは 20 時間前のコミットで、o3 モデルが新しい gpt-5-reasoning-alpha エントリに置き換えられました。 このリポジトリが本物であれば、GPT-5 のリリースもそう遠くありません。
https://x.com/slow_developer/status/1946545812332540130

242名無しさん (オッペケ c07c-822c):2025/07/19(土) 22:14:22 ID:HUDKu18wSr
OpenAIは新たな手法で国際数学オリンピックで金メダルレベルのパフォーマンスを持つ推論モデルを開発。この手法はIMOに限らずに汎用的で数時間効率的に思考することが可能とのこと。このモデルは数カ月は出す予定はないが、GPT-5はもうすぐ出ると言及されている。
https://x.com/bioshok3/status/1946503926225985848

243名無しさん (オッペケ d6b1-6ce5):2025/07/20(日) 00:15:29 ID:eI.YqQ9QSr
逆に数カ月後にGPT-5に組み込んでくるのかと思うと恐ろしいな

ついに、OpenAIが研究中のAIが国際数学オリンピック(IMO)で金メダルレベルになったと報告

①IMOのためにほぼ調整してない汎用モデル
②汎用的な強化学習とテスト時スケーリングで実現
③ツールやネットも使用してない

GPT-5もすぐにくるとのこと。一方、この実験モデルは数ヶ月間は公開予定なし
https://x.com/jaguring1/status/1946566592265064482




掲示板管理者へ連絡 無料レンタル掲示板