技術的特異点/シンギュラリティ【総合】避難所 25 - 1724422340

レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。

514：名無しさん (ﾜｯﾁｮｲ 685d-39a8)：2024/09/13(金) 05:14:30 ID:A9f8ueKo00: モデルは絶えず改良され、さらに開発が進められています。この調子でいくと、2025年までに本当にAGIに到達するかもしれません。もちろん誰もが利用できるわけではありませんが、アプリケーションとしてはおそらく可能です。経済や仕事の分野への影響は予測できません。

「o1 は、AI 推論の最先端技術を大幅に進歩させます。今後も繰り返し作業を続けながら、このモデルの改良版をリリースする予定です。これらの新しい推論機能により、モデルを人間の価値観や原則に合わせる能力が向上すると期待しています。o1 とその後継モデルにより、科学、コーディング、数学、関連分野で AI の新しいユースケースが数多く実現すると考えています。ユーザーや API 開発者が、o1 が日々の業務をどのように改善できるかを発見してくれることを楽しみにしています。 (...)また、化学、物理学、生物学の専門知識をテストする難しいインテリジェンスベンチマークである GPQA ダイヤモンドでも o1 を評価しました。モデルを人間と比較するために、GPQA ダイヤモンドの質問に答える博士号を持つ専門家を採用しました。その結果、o1 はこれらの人間の専門家のパフォーマンスを上回り、このベンチマークでそれを達成した最初のモデルとなりました。これらの結果は、o1 があらゆる点で博士号取得者よりも優れていることを意味するものではなく、博士号取得者が解決することが期待されるいくつかの問題を解決するのにモデルの方が優れていることを意味するだけです。他のいくつかの ML ベンチマークでは、o1 は最先端のものよりも優れた結果を残しました。視覚認識機能を有効にした o1 は、MMMU で 78.2% のスコアを獲得し、人間の専門家と競合する最初のモデルとなりました。また、57 の MMLU サブカテゴリのうち 54 で GPT-4o を上回りました。"

しかし、少なくとも同じくらい重要なのは、OpenAI が 01 のミニバージョンを直接リリースしたという事実です。このバージョンは、約 80% 安価でありながら、GPT-4o よりも大幅に優れており、通常の OpenAI-01 よりもわずかに劣るだけです。これは、この優れたモデルが低コストでどこでも使用できることを意味するため、過小評価すべきではありません (ベンチマーク結果も下に記載)。
「OpenAI o1-mini はコスト効率の高い推論モデルです。o1-mini は STEM、特に数学とコーディングに優れており、AIME や Codeforces などの評価ベンチマークで [OpenAI o1] のパフォーマンスにほぼ匹敵します。」
本日、OpenAI o1-preview より 80% 安い価格で、o1-mini を [Tier 5 API ユーザー(新しいウィンドウで開きます)] にリリースします。

OpenAI-01 の前と後の時代があると思います。今日私たちが目にしたのは、まさに歴史の転換点です。数字は嘘をつきません。OpenAI-01 は、すでにそれがいかに優れているかを示しています。世界を変えるでしょう。OpenAI は成果を上げました。今日は祝うべき日です。