レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】 避難所13
-
https://twitter.com/svpino/status/1681614284613099520
>チームは、モデルが指定された整数が素数かどうかを判断する必要がある 500 の問題のデータセットを使用してモデルを評価しました。 3 月に、GPT-4 はこれらの質問のうち 488 件に正解しました。 6月の正解数はわずか12問だった。
>なぜこうなった?
>OpenAI は継続的に変更をプッシュしていると考えられますが、そのプロセスがどのように機能するのか、モデルが改善しているのか後退しているのかをどのように評価するのかはわかりません。
>噂によると、彼らは、大型モデルと同様に動作するが、実行コストが低い、いくつかの小型で特殊な GPT-4 モデルを使用していると示唆されています。ユーザーが質問すると、システムはクエリをどのモデルに送信するかを決定します。
>安くて早いですが、この新しいアプローチが品質低下の背後にある問題なのでしょうか?
>私の意見では、これは GPT-4 に依存するアプリケーションを構築している人にとって危険信号です。 LLM の動作が時間の経過とともに変化することは許容できません。
>最近、GPT-4 と ChatGPT を使用するときに何か問題に気づきましたか?
>これらの問題は大げさだと思いますか?
掲示板管理者へ連絡
無料レンタル掲示板