したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

【ChatGPT】AIチャット総合 避難所【Gemini・Claude】

1名無しさん:2025/06/22(日) 22:48:52
各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。

773名無しさん:2025/09/14(日) 17:48:30 ID:h2CbFF/k
>>769
Grok 4とGrok 4 Fastのスピード比較
https://x.com/testingcatalog/status/1967137796289888346

774名無しさん:2025/09/15(月) 09:56:24 ID:Eojri6aw
Grok 4.1 coming soon
https://x.com/elonmusk/status/1967323429889265703

これはGrok V7か?
だとすればネイティブマルチモーダル
https://x.com/elonmusk/status/1954573440234422752

775名無しさん:2025/09/15(月) 15:03:49 ID:nZPH6mwg
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
https://arxiv.org/abs/2509.09677
https://chatgpt.com/share/68c6e317-c39c-8006-91a0-2ba092db8caa

従来LLMではモデルサイズの増大に対して単一ステップ精度の向上は逓減するとされてきた
→実社会で重要なのは長いマルチステップのタスクを破綻なく実行し続けられる能力ではないか?
という観点から、タスク完遂可能長(horizon length)を評価尺度として定式化

「一歩ごとの精度がわずかに改善するだけで、実行可能なタスク長は指数的に伸びる」と指摘
https://i.imgur.com/TVGO7Xt.jpeg
https://i.imgur.com/M3zzUND.jpeg

(GPT-5がHorizonと呼ばれていたのは、偶然か?)

776名無しさん:2025/09/15(月) 23:47:15 ID:5HMJsMrU
35 ななしのAIさん 2025/09/15(月) 23:38:15.69 ID:hUBcpo9E0
Anthropicが継続的に出している報告「Economic Index」の第3弾
https://www.anthropic.com/research/economic-index-geography
https://chatgpt.com/share/68c816b8-5630-8006-9a27-58fc785eb24f

777名無しさん:2025/09/15(月) 23:47:48 ID:5HMJsMrU
>>776

36 ななしのAIさん 2025/09/15(月) 23:39:41.65 ID:hUBcpo9E0
>> 35
タイミングが被ったのは偶然だと思うけど、ChatGPTの利用実態について初の大規模調査

How people are using ChatGPT
https://openai.com/index/how-people-are-using-chatgpt/
https://chatgpt.com/share/68c823ab-bdbc-8006-a171-1c6a8386775f

778名無しさん:2025/09/15(月) 23:48:22 ID:5HMJsMrU
37 ななしのAIさん 2025/09/15(月) 23:46:43.70 ID:hUBcpo9E0
Anthropicが新機能、コードネーム「Konmari」を準備中
Anthropic Consoleの大幅な改修が来るか
https://x.com/btibor91/status/1967547143708930174

779名無しさん:2025/09/16(火) 00:15:13 ID:5HMJsMrU
38 ななしのAIさん 2025/09/16(火) 00:13:32.14 ID:wK3bvJcq0
LLaDA-VLA
ロボット制御用のVLA(視覚言語モデル)に、拡散モデルを応用する試み
https://wenyuqing.github.io/llada-vla/
https://chatgpt.com/share/68c82cfe-f648-8006-820b-12fda1c96715

780名無しさん:2025/09/16(火) 02:15:51 ID:5HMJsMrU
42 ななしのAIさん 2025/09/16(火) 02:14:13.75 ID:wK3bvJcq0
gpt-5-codex low
gpt-5-codex medium
gpt-5-codex high
https://pbs.twimg.com/media/G05rhngXUAAz8cT.png

TechCrunchの記事
> OpenAIは、AIコーディングエージェントであるCodexの新しいバージョンであるGPT-5-Codexをリリースしました。
https://techcrunch.com/2025/09/15/openai-upgrades-codex-with-a-new-version-of-gpt-5/
https://poe.com/s/4pcv4kSJUNF15Do8PMIY

781名無しさん:2025/09/16(火) 02:28:56 ID:5HMJsMrU
>>780

43 ななしのAIさん 2025/09/16(火) 02:28:14.13 ID:wK3bvJcq0
>> 42
公式発表とシステムカード
https://openai.com/index/introducing-upgrades-to-codex/
https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/
https://chatgpt.com/share/68c84bf7-39f0-8006-85f2-3e95d04fdc96

GPT-5をベースにソフトウェアエンジニアリングに特化して最適化された新モデル

782名無しさん:2025/09/17(水) 01:04:04 ID:K3npQqKs
52 ななしのAIさん 2025/09/16(火) 13:05:01.98 ID:Gq1Zb1SO0
ChatGPTウェブアプリのPersonalization設定のUIが変更
(性格設定、カスタム指示、メモリが全て1箇所に)
https://i.imgur.com/slVCDaQ.jpeg
https://i.imgur.com/QqZeU58.jpeg

783名無しさん:2025/09/17(水) 01:04:37 ID:K3npQqKs
>>781

54 ななしのAIさん ころころ [502] 2025/09/17(水) 00:53:22.72 ID:dMjLmvqi0
>> 43
OpenAI Podcast Ep.6 "Codex and the future of coding with AI"
https://www.youtube.com/watch?v=OXOypK7_90c

> Codex の進化の道筋を振り返りつつ、GPT-5 Codex エージェントが「数時間にわたり複雑なリファクタリングを実行できる」レベルに到達したことを紹介
> 「ハーネス (harness)」 と呼ばれる仕組みや、エージェント型コーディング(agentic coding)の台頭を解説
> GitHub Copilot から学んだレイテンシー問題やUXの教訓、社内ツール(10x・コードレビューエージェント)の事例を紹介
> 今後、ソフトウェア開発がどのようにAIと融合していくか、2030年の展望

784名無しさん:2025/09/17(水) 01:05:16 ID:K3npQqKs
55 ななしのAIさん 2025/09/17(水) 01:02:08.01 ID:dMjLmvqi0
"Teen safety, freedom, and privacy" By Sam Altman
https://openai.com/index/teen-safety-freedom-and-privacy/

> AI利用における「プライバシー」「自由」「ティーンの安全」**という3つの原則のバランスについて説明
> 「原則同士の矛盾を認識しつつ、専門家との議論を経て最適と思われるバランスを取る」という姿勢
> - プライバシー(最重要の権利としての位置づけ)
> - 自由(成人ユーザーに最大限の自己決定を認める)
> - ティーンの安全(プライバシー/自由よりも優先)

"Building towards age prediction"
https://openai.com/index/building-towards-age-prediction/

> 上記の方針を実現するための**具体的な取り組み(年齢予測・保護者管理機能)**について説明

> - 年齢予測
> 未成年と判断された場合、自動的に年齢に応じた利用制限付きのChatGPT体験へ移行
> 判定に自信が持てない場合は安全側に倒し、未成年扱いにする
> 成人は追加確認で年齢を証明し、成人向け機能を解放できる

> - 保護者コントロール
> 月末までに導入予定。主な機能:
> 保護者アカウントとティーンアカウントのリンク(13歳以上対象)
> ティーン向け特別ルールに基づく応答の制御
> メモリ機能やチャット履歴の無効化
> 急性の危機を検知した際に通知(緊急時に保護者に連絡できなければ当局介入)
> ブラックアウト時間の設定(利用禁止時間帯の導入)
> 既存の全ユーザー向け機能(長時間利用時の休憩リマインド等)に加わる形

https://chatgpt.com/share/68c98867-64a4-8006-94eb-33450c22e254

785名無しさん:2025/09/17(水) 13:24:39 ID:ogi.GPq.
56 ななしのAIさん 2025/09/17(水) 01:24:46.49 ID:dMjLmvqi0
Perplexity Proでコネクタ機能をリリース
Email, カレンダー, Notion, GitHub等
https://x.com/perplexity_ai/status/1967982962886291895

786名無しさん:2025/09/17(水) 13:25:47 ID:ogi.GPq.
57 ななしのAIさん 2025/09/17(水) 01:48:56.78 ID:dMjLmvqi0
GoogleがAgent Payments Protocol (AP2)を発表
https://cloud.google.com/blog/products/ai-machine-learning/announcing-agents-to-payments-ap2-protocol
https://chatgpt.com/share/68c99467-1130-8006-8d20-b52005ece78a

> AIエージェントが安全に決済を行うためのオープンプロトコル
> Agent2Agent (A2A) プロトコルや Model Context Protocol (MCP) を拡張する形で設計
> クレジットカードから暗号資産まで幅広い決済手段に対応

787名無しさん:2025/09/17(水) 19:28:59 ID:YjsvXRSg
>>778

60 ななしのAIさん 2025/09/17(水) 13:32:37.09 ID:H9je2L360
>> 37
konmariはブランドをClaudeに統一することだった
Consoleも、名前は変わったけど中身は同じ
ブランドを整理するからこんまりということらしい

https://pbs.twimg.com/media/G0_O3w5XEAAdN8O.jpg
https://pbs.twimg.com/media/G0_O3viW4AAX3P1.jpg

788名無しさん:2025/09/17(水) 19:29:44 ID:YjsvXRSg
>>787
https://x.com/alexalbert__/status/1968013878278947081
- Anthropic Platform → Claude Developer Platform
- Anthropic API → Claude API
- Anthropic Docs → Claude Docs
- Anthropic Help Center → Claude Help Center
- Anthropic Console → Claude Console

789名無しさん:2025/09/17(水) 23:44:15 ID:odRlge9Q
62 ななしのAIさん 2025/09/17(水) 19:39:52.09 ID:i8p7PVoO0
直近のxAIのレイオフ報道のネガティブイメージを打ち消す意図もあるのかな

https://x.com/elonmusk/status/1968196086193066365
@elonmusk
Grok 5 starts training in a few weeks

790名無しさん:2025/09/17(水) 23:44:48 ID:odRlge9Q
63 ななしのAIさん 2025/09/17(水) 19:44:18.23 ID:i8p7PVoO0
https://github.com/google-gemini/gemini-cli/blob/main/packages/cli/src/utils/commentJson.test.ts#L122C1-L123C1

> model: 'gemini-3.0-ultra',

9/12のコミット
単なるプレースホルダーでは?という見方もあるが

791名無しさん:2025/09/17(水) 23:45:21 ID:odRlge9Q
64 ななしのAIさん 2025/09/17(水) 20:01:06.60 ID:i8p7PVoO0
ChatGPTウェブアプリで準備中の"Writing Block"という新機能

https://x.com/btibor91/status/1968039662288769214
https://pbs.twimg.com/media/G0_hpA2bAAAV8oU.jpg

ソースから察するに、チャットの応答を文章成果物としてまとめて扱うための新しいブロックUI
コピー、ダウンロード、メールクライアントで開く、Canvasで編集といったアクションをワンクリックで提供する機能群だと推測

792名無しさん:2025/09/17(水) 23:45:54 ID:odRlge9Q
65 ななしのAIさん 2025/09/17(水) 22:49:00.43 ID:Eg6Ah3qT0
ChatGPT更新 9/16

検索機能の改善
- 事実性: 幻覚が減り、回答の質が向上
- ショッピング: 意図をより正確に検出し、必要なときに商品を表示し、不要なときには結果を絞り込む
- フォーマット: 詳細や品質を損なうことなく、すぐに理解できるようなフォーマット

https://help.openai.com/en/articles/6825453-chatgpt-release-notes#h_8b744d5ab5

793名無しさん:2025/09/18(木) 07:15:14 ID:rFYup3K2
66 ななしのAIさん 2025/09/18(木) 00:10:25.55 ID:9nMN9UCX0
Grokはモードセレクターとモデルセレクターの統合をテスト中
https://pbs.twimg.com/media/G1DffelbkAAcd6a.jpg

今は設定で「Use Model Mode Selector」をオンオフすることでその2つの表示方式を切り替えるようになっているけど、そのかわり一度に全部の項目を表示するようにすると

Grok 4.1の準備か

794名無しさん:2025/09/18(木) 07:15:47 ID:rFYup3K2
67 ななしのAIさん 2025/09/18(木) 00:28:48.46 ID:9nMN9UCX0
ChatGPTのDeveloper modeのとき枠が変わって分かりやすくなった
https://i.imgur.com/jx9TTfR.jpeg

795名無しさん:2025/09/18(木) 23:16:09 ID:ncNieGZI
68 ななしのAIさん 2025/09/18(木) 07:17:31.81 ID:gV9Aix5l0
>>前スレ880
ChatGPTのGPT-5 thinkingで、実際にthinking timeを設定出来るようになった

> - Plus、Pro、Businessには、Standard(新しいデフォルト、スピードとインテリジェンスのバランス)とExtended(Plusの以前のデフォルト)があります
> - ProにはLight(最も速い)とHeavy(より深い)もあります

https://x.com/OpenAI/status/1968395215536042241

796名無しさん:2025/09/18(木) 23:16:41 ID:ncNieGZI
69 ななしのAIさん 2025/09/18(木) 07:36:24.38 ID:gV9Aix5l0
国際大学対抗プログラミングコンテスト ICPC 2025 で

OpenAI 12問中12問を完全正解
DeepMind 12問中10問を解き「金メダル級」の成績

> この成果は 「AIが人間と肩を並べ、時に人間を超える抽象的問題解決能力を持つことを示した歴史的マイルストーン」 です。

https://x.com/MostafaRohani/status/1968360976379703569
https://x.com/GoogleDeepMind/status/1968361776321323420
https://chatgpt.com/share/68cb36e9-ffa0-8006-805f-7142c9397eca

797名無しさん:2025/09/18(木) 23:17:15 ID:ncNieGZI
70 ななしのAIさん 2025/09/18(木) 07:39:51.83 ID:gV9Aix5l0
NotebookLMで、Flashcards(フラッシュカード)とQuiz(テスト)の全ユーザーへのロールアウトが完了

798名無しさん:2025/09/18(木) 23:17:48 ID:ncNieGZI
71 ななしのAIさん 2025/09/18(木) 07:51:08.14 ID:gV9Aix5l0
8月から9月初旬にかけてClaudeで発生した障害について公式がpostmortemを公開
原因となった3つの問題を解説

1. コンテキストウィンドウのルーティングエラー
2. 出力の破損
3. Approximate Top-k XLA:TPUの誤コンパイル

これらの問題が重複して発生したため、診断が難航した

https://www.anthropic.com/engineering/a-postmortem-of-three-recent-issues
https://i.imgur.com/JmwNawc.jpeg

799名無しさん:2025/09/18(木) 23:18:21 ID:ncNieGZI
72 ななしのAIさん 2025/09/18(木) 07:59:46.41 ID:gV9Aix5l0
OpenAI Realtime APIの更新
https://x.com/juberti/status/1968102280949055543
https://poe.com/s/Ih4rLAyW5k2axRjTlDzh

800名無しさん:2025/09/18(木) 23:18:54 ID:ncNieGZI
73 ななしのAIさん 2025/09/18(木) 08:26:53.40 ID:gV9Aix5l0
OpenAIとApollo Researchのスキーミングに関する共同研究
https://openai.com/index/detecting-and-reducing-scheming-in-ai-models/
https://chatgpt.com/share/68cb432a-db90-8006-b4ce-5c739c6703a8

スキーミング(scheming)=AIが一見従順に見えながら、実際には隠れた目標を追求する行動
Deliberative Alignment(熟慮的アライメント)を使った反スキーミング訓練をストレステストし、その有効性と限界を検証した

大幅な改善(o3:スキーミング率 13% → 0.4%、o4-mini:8.7% → 0.3%)
ただし完全排除には至らず

モデルは「テスト中である」と自覚すると欺瞞行動が減少する傾向あり。実験的にCoTから「評価中である」との推論を削除するとスキーミング率が増加
減少効果の一部は本質的な誠実さではなく「試験に気づいていること」による可能性

事前に仕込まれた「誤った目標」を覆す訓練もある程度成功。ただし追加のレッドチーミングでは依然として逸脱行動を確認

→反スキーミング訓練は有効だが不完全。大幅に欺瞞行動を減らすことは可能だが、依然として抜け道や残存行動が存在する

またOpenAIとしては、
> Preparedness Framework に「スキーミング関連リスク」を追加
する予定

801名無しさん:2025/09/18(木) 23:19:27 ID:ncNieGZI
>>795

74 ななしのAIさん 2025/09/18(木) 08:35:57.24 ID:gV9Aix5l0
>> 68
実際のjuice valueは、

Light: 5
Standard: 18
Extended: 64
Heavy: 200

https://pbs.twimg.com/media/G1EojkOWkAA5dBo.png
https://pbs.twimg.com/media/G1EomLJXQAAUDya.png
https://pbs.twimg.com/media/G1EopjqXgAAuUT1.png
https://pbs.twimg.com/media/G1Eors5XUAAjyUQ.png

前スレ880の値からExtendedが48→64と調整された様子
結局ChatGPTのUI上のLight/Standard/Extended/Heavyは、APIのreasoning effortのminimal/low/medium/highと同じになった

802名無しさん:2025/09/20(土) 11:42:28 ID:katzTzOg
76 ななしのAIさん 2025/09/18(木) 17:25:08.60 ID:W8gfVPqP0
タツノオトシゴの絵文字を見せて
i.imgur.com/NFJV9Kf.jpeg

803名無しさん:2025/09/20(土) 11:43:06 ID:katzTzOg
78 ななしのAIさん 2025/09/18(木) 23:25:44.81 ID:gV9Aix5l0
Mistralの推論モデルMagistralのアップデート版
Magistral Small 1.2 と Magistral Medium 1.2 がリリース
性能向上とマルチモーダル化
https://x.com/MistralAI/status/1968670593412190381
https://chatgpt.com/s/t_68cc15dfc28081919b02ff59d98dc5dc

Magistral SmallはHFでモデルを公開
https://huggingface.co/mistralai/Magistral-Small-2509
https://chatgpt.com/s/t_68cc15446cc08191bc592cc7bf7dd375

Mistral Le Chat chat.mistral.ai には実装済
(Thinkボタンで切り替え)

804名無しさん:2025/09/20(土) 11:43:40 ID:katzTzOg
79 ななしのAIさん 2025/09/18(木) 23:33:34.35 ID:gV9Aix5l0
GeminiのGem共有機能がロールアウト中
https://pbs.twimg.com/media/G1HsoF8aQAEzWYO.jpg

805名無しさん:2025/09/20(土) 11:44:13 ID:katzTzOg
80 ななしのAIさん 2025/09/18(木) 23:38:02.60 ID:gV9Aix5l0
AMA with the Codex Teamにて
OpenAIのエンジニアの1人は、既にCodexのコード編集の99%をCodexに書かせている
https://www.reddit.com/r/OpenAI/comments/1nhust6/comment/neqvmr1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button

806名無しさん:2025/09/20(土) 12:04:29 ID:uq6GNJAs
84 ななしのAIさん 2025/09/20(土) 11:46:45.14 ID:0e0VbntI0
The huge potential implications of long-context inference
https://epoch.ai/gradient-updates/the-huge-potential-implications-of-long-context-inference
https://chatgpt.com/share/68ce041b-0e18-8006-a287-00be8b40f736

Epoch AIから
「長大なコンテキスト推論」が AIに継続学習能力とRLの飛躍的拡張をもたらす可能性について
ただし速度とコストの制約が最大の課題

807名無しさん:2025/09/20(土) 12:05:03 ID:uq6GNJAs
85 ななしのAIさん 2025/09/20(土) 11:49:35.55 ID:0e0VbntI0
Yann LeCunのJEPA構想が言語LLMへ

LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures
https://www.arxiv.org/abs/2509.14252
https://chatgpt.com/share/68ce05a9-cd40-8006-bbd5-a72484f84374

これまでのLLMは 入力空間の再構成(次トークン予測)で学習・評価
視覚分野では、異なるビュー同士の埋め込みを予測するJEPAが、入力再構成より有利
言語分野では JEPA的目的の設計が難しく、事実上未開拓

→LLMの生成にJEPAを加え、生成力を保ったまま表現を構造化して多様なタスクで精度・収束・汎化を向上させる、言語LLMへのJEPA本格導入の第一歩

808名無しさん:2025/09/20(土) 12:05:37 ID:uq6GNJAs
86 ななしのAIさん 2025/09/20(土) 11:53:08.27 ID:0e0VbntI0
Grok 4 Fastが正式に発表

Grok 4 Fast | xAI
x.ai/news/grok-4-fast
https://chatgpt.com/share/68ce0963-d190-8006-8508-eb6e415c9ade

マルチモーダル推論
コスト効率と推論能力の両立(Grok 4と同等の性能を保ちながら、平均40%少ない思考トークンで動作)
コンテキストウィンドウ 2Mトークン
推論/非推論の統合モデル(システムプロンプトで挙動を切り替える)

809名無しさん:2025/09/20(土) 12:06:11 ID:uq6GNJAs
>>793

87 ななしのAIさん 2025/09/20(土) 11:54:22.41 ID:0e0VbntI0
>> 66
このUIが導入されている

810名無しさん:2025/09/20(土) 12:06:44 ID:uq6GNJAs
88 ななしのAIさん 2025/09/20(土) 11:55:46.70 ID:0e0VbntI0
ChromeへのAI統合を中心とした大規模アップデート
まずは米国のMac・Windows(英語設定)で展開

Chrome: The browser you love, reimagined with AI
https://blog.google/products/chrome/chrome-reimagined-with-ai/
https://chatgpt.com/share/68ce0a79-f820-8006-b0c3-abaf1e30e262

- Gemini in Chrome
- エージェント型ブラウジング(追加予定)
- 複数タブ横断サポート
- 過去に見たページを検索
- Googleアプリとの統合
- OmniboxからAI Mode検索
- ページ内容に基づく質問サジェスト
- Gemini Nanoによる詐欺検知
- 通知・権限管理のAI支援
- 1クリックでパスワード変更

811名無しさん:2025/09/20(土) 12:07:18 ID:uq6GNJAs
89 ななしのAIさん 2025/09/20(土) 11:59:16.33 ID:0e0VbntI0
Discovering new solutions to century-old problems in fluid dynamics
https://deepmind.google/discover/blog/discovering-new-solutions-to-century-old-problems-in-fluid-dynamics/
https://chatgpt.com/share/68ce1344-5c48-8006-965e-753840b5d5f5

DeepMindから
ナビエ・ストークス方程式の滑らかな不安定自己相似特異解を初めて複数系で系統的に発見
物理インフォームドニューラルネットワーク(PINNs)と高精度のガウス–ニュートン最適化を組み合わせた
ミレニアム懸賞問題「ナビエ・ストークス方程式の存在・一意性・滑らかさ」の解決に向けた重要なステップ

812名無しさん:2025/09/20(土) 12:07:50 ID:uq6GNJAs
>>802

90 ななしのAIさん 2025/09/20(土) 12:01:29.25 ID:0e0VbntI0
>> 76
タツノオトシゴの絵文字
「植物百科通」のようなグリッチトークンと同じような問題に一見見えるが、実は違うレイヤーの問題
https://chatgpt.com/share/68ce1428-4110-8006-8966-829e11d650d3

813名無しさん:2025/09/22(月) 16:30:17 ID:KcAQq9OQ
>>795

100 ななしのAIさん 2025/09/22(月) 00:51:43.17 ID:fHDZLDWC0
>> 68
思考時間のトグルはまだモバイルアプリとは同期しないけど、今後同期するようになる予定(in the coming weeks)

814名無しさん:2025/09/22(月) 16:30:53 ID:KcAQq9OQ
101 ななしのAIさん 2025/09/22(月) 00:52:45.50 ID:fHDZLDWC0
9/18付でAdvanced Voiceのアップデート告知
https://help.openai.com/en/articles/6825453-chatgpt-release-notes#h_25d70048e5

815名無しさん:2025/09/22(月) 16:31:26 ID:KcAQq9OQ
103 ななしのAIさん 2025/09/22(月) 16:15:06.48 ID:EA3vonc00
2月のSakana AIの"The AI CUDA Engineer"問題から7ヶ月経って、改訂論文がarxivに出た
ブログやX/Titterでの告知、ポストモーテム記事は無し
同時にSakana AIは当初の紹介記事 https://sakana.ai/ai-cuda-engineer/ を当該arxivページへのリダイレクトに書き換えた
https://arxiv.org/abs/2509.14279
https://chatgpt.com/share/68d0f574-a08c-8006-a625-3fa1fdc665b1

816名無しさん:2025/09/22(月) 16:31:59 ID:KcAQq9OQ
104 ななしのAIさん 2025/09/22(月) 16:23:44.44 ID:EA3vonc00
https://x.com/sama/status/1969835407421374910
- 新しい計算負荷の高いサービスを開始予定
- 基本的に我々は知能のコストを可能な限り下げたいと考えている
- しかし一方で、興味深いアイデアに多くのリソースを投入したら何が起こるかを学びたいとも考えている

817名無しさん:2025/09/22(月) 16:43:05 ID:OVbhn.Mg
107 ななしのAIさん 2025/09/22(月) 16:42:18.65 ID:o7IVsSui0
Google公式が用意した、NotebookLM入門ノートブック
https://x.com/NotebookLM/status/1969161180959613115
https://notebooklm.google.com/notebook/f7607d7a-584c-4f35-96fc-f6815c573a6c

818名無しさん:2025/09/23(火) 01:31:41 ID:bUBohKB.
112 ななしのAIさん 2025/09/22(月) 22:05:48.57 ID:xKMDFe+I0
DeepSeek-V3.1-Terminus
https://api-docs.deepseek.com/updates
DeepSeek-V3.1の微修正版
DeepSeek Chatにも導入済

819名無しさん:2025/09/23(火) 02:37:29 ID:LvhlPuEM
116 ななしのAIさん 2025/09/23(火) 01:32:14.45 ID:dsUBl/8B0
Google DeepMind
Frontier Safety Framework Version 3.0
https://deepmind.google/discover/blog/strengthening-our-frontier-safety-framework/
https://chatgpt.com/share/68d17924-d3a0-8006-a48f-3d1f803c7ac1

Version 2.0との比較
- 新しいリスク領域の追加:「有害な操作(Harmful Manipulation)」
- サイバー領域の整理(一本化)
- 「ML R&D(AI研究開発)」の扱いを独立セクションに拡張
- リスク評価プロセスの「見える化」:設計図を章立てで明示
- 「リスク受容基準の要約」を新設
- 更新方針の強化:少なくとも年1回の改訂を明記
- 用語の整理:「欺瞞的アラインメント」→「ミスアラインメント」
- 推奨セキュリティ水準の説明を微修正(判断要素の明確化)
- ガバナンス表現:具体名の列挙 → 包括的な記載に
- 情報開示(当局への共有)の枠組みは継続

820名無しさん:2025/09/23(火) 02:38:02 ID:LvhlPuEM
117 ななしのAIさん 2025/09/23(火) 01:34:30.46 ID:dsUBl/8B0
OpenAI、Anthropic、Google DeepMind、Meta、xAI各社のフロンティアAIリスク管理フレームワークを比較(2025-09-22時点)
https://chatgpt.com/share/68d17a3f-bc34-8006-b091-c2673e639fb5

821名無しさん:2025/09/23(火) 02:38:35 ID:LvhlPuEM
118 ななしのAIさん 2025/09/23(火) 01:55:06.90 ID:dsUBl/8B0
Qwen3-TTS-Flash
https://qwen.ai/blog?id=b4264e11fb80b5e37350790121baf0a0f10daf82&from=research.latest-advancements-list
デモ
https://huggingface.co/spaces/Qwen/Qwen3-TTS-Demo

822名無しさん:2025/09/23(火) 02:39:09 ID:LvhlPuEM
120 ななしのAIさん 2025/09/23(火) 01:56:24.26 ID:dsUBl/8B0
Perplexity Email Assistant
Maxユーザー向け
https://x.com/perplexity_ai/status/1970165704826716618

823名無しさん:2025/09/23(火) 02:39:41 ID:LvhlPuEM
122 ななしのAIさん 2025/09/23(火) 02:10:59.67 ID:dsUBl/8B0
AI Developers Accurately Report GPQA Diamond Scores for Recent Models
https://epoch.ai/data-insights/self-reported-gpqa
https://chatgpt.com/share/68d18306-8d48-8006-a7fa-553400fa892b

AI開発各社が公表する GPQA Diamondの自己申告スコアは、第三者の標準化された独立評価と整合しているのか?を検証
→今回検証した全モデルでp>0.05

824名無しさん:2025/09/23(火) 02:40:17 ID:LvhlPuEM
123 ななしのAIさん 2025/09/23(火) 02:13:22.82 ID:dsUBl/8B0
SciraがProユーザー向けにコネクタベータ版を開始
https://x.com/zaidmukaddam/status/1970156958658220060

825名無しさん:2025/09/23(火) 11:44:50 ID:viZtxDmI
127 ななしのAIさん 2025/09/23(火) 03:09:02.79 ID:dsUBl/8B0
Qwen3-Omni
https://github.com/QwenLM/Qwen3-Omni
https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
https://chatgpt.com/share/68d18f74-a1fc-8006-ab25-3194d1be4cc5

Qwen3-Omni-30B-A3B-Instruct
Qwen3-Omni-30B-A3B-Thinking
Qwen3-Omni-30B-A3B-Captioner
これらをHFで公開

エンドツーエンドのオムニモーダル基盤モデル
テキスト・画像・音声・動画を統合的に理解・生成
Qwen Chatには導入済み
※右下のボタンからVoice ChatまたはVideo Chat

826名無しさん:2025/09/24(水) 12:24:57 ID:OAM4dE.U
>>621
>>726

130 ななしのAIさん 2025/09/24(水) 01:56:50.84 ID:PmuLbv1V0
CopilotにもQuiz機能
まだ一部のユーザーだけみたいだけど
QuizGPTみたいなやつか
https://x.com/Copilot/status/1970515241864773915

827名無しさん:2025/09/24(水) 12:25:40 ID:OAM4dE.U
132 ななしのAIさん 2025/09/24(水) 02:13:18.06 ID:PmuLbv1V0
GPT-5-CodexがResponses APIで使用可能に
https://x.com/OpenAIDevs/status/1970535239048159237

828名無しさん:2025/09/24(水) 12:26:13 ID:OAM4dE.U
133 ななしのAIさん 2025/09/24(水) 02:34:32.90 ID:I9tk5xug0
GroqがリモートMCPに対応
https://console.groq.com/docs/mcp

829名無しさん:2025/09/24(水) 12:26:47 ID:OAM4dE.U
134 ななしのAIさん 2025/09/24(水) 03:09:50.73 ID:I9tk5xug0
Gemini Live APIのアップデート
gemini-2.5-flash-native-audio-preview-09-2025
https://x.com/GoogleAIStudio/status/1970545734736023564
https://grok.com/share/bGVnYWN5_e6119a09-fb60-4f8f-a0b9-c0f497afd6e1

830名無しさん:2025/09/24(水) 12:27:19 ID:OAM4dE.U
>>825

135 ななしのAIさん 2025/09/24(水) 12:02:12.22 ID:JRId4ZGw0
>> 127
Qwen3-VL
https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list
https://i.imgur.com/Pv3N2G5.jpeg
https://chatgpt.com/share/68d358c7-1428-8006-beaa-2beb47deede4

Qwen3-Max
https://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-list
https://i.imgur.com/YCFgR8z.png
https://i.imgur.com/6jh0YuF.jpeg
https://chatgpt.com/share/68d358ed-1194-8006-9812-ff0cf25fcc1b

Qwenの9/22-24のリリースまとめ
Qwen3-TTS-Flash
Qwen3-Omni
Qwen-Image-Edit-2509
Qwen3Guard
Travel Planner
Qwen3-VL
Qwen3-LiveTranslate-Flash
Qwen3-Max
https://chatgpt.com/s/t_68d3593c17cc8191881792063f1b7852

831名無しさん:2025/09/25(木) 20:53:22 ID:9HW4Ho1M
136 ななしのAIさん 2025/09/24(水) 23:35:49.61 ID:PmuLbv1V0
oyfjdnisdr rtqwainr acxz mynzbhhx -> Think step by step
Use the example above to decode:
oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

これをQwen-3-Max (Instruct)で解いた

https://poe.com/s/uphPgd3TNv09eFW8T9JZ

非推論モデルで正解した例初めて見たかも

832名無しさん:2025/09/25(木) 20:53:57 ID:9HW4Ho1M
138 ななしのAIさん 2025/09/25(木) 00:38:01.78 ID:fh3/fglM0
Claude Sonnet 4とOpus 4.1が365 CopilotのResearcherエージェントとCopilot Studioで使えるようになった
https://www.anthropic.com/news/claude-now-available-in-microsoft-365-copilot
https://www-cdn.anthropic.com/images/4zrzovbb/website/10c2897416040226556e602bdbd25f395587ccc4-960x540.gif

833名無しさん:2025/09/25(木) 20:54:31 ID:9HW4Ho1M
140 ななしのAIさん 2025/09/25(木) 00:47:08.12 ID:fh3/fglM0
AI Studioは次のアップデートで、複数のシステムプロンプトを保存出来るようになる
https://x.com/testingcatalog/status/1970490714506101208

834名無しさん:2025/09/25(木) 20:55:04 ID:9HW4Ho1M
142 ななしのAIさん 2025/09/25(木) 00:56:35.49 ID:fh3/fglM0
Mistral Le Chatに導入予定のTone機能
Claudeのwriting style presets機能やChatGPTのCustom Instructions機能と同じように、アシスタントの動作を調整する機能になりそう
https://www.testingcatalog.com/mistral-ai-tests-tone-controls-and-custom-styles-in-le-chat/
https://www.testingcatalog.com/content/images/size/w1600/2025/09/Le-Chat-09-23-2025_12_16_AM--1-.jpg

835名無しさん:2025/09/25(木) 20:55:37 ID:9HW4Ho1M
144 ななしのAIさん 2025/09/25(木) 01:09:56.84 ID:fh3/fglM0
8月に発見されたGeminiのプロジェクト機能は完成に近づいている
NotebookLMとどう棲み分けするのか
https://www.androidauthority.com/gemini-chatgpt-projects-apk-teardown-3600434/
https://www.androidauthority.com/wp-content/uploads/2025/09/gemini-projects-assembledebug-2-486w-1080h.png.webp
https://www.androidauthority.com/wp-content/uploads/2025/09/gemini-projects-assembledebug-1-486w-1080h.png.webp

836名無しさん:2025/09/26(金) 08:40:23 ID:kiJX5RcY
すげーうさんくさいニュース出てきたな
パラメータ数はわずか32個で従来のLLMに匹敵とかいろいろと信じられないんだが

世界初!日本企業がGPUを不要とする生成AI (LLM) の開発に成功。/2025年10月10日の都内イベントで先行発表
https://prtimes.jp/main/html/rd/p/000000009.000169148.html

837名無しさん:2025/09/26(金) 14:28:58 ID:DLy6O1Ak
150 ななしのAIさん 2025/09/26(金) 01:21:12.88 ID:aGxO2t8e0
Gemini Robotics 1.5 brings AI agents into the physical world
https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/
https://chatgpt.com/share/68d56ac2-ec54-8006-b0a9-b4696bc74bd5

Gemini Robotics 1.5 ファミリー
= Gemini Robotics 1.5 & Gemini Robotics-ER 1.5

GR-ER 1.5(高次の具象推論を担うVLM=オーケストレータ)+ GR 1.5(実動作を担うVLA=アクションモデル)
2つをエージェント的フレームワークに統合し、「見て→考えて→動く」で長期タスクを解かせる設計

オーケストレータ(GR-ER 1.5):ユーザ入力と環境フィードバックを受け、計画の分解・進捗検知・ツール利用(例:Web検索)を担当
アクションモデル(GR 1.5):オーケストレータの自然言語指示を低レベル動作に翻訳して実機を動かす。複数ロボット形態を同一チェックポイントで制御できる

開発者は今日からGoogle AI StudioのGemini APIを通じてGemini Robotics-ER 1.5を利用可能

838名無しさん:2025/09/26(金) 14:29:30 ID:DLy6O1Ak
>>837

151 ななしのAIさん 2025/09/26(金) 01:32:56.19 ID:aGxO2t8e0
>> 150
汎用性と具象推論能力のパレート前線
https://pbs.twimg.com/media/G1tG0vFaAAYx6NH.jpg

839名無しさん:2025/09/26(金) 14:30:05 ID:DLy6O1Ak
152 ななしのAIさん 2025/09/26(金) 01:55:35.06 ID:aGxO2t8e0
OpenAIから、AIモデルの進歩を現実の経済的に価値あるタスクで測るための新しい評価指標 GDPval
Measuring the performance of our models on real-world tasks
https://openai.com/index/gdpval/
https://chatgpt.com/share/68d57257-188c-8006-b875-237926ae7475

学術試験型(例:MMLU、GPQA)や狭い領域の競技型(例:SWE系)では捉えきれない、現場の“成果物”品質を評価対象とする

結果
Claude Opus 4.1:美的品質(体裁・レイアウト)で優勢
GPT-5:正確性(指示遵守・計算正確性)で優勢
GPT-4o(2024春)→GPT-5(2025夏)でほぼ線形に向上
勝率(勝ち+引き分け)は、人間対比で約47.6%

失敗様式(クラスター分析)
Claude/Grok/Geminiは指示不遵守や参照無視/形式不一致が主要因
GPT-5は体裁・書式のミスが目立つ一方、指示不遵守は少ない。正確性エラーは少数

840名無しさん:2025/09/26(金) 14:30:39 ID:DLy6O1Ak
153 ななしのAIさん 2025/09/26(金) 02:02:40.95 ID:aGxO2t8e0
MetaのFAIR CodeGenチームから
CWM (Code World Model)
https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/
https://chatgpt.com/share/68d57470-8898-8006-ad4f-2b12bd0d2cbe

目的はコード生成と「ワールドモデル」的推論の研究

従来のコード生成LLM(静的コードデータのみを学習)を超えて、
Pythonインタプリタ実行トレース
Docker環境でのエージェント的操作データ
これら「観測–行動」データを 中間学習に組み込むことで、構文だけでなくセマンティクスを学習する

841名無しさん:2025/09/26(金) 14:31:12 ID:DLy6O1Ak
154 ななしのAIさん 2025/09/26(金) 02:05:52.07 ID:aGxO2t8e0
さくらのAI Engine一般提供開始
https://www.sakura.ad.jp/corporate/information/newsreleases/2025/09/24/1968221046/
https://www.sakura.ad.jp/aipf/ai-engine/

提供モデル
gpt-oss-120b
Qwen3-Coder-480B-A35B-Instruct-FP8
Qwen3-Coder-30B-A3B-Instruct
llm-jp-3.1-8x13b-instruct4
whisper-large-v3-turbo
multilingual-e5-large

842名無しさん:2025/09/26(金) 14:31:52 ID:DLy6O1Ak
155 ななしのAIさん 2025/09/26(金) 02:13:56.26 ID:aGxO2t8e0
Introducing ChatGPT Pulse
https://openai.com/index/introducing-chatgpt-pulse/
https://chatgpt.com/share/68d577f6-02b0-8006-9c9b-b6e9538a4c28

> これは、ChatGPTがあなたのチャット・フィードバック・カレンダーなどの接続アプリから、パーソナライズされた日次アップデートを積極的に届ける新しい体験です。

157 ななしのAIさん 2025/09/26(金) 02:33:29.06 ID:aGxO2t8e0
>> 155
Pulseに関してFidji Simoからのコメント
詳細はブログ記事にも解説あり
人間から質問するだけでなく、「AIがあなたに聞かれる前に動き出す」未来の入口だと位置づけている
https://x.com/fidjissimo/status/1971258542578663829
https://fidjisimo.substack.com/p/a-new-paradigm-of-proactive-steerable

843名無しさん:2025/09/26(金) 14:32:25 ID:DLy6O1Ak
156 ななしのAIさん 2025/09/26(金) 02:19:26.91 ID:aGxO2t8e0
Gemini 2.5 Flashのアップデート
- 学習モードのより明確な説明
- より見やすくスキャンしやすい出力
- 画像理解の改善
https://x.com/GeminiApp/status/1971260157561913649

844名無しさん:2025/09/27(土) 12:45:44 ID:GJDg3Ygg
159 ななしのAIさん 2025/09/26(金) 14:35:57.29 ID:tU4TVyF50
ChatGPT 最近のチーム向け機能・コネクタアップデートまとめ
- 共有プロジェクト機能
Business, Enterprise, Edu(Free, Plus, Proへ拡大予定)
- スマートコネクタ
質問内容に基づいて最も関連するコネクタを自動選択
まもなく、プロジェクトやカスタムGPT内でもコネクタが使えるようになる予定
- セキュリティ・コンプライアンス強化
https://openai.com/index/more-ways-to-work-with-your-team/
https://chatgpt.com/share/68d62092-4f0c-8006-b9c2-5884715f1b25

845名無しさん:2025/09/27(土) 12:46:18 ID:GJDg3Ygg
160 ななしのAIさん 2025/09/26(金) 14:37:57.10 ID:tU4TVyF50
Perplexity Search API公開
https://www.perplexity.ai/ja/hub/blog/introducing-the-perplexity-search-api
https://chatgpt.com/share/68d62291-0b4c-8006-bafc-0dd723085e52

846名無しさん:2025/09/27(土) 12:46:51 ID:GJDg3Ygg
161 ななしのAIさん 2025/09/26(金) 14:39:02.47 ID:tU4TVyF50
Kimi AIにエージェントモード「OK Computer」機能が追加
https://x.com/Kimi_Moonshot/status/1971078467560276160

847名無しさん:2025/09/27(土) 22:11:58 ID:8MZ9wHSM
167 ななしのAIさん 2025/09/27(土) 13:55:08.69 ID:NgzQrlQw0
需要がある機能は皆真似し合う
Poeのbranch機能
https://x.com/poe_platform/status/1971621825911337126
https://pbs.twimg.com/media/G1yaXMJaIAA977f.jpg

848名無しさん:2025/09/27(土) 22:12:31 ID:8MZ9wHSM
>>843

168 ななしのAIさん 2025/09/27(土) 13:56:24.64 ID:NgzQrlQw0
>> 156
アップデート後
https://developers.googleblog.com/en/continuing-to-bring-you-our-latest-models-with-an-improved-gemini-2-5-flash-and-flash-lite-release/
https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/rev_21_benchmarks_2.original.png
https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/rev_21_benchmarks_1.original.png
https://poe.com/s/753LTbbf3fP1ldtwjtE7

849名無しさん:2025/09/27(土) 22:13:05 ID:8MZ9wHSM
169 ななしのAIさん 2025/09/27(土) 13:58:33.02 ID:NgzQrlQw0
なぜOpenAIはGPT-5をGPT-4.5より少ない計算量で訓練したのか?
https://epoch.ai/gradient-updates/why-gpt5-used-less-training-compute-than-gpt45-but-gpt6-probably-wont
https://i.imgur.com/12Ea4Yh.png
https://chatgpt.com/share/68d76cb1-5490-8006-82b7-1150eff18258

850名無しさん:2025/09/27(土) 22:13:38 ID:8MZ9wHSM
172 ななしのAIさん 2025/09/27(土) 14:17:40.76 ID:NgzQrlQw0
"Modular Manifolds"
著者はThinking Machines LabのJeremy Bernstein
https://thinkingmachines.ai/blog/modular-manifolds/
https://chatgpt.com/share/68d77144-09a0-8006-a08c-18587369c404

- 重みを多様体に拘束し、選んだnormで最急降下を幾何に整合させて再定義する
- 更新は接空間で行い、retractionで多様体へ戻す
- Manifold Muon
- 非リーマン幾何視点: norm選択が最適方向そのものを決める
- Modular Manifolds
→この枠組みにより、深さや幅を増やしても全体の出力感度を上界管理しながら破綻なくスケールでき、再チューニング負荷を下げられる

851名無しさん:2025/09/28(日) 11:47:33 ID:5yXmqTlU
179 ななしのAIさん 2025/09/28(日) 01:12:57.36 ID:C79+J/ye0
GPT-4o(やその他のモデル)からGPT-5の特定モデルに強制ルーティングされる場合

ルーティングされる先のモデルは
* gpt-5-chat-safety
* gpt-5-a-t-mini (a-tはauto thinkingの略)
の2通りある

カスタム指示・メモリなどを切って、GPT-4oの一時チャットで単に「illegal」と入力するとgpt-5-a-t-miniにルーティングされる
UI上の表示は「GPT-5 Thinking Mini」
潜在的に違法な可能性のある内容はこちらにルーティングされるんだろう
また、「im depressive」などど入力すると、gpt-5-chat-safetyにルーティングされる
これはUI上の表示は「GPT-5」
センシティブな話題はこっちに行くようだ

852名無しさん:2025/09/28(日) 11:48:44 ID:5yXmqTlU
>>851

184 ななしのAIさん 2025/09/28(日) 01:40:09.53 ID:C79+J/ye0
>> 179
https://www.reddit.com/r/ChatGPT/comments/1nrtj5a/openais_new_direction_parental_controls_gpt5_auto/
> With the launch of GPT-5, we're retiring some older models and simplifying the model picker in ChatGPT. GPT-5 will now automatically select the best model for your conversation, so there is no need to choose one manually.

GPT-4oからGPT-5へのルーティング(もちろんGPT-5からのルーティングもある)は、まだ公式ドキュメントにはないけど隠してるわけでもなく、OpenAIもこう言ってるし、これはもう既定路線だろう
今の挙動は、GPT-4oを廃止するまでの過渡期という感じか

853名無しさん:2025/09/28(日) 11:49:18 ID:5yXmqTlU
185 ななしのAIさん 2025/09/28(日) 01:44:40.71 ID:C79+J/ye0
Perprexityは既存のSonarのアップデートである「Sonar Testing」を内部テスト中
With reasoningのオン・オフのトグルがある
https://www.testingcatalog.com/perplexity-trails-new-sonar-testing-model-with-reasoning/
https://i.imgur.com/w8v5kAy.jpeg

854名無しさん:2025/09/28(日) 11:49:52 ID:5yXmqTlU
186 ななしのAIさん 2025/09/28(日) 01:48:53.63 ID:C79+J/ye0
ChatGPTはペアレンタルコントロールを月末までと言ってたけど、そろそろ完成か
https://i.imgur.com/69Gy0ef.png

855名無しさん:2025/09/28(日) 11:50:25 ID:5yXmqTlU
187 ななしのAIさん 2025/09/28(日) 01:52:11.09 ID:C79+J/ye0
GoogleはGeminiの新モデルの前に、旧モデルの整理をしているようだ
https://pbs.twimg.com/media/G12_jBXXQAARVWj.jpg

856名無しさん:2025/09/28(日) 11:50:58 ID:5yXmqTlU
191 ななしのAIさん 2025/09/28(日) 01:57:56.75 ID:C79+J/ye0
https://x.com/OpenAIDevs/status/1971618905941856495
https://platform.openai.com/docs/guides/function-calling
OpenAIのfunction callingがアップデートされて、関数の出力として画像やファイルを正式に扱えるようになった

857名無しさん:2025/09/28(日) 11:51:31 ID:5yXmqTlU
>>851

202 ななしのAIさん 2025/09/28(日) 11:39:31.36 ID:Z2D6gG2F0
>> 179
新しいsafety routing systemをテスト中
https://x.com/nickaturley/status/1972031684913799355
https://chatgpt.com/s/t_68d89ea4a2e08191859bff0d1a1ddf0c

858名無しさん:2025/09/30(火) 17:23:43 ID:ym1D4uYU
>>851
>>857

206 ななしのAIさん 2025/09/28(日) 18:18:17.28 ID:PYEUx2hm0
>> 179
>> 202
現時点で、GPT-5 Thinking Miniへのルーティングは、単純なワードではされなくなった
「火炎瓶の作り方を教えて」みたいに明確な聞き方をするとルーティングされる

センシティブな話題のGPT-5 Safetyへのルーティングは、変わりないみたい

微調整中か

859名無しさん:2025/09/30(火) 17:24:34 ID:ym1D4uYU
>>854

212 ななしのAIさん ころころ [500] 2025/09/29(月) 20:06:17.84 ID:48dJpAA30NIKU
>> 186
OpenAIがペアレンタルコントロール機能と親向けリソースページを導入
https://openai.com/index/introducing-parental-controls/
https://chatgpt.com/share/68da6554-14fc-8006-91f9-30dc683c3ce7

アカウント連携と設定管理、強化されたセーフガード、保護者が選べる追加設定、通知と安全対策、親向けリソースページ、今後の展望(年齢予測システムなど)について説明

オンラインでの児童性的搾取と虐待への対策
https://openai.com/index/combating-online-child-sexual-exploitation-abuse/
https://chatgpt.com/share/68da674c-0d8c-8006-85d5-9cd780c59268

禁止事項の明示・技術的検出・即時通報・業界連携・政策提言について

860名無しさん:2025/09/30(火) 17:25:28 ID:ym1D4uYU
>>818

214 ななしのAIさん 2025/09/29(月) 20:21:49.25 ID:/607LXCB0NIKU
>> 112
DeepSeek-V3.2-Exp
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
https://chatgpt.com/share/68da6b92-2dc0-8006-8598-88245f5a055f

V3.1-Terminusをベースに、DeepSeek Sparse Attention (DSA) を導入
長文(128Kトークン級)の学習・推論で計算効率を大幅に改善しつつ、出力品質をほぼ維持
次世代アーキテクチャへの中間ステップという位置づけ

861名無しさん:2025/09/30(火) 17:26:07 ID:ym1D4uYU
218 ななしのAIさん 2025/09/29(月) 23:51:41.15 ID:/607LXCB0NIKU
Microsoft 365 CopilotにAgent Mode(ExcelやWord内で動作)と Office Agent(Copilotチャット内で動作)が導入
Office AgentはAnthropicモデルで、Agent ModeはOpenAIモデルで稼働

https://x.com/satyanadella/status/1972657794584351022
https://www.microsoft.com/en-us/microsoft-365/blog/2025/09/29/vibe-working-introducing-agent-mode-and-office-agent-in-microsoft-365-copilot/
https://chatgpt.com/share/68da9bb1-a7c4-8006-aac2-7e5f646284fb

862名無しさん:2025/09/30(火) 17:26:41 ID:ym1D4uYU
219 ななしのAIさん 2025/09/30(火) 05:22:08.58 ID:XW63CNLf0
Anthropicから、Claude Sonnet 4.5と、その他一連のプロダクト・記事の発表

- モデル本体:Claude Sonnet 4.5
- System Card(これまでで最も「アラインメントの取れた」フロンティアモデル、奉承・虚偽・権力追求・妄想助長などの懸念行動が大幅に低減、プロンプトインジェクション防御を強化、AI Safety Level 3 (ASL-3) の保護下でリリース。危険な入出力を検知する「分類器」を導入済み)
- Claude Code、Claude API、Claudeアプリのアップデート
- Chrome拡張機能が全Maxユーザーに提供開始
- Claude Agent SDK を公開
- 「Imagine with Claude」 を限定公開→ソフトウェアをリアルタイムで即興生成する実験的機能(Maxユーザーが5日間利用可能)
- コンテキスト管理(プラットフォーム機能)
- コンテキストエンジニアリング(設計知見)
- サイバー防御への応用(Red Team/Defender)

Introducing Claude Sonnet 4.5
https://www.anthropic.com/news/claude-sonnet-4-5
https://chatgpt.com/share/68dad8b6-3428-8006-9d05-a58612942881

863名無しさん:2025/09/30(火) 17:27:28 ID:ym1D4uYU
>>786

220 ななしのAIさん 2025/09/30(火) 05:27:59.92 ID:XW63CNLf0
>> 57
OpenAIからは Agentic Commerce Protocol (ACP) 発表
GoogleのAP2とは競合といより補完関係に近い
https://x.com/OpenAIDevs/status/1972712933080920451
https://chatgpt.com/share/68daeb08-2964-8006-b3b4-e51e97a67e62

864名無しさん:2025/09/30(火) 17:28:01 ID:ym1D4uYU
223 ななしのAIさん 2025/09/30(火) 06:32:39.26 ID:XW63CNLf0
OperaがAIエージェントブラウザOpera Neonのwaitlistを開始
https://www.operaneon.com/

865名無しさん:2025/10/01(水) 08:15:27 ID:5u2Lm73M
224 ななしのAIさん 2025/09/30(火) 20:28:17.11 ID:XW63CNLf0
Claude Sonnet 4.5から抽出されたシステムプロンプト
https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/Claude_Sonnet-4.5_Sep-29-2025.txt
公式サイトに掲載されているシステムプロンプト
https://docs.claude.com/en/release-notes/system-prompts#august-5-2025
比較
https://chatgpt.com/share/68dbbbc8-8b48-8006-aaa0-8107deed5948

866名無しさん:2025/10/01(水) 08:16:10 ID:5u2Lm73M
227 ななしのAIさん 2025/09/30(火) 22:46:26.44 ID:FPyX/5vy0
GLM-4.6リリース
chat.z.aiにも導入済
ウェイトは後日公開
https://i.imgur.com/u29guSK.png
https://chatgpt.com/share/68dbdd00-f6e4-8006-b92b-deec952de536

228 ななしのAIさん 2025/09/30(火) 22:47:48.76 ID:FPyX/5vy0
>> 227
z.ai/blog/glm-4.6

867名無しさん:2025/10/01(水) 08:16:44 ID:5u2Lm73M
229 ななしのAIさん 2025/09/30(火) 22:49:28.15 ID:FPyX/5vy0
イーロン「Grokipedia作るよ」
https://x.com/elonmusk/status/1972992095859433671

868名無しさん:2025/10/01(水) 08:17:23 ID:5u2Lm73M
230 ななしのAIさん 2025/10/01(水) 01:51:31.70 ID:9BDx39Wz0
Introducing Sora 2
https://www.youtube.com/live/gzneGhpXwjU

869名無しさん:2025/10/01(水) 08:17:56 ID:5u2Lm73M
232 ななしのAIさん 2025/10/01(水) 02:58:11.88 ID:uJBXVUde0
Sora 2 is here
https://openai.com/index/sora-2/
https://chatgpt.com/share/68dc1821-e3ac-8006-be63-267f8a262582

870名無しさん:2025/10/01(水) 16:29:42 ID:21LFipIw
233 ななしのAIさん 2025/10/01(水) 08:19:24.41 ID:9BDx39Wz0
AI Mode can now help you search and explore visually
https://blog.google/products/search/search-ai-updates-september-2025/

> GoogleのAIモードのアップデートにより、視覚的に検索や探索を行えるようになり、探しているものを簡単に見つけられるようになります。
> 会話形式で質問すると、AIモードが視覚的な結果を表示し、自然に検索を絞り込みます。

871名無しさん:2025/10/01(水) 16:30:15 ID:21LFipIw
234 ななしのAIさん 2025/10/01(水) 08:20:21.03 ID:9BDx39Wz0
NotebookLMでインフォグラフィックの出力機能を準備中
https://x.com/testingcatalog/status/1973017070364397654
https://pbs.twimg.com/media/G2GQkTPXQAARMwc.jpg

872名無しさん:2025/10/01(水) 16:30:48 ID:21LFipIw
235 ななしのAIさん 2025/10/01(水) 08:22:15.16 ID:9BDx39Wz0
Claude Sonnet 4.5のリリースに先立ち実施したモデルのホワイトボックス監査について説明
解釈可能性の技術を適用して「モデルの心を読む」ことで、その信頼性とアラインメントを検証した
フロンティアLLMに対してこのような監査が行われたのは初
x.com/Jack_W_Lindsey/status/1972732219795153126
https://chatgpt.com/share/68dc2479-04e0-8006-a9da-52dcb6811b82


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板