レス数が1スレッドの最大レス数(1000件)を超えています。残念ながら投稿することができません。
技術的特異点/シンギュラリティ【総合】避難所 34
-
d @d_1d2d
OpenAIがAIコーディングエージェントの「Codex in ChatGPT」を発表
・o3をソフトウェア開発向けに最適化したcodex-1を搭載
・合格するまでコードに対して反復テスト
・クラウド内の仮想コンピュータ上で動作
・GitHub接続
・複数タスクの並列実行
・仮想チームメイトへ
詳細はスレッド↓
2025年05月17日 00:32
https://x.com/d_1d2d/status/1923401196800221673
d @d_1d2d
【概要】
- 「Codex in ChatGPT」の研究プレビューを開始
【codex-1】
- o3をソフトウェアエンジニアリングタスク向けに最適化したバージョンであるcodex-1を搭載
- codex-1はo3よりも「クリーン」なコードを生成し、命令をより正確に遵守し、合格結果が得られるまでコードに対して反復的なテストを実行
【特徴】
- クラウド内のサンドボックス化された仮想コンピュータ上で動作
- GitHubに接続することで、Codexの環境にコードリポジトリを事前にロード
- 簡単な機能の作成、バグの修正、コードベースに関する質問への回答、テストの実行などのタスクを1分から30分程度で実行
- Codexは複数のソフトウェアエンジニアリングタスクを同時に処理することができ、実行中にユーザーがコンピューターやブラウザにアクセスすることを制限しない
【展開】
- 本日からChatGPT Pro、Enterprise、Teamの加入者向けに展開
- 当初はユーザーにCodexへの「寛大なアクセス」が提供されるが、今後数週間でツールのレート制限を導入する予定
- ユーザーはその後、Codexを利用するために追加のクレジットを購入するオプションが利用可能になる
- 近々 Codex へのアクセスを ChatGPT Plus および Edu ユーザーにも拡大する予定
【その他】
- 最終的にAIコーディングエージェントを「仮想チームメイト」として機能させ、人間のエンジニアが「数時間、あるいは数日」かかるタスクを自律的に完了させたい
- OpenAIは既に社内でCodexを活用し、反復的なタスクのオフロード、新機能のスキャフォールディング、ドキュメント作成を行っている
- Codexは「悪意のあるソフトウェア」の開発依頼を確実に拒否する
2025年05月17日 00:32
d @d_1d2d
Codexのドキュメント
https://platform.openai.com/docs/codex
概要
・Codexはクラウド上で動くソフトウェア開発エージェント。PR作成、バグ修正、リファクタリングを数分で実行
・OpenAI o3を開発向けに最適化したモデルを搭載
連携
・組織にGitHubアプリをインストールし「クローン」「PR作成」の権限を付与
・各ユーザがGitHub認証後、同一ワークスペース内でリポジトリを共有利用可能
動作
・http://chatgpt.com/codex でタスク提出 → 新規Dockerコンテナ起動
・指定ブランチ/コミットを /workspace へクローン後、セットアップスクリプト実行
・以降はネットワーク遮断。依存追加は不可
・ターミナル操作をループし、コード生成→テスト実行→結果確認
・http://agents.md/に定義されたlint/テストコマンドを尊重
・完了時にdiffまたはフォローアップタスクを返却。ユーザはPR作成や追加指示が可能
モード
・Ask:リードオンリークローンで高速起動。ブレインストーミングやアーキ質問向き
・Code:完全環境でコード変更・テスト実行。自動PRを生成
使用例
・リファクタ案提示:「最も複雑なファイルを分割・テスト・機能分離する方法は?」
・アーキ構造説明:クライアントからDBまでのフローをMermaid図で生成
・セキュリティ監査:パッケージのメモリ安全性脆弱性を発見し修正
・コードレビュー:PR URLに.diffを付けて送信し改善提案を受取
・テスト追加:特定ファイルにユニットテストを生成
・バグ修正:スタックトレースから原因特定しパッチ適用
・UI微調整:オンボーディングモーダルの位置ずれを修正
環境設定
・既定は多言語入りベースイメージ。独自Dockerイメージも指定可能
・リポジトリ直下にセットアップコマンドを列挙し、依存・Lint・テストを準備
・http://agents.md/で作業領域・スタイルガイド・移行対象・検証手順を共有。ネスト配置可
プロンプト指南
・grep可能な固有名(ファイル名/シンボル)を使う
・対象を単一ファイルまたは最大100ファイル程度に限定
・フルスタックトレースを貼付しバグ特定を高速化
・テストやLintで合否を定義し、結果をCodexに検証させる
・大規模変更は小タスクに分割し、並列実行で効率化
・行き詰まったらブランチを切ってCodexに委任。朝イチで複数タスクを投入しておくと便利
ベストプラクティス
・ネットワーク遮断後は依存追加不可。必要パッケージはセットアップでインストール
・UIテストは未対応。ユニットテストとLintで品質担保
・PRタイトルやパッケージ名に一貫した接頭辞(例: wham)を付けて検索性向上
2025年05月17日 01:01
|
|
|
掲示板管理者へ連絡
無料レンタル掲示板