OpenAIは、o3とo4-miniの最強の推論モデルをリリースしました:絵を考え、ツールを自動的に選択し、数学とコーディングのパフォーマンスにブレークスルーをもたらすことができます

OpenAIは本日、o3およびo4-mini推論モデルを正式に発表し、画像推論とマルチツール統合を初めて実現し、コミュニティは「AIエージェント」を促進する可能性について楽観的です。 (あらすじ:OpenAIは独自のソーシャルプラットフォームを密かに構築し、マスク氏のXを指し示している) (背景補足:GPT-5は延期! OpenAIがo3、o4-miniを最初にプッシュ、サム・アルトマンが明らかに:統合は予想以上に難しい) 人工知能大手のOpenAIは、(17)日早朝に2つの新世代推論モデル「o3」と「o4-mini」を正式にリリースし、「画像推論」とすべてのChatGPTツールを自律的に使用できる機能を強調し、グローバルAIをトリガーしました 開発者コミュニティは賑やかで、同社の「代理AI」に向けた新たな重要なステップを象徴しています。 数学、コーディング、その他のパフォーマンスのブレークスルー o3は、複雑な数学、科学、コード作成、グラフィカルロジックタスク向けに設計された、OpenAIのこれまでで最も強力な推論モデルとして位置付けられており、SWE-bench Verified(ソフトウェアエンジニアリングベンチマーク)で69.1%のスコアで、Claude 3.7 Sonnetの62.3%を上回って最先端のパフォーマンスを達成しています。 O4-miniは、コストとスピードを考慮しながら高い推論力を保持し、開発者にとって軽量なファーストチョイスとなっています。 OpenAIのテストデータによると、AIME(American Mathematics Competition)2024年と2025年のo4-miniのパフォーマンスはそれぞれ93.4%と92.7%で、o3のフルバージョンを上回り、最も精度の高い現在のモデルになりました。 Codeforcesコンペティションで2700ポイントを獲得し、世界のトップ200エンジニアにランクインする。 O3 と O4-mini は、O シリーズで強調された推論指向のトレーニング方法を継続し、「応答する前に長く考える」というモデル アーキテクチャとして特別に設計されているため、AI は迅速に反応するだけでなく、複雑で多段階の問題を解決できます。 また、この設計は、OpenAIが「推論時間が長い=パフォーマンスが高い」という技術的な文脈で歩き続け、強化学習プロセスでこの仮説を検証することを表しています。 初めての画像推論:AIは「図、スケッチ、PDFを理解できる」 最も印象的なアップデートは、両方のモデルが初めて画像推論機能を備えていることです。 o3とo4-miniは、手書きのホワイトボード、ぼやけたPDF、スケッチ、統計チャートなどの低品質でも画像を理解して分析し、多段階の推論プロセスを組み込むことができます。 つまり、AIはテキストの指示を読み取って応答するだけでなく、画像の背後にある論理や連想を「考える」ことができ、真のマルチモーダルエージェントシステムへと移行することができるのです。 視覚的理解の向上に加えて、モデルは回転、スケーリング、変形処理などの画像を操作することもでき、画像を推論チェーンの一部にし、クロスモーダル問題に対する新しい解決策を解き放ちます。 マルチツール連携:「チャット」から「タスク解決」へ どちらのモデルも、検索、プログラム実行、DALL· E 指示の受け取りから情報のキャプチャ、視覚的な推論までの統合プロセスを実現するための画像生成と分析。 O3とO4-miniは、従来のツール利用ロジックの受動的実行とは異なり、自律的な意思決定機能を持ち、問題の性質に応じて、検索、プログラム実行、画像生成などのツールを有効にするかどうかを自動的に選択することができ、人間の専門家に近いワークフローを示します。 また、この柔軟なポリシー適用方法により、モデルは入力に基づいて処理順序とコンテンツを動的に調整することができ、これは「代理AI」への移行における重要なマイルストーンとなります。 OpenAIはまた、開発者がAIをローカルターミナルに統合してコードの記述とデバッグを支援するためのオープンソースツールCodex CLIを立ち上げました。 Codex CLIは現在オープンソースであり、100万ドルの開発助成金プログラムが公開されています。 価格と入手可能性: o4-miniには「高CP」という利点があります o3モデルAPIの価格は、100万ドルの入力トークンと40ドルの出力トークンあたり10ドルです。 比較すると、O4-MINIの価格は1.10ドルと4.40ドルと、性能はわずかに劣りますが、圧倒的なコスト優位性があります。 ChatGPT Plus(月額20ドル)、Pro(月額200ドル)、Teamのユーザーは現在利用可能で、企業や教育機関は1週間以内に利用可能になります。 OpenAIは、o3とo4-miniを通じて「推論AI」の進化の方向性を明確に示し、言語能力を向上させるだけでなく、画像理解とツール操作を初めて統合しました。 この2つのモデルは、単なるアップデートポイントではなく、ChatGPTからプロキシAIへの重要な移行でもあります。 o3-pro(今後数週間でProユーザーが利用できるようになります)とGPT-5の今後の発売は、この一連の技術的ブレークスルーを統合することができれば、次世代のAI製品標準を定義する機会を持つことになります。 関連レポート OpenAIがGPT-4oを強化してランキング2位に躍り出よう! サム・アルトマン:人とプログラムを書くことへの理解が深まり、創造性が高まる OpenAIが発表:Open Agents SDKがMCPをサポートし、すべてを直列に接続して別の重要なステップを踏み出す OpenAIが最強のグラフモデルを発表:正確な情報グラフィックス、マルチモーダル入力、リアルで区別が難しい、GPT-4oに内蔵 〈OpenAIがo3とo4-miniをリリース 最強の推論モデル:絵を考えたり、ツールを自動的に選択したり、数学、 この記事は、BlockTempoの「Dynamic Trend - The Most Influential Blockchain News Media」に掲載されたものです。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)