OpenAI представляет O3 и O4-mini: дебютирует самая умная модель ChatGPT, а «логический вывод изображений» — новый прорыв

OpenAI анонсировала две новые модели ChatGPT: o3 и o4-mini, которые, по словам OpenAI, являются не только самыми умными и способными моделями, но и включают в себя беспрецедентные возможности: способность действительно «думать» изображения, не просто смотреть на картинки, но и включать изображения в процесс вывода.

Обе модели доступны пользователям тарифных планов ChatGPT Plus, Pro и Team и будут доступны пользователям ChatGPT Enterprise и Edu в течение недели. В то же время разработчики теперь могут использовать две новые модели через Chat Completions API и Answers API.

O3: Всесторонний игрок, мышление и визуальное понимание полностью улучшены

По мнению OpenAI, модель o3 преуспевает в нескольких областях, особенно устанавливая новые стандарты в таких задачах, как программирование, математические операции, научные рассуждения и визуальное понимание. Эта модель также поддерживает интеграцию нескольких встроенных инструментов, в том числе:

Поиск в Интернете

Арифметические инструменты Python

Анализ и генерация изображений

Функция парсинга файлов

Это означает, что пользователи теперь могут не только задавать вопросы, но и позволять ИИ реально помогать анализировать данные, просматривать изображения и интерпретировать их, и даже автоматически генерировать изображения или код.

O4-MINI: Высокоэффективная машина для логических выводов, подходящая для большого количества запросов

По сравнению с O3, O4-mini фокусируется на оптимизации затрат и скорости. Несмотря на то, что модель небольшая, ее возможности инференса по-прежнему превосходны, особенно подходят для приложений, требующих высокой частоты и высокой пропускной способности.

OpenAI говорит, что если вам нужно задавать сотни вопросов в день, o4-mini определенно лучший выбор для вас. А благодаря отличной производительности и низкой стоимости вычислений пользователи могут пользоваться более высокими квотами на использование.

Новая способность думать об образах: от созерцания картинок к «мышлению картинками»

Одной из самых больших изюминок обеих моделей является возможность впервые «думать образами».

В то время как традиционные модели ИИ могут видеть только изображения, o3 и o4-mini теперь могут включать изображения во весь процесс логического вывода. Это означает, что если вы передадите изображение модели, она не просто скажет вам, что изображено на картинке, но и будет рассматривать это изображение как подсказку для рассуждения, анализировать и интегрировать с текстовыми данными, а также отвечать более подробно.

Этот прорыв является благом для таких областей, как образование, здравоохранение, дизайн и инженерия.

Попросите GPT рассуждать о том, что написать в перевернутой заметке на картинке Вы можете попросить ChatGPT идентифицировать портовое судно на фотографии и вывести соответствующую информацию Новая версия модели доступна онлайн, и пользователи ChatGPT могут сразу же испытать ее

Отныне пользователи ChatGPT Plus, Pro и Team увидят:

O3

О4-мини

o4-мини-высокий

Они заменят старые O1, O3-Mini и O3-Mini-High. Хотя пользователи Pro в настоящее время могут выбрать модель o1-pro, OpenAI заявила, что o3-pro будет запущена в ближайшие несколько недель, когда будет доступна полная поддержка инструментов.

Средства разработчика обновляются синхронно, а API ответов расширяет возможности вывода

В дополнение к пользователям ChatGPT, разработчики теперь могут использовать o3 и o4-mini через API завершения чата и недавно обновленный API ответов.

В API ответов добавлено несколько новых функций, в том числе:

Резюме рассуждений

Поддержка сохраняемых маркеров для процессов вывода (повышенная производительность)

Встроенные инструменты, такие как веб-поиск, поиск файлов и интерпретатор кода, будут поддерживаться в ближайшее время

Это позволяет разработчикам создавать более интеллектуальные и обоснованные приложения.

С появлением o3 и o4-mini компания OpenAI в очередной раз подняла потолок моделей ИИ. Была всесторонне улучшена не только способность к рассуждению, но и способность по-настоящему понимать «смотреть на картинки и думать». Независимо от того, являетесь ли вы разработчиком, бизнес-пользователем или любознательным повседневным пользователем, обе модели предлагают больше опций и возможностей.

Эта статья OpenAI запускает o3 и o4-mini: дебютирует самая умная модель ChatGPT, а «логический вывод изображений» становится новым прорывом впервые появилась в Chain News ABMedia.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить