Lançamento do modelo GPT 5.5: foco em programação de pesquisa! Veja uma comparação das diferenças com Claude Opus 4.7

OpenAI lança repentinamente o modelo GPT-5.5, com foco na capacidade mais poderosa e intuitiva de programação e operação entre ferramentas, este artigo organiza uma comparação de desempenho entre o GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro e outros modelos principais.

OpenAI apresenta o GPT-5.5! Veja suas características de uma só vez

A gigante de IA OpenAI lançou de surpresa, na madrugada de 24 de abril, horário de Taiwan, o novo modelo GPT-5.5, afirmando ser o sistema de IA mais inteligente e intuitivo até hoje.

OpenAI afirma que o modelo GPT-5.5 possui uma poderosa capacidade de programação de agentes de IA, especializado em lidar com código, além de bugs, pesquisa online e operação entre ferramentas.

Em comparação com a versão anterior GPT-5.4, o GPT-5.5 mantém o mesmo nível de latência de processamento, podendo completar tarefas com menos marcações.

O presidente da OpenAI, Greg Brockman, destacou que o novo modelo é um avanço importante rumo ao cálculo intuitivo, além de ser uma etapa crucial na criação de uma aplicação super que combina ChatGPT, Codex e navegador de IA.

Planos de custos e permissões de uso do modelo GPT-5.5

A partir de hoje, usuários do ChatGPT Plus, Pro, Business e Enterprise, bem como usuários do Codex, podem usar o GPT-5.5, enquanto a versão avançada GPT-5.5 Pro é disponibilizada para usuários Pro, Business e Enterprise.

No que diz respeito à precificação da API, o custo por token de entrada do GPT-5.5 é de 5 dólares por 1 milhão de tokens, e de saída, 30 dólares por 1 milhão de tokens. Para o GPT-5.5 Pro, o custo de entrada é de 30 dólares por 1 milhão de tokens, e de saída, 180 dólares por 1 milhão de tokens.

Curiosamente, o lançamento do GPT-5.5 coincide com uma disputa judicial entre Elon Musk e o CEO da OpenAI, Sam Altman, atraindo atenção pública.

Desempenho nos testes de benchmark do GPT-5.5: análise de vantagens e desvantagens

Nos testes de desempenho (Benchmark), o GPT-5.5 demonstra vantagens técnicas, embora ainda enfrente desafios em algumas áreas.

De acordo com dados oficiais da OpenAI, o GPT-5.5 atingiu uma precisão de 82,7% no teste Terminal-Bench 2.0, que avalia comandos complexos; no teste GDPval, que avalia tarefas de conhecimento, obteve uma pontuação de 84,9%, mostrando alta utilidade para tarefas diárias de escritório.

Nos testes públicos SWE-Bench Pro, que avaliam resolução de problemas reais no GitHub, o GPT-5.5 obteve 58,6%, ligeiramente atrás do Claude Opus 4.7, lançado pela Anthropic, com 64,3%.

A OpenAI observa que os testes podem ser influenciados pelo efeito de memória do modelo, mas ainda assim refletem que o GPT-5.5 apresenta desvantagens na correção de bugs específicos de desenvolvimento.

Fonte da imagem: Desempenho nos testes de benchmark do GPT-5.5 da OpenAI: análise de vantagens e desvantagens

Na área de segurança cibernética, a Anthropic lançou recentemente o modelo Claude Mythos Preview, focado em forte proteção de segurança, enquanto o GPT-5.5, embora tenha melhorado suas defesas, atualmente é disponibilizado apenas por canais específicos para uso de empresas certificadas na infraestrutura básica.

Comparação entre modelos principais: GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro

Comparação de dados entre GPT-5.5 e Claude Opus 4.7

Com base em testes oficiais da OpenAI e ITmedia, na avaliação OSWorld-Verified, que simula ambientes reais de operação de computadores, o GPT-5.5 obteve uma pontuação de 78,7%, ligeiramente superior ao Claude Opus 4.7, que marcou 78,0%.

No teste BrowseComp, que avalia lógica avançada e colaboração com ferramentas, o GPT-5.5 atingiu 84,4%, superando o Claude Opus 4.7, com 79,3%; nos testes FrontierMath Tier 1 a 3, que avaliam habilidades matemáticas avançadas, o GPT-5.5 obteve 51,7%, superando o Claude Opus 4.7, com 43,8%.

Comparação de dados entre GPT-5.5 e Gemini 3.1 Pro

Em comparação com o Gemini 3.1 Pro, o GPT-5.5 mantém liderança na maioria dos testes profissionais. No teste GDPval de tarefas de conhecimento, o GPT-5.5 atingiu 84,9%, enquanto o Gemini 3.1 Pro marcou 67,3%.

No teste Toolathlon, que avalia o uso de ferramentas externas, o GPT-5.5 obteve 55,6%, superior ao Gemini 3.1 Pro, com 48,8%.

Fonte da imagem: Comparação de dados entre GPT-5.5 e Gemini 3.1 Pro

No teste multimodal MMMU Pro, sem auxílio de ferramentas, o GPT-5.5 obteve 81,2%, enquanto o Gemini 3.1 Pro marcou 80,5%, desempenho bastante próximo.

GPT-5.5 está preparando o caminho para IPO?

O chefe de pesquisa da OpenAI, Mark Chen, afirmou que, o GPT-5.5 traz melhorias substanciais nos processos de pesquisa científica e tecnológica, podendo futuramente ajudar cientistas a acelerar descobertas, como na área de desenvolvimento de medicamentos.

A mídia estrangeira, The Verge, apontou que o lançamento deste novo modelo reflete uma disputa crescente entre OpenAI e Anthropic pelo domínio do mercado de ferramentas de IA corporativas, além de preparar o terreno para uma possível oferta pública inicial (IPO) ainda neste ano, com ambos os lados em uma competição cada vez mais acirrada.

Leitura adicional:
Como usar o ChatGPT Images 2.0? Teste com cardápio de ramen, capa de revista, e efeitos de divulgação científica em múltiplos idiomas

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar