Escaneie para baixar o app da Gate
qrCode
Mais opções de download
Não me lembre de novo hoje

Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

robot
Geração do resumo em andamento

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição ‘cons@64’. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

XAI2.72%
GROK-2.69%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)