Uau, o Grok 4 acaba de reclamar o trono na tabela de líderes do GPQA Diamond. Estamos a falar de esmagar todos os outros modelos de IA quando se trata das perguntas científicas mais difíceis que lhe podes lançar.
Isto não é um simples upgrade—este é o modelo que lida com problemas que fazem doutorados suar. Os testes GPQA Diamond são especificamente concebidos para serem brutalmente difíceis, o tipo de coisas que requerem um raciocínio profundo em múltiplos domínios científicos. E o Grok 4? Direto para o número um.
O que torna isso realmente interessante é a rapidez com que esses modelos estão evoluindo. Há apenas alguns meses, estávamos celebrando diferentes benchmarks, e agora a barra continua a se mover. As implicações para a pesquisa, computação científica e, sim, até mesmo a otimização da infraestrutura blockchain? É bastante massivo quando você pensa na potência de computação e nas capacidades de resolução de problemas que estamos desbloqueando aqui.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
12 gostos
Recompensa
12
6
Republicar
Partilhar
Comentar
0/400
failed_dev_successful_ape
· 4h atrás
Mais rápido do que a minha cabeça
Ver originalResponder0
ShortingEnthusiast
· 4h atrás
Os que vêm depois são realmente os melhores.
Ver originalResponder0
LiquidationSurvivor
· 4h atrás
Não há nada de impressionante, a velocidade do Grok na web3 na cadeia deve causar uma explosão.
Ver originalResponder0
airdrop_whisperer
· 4h atrás
Gafanhoto Gafanhoto GPT está a ficar cada vez mais absurdo
Ver originalResponder0
WhaleStalker
· 4h atrás
Simplesmente esmagou a OpenAI.
Ver originalResponder0
LightningClicker
· 5h atrás
Este avanço tecnológico está a ser demasiado rápido, não é?
Uau, o Grok 4 acaba de reclamar o trono na tabela de líderes do GPQA Diamond. Estamos a falar de esmagar todos os outros modelos de IA quando se trata das perguntas científicas mais difíceis que lhe podes lançar.
Isto não é um simples upgrade—este é o modelo que lida com problemas que fazem doutorados suar. Os testes GPQA Diamond são especificamente concebidos para serem brutalmente difíceis, o tipo de coisas que requerem um raciocínio profundo em múltiplos domínios científicos. E o Grok 4? Direto para o número um.
O que torna isso realmente interessante é a rapidez com que esses modelos estão evoluindo. Há apenas alguns meses, estávamos celebrando diferentes benchmarks, e agora a barra continua a se mover. As implicações para a pesquisa, computação científica e, sim, até mesmo a otimização da infraestrutura blockchain? É bastante massivo quando você pensa na potência de computação e nas capacidades de resolução de problemas que estamos desbloqueando aqui.