A ByteDance apresentou um "cérebro" de IA para robôs

ByteDance apresentou o «cérebro» de IA para robôs

A empresa ByteDance, que controla o TikTok, apresentou um sistema que atua como o "cérebro" para robôs. Ele permite realizar tarefas domésticas como pendurar roupas ou limpar a mesa.

GR-3 é um grande modelo de linguagem do tipo "visão-linguagem-ação", que permite que os robôs sigam comandos em linguagem natural e realizem tarefas universais com objetos desconhecidos. Eles podem operar em novas condições ou com conceitos abstratos relacionados a tamanhos e relações espaciais.

No vídeo publicado no site, é demonstrado como o robô de laboratório de duas mãos ByteMini pode inserir um cabide na camisa e colocá-lo no suporte.

🚀🚀🚀 Já se perguntou o que é necessário para os robôs lidarem com tarefas domésticas do mundo real? execução de longo prazo, destreza com objetos deformáveis e generalização de objetos invisíveis — conheça o GR-3, o novo modelo Vision-Language-Action (VLA) da ByteDance Seed!

GR-3 é um generalizável… pic.twitter.com/zECRjaXC0J

— Xiao Ma (@yusufma555) 22 de julho de 2025

Num relatório técnico separado, a equipe informou que o robô lida com roupas de mangas curtas, embora "todos os itens nos dados de treinamento fossem de mangas longas."

Graças ao GR-3, o robô pode executar comandos para escolher um item específico entre vários e colocá-lo em um local designado.

O sistema é capaz de reconhecer um objeto não apenas pelo nome, mas também pelo tamanho (, por exemplo, "prato grande" ) ou por um atributo espacial (, por exemplo, "à esquerda" ). Ele pode executar completamente a tarefa "limpar a mesa de jantar" com um único comando.

Para treinar o modelo, a ByteDance utilizou uma abordagem multimodal que inclui:

  • aprendizagem conjunta em grandes conjuntos de dados no formato "imagem-texto";
  • treinamento adicional com informações sobre as trajetórias das ações humanas, coletadas com dispositivos de VR;
  • configuração por imitação com dados sobre os movimentos do android.

"Esperamos que o GR-3 seja um passo em direção à criação de robôs universais capazes de ajudar as pessoas no dia a dia", disse a equipe.

Recordamos que, em janeiro, a startup Perplexity AI anunciou a sua intenção de adquirir o TikTok americano. A empresa enviou à ByteDance uma proposta para unir a Perplexity, o TikTok U.S. e novos parceiros de capital numa única estrutura jurídica.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)