A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Investigadores Implementam a tecnologia DPN-LE para Editar Traços de Personalidade de IA, Editando Apenas 0,5% dos Neurónios

De acordo com a BlockBeats, a 3 de maio, o investigador de IA Brian Roemmele revelou que a sua Zero-Human Company implementou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão

GateNews3h atrás

O agente de IA Manfred forma empresa, prepara uma carteira de criptomoedas para negociar até ao final de maio

O agente de IA Manfred estabeleceu a sua própria empresa e obteve uma carteira de criptomoedas e credenciais empresariais, incluindo a capacidade de contratar funcionários e efetuar pagamentos. O agente está agendado para começar a negociar criptomoedas até ao final de

GateNews4h atrás

O CEO da Tether propõe a integração da WDK e da QVAC para suportar cartões de agentes

Segundo o Foresight News, o CEO da Tether, Paolo Ardoino, afirmou no X que a entidade emissora da stablecoin poderá ter de avançar a integração entre WDK e QVAC para suportar a funcionalidade de Agent Cards.

GateNews7h atrás

Particle Network lança roteiro de contas universais, disponibiliza o Universal Deposit SDK e lança contas de agentes de IA

De acordo com a ChainCatcher, a Particle Network lançou hoje a próxima fase do plano para Universal Accounts, introduzindo dois novos produtos nos próximos meses: Universal Deposit SDK, permitindo aos programadores adicionar depósitos multi-chain com aproximadamente 10 linhas de código, e Universal Agent Accounts,

GateNews7h atrás

A OpenAI permite que as subscrições do ChatGPT funcionem na plataforma de agentes OpenClaw

De acordo com o CEO da OpenAI, Sam Altman, a 2 de maio, os utilizadores do ChatGPT já podem iniciar sessão na plataforma de agentes OpenClaw com as suas contas do ChatGPT e utilizar diretamente as suas subscrições existentes do ChatGPT na plataforma.

GateNews10h atrás

O agente de IA Manfred cria empresa e prepara-se para fazer trading de criptomoedas até ao final de maio

O agente de IA Manfred criou a sua própria empresa e obteve uma carteira de criptomoedas, juntamente com credenciais, para contratar pessoal, efectuar pagamentos e conduzir negócios. O agente planeia começar a negociar criptomoedas até ao fim de

GateNews10h atrás
Comentar
0/400
Nenhum comentário