A fusão da IA com o Web3: abrindo uma nova era de dados, Poder de computação e inovação.

2025-08-01 08:17:33

AI+Web3: Torres e Praças

TL;DR

Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se em: o uso de incentivos distribuídos para coordenar o fornecimento potencial na cauda longa ------ entre dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.
A IA no setor Web3 é principalmente utilizada em finanças on-chain (pagamentos em criptomoedas, negociação, análise de dados) e para auxiliar no desenvolvimento.
A utilidade do AI+Web3 está na complementaridade entre ambos: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir suas fronteiras.

Introdução

Nos últimos dois anos, o desenvolvimento da IA acelerou como se tivesse sido pressionado um botão de aceleração. As asas da borboleta agitadas pelo Chatgpt não apenas abriram um novo mundo de inteligência artificial generativa, mas também geraram uma onda no Web3 do outro lado.

Com o suporte do conceito de IA, o financiamento no mercado de criptomoedas, que está a desacelerar, teve um impulso significativo. A mídia estatística revelou que, apenas no primeiro semestre de 2024, 64 projetos Web3+IA concluíram financiamentos, e o sistema operacional baseado em inteligência artificial Zyber365 alcançou um montante máximo de financiamento de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero, os dados de sites de agregação de criptomoedas mostram que, em pouco mais de um ano, o valor total de mercado da área de IA atingiu 48,5 bilhões de dólares, com um volume de negociação de 8,6 bilhões de dólares em 24 horas; os benefícios evidentes dos avanços nas principais tecnologias de IA resultaram em um aumento médio de 151% no preço do setor de IA após o lançamento do modelo Sora de conversão de texto em vídeo de uma determinada empresa; o efeito da IA também se espalhou para um dos setores de captação de criptomoedas, o Meme: o primeiro conceito de Agent de IA, o MemeCoin ------ GOAT, rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhões de dólares, gerando um grande entusiasmo pelos Memes de IA.

A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin e agora AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da rotação das novas narrativas.

AI+Web3, esta combinação de termos repleta de dinheiro fácil, oportunidades e fantasias de futuro, inevitavelmente é vista como um casamento arranjado pelas forças do capital. Parece-nos difícil distinguir, sob este esplêndido manto, se é realmente o palco dos especuladores ou a véspera da explosão do amanhecer.

Para responder a esta questão, uma reflexão crucial para ambas as partes é: a outra parte ficará melhor com isso? É possível beneficiar-se do modelo da outra parte? Neste artigo, também tentamos examinar este padrão sobre os ombros de gigantes: como o Web3 pode desempenhar um papel em cada camada da pilha tecnológica de IA, e o que a IA pode trazer de novo ao Web3?

Parte 1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Expressar todo o processo em uma linguagem mais acessível: "O grande modelo" é como o cérebro humano; nas fases iniciais, esse cérebro pertence a um bebê que acabou de chegar ao mundo e precisa observar e absorver uma enorme quantidade de informações do ambiente para entender este mundo, essa é a fase de "coleta" de dados; como os computadores não possuem os sentidos humanos como a visão e a audição, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser convertidas, através de "pré-processamento", em um formato de informação que o computador possa entender e utilizar.

Após a entrada de dados, a IA constrói um modelo com capacidade de compreensão e previsão por meio de "treinamento", o que pode ser visto como o processo em que um bebê gradualmente entende e aprende sobre o mundo externo. Os parâmetros do modelo são como a capacidade linguística que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser dividido em disciplinas ou quando a comunicação com as pessoas gera feedback e correções, entra-se na fase de "ajuste fino" do grande modelo.

Quando as crianças crescem e aprendem a falar, conseguem entender o significado e expressar os seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" dos grandes modelos de IA, que conseguem prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem diversos problemas através da capacidade linguística, o que também é semelhante ao que os grandes modelos de IA fazem na fase de raciocínio, após serem treinados e colocados em uso para diversas tarefas específicas, como classificação de imagens, reconhecimento de voz, entre outros.

E o AI Agent está mais próximo da próxima forma dos grandes modelos ------ capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de raciocínio, mas também pode memorizar, planejar e interagir com o mundo usando ferramentas.

Atualmente, em resposta aos pontos problemáticos da IA em várias pilhas, o Web3 está, por enquanto, a formar um ecossistema interconectado e multilayer, abrangendo todas as etapas do processo de modelos de IA.

Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados

poder de cálculo

Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.

Um exemplo é que a LLAMA3 de uma determinada empresa precisa de 16.000 H100GPU produzidos por uma empresa (que é uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). Leva 30 dias para concluir o treinamento. O preço unitário da versão de 80GB varia entre 30.000 e 40.000 dólares, o que exige um investimento em hardware de computação (GPU + chip de rede) de 400 a 700 milhões de dólares, ao mesmo tempo que o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com despesas de energia de quase 20 milhões de dólares por mês.

A descompressão do poder computacional de IA é precisamente a área onde o Web3 se cruzou pela primeira vez com a IA ------ DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, um site de dados já listou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de poder computacional de GPU incluem vários projetos.

A lógica principal é a seguinte: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem permissão, aumentando a utilização de recursos de GPU subutilizados através de um mercado online semelhante ao de compradores e vendedores de certas empresas. Os usuários finais, portanto, obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se houver violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos enfrentem as devidas penalizações.

As suas características são:

Agregar recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte e de criptomineração com recursos de computação excedentes, com mecanismo de consenso para hardware de mineração PoS, como algumas máquinas de mineração de projetos específicos. Atualmente, também existem projetos dedicados a iniciar dispositivos com barreiras de entrada mais baixas, como alguns projetos que utilizam determinados dispositivos para estabelecer redes de computação para inferência de grandes modelos.
Enfrentando o mercado de longo prazo da capacidade computacional de IA:

a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para o passo de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por grandes clusters de GPU, enquanto a inferência requer um desempenho computacional de GPU relativamente baixo, como em alguns projetos que se concentram em trabalhos de renderização de baixa latência e aplicações de inferência de IA.

b. "Do lado da demanda", as pequenas e médias empresas que necessitam de poder computacional não treinarão seus próprios grandes modelos, mas apenas escolherão otimizar e ajustar finamente em torno de alguns poucos grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos de computação ociosos distribuídos.

Propriedade descentralizada: O significado técnico da blockchain é que os proprietários de recursos mantêm sempre o controle sobre os seus recursos, ajustando-se de forma flexível à demanda, ao mesmo tempo que obtêm lucros.

Dados

Os dados são a base da IA. Sem dados, os cálculos são como folhas flutuantes, sem utilidade, e a relação entre dados e modelos é como diz o provérbio "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo a visão de mundo e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados para IA concentram-se principalmente em quatro aspectos:

Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que uma empresa treinou um modelo com um número de parâmetros que atinge o nível de trilhões.
Qualidade dos dados: Com a integração da IA em vários setores, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, também impuseram novas exigências à sua qualidade.
Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente percebendo a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custo elevado de processamento de dados: grande volume de dados, processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são usados na coleta e tratamento de dados básicos.

Atualmente, as soluções web3 estão refletidas em quatro áreas principais:

Coleta de dados: A disponibilidade de dados do mundo real coletados gratuitamente está rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam a cada ano. No entanto, esses gastos não estão retornando para os verdadeiros contribuidores dos dados, com as plataformas desfrutando integralmente da criação de valor proporcionada pelos dados, como uma plataforma que gerou uma receita total de 203 milhões de dólares através de um acordo de licenciamento de dados com uma empresa de IA.

Permitir que os usuários que realmente contribuem também participem na criação de valor gerado pelos dados, e através de uma rede distribuída e mecanismos de incentivo, obter dados mais privados e valiosos de forma econômica, é a visão do Web3.

Um projeto é uma camada de dados e rede descentralizada, onde os usuários podem executar nós, contribuir com largura de banda ociosa e tráfego de retransmissão para capturar dados em tempo real de toda a internet e receber recompensas em tokens;
Um determinado projeto introduziu um conceito único de pool de liquidez de dados (DLP), onde os usuários podem fazer o upload de seus dados privados (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher de forma flexível se desejam autorizar o uso desses dados por terceiros específicos;
Em determinado projeto, os usuários podem utilizar algumas etiquetas numa determinada plataforma e @uma conta para realizar a coleta de dados.

Pré-processamento de dados: No processo de tratamento de dados da IA, como os dados coletados costumam ser ruidosos e conter erros, eles devem ser limpos e convertidos em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, tendo surgido a profissão de rotulador de dados. À medida que a exigência de qualidade dos dados pelos modelos aumenta, o nível de entrada para os rotuladores de dados também se eleva, e essa tarefa é naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.

Atualmente, alguns projetos estão considerando a adição da rotulagem de dados a esta fase crítica.
Um projeto apresentou o conceito de "Train2earn", enfatizando a qualidade dos dados, onde os usuários podem receber recompensas ao fornecer dados rotulados, anotações ou outras formas de contribuição.
O projeto de anotação de dados gamifica as tarefas de marcação e permite que os usuários apostem pontos para ganhar mais pontos.

Privacidade e segurança dos dados: é necessário esclarecer que privacidade e segurança dos dados são dois conceitos diferentes. A privacidade dos dados diz respeito ao tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens das tecnologias de privacidade do Web3 e os potenciais cenários de aplicação se manifestam em duas áreas: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: vários proprietários de dados podem participar conjuntamente no treinamento de IA, sem a necessidade de compartilhar seus dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

Ambiente de Execução Confiável ( TEE ), como em algum projeto;
Criptografia homomórfica completa (FHE), como alguns projetos;
A tecnologia de conhecimento zero (zk), como um projeto que utiliza a tecnologia zkTLS, gera provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, este campo ainda está em estágio inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito elevados, alguns exemplos são:

Um determinado framework leva cerca de 80 minutos para gerar uma prova de um modelo 1M-nanoGPT.
De acordo com os dados de uma determinada empresa, os custos do zkML são mais de 1000 vezes superiores aos da computação pura.

4, Armazenamento de dados: Depois de ter os dados, também é necessário um lugar

AGENT8.45%

MEME0.21%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

13 gostos