Oportunidades e desafios da fusão de IA e Web3: uma inovação de pilha completa desde dados até Poder de computação

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornaram-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar a oferta potencial na longa cauda, através de dados, armazenamento e computação; ao mesmo tempo, estabelecer modelos de código aberto e um mercado descentralizado para Agentes de IA.

  3. A IA na indústria Web3 é principalmente utilizada em finanças on-chain (pagamentos em criptomoeda, transações, análise de dados) e para auxiliar no desenvolvimento.

  4. A utilidade do AI+Web3 reflete-se na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a romper barreiras.

AI+Web3: Torre e Praça

Introdução

Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado. Esta onda iniciada pelo Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também causou grandes ondas no campo do Web3.

Com o suporte do conceito de IA, o financiamento no mercado de criptomoedas, que estava a desacelerar, viu um aumento significativo. Apenas no primeiro semestre de 2024, 64 projetos Web3+IA conseguiram financiamento, e o sistema operacional baseado em inteligência artificial Zyber365 alcançou um valor máximo de financiamento de 100 milhões de dólares na sua rodada A.

O mercado secundário está mais próspero, com dados da Coingecko mostrando que, em pouco mais de um ano, o valor total de mercado da área de IA já alcançou 48,5 bilhões de dólares, com um volume de transações em 24 horas próximo de 8,6 bilhões de dólares. Os benefícios trazidos pelos avanços das principais tecnologias de IA são evidentes; após o lançamento do modelo de texto para vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%. O efeito da IA também se espalhou para um dos segmentos que atraem investimentos em criptomoedas, os Memes: o primeiro MemeCoin com o conceito de Agente de IA - GOAT, rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhão de dólares, desencadeando com sucesso a onda dos Memes de IA.

A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin e agora AI Agent e AI DAO, a emoção de FOMO já não acompanha a velocidade da rotação da nova narrativa.

AI+Web3, esta combinação de termos cheia de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado por capital. Parece-nos difícil distinguir sob este manto glamoroso, se é realmente o palco dos especuladores ou se estamos na véspera de uma explosão ao amanhecer?

Para responder a esta questão, uma reflexão crucial para ambas as partes é: ficará melhor com a outra parte? Será que se pode beneficiar dos padrões da outra parte? Neste artigo, tentamos examinar este cenário apoiando-nos nos ombros de gigantes: como o Web3 pode desempenhar um papel em cada etapa da pilha de tecnologia de IA, e o que a IA pode trazer de novo ao Web3?

Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Expressar todo o processo em uma linguagem mais simples: "grande modelo" é como o cérebro humano, na fase inicial, esse cérebro pertence a um bebê que acabou de chegar ao mundo, precisando observar e absorver uma enorme quantidade de informações do ambiente para entender este mundo, essa é a fase de "coleta" de dados. Como os computadores não possuem os múltiplos sentidos humanos, como visão e audição, antes do treinamento, as grandes informações não rotuladas do exterior precisam ser convertidas em um formato de informação que o computador possa entender e usar através de "pré-processamento".

Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através de "treinamento", que pode ser visto como o processo pelo qual um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser especializado ou quando há interação com as pessoas que fornece feedback e correção, entra-se na fase de "ajuste fino" do grande modelo.

As crianças, à medida que crescem e aprendem a falar, podem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Essa fase é semelhante ao "raciocínio" de um grande modelo de IA, onde o modelo é capaz de prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio de suas habilidades linguísticas, o que também é semelhante à aplicação de grandes modelos de IA na fase de raciocínio após a conclusão do treinamento, em várias tarefas específicas, como classificação de imagens e reconhecimento de voz.

E o Agente de IA está mais próximo da próxima forma do grande modelo - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possuindo capacidade de pensamento, mas também sendo capaz de memorizar, planejar e interagir com o mundo usando ferramentas.

Atualmente, em resposta às dificuldades da IA em várias pilhas, o Web3 formou preliminarmente um ecossistema multilayer, interconectado, que abrange todas as fases do processo de modelos de IA.

AI+Web3: Torres e Praças

Uma, camada básica: Airbnb de poder de computação e dados

Poder de cálculo

Atualmente, um dos maiores custos da IA é a potência de cálculo e a energia necessárias para treinar modelos e realizar inferências.

Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100 GPUs produzidas pela NVIDIA (que é uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho) durante 30 dias para completar o treinamento. O preço unitário da versão de 80GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação (GPU + chip de rede) de 400 a 700 milhões de dólares. Ao mesmo tempo, o treinamento mensal consome 1,6 mil milhões de quilowatts-hora, com despesas de energia de quase 20 milhões de dólares por mês.

A descompressão da capacidade computacional de IA é, na verdade, uma das primeiras áreas de interseção entre Web3 e IA - DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, o site de dados DePin Ninja já apresenta mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de capacidade GPU incluem io.net, Aethir, Akash, Render Network, entre outros.

A sua lógica principal é a seguinte: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online de compradores e vendedores semelhante ao Uber ou Airbnb, aumentando a taxa de utilização de recursos de GPU que não estão sendo totalmente aproveitados; ao mesmo tempo, o mecanismo de staking também garante que, se ocorrerem violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos terão suas devidas penalizações.

As suas características residem em:

  • Reunir recursos ociosos de GPU: os fornecedores são principalmente centros de dados independentes de pequeno e médio porte, operadores de criptomoedas com recursos de computação excedentes e hardware de mineração com mecanismo de consenso PoS, como mineradores de FileCoin e ETH. Atualmente, também existem projetos que se dedicam a iniciar dispositivos com barreiras de entrada mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferências de grandes modelos.

  • Enfrentando o mercado de cauda longa de poder de computação de IA:

a. "Do ponto de vista técnico", o mercado de computação descentralizada é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por GPUs em escala de superclusters, enquanto a inferência requer um desempenho de computação GPU relativamente mais baixo, como Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.

b. No que diz respeito à demanda, os pequenos e médios consumidores de poder computacional não treinarão seus próprios grandes modelos de forma isolada, mas apenas optarão por otimizar e ajustar finamente em torno de alguns grandes modelos líderes, e esses cenários são naturalmente adequados para recursos de computação ociosos distribuídos.

  • Propriedade descentralizada: O significado técnico da blockchain é que os proprietários de recursos mantêm sempre o controle sobre os seus recursos, ajustando-se de forma flexível às necessidades e, ao mesmo tempo, obtendo lucros.

Dados

Dados são a base da IA. Sem dados, o cálculo é tão inútil quanto uma folha flutuante, e a relação entre dados e modelos é como diz o provérbio "Garbage in, Garbage out"; a quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo as visões de valor e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados para IA concentram-se nas seguintes quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que a OpenAI treinou o GPT-4 com um número de parâmetros que alcançou o nível de trilhões.

  • Qualidade dos dados: Com a integração da IA em várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, também impuseram novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente reconhecendo a importância de conjuntos de dados de alta qualidade e estão impondo restrições à coleta de conjuntos de dados.

  • Custo elevado de processamento de dados: grande volume de dados e processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são gastos na coleta e processamento de dados básicos.

Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:

  1. Coleta de dados: A disponibilidade de dados do mundo real que podem ser coletados gratuitamente está rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam ano após ano. No entanto, ao mesmo tempo, esses gastos não estão retornando aos verdadeiros contribuintes dos dados, enquanto as plataformas desfrutam inteiramente da criação de valor trazida pelos dados.

Permitir que os usuários que realmente contribuem também participem na criação de valor trazida pelos dados, e obter dados mais privados e valiosos dos usuários de uma maneira de baixo custo através de uma rede distribuída e mecanismos de incentivo, é a visão do Web3.

  • Grass é uma camada de dados e rede descentralizada, onde os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão ao executar nós Grass para capturar dados em tempo real de toda a internet e receber recompensas em tokens;

  • Vana introduziu um conceito único de pool de liquidez de dados (DLP), onde os usuários podem carregar seus dados privados (como histórico de compras, hábitos de navegação, atividades nas redes sociais, etc.) para um DLP específico e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;

  • No PublicAI, os usuários podem usar #AI或#Web3 como etiqueta de classificação em X e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados da IA, devido ao fato de que os dados coletados geralmente são ruidosos e contêm erros, é necessário limpá-los e convertê-los em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, e já deu origem à profissão de rotulador de dados. À medida que as exigências do modelo em relação à qualidade dos dados aumentam, a barreira de entrada para os rotuladores de dados também se eleva, e essa tarefa é naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.
  • Atualmente, a Grass e a OpenLayer estão considerando adicionar a rotulagem de dados a esta etapa crucial.

  • A Synesis apresentou o conceito de "Train2earn", enfatizando a qualidade dos dados, onde os usuários podem obter recompensas ao fornecer dados anotados, comentários ou outras formas de contribuição.

  • O projeto de anotação de dados Sapien gamifica as tarefas de marcação e permite que os usuários façam staking de pontos para ganhar mais pontos.

  1. Privacidade e segurança dos dados: É importante esclarecer que privacidade e segurança dos dados são dois conceitos diferentes. A privacidade dos dados envolve o tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens da tecnologia de privacidade Web3 e os possíveis cenários de aplicação se manifestam em dois aspectos: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: Vários proprietários de dados podem participar juntos do treinamento de IA, sem precisar compartilhar seus dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol;

  • Criptografia homomórfica completa (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network;

  • Tecnologia de prova de conhecimento zero (zk), como o Reclaim Protocol que utiliza a tecnologia zkTLS, gera provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, atualmente este campo ainda está em uma fase inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são:

  • O framework zkML EZKL leva cerca de 80 minutos para gerar uma prova para um modelo 1M-nanoGPT.

  • De acordo com os dados da Modulus Labs, os custos de zkML são mais de 1000 vezes superiores aos de cálculos puros.

  1. Armazenamento de dados: Depois de ter os dados, é necessário um local para armazená-los na cadeia, bem como o LLM gerado com esses dados. Com a disponibilidade de dados (DA) como questão central, antes da atualização Danksharding do Ethereum, sua capacidade de processamento era de 0,08MB. Ao mesmo tempo, o treinamento de modelos de IA e a inferência em tempo real geralmente requerem uma taxa de transferência de dados de 50 a 100GB por segundo. Essa discrepância de magnitude faz com que as soluções existentes na cadeia sejam incapazes de lidar com "aplicações de IA que consomem muitos recursos."
  • 0g.AI é o projeto representativo desta categoria. É uma solução de armazenamento centralizado projetada para atender às altas demandas de desempenho de IA, cuja relação
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Republicar
  • Partilhar
Comentar
0/400
RektCoastervip
· 19h atrás
Deixe de lado os conceitos... primeiro, vamos criar uma aplicação que funcione.
Ver originalResponder0
degenonymousvip
· 19h atrás
fazer as pessoas de parvas idiotas conseguem falar de ideais.
Ver originalResponder0
not_your_keysvip
· 19h atrás
Outra vez a fazer as pessoas de parvas.
Ver originalResponder0
MidsommarWalletvip
· 19h atrás
Aguardo ver a IA a levar o web3 a novos patamares.
Ver originalResponder0
ConfusedWhalevip
· 19h atrás
Eu não entendo, não sei o que estão a dizer.
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)