Desenvolvimento colaborativo de tecnologia Web3 e IA: desbloquear novas oportunidades de recursos de poder de computação e valor de dados

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o fornecimento potencial na cauda longa------através de dados, armazenamento e computação; ao mesmo tempo, construir um modelo de código aberto e um mercado descentralizado para Agentes de IA.

  3. A IA no setor Web3 tem seu principal campo de aplicação nas finanças em cadeia (pagamentos em criptomoeda, negociação, análise de dados) e no suporte ao desenvolvimento.

  4. A utilidade do AI+Web3 reside na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir seus limites.

AI+Web3: Torre e Praça

Introdução

Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e esta onda provocada pela batida das asas de uma borboleta do Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou uma corrente poderosa no Web3 do outro lado.

Com o apoio do conceito de IA, o impulso para o financiamento no mercado de criptomoedas, que está a abrandar, é evidente. As estatísticas da mídia mostram que, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamentos, com o sistema operacional baseado em inteligência artificial Zyber365 a alcançar um montante máximo de financiamento de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero. Dados de um site de estatísticas mostram que, em pouco mais de um ano, o valor total de mercado da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo de 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo de conversão de texto em vídeo Sora de uma certa empresa, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos setores de captação de criptomoedas, os Memes: o primeiro conceito de MemeCoin de Agente de IA ------ GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhão de dólares, desencadeando com sucesso a febre dos Memes de IA.

A pesquisa e os temas sobre AI+Web3 também estão em alta, desde AI+Depin a AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção FOMO já não consegue acompanhar a velocidade das novas narrativas.

AI+Web3, esta combinação de termos repleta de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado promovido pelo capital; parece que é difícil distinguir se, sob esta magnífica vestimenta, é realmente o campo dos especuladores ou a véspera da explosão da manhã?

Para responder a esta questão, uma reflexão crucial para ambas as partes é: será que a outra parte se tornaria melhor? Será que é possível beneficiar-se do modelo da outra parte? Neste artigo, também tentamos examinar este panorama a partir das bases deixadas por aqueles que vieram antes: como é que o Web3 pode desempenhar um papel em todas as etapas da pilha tecnológica de IA, e o que a IA pode trazer de novo ao Web3?

Parte.1 Quais são as oportunidades do Web3 sob o stack de IA?

Antes de abordar este tópico, precisamos entender a pilha técnica dos grandes modelos de IA:

Expressar todo o processo em uma linguagem mais acessível: "O grande modelo" é como o cérebro humano. Nas fases iniciais, esse cérebro pertence a um bebê que acabou de nascer e precisa observar e absorver uma quantidade massiva de informações do mundo ao seu redor para entender este mundo. Esta é a fase de "coleta" de dados; como os computadores não possuem os sentidos humanos, como visão e audição, antes do treinamento, a grande quantidade de informações não rotuladas do ambiente precisa ser convertida, através de "pré-processamento", em um formato de informação que o computador consiga entender e usar.

Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através do "treinamento", o que pode ser visto como o processo pelo qual um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística do bebê que é ajustada continuamente durante o processo de aprendizagem. Quando o conteúdo aprendido começa a ser dividido em áreas específicas, ou quando a comunicação com outras pessoas fornece feedback e correções, entra-se na fase de "ajuste fino" do grande modelo.

As crianças, à medida que crescem e aprendem a falar, conseguem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo é capaz de prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem diversos problemas através da habilidade linguística, o que também se assemelha à aplicação dos grandes modelos de IA na fase de raciocínio em diversas tarefas específicas, como classificação de imagens e reconhecimento de voz, após terem sido treinados e colocados em uso.

E o AI Agent está mais próximo da próxima forma do grande modelo------capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de raciocínio, mas também pode lembrar, planejar e interagir com o mundo usando ferramentas.

Atualmente, em resposta às dificuldades da IA em várias camadas, o Web3 está a formar, de forma preliminar, um ecossistema multilayer interconectado que abrange todas as fases do processo de modelos de IA.

AI+Web3: Torres e Praças

Uma, camada básica: Airbnb de poder computacional e dados

Poder de cálculo

Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.

Um exemplo é que um determinado modelo de uma empresa precisa de 16.000 GPUs de um determinado modelo produzidas por uma empresa (que é uma unidade de processamento gráfico de ponta projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). Leva 30 dias para completar o treinamento. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento de 400 a 700 milhões de dólares em hardware de computação (GPU + chip de rede), ao mesmo tempo que o treinamento mensal consome 1,6 bilhões de quilowatt-hora, com despesas de energia mensais perto de 20 milhões de dólares.

A descompressão da capacidade computacional da IA é, de fato, um dos primeiros campos onde o Web3 se cruza com a IA ------ DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, um site de dados já listou mais de 1400 projetos, dos quais projetos representativos de compartilhamento de capacidade de GPU incluem io.net, Aethir, Akash, Render Network, entre outros.

A sua lógica principal reside em: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de autorização, através de um mercado online de compradores e vendedores semelhante ao Uber ou Airbnb, aumentando a taxa de utilização de recursos de GPU que não estão a ser totalmente aproveitados, e os utilizadores finais também obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se houver violação dos mecanismos de controle de qualidade ou interrupção da rede, os provedores de recursos tenham as suas respectivas penalizações.

As suas características são:

  • Reunir recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte, como mineradoras de criptomoedas, que possuem recursos de computação excedentes, e o hardware de mineração com mecanismo de consenso PoS, como mineradores de FileCoin e ETH. Atualmente, também há projetos dedicados a iniciar um nível de entrada mais baixo em dispositivos, como a exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferência de grandes modelos.

  • Enfrentando o mercado de longo prazo da capacidade de computação de IA:

a. "Em termos técnicos, o mercado de poder de computação descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por clusters de GPU de grande escala, enquanto a inferência requer um desempenho de computação de GPU relativamente baixo, como Aethir que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA."

b. No que diz respeito à demanda, as pequenas e médias empresas de computação não treinarão seus próprios grandes modelos de forma isolada, mas apenas escolherão otimizar e ajustar finamente em torno de alguns grandes modelos principais. Esses cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.

  • Propriedade descentralizada: O significado técnico da blockchain reside no fato de que os proprietários de recursos sempre mantêm o controle sobre os seus recursos, ajustando-se de forma flexível conforme a demanda, enquanto obtêm lucros.

Dados

Os dados são a base da IA. Sem dados, o cálculo é tão inútil quanto uma erva daninha flutuante, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. No que diz respeito ao treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo a visão de valores e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados da IA concentram-se principalmente em quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que uma certa empresa alcançou um número de parâmetros na ordem dos trilhões ao treinar um determinado modelo.

  • Qualidade dos dados: Com a combinação da IA com vários setores, a atualidade dos dados, a diversidade dos dados, a especialização de dados por setor e a incorporação de novas fontes de dados, como a emoção nas redes sociais, também impõem novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente a reconhecer a importância de conjuntos de dados de qualidade e estão a impor restrições à coleta de conjuntos de dados.

  • Custo elevado de processamento de dados: grande volume de dados, processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são destinados à coleta e processamento de dados básicos.

Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:

  1. Coleta de Dados: A disponibilidade de dados do mundo real que podem ser coletados gratuitamente está rapidamente se esgotando, e os gastos das empresas de IA com dados estão aumentando a cada ano. No entanto, ao mesmo tempo, esses gastos não estão retornando aos verdadeiros contribuidores dos dados, e a plataforma desfruta inteiramente da criação de valor trazida pelos dados, como uma plataforma que gerou uma receita total de 203 milhões de dólares através de um acordo de licença de dados com uma empresa de IA.

Permitir que os usuários que realmente contribuem também participem na criação de valor trazido pelos dados, bem como obter dados mais privados e valiosos dos usuários de uma forma de baixo custo através de uma rede distribuída e mecanismos de incentivo, é a visão do Web3.

  • O Grass é uma camada de dados e rede descentralizada, onde os usuários podem executar nós do Grass, contribuindo com largura de banda ociosa e tráfego de retransmissão para capturar dados em tempo real de toda a Internet e receber recompensas em tokens;

  • Vana introduziu um conceito único de pool de liquidez de dados (DLP), onde os usuários podem fazer upload de seus dados pessoais (como registros de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;

  • No PublicAI, os usuários podem usar #AI 或#Web3 como etiqueta de classificação e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados da IA, devido ao fato de que os dados coletados costumam ser ruidosos e conter erros, eles precisam ser limpos e convertidos para um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é um dos poucos momentos manuais na indústria de IA, tendo gerado a profissão de rotulador de dados. À medida que a exigência de qualidade dos dados pelos modelos aumenta, o nível de entrada para rotuladores de dados também se eleva, e esta tarefa se adapta naturalmente ao mecanismo de incentivo descentralizado do Web3.
  • Atualmente, a Grass e a OpenLayer estão considerando adicionar a rotulagem de dados a esta etapa crucial.

  • A Synesis apresentou o conceito de "Train2earn", enfatizando a qualidade dos dados, onde os usuários podem ganhar recompensas ao fornecer dados rotulados, comentários ou outras formas de input.

  • O projeto de anotação de dados Sapien transforma as tarefas de marcação em um jogo, permitindo que os usuários façam staking de pontos para ganhar mais pontos.

  1. Privacidade e segurança de dados: É importante esclarecer que privacidade e segurança de dados são dois conceitos diferentes. A privacidade dos dados envolve o tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens da tecnologia de privacidade Web3 e os potenciais cenários de aplicação são evidentes em dois aspectos: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: múltiplos proprietários de dados podem participar juntos do treinamento de IA sem precisar compartilhar seus dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol;

  • Criptografia homomórfica completa (FHE), como BasedAI, Fhenix.io ou Inco Network;

  • Tecnologia de conhecimento zero (zk), como o Protocolo Reclaim que utiliza a tecnologia zkTLS, gera provas de conhecimento zero do tráfego HTTPS, permitindo que os usuários importem de forma segura atividades, reputação e dados de identidade de sites externos, sem expor informações sensíveis.

No entanto, o setor ainda está numa fase inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que o custo computacional é muito alto, alguns exemplos são:

  • O framework zkML EZKL leva cerca de 80 minutos
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 3
  • Compartilhar
Comentário
0/400
shadowy_supercodervip
· 14h atrás
A tecnologia deve capacitar de forma igualitária
Ver originalResponder0
MEVHuntervip
· 14h atrás
A previsão ousada vai ser um sucesso.
Ver originalResponder0
LightningAllInHerovip
· 14h atrás
A combinação de duas espadas deve resultar em uma grande obra.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)