Projetos Web3 com conceito de IA tornaram-se alvos de captação de recursos nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o suprimento potencial na cauda longa ( através de dados, armazenamento e computação ); ao mesmo tempo, estabelecer modelos de código aberto e um mercado descentralizado para Agentes de IA.
A IA no setor Web3 é principalmente utilizada para finanças em cadeia( pagamentos em criptomoeda, transações, análise de dados) e assistência no desenvolvimento.
A utilidade do AI+Web3 reside na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir seu alcance.
Introdução
Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e este efeito borboleta provocado pelo Chatgpt não só abriu um novo mundo de inteligência artificial generativa, como também desencadeou uma onda no domínio do Web3.
Com o impulso do conceito de IA, o financiamento no mercado de criptomoedas, que estava a desacelerar, apresenta uma recuperação significativa. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA completaram financiamento, com o sistema operacional baseado em inteligência artificial Zyber365 alcançando o montante máximo de financiamento de 100 milhões de dólares na rodada A.
O mercado secundário está mais próspero, com dados de sites de agregação de criptomoedas mostrando que, em pouco mais de um ano, o valor total de mercado da área de IA atingiu 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo a 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo Sora de texto para vídeo da OpenAI, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos segmentos de captação de criptomoeda, Meme: a primeira MemeCoin com o conceito de Agente de IA - GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhões de dólares, gerando um grande interesse pelo Meme de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+DePIN até AI Memecoin e agora AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da rotação das novas narrativas.
AI+Web3, esta combinação de termos repleta de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado por capitalistas, parece que é muito difícil distinguir, sob este manto deslumbrante, se é o terreno dos especuladores ou a véspera de uma explosão ao amanhecer?
Para responder a esta questão, uma reflexão fundamental para ambas as partes é: ficará melhor com o outro? Será que se pode beneficiar dos modelos do outro? Neste artigo, também tentamos, com base no trabalho de outros, examinar este panorama: como é que o Web3 pode desempenhar um papel em cada um dos elos da pilha de tecnologia de IA, e o que a IA pode trazer de novo ao Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tópico, precisamos entender a pilha de tecnologia dos grandes modelos de IA:
Usando uma linguagem mais simples para descrever todo o processo: o "grande modelo" é como o cérebro humano. Na fase inicial, esse cérebro pertence a um bebê que acabou de chegar ao mundo, precisando observar e absorver uma quantidade massiva de informações do ambiente para entender este mundo, que é a fase de "coleta" de dados; como os computadores não possuem os múltiplos sentidos humanos, como a visão e a audição, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e usar.
Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através do "treinamento", que pode ser visto como o processo gradual em que um bebê compreende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística do bebê, que é ajustada continuamente durante o processo de aprendizagem. Quando o conteúdo de aprendizagem começa a ser dividido em disciplinas ou quando o feedback é obtido através da comunicação com outras pessoas e as correções são feitas, entra-se na fase de "ajuste fino" do grande modelo.
As crianças, ao crescerem e aprenderem a falar, conseguem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" de um modelo de IA, que pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas através de suas habilidades linguísticas, o que também é semelhante à aplicação de um modelo de IA em tarefas específicas durante a fase de raciocínio, após ter sido treinado e colocado em uso, como classificação de imagens, reconhecimento de voz, entre outros.
E o Agente de IA está mais próximo da próxima forma dos grandes modelos - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de pensamento, mas também consegue lembrar, planejar e interagir com o mundo utilizando ferramentas.
Atualmente, em resposta às dificuldades da IA em várias camadas, o Web3 formou atualmente um ecossistema multilayer interconectado, abrangendo todas as fases do processo de modelos de IA.
Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados
Poder de cálculo
Atualmente, um dos maiores custos da IA é a potência de cálculo e a energia necessárias para treinar modelos e realizar inferências.
Um exemplo é que um grande modelo de linguagem de uma gigante da tecnologia precisa de 16.000 GPUs de alta gama produzidas por um determinado fabricante de GPU, levando 30 dias para concluir o treinamento. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação entre 400 e 700 milhões de dólares (GPU+chip de rede ), ao mesmo tempo que o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com gastos com energia próximos a 20 milhões de dólares por mês.
A descompressão do poder de computação de IA é, de facto, uma das primeiras áreas de intersecção entre o Web3 e a IA - DePIN( rede de infraestrutura física descentralizada) atualmente, sites de dados relevantes já listaram mais de 1400 projetos, dos quais os projetos representativos de compartilhamento de poder de computação de GPU incluem várias plataformas conhecidas.
A sua lógica principal reside em: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online de compradores e vendedores semelhante ao Uber ou Airbnb, aumentando a utilização de recursos de GPU que não estão sendo plenamente aproveitados, e os usuários finais, assim, obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, caso ocorra uma violação do mecanismo de controle de qualidade ou uma interrupção da rede, os provedores de recursos sofram as penalizações correspondentes.
As suas características são:
Agregar recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte, mineradoras de criptomoedas, etc., com recursos de computação excedentes, e o mecanismo de consenso é hardware de mineração PoS, como máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar equipamentos com barreiras de entrada mais baixas, como a construção de uma rede de computação para executar inferências de grandes modelos usando dispositivos locais como MacBook, iPhone e iPad.
Enfrentando o mercado de longa cauda de poder de computação de IA:
a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para o passo de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por GPUs em escala de superclusters, enquanto a inferência requer um desempenho de computação em GPU relativamente mais baixo, como algumas plataformas que se concentram em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. "Em relação à demanda" os pequenos e médios demandantes de poder computacional não treinarão seus próprios grandes modelos separadamente, mas apenas escolherão otimizar e ajustar em torno de alguns grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.
Propriedade descentralizada: O significado técnico da blockchain reside no fato de que os proprietários de recursos mantêm sempre o controle sobre os mesmos, ajustando-se de forma flexível às necessidades, ao mesmo tempo que obtêm lucro.
Dados
Os dados são a base da IA. Sem dados, os cálculos são como folhas flutuantes, completamente inúteis, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo as visões de mundo e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados na IA concentram-se principalmente em quatro áreas:
Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que um conhecido empresa de IA treinou um modelo de linguagem com um número de parâmetros que chega à casa dos trilhões.
Qualidade dos dados: À medida que a IA se combina com diversos setores, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, impõem novas exigências à sua qualidade.
Questões de privacidade e conformidade: atualmente, vários países e empresas estão começando a reconhecer a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custos de processamento de dados elevados: grande volume de dados, processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados na coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Coleta de dados: A oferta de dados do mundo real coletados gratuitamente está a esgotar-se rapidamente, e os gastos das empresas de IA com dados aumentam ano após ano. Mas, ao mesmo tempo, esses gastos não estão a beneficiar os verdadeiros contribuintes de dados, pois as plataformas desfrutam inteiramente da criação de valor proporcionada pelos dados, como uma determinada plataforma de redes sociais que gerou um total de 203 milhões de dólares através de um acordo de licenciamento de dados com uma empresa de IA.
Permitir que os usuários que realmente contribuem também participem na criação de valor trazido pelos dados, e obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Algumas plataformas são uma camada de dados e rede descentralizada, onde os usuários podem executar nós, contribuir com largura de banda ociosa e retransmitir tráfego para capturar dados em tempo real de toda a internet e receber recompensas em tokens;
Algumas plataformas introduziram o conceito único de pools de liquidez de dados (DLP), onde os usuários podem fazer upload de seus dados pessoais (, como registros de compras, hábitos de navegação, atividades em redes sociais, etc. ) para um DLP específico e escolher de forma flexível se desejam autorizar o uso desses dados por terceiros específicos;
Em algumas plataformas, os utilizadores podem usar etiquetas específicas nas redes sociais e @plataforma para realizar a coleta de dados.
Pré-processamento de dados: No processo de tratamento de dados da IA, devido ao fato de os dados coletados geralmente serem ruidosos e conterem erros, é necessário limpá-los e convertê-los em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, tendo dado origem à profissão de anotador de dados; à medida que a demanda do modelo por qualidade de dados aumenta, o nível de exigência para os anotadores de dados também se eleva, e essa tarefa é naturalmente adequada ao mecanismo de incentivo descentralizado do Web3.
Atualmente, várias plataformas estão considerando a adição da rotulagem de dados a esta etapa crucial.
Alguns projetos apresentaram o conceito de «Train2earn», enfatizando a qualidade dos dados, onde os usuários podem obter recompensas ao fornecer dados anotados, comentários ou outras formas de input.
O projeto de rotulagem de dados irá gamificar as tarefas de rotulagem e permitir que os utilizadores façam staking de pontos para ganhar mais pontos.
Privacidade e segurança de dados: É necessário esclarecer que privacidade e segurança de dados são dois conceitos distintos. A privacidade de dados envolve o tratamento de dados sensíveis, enquanto a segurança de dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens da tecnologia de privacidade Web3 e os potenciais cenários de aplicação manifestam-se em dois aspectos: (1) treinamento de dados sensíveis; (2) colaboração de dados: vários proprietários de dados podem participar juntos do treinamento de IA, sem precisar compartilhar seus dados originais.
As tecnologias de privacidade mais comuns no Web3 atualmente incluem:
Ambiente de Execução Confiável(TEE)
Criptografia homomórfica completamente (FHE)
Tecnologia de Zero Conhecimento ( zk ), como alguns protocolos que utilizam a tecnologia zkTLS, gerando provas de zero conhecimento para tráfego HTTPS, permitindo que os usuários importem de forma segura atividades, reputação e dados de identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente esta área ainda está em estágio inicial, a maioria dos projetos ainda está em fase de exploração, um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são:
Um determinado framework zkML leva cerca de 80 minutos para gerar uma prova de um modelo 1M-nanoGPT.
De acordo com os dados de um determinado laboratório, os custos do zkML são mais de 1000 vezes superiores aos da computação pura.
Armazenamento de dados: Depois de ter os dados, é necessário um lugar para armazená-los na blockchain, bem como o LLM gerado a partir desses dados. Com a disponibilidade de dados (DA) como um problema central, antes da atualização Danksharding do Ethereum, sua capacidade era de 0,08MB. Ao mesmo tempo, o treinamento de modelos de IA e a inferência em tempo real geralmente requerem um throughput de dados de 50 a 100GB por segundo. Essa discrepância de magnitude torna as soluções existentes em blockchain incapazes de lidar com "aplicações de IA que são intensivas em recursos".
Algumas plataformas são projetos representativos desta categoria. É uma solução de armazenamento centralizada projetada para atender às altas demandas de desempenho da IA, cujas características principais incluem: alto
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Nova situação da fusão AI+Web3: Incentivos de distribuição de cauda longa e mercado de modelos Código aberto
AI+Web3: Torres e Praças
Resumo dos Pontos Chave
Projetos Web3 com conceito de IA tornaram-se alvos de captação de recursos nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o suprimento potencial na cauda longa ( através de dados, armazenamento e computação ); ao mesmo tempo, estabelecer modelos de código aberto e um mercado descentralizado para Agentes de IA.
A IA no setor Web3 é principalmente utilizada para finanças em cadeia( pagamentos em criptomoeda, transações, análise de dados) e assistência no desenvolvimento.
A utilidade do AI+Web3 reside na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir seu alcance.
Introdução
Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e este efeito borboleta provocado pelo Chatgpt não só abriu um novo mundo de inteligência artificial generativa, como também desencadeou uma onda no domínio do Web3.
Com o impulso do conceito de IA, o financiamento no mercado de criptomoedas, que estava a desacelerar, apresenta uma recuperação significativa. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA completaram financiamento, com o sistema operacional baseado em inteligência artificial Zyber365 alcançando o montante máximo de financiamento de 100 milhões de dólares na rodada A.
O mercado secundário está mais próspero, com dados de sites de agregação de criptomoedas mostrando que, em pouco mais de um ano, o valor total de mercado da área de IA atingiu 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo a 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo Sora de texto para vídeo da OpenAI, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos segmentos de captação de criptomoeda, Meme: a primeira MemeCoin com o conceito de Agente de IA - GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhões de dólares, gerando um grande interesse pelo Meme de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+DePIN até AI Memecoin e agora AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da rotação das novas narrativas.
AI+Web3, esta combinação de termos repleta de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado por capitalistas, parece que é muito difícil distinguir, sob este manto deslumbrante, se é o terreno dos especuladores ou a véspera de uma explosão ao amanhecer?
Para responder a esta questão, uma reflexão fundamental para ambas as partes é: ficará melhor com o outro? Será que se pode beneficiar dos modelos do outro? Neste artigo, também tentamos, com base no trabalho de outros, examinar este panorama: como é que o Web3 pode desempenhar um papel em cada um dos elos da pilha de tecnologia de IA, e o que a IA pode trazer de novo ao Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tópico, precisamos entender a pilha de tecnologia dos grandes modelos de IA:
Usando uma linguagem mais simples para descrever todo o processo: o "grande modelo" é como o cérebro humano. Na fase inicial, esse cérebro pertence a um bebê que acabou de chegar ao mundo, precisando observar e absorver uma quantidade massiva de informações do ambiente para entender este mundo, que é a fase de "coleta" de dados; como os computadores não possuem os múltiplos sentidos humanos, como a visão e a audição, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e usar.
Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através do "treinamento", que pode ser visto como o processo gradual em que um bebê compreende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística do bebê, que é ajustada continuamente durante o processo de aprendizagem. Quando o conteúdo de aprendizagem começa a ser dividido em disciplinas ou quando o feedback é obtido através da comunicação com outras pessoas e as correções são feitas, entra-se na fase de "ajuste fino" do grande modelo.
As crianças, ao crescerem e aprenderem a falar, conseguem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" de um modelo de IA, que pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas através de suas habilidades linguísticas, o que também é semelhante à aplicação de um modelo de IA em tarefas específicas durante a fase de raciocínio, após ter sido treinado e colocado em uso, como classificação de imagens, reconhecimento de voz, entre outros.
E o Agente de IA está mais próximo da próxima forma dos grandes modelos - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de pensamento, mas também consegue lembrar, planejar e interagir com o mundo utilizando ferramentas.
Atualmente, em resposta às dificuldades da IA em várias camadas, o Web3 formou atualmente um ecossistema multilayer interconectado, abrangendo todas as fases do processo de modelos de IA.
Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados
Poder de cálculo
Atualmente, um dos maiores custos da IA é a potência de cálculo e a energia necessárias para treinar modelos e realizar inferências.
Um exemplo é que um grande modelo de linguagem de uma gigante da tecnologia precisa de 16.000 GPUs de alta gama produzidas por um determinado fabricante de GPU, levando 30 dias para concluir o treinamento. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação entre 400 e 700 milhões de dólares (GPU+chip de rede ), ao mesmo tempo que o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com gastos com energia próximos a 20 milhões de dólares por mês.
A descompressão do poder de computação de IA é, de facto, uma das primeiras áreas de intersecção entre o Web3 e a IA - DePIN( rede de infraestrutura física descentralizada) atualmente, sites de dados relevantes já listaram mais de 1400 projetos, dos quais os projetos representativos de compartilhamento de poder de computação de GPU incluem várias plataformas conhecidas.
A sua lógica principal reside em: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online de compradores e vendedores semelhante ao Uber ou Airbnb, aumentando a utilização de recursos de GPU que não estão sendo plenamente aproveitados, e os usuários finais, assim, obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, caso ocorra uma violação do mecanismo de controle de qualidade ou uma interrupção da rede, os provedores de recursos sofram as penalizações correspondentes.
As suas características são:
Agregar recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte, mineradoras de criptomoedas, etc., com recursos de computação excedentes, e o mecanismo de consenso é hardware de mineração PoS, como máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar equipamentos com barreiras de entrada mais baixas, como a construção de uma rede de computação para executar inferências de grandes modelos usando dispositivos locais como MacBook, iPhone e iPad.
Enfrentando o mercado de longa cauda de poder de computação de IA:
a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para o passo de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por GPUs em escala de superclusters, enquanto a inferência requer um desempenho de computação em GPU relativamente mais baixo, como algumas plataformas que se concentram em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. "Em relação à demanda" os pequenos e médios demandantes de poder computacional não treinarão seus próprios grandes modelos separadamente, mas apenas escolherão otimizar e ajustar em torno de alguns grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.
Dados
Os dados são a base da IA. Sem dados, os cálculos são como folhas flutuantes, completamente inúteis, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo as visões de mundo e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados na IA concentram-se principalmente em quatro áreas:
Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que um conhecido empresa de IA treinou um modelo de linguagem com um número de parâmetros que chega à casa dos trilhões.
Qualidade dos dados: À medida que a IA se combina com diversos setores, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, impõem novas exigências à sua qualidade.
Questões de privacidade e conformidade: atualmente, vários países e empresas estão começando a reconhecer a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custos de processamento de dados elevados: grande volume de dados, processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados na coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Permitir que os usuários que realmente contribuem também participem na criação de valor trazido pelos dados, e obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Algumas plataformas são uma camada de dados e rede descentralizada, onde os usuários podem executar nós, contribuir com largura de banda ociosa e retransmitir tráfego para capturar dados em tempo real de toda a internet e receber recompensas em tokens;
Algumas plataformas introduziram o conceito único de pools de liquidez de dados (DLP), onde os usuários podem fazer upload de seus dados pessoais (, como registros de compras, hábitos de navegação, atividades em redes sociais, etc. ) para um DLP específico e escolher de forma flexível se desejam autorizar o uso desses dados por terceiros específicos;
Em algumas plataformas, os utilizadores podem usar etiquetas específicas nas redes sociais e @plataforma para realizar a coleta de dados.
Atualmente, várias plataformas estão considerando a adição da rotulagem de dados a esta etapa crucial.
Alguns projetos apresentaram o conceito de «Train2earn», enfatizando a qualidade dos dados, onde os usuários podem obter recompensas ao fornecer dados anotados, comentários ou outras formas de input.
O projeto de rotulagem de dados irá gamificar as tarefas de rotulagem e permitir que os utilizadores façam staking de pontos para ganhar mais pontos.
As tecnologias de privacidade mais comuns no Web3 atualmente incluem:
Ambiente de Execução Confiável(TEE)
Criptografia homomórfica completamente (FHE)
Tecnologia de Zero Conhecimento ( zk ), como alguns protocolos que utilizam a tecnologia zkTLS, gerando provas de zero conhecimento para tráfego HTTPS, permitindo que os usuários importem de forma segura atividades, reputação e dados de identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente esta área ainda está em estágio inicial, a maioria dos projetos ainda está em fase de exploração, um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são:
Um determinado framework zkML leva cerca de 80 minutos para gerar uma prova de um modelo 1M-nanoGPT.
De acordo com os dados de um determinado laboratório, os custos do zkML são mais de 1000 vezes superiores aos da computação pura.