Projetos Web3 com conceito de IA tornaram-se alvos de captação de recursos nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se na: utilização de incentivos distribuídos para coordenar o potencial de oferta na cauda longa ------ através de dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.
A IA no setor Web3 tem como principais áreas de aplicação a finança em blockchain (pagamentos em criptomoeda, negociação, análise de dados) e suporte ao desenvolvimento.
A utilidade do AI+Web3 reside na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir-se.
Introdução
Nos últimos dois anos, o desenvolvimento da IA acelerou como se tivesse sido pressionado um botão de aceleração; esta onda provocada pelas asas da borboleta do Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou um grande movimento no Web3 do outro lado.
Com o suporte do conceito de IA, a recuperação do financiamento no mercado de criptomoedas, que está a desacelerar, é evidente. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamentos, com o sistema operativo baseado em inteligência artificial Zyber365 a alcançar um valor máximo de financiamento de 100 milhões de dólares na ronda A.
O mercado secundário está mais próspero, de acordo com os dados de sites de agregação de criptomoedas, em pouco mais de um ano, o valor de mercado total da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo a 8,6 bilhões de dólares; os avanços claros nas tecnologias de IA trouxeram benefícios evidentes, após o lançamento do modelo de conversão de texto em vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos segmentos mais lucrativos de criptomoedas, os Memes: a primeira MemeCoin com conceito de Agente de IA ------ GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhão de dólares, desencadeando com sucesso a onda dos Memes de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade das novas narrativas.
AI+Web3, esta combinação de termos cheia de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado pela capital; parece que é difícil distinguir se, sob esta roupagem glamourosa, é realmente o palco dos especuladores ou a véspera da explosão do amanhecer?
Para responder a esta questão, uma reflexão crucial para ambas as partes é: será que para o outro vai melhorar? Será que se pode beneficiar do modelo do outro? Neste artigo, também tentamos, apoiando-nos em ombros de gigantes, examinar este padrão: como o Web3 pode desempenhar um papel em cada um dos componentes da pilha tecnológica de IA, e o que a IA pode trazer de novo para o Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:
Expressar todo o processo em uma linguagem mais simples: "O grande modelo" é como o cérebro humano. Nas fases iniciais, este cérebro pertence a um bebê recém-nascido, que precisa observar e absorver uma enorme quantidade de informações do mundo ao seu redor para entender este mundo, que é a fase de "coleta" de dados. Como os computadores não possuem os sentidos humanos de visão, audição e outros, antes do treinamento, as grandes quantidades de informações não rotuladas do mundo exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e utilizar.
Após inserir os dados, a IA construiu um modelo com capacidades de compreensão e previsão através do "treinamento", o que pode ser visto como o processo pelo qual um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser especializado ou quando há feedback na comunicação com outras pessoas e ajustes são feitos, chega-se à fase de "ajuste fino" do grande modelo.
As crianças, à medida que crescem e aprendem a falar, conseguem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio de suas habilidades linguísticas, o que também é semelhante à aplicação de grandes modelos de IA na fase de raciocínio em várias tarefas específicas após serem treinados e colocados em uso, como classificação de imagens e reconhecimento de voz.
O AI Agent aproxima-se da próxima forma do grande modelo ------ capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possuindo capacidade de pensamento, mas também memória, planejamento e a capacidade de usar ferramentas para interagir com o mundo.
Atualmente, em resposta às dores de AI em várias pilhas, o Web3 está a formar, de forma preliminar, um ecossistema multilayer e interconectado, que abrange todas as fases do processo de modelos de AI.
Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados
▎Poder de cálculo
Atualmente, um dos maiores custos da IA é a computação e a energia necessárias para treinar e inferir modelos.
Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100 GPU produzidas pela NVIDIA (uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). Leva 30 dias para completar o treinamento. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação de 400 a 700 milhões de dólares (GPU + chip de rede), enquanto o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com despesas de energia próximas a 20 milhões de dólares por mês.
A descompressão do poder computacional da IA é, de facto, uma das primeiras áreas de interseção entre o Web3 e a IA------DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, o site de dados já listou mais de 1400 projetos, dos quais os projetos representativos de compartilhamento de poder computacional de GPU incluem io.net, Aethir, Akash, Render Network, entre outros.
A principal lógica é que a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online de compradores e vendedores, semelhante ao Uber ou Airbnb, aumentando a utilização de recursos de GPU que não estão plenamente aproveitados. Os usuários finais, portanto, obtêm recursos de computação de alta eficiência a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se ocorrerem violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos sofrerão as penalizações correspondentes.
As suas características são:
Agregar recursos de GPU ociosos: os fornecedores são principalmente operadores de data centers independentes de pequeno e médio porte e fazendas de criptomoedas, com recursos de computação excedentes, hardware de mineração com mecanismo de consenso PoS, como as máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar equipamentos com barreiras de entrada mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferência de grandes modelos.
Enfrentando o mercado de cauda longa da capacidade de cálculo de IA:
a. "Do ponto de vista técnico", o mercado de computação descentralizada é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por um cluster de GPU de grande escala, enquanto a inferência tem uma exigência relativamente baixa de desempenho de computação de GPU, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. Em termos de demanda, os pequenos e médios demandantes de poder computacional não irão treinar seus próprios grandes modelos de forma independente, mas apenas escolherão otimizar e ajustar em torno de alguns grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos de poder computacional ocioso distribuído.
Propriedade descentralizada: o significado técnico da blockchain é que os proprietários de recursos mantêm sempre o controle sobre seus recursos, ajustando-se de forma flexível conforme a demanda, ao mesmo tempo que obtêm lucros.
▎Dados
Os dados são a base da IA. Se não houver dados, o cálculo é tão inútil quanto uma erva flutuante, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. No que diz respeito ao treinamento dos atuais modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão e até mesmo as convicções e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda de dados para IA concentram-se principalmente em quatro áreas:
Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que a OpenAI treinou o GPT-4 com um número de parâmetros na ordem dos trilhões.
Qualidade dos dados: Com a integração da IA em várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, também levantaram novas exigências sobre sua qualidade.
Questões de privacidade e conformidade: Atualmente, diversos países e empresas estão gradualmente reconhecendo a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custo elevado de processamento de dados: grande volume de dados e processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados na coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Coleta de dados: A disponibilidade de dados do mundo real coletados gratuitamente está rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam a cada ano. Mas, ao mesmo tempo, essa despesa não está retornando aos verdadeiros contribuintes dos dados, pois as plataformas desfrutam inteiramente da criação de valor trazida pelos dados, como o Reddit, que gerou uma receita total de 203 milhões de dólares através de acordos de licenciamento de dados com empresas de IA.
Permitir que os usuários que realmente contribuem também participem na criação de valor trazida pelos dados, bem como obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Como Grass é uma camada de dados e rede descentralizada, os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão executando nós Grass para capturar dados em tempo real de toda a Internet e receber recompensas em tokens;
Vana introduziu um conceito único de Pool de Liquidez de Dados (DLP), onde os usuários podem enviar seus dados pessoais (como registros de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher flexivelmente se autorizam ou não o uso desses dados por terceiros específicos;
Numa plataforma de IA, os utilizadores podem usar #AI 或#Web3 como etiqueta de categorização nas redes sociais e mencionar a plataforma para realizar a coleta de dados.
Pré-processamento de dados: No processo de tratamento de dados da IA, como os dados coletados costumam ser ruidosos e conter erros, eles devem ser limpos e convertidos para um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de normalização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, tendo gerado a profissão de anotador de dados, e à medida que as exigências dos modelos em relação à qualidade dos dados aumentam, o nível de entrada para anotadores de dados também se eleva, sendo essa tarefa naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.
Atualmente, a Grass e a OpenLayer estão considerando a inclusão da rotulagem de dados nesta etapa crucial.
A Synesis introduziu o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários ganhem recompensas ao fornecer dados rotulados, anotações ou outras formas de contribuição.
O projeto de anotação de dados Sapien transforma as tarefas de marcação em um jogo e permite que os usuários façam staking de pontos para ganhar mais pontos.
Privacidade e segurança dos dados: é importante esclarecer que privacidade e segurança dos dados são dois conceitos distintos. A privacidade dos dados refere-se ao tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acessos, destruição e roubo não autorizados. Assim, as vantagens da tecnologia de privacidade do Web3 e os potenciais cenários de aplicação manifestam-se em dois aspectos: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: múltiplos proprietários de dados podem participar conjuntamente do treinamento de IA, sem precisar compartilhar seus dados originais.
As tecnologias de privacidade atualmente mais comuns no Web3 incluem:
Ambiente de Execução Confiável (TEE), como o Super Protocol;
Criptografia homomórfica completa (FHE), como BasedAI, Fhenix.io ou Inco Network;
Tecnologias de conhecimento zero (zk), como o Reclaim Protocol que utiliza a tecnologia zkTLS, geram provas de conhecimento zero do tráfego HTTPS, permitindo que os usuários importem de forma segura dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente este campo ainda está em uma fase inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são:
zkML framework E
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Efeitos sinérgicos da IA e Web3: Construindo um ecossistema de IA descentralizado
AI+Web3: Torres e Praças
TL;DR
Projetos Web3 com conceito de IA tornaram-se alvos de captação de recursos nos mercados primário e secundário.
As oportunidades do Web3 na indústria de IA manifestam-se na: utilização de incentivos distribuídos para coordenar o potencial de oferta na cauda longa ------ através de dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.
A IA no setor Web3 tem como principais áreas de aplicação a finança em blockchain (pagamentos em criptomoeda, negociação, análise de dados) e suporte ao desenvolvimento.
A utilidade do AI+Web3 reside na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a expandir-se.
Introdução
Nos últimos dois anos, o desenvolvimento da IA acelerou como se tivesse sido pressionado um botão de aceleração; esta onda provocada pelas asas da borboleta do Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou um grande movimento no Web3 do outro lado.
Com o suporte do conceito de IA, a recuperação do financiamento no mercado de criptomoedas, que está a desacelerar, é evidente. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamentos, com o sistema operativo baseado em inteligência artificial Zyber365 a alcançar um valor máximo de financiamento de 100 milhões de dólares na ronda A.
O mercado secundário está mais próspero, de acordo com os dados de sites de agregação de criptomoedas, em pouco mais de um ano, o valor de mercado total da área de IA já alcançou 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo a 8,6 bilhões de dólares; os avanços claros nas tecnologias de IA trouxeram benefícios evidentes, após o lançamento do modelo de conversão de texto em vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos segmentos mais lucrativos de criptomoedas, os Memes: a primeira MemeCoin com conceito de Agente de IA ------ GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhão de dólares, desencadeando com sucesso a onda dos Memes de IA.
A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade das novas narrativas.
AI+Web3, esta combinação de termos cheia de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado pela capital; parece que é difícil distinguir se, sob esta roupagem glamourosa, é realmente o palco dos especuladores ou a véspera da explosão do amanhecer?
Para responder a esta questão, uma reflexão crucial para ambas as partes é: será que para o outro vai melhorar? Será que se pode beneficiar do modelo do outro? Neste artigo, também tentamos, apoiando-nos em ombros de gigantes, examinar este padrão: como o Web3 pode desempenhar um papel em cada um dos componentes da pilha tecnológica de IA, e o que a IA pode trazer de novo para o Web3?
Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?
Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:
Expressar todo o processo em uma linguagem mais simples: "O grande modelo" é como o cérebro humano. Nas fases iniciais, este cérebro pertence a um bebê recém-nascido, que precisa observar e absorver uma enorme quantidade de informações do mundo ao seu redor para entender este mundo, que é a fase de "coleta" de dados. Como os computadores não possuem os sentidos humanos de visão, audição e outros, antes do treinamento, as grandes quantidades de informações não rotuladas do mundo exterior precisam ser convertidas por meio de "pré-processamento" em um formato de informação que o computador possa entender e utilizar.
Após inserir os dados, a IA construiu um modelo com capacidades de compreensão e previsão através do "treinamento", o que pode ser visto como o processo pelo qual um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser especializado ou quando há feedback na comunicação com outras pessoas e ajustes são feitos, chega-se à fase de "ajuste fino" do grande modelo.
As crianças, à medida que crescem e aprendem a falar, conseguem entender o significado e expressar seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo pode prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio de suas habilidades linguísticas, o que também é semelhante à aplicação de grandes modelos de IA na fase de raciocínio em várias tarefas específicas após serem treinados e colocados em uso, como classificação de imagens e reconhecimento de voz.
O AI Agent aproxima-se da próxima forma do grande modelo ------ capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possuindo capacidade de pensamento, mas também memória, planejamento e a capacidade de usar ferramentas para interagir com o mundo.
Atualmente, em resposta às dores de AI em várias pilhas, o Web3 está a formar, de forma preliminar, um ecossistema multilayer e interconectado, que abrange todas as fases do processo de modelos de AI.
Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados
▎Poder de cálculo
Atualmente, um dos maiores custos da IA é a computação e a energia necessárias para treinar e inferir modelos.
Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100 GPU produzidas pela NVIDIA (uma unidade de processamento gráfico de topo projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). Leva 30 dias para completar o treinamento. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação de 400 a 700 milhões de dólares (GPU + chip de rede), enquanto o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com despesas de energia próximas a 20 milhões de dólares por mês.
A descompressão do poder computacional da IA é, de facto, uma das primeiras áreas de interseção entre o Web3 e a IA------DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, o site de dados já listou mais de 1400 projetos, dos quais os projetos representativos de compartilhamento de poder computacional de GPU incluem io.net, Aethir, Akash, Render Network, entre outros.
A principal lógica é que a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online de compradores e vendedores, semelhante ao Uber ou Airbnb, aumentando a utilização de recursos de GPU que não estão plenamente aproveitados. Os usuários finais, portanto, obtêm recursos de computação de alta eficiência a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se ocorrerem violações do mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos sofrerão as penalizações correspondentes.
As suas características são:
Agregar recursos de GPU ociosos: os fornecedores são principalmente operadores de data centers independentes de pequeno e médio porte e fazendas de criptomoedas, com recursos de computação excedentes, hardware de mineração com mecanismo de consenso PoS, como as máquinas de mineração FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar equipamentos com barreiras de entrada mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferência de grandes modelos.
Enfrentando o mercado de cauda longa da capacidade de cálculo de IA:
a. "Do ponto de vista técnico", o mercado de computação descentralizada é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por um cluster de GPU de grande escala, enquanto a inferência tem uma exigência relativamente baixa de desempenho de computação de GPU, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.
b. Em termos de demanda, os pequenos e médios demandantes de poder computacional não irão treinar seus próprios grandes modelos de forma independente, mas apenas escolherão otimizar e ajustar em torno de alguns grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos de poder computacional ocioso distribuído.
▎Dados
Os dados são a base da IA. Se não houver dados, o cálculo é tão inútil quanto uma erva flutuante, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. No que diz respeito ao treinamento dos atuais modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão e até mesmo as convicções e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda de dados para IA concentram-se principalmente em quatro áreas:
Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que a OpenAI treinou o GPT-4 com um número de parâmetros na ordem dos trilhões.
Qualidade dos dados: Com a integração da IA em várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, também levantaram novas exigências sobre sua qualidade.
Questões de privacidade e conformidade: Atualmente, diversos países e empresas estão gradualmente reconhecendo a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.
Custo elevado de processamento de dados: grande volume de dados e processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados na coleta e processamento de dados básicos.
Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:
Permitir que os usuários que realmente contribuem também participem na criação de valor trazida pelos dados, bem como obter dados mais privados e valiosos de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.
Como Grass é uma camada de dados e rede descentralizada, os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão executando nós Grass para capturar dados em tempo real de toda a Internet e receber recompensas em tokens;
Vana introduziu um conceito único de Pool de Liquidez de Dados (DLP), onde os usuários podem enviar seus dados pessoais (como registros de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher flexivelmente se autorizam ou não o uso desses dados por terceiros específicos;
Numa plataforma de IA, os utilizadores podem usar #AI 或#Web3 como etiqueta de categorização nas redes sociais e mencionar a plataforma para realizar a coleta de dados.
Atualmente, a Grass e a OpenLayer estão considerando a inclusão da rotulagem de dados nesta etapa crucial.
A Synesis introduziu o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários ganhem recompensas ao fornecer dados rotulados, anotações ou outras formas de contribuição.
O projeto de anotação de dados Sapien transforma as tarefas de marcação em um jogo e permite que os usuários façam staking de pontos para ganhar mais pontos.
As tecnologias de privacidade atualmente mais comuns no Web3 incluem:
Ambiente de Execução Confiável (TEE), como o Super Protocol;
Criptografia homomórfica completa (FHE), como BasedAI, Fhenix.io ou Inco Network;
Tecnologias de conhecimento zero (zk), como o Reclaim Protocol que utiliza a tecnologia zkTLS, geram provas de conhecimento zero do tráfego HTTPS, permitindo que os usuários importem de forma segura dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.
No entanto, atualmente este campo ainda está em uma fase inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é que os custos de computação são muito altos, alguns exemplos são: