Los proyectos de Web3 con concepto de IA se convierten en objetivos de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para agentes de IA.
El principal campo de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos en criptomonedas, comercio, análisis de datos) y el desarrollo asistido.
La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 espera contrarrestar la concentración de AI, y AI espera ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado el botón de aceleración; las alas de la mariposa agitadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han provocado un fuerte oleaje en el Web3 al otro lado.
Con el respaldo del concepto de IA, el impulso de financiamiento en un mercado de criptomonedas que se está desacelerando es evidente. Según estadísticas de los medios, solo en la primera mitad de 2024, se completaron 64 proyectos de Web3+AI en financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto de financiamiento máximo de 100 millones de dólares en su ronda A.
El mercado secundario se ha vuelto más próspero. Según los datos de los sitios web de agregación de criptomonedas, en poco más de un año, la capitalización total del sector de la IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones de 24 horas cercano a los 8.6 mil millones de dólares; los beneficios derivados de los avances en la tecnología de IA son evidentes, después del lanzamiento del modelo de texto a video Sora de OpenAI, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha extendido a uno de los sectores de captación de capital de criptomonedas, Meme: el primer concepto de MemeCoin de AI Agent------GOAT se volvió rápidamente popular y alcanzó una valoración de 1.4 mil millones de dólares, logrando así desencadenar la fiebre de los Meme de IA.
La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y, actualmente, AI Agent y AI DAO, la sensación de FOMO ya no puede seguir el ritmo de la rotación de las nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, es difícil de ver como un matrimonio arreglado por el capital, parece que es difícil distinguir si debajo de esta lujosa capa hay un escenario para especuladores o si es la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará la situación con el otro? ¿Puede beneficiarse de los modelos de la otra parte? En este artículo, también intentamos examinar este patrón apoyándonos en los hombros de los que nos precedieron: ¿cómo puede Web3 jugar un papel en cada etapa de la pila tecnológica de la IA y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Cuáles son las oportunidades de Web3 bajo la pila de IA?
Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Expresado en un lenguaje más sencillo, todo el proceso es el siguiente: el "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar y absorber una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recopilación" de datos. Dado que las computadoras no tienen múltiples sentidos como la vista y el oído humanos, antes del entrenamiento, la gran cantidad de información sin etiquetar del exterior debe transformarse en un formato de información que la computadora pueda entender y utilizar a través de "preprocesamiento".
Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través de "entrenamiento", lo que se puede ver como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como las habilidades lingüísticas que el bebé ajusta constantemente durante su proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a especializarse, o se recibe retroalimentación al interactuar con otras personas y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.
Cuando los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA se aplican en la etapa de razonamiento a diversas tareas específicas después de haber completado su entrenamiento, como la clasificación de imágenes, el reconocimiento de voz, etc.
El Agente de IA se acerca más a la próxima forma de un gran modelo ------ capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en diversas capas, Web3 ha comenzado a formar un ecosistema multidimensional e interconectado que abarca todas las etapas del proceso de modelos de IA.
Uno, Capa básica: Airbnb de poder de cómputo y datos
▎Poder de cálculo
Actualmente, uno de los mayores costos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.
Un ejemplo es que el LLAMA3 de Meta necesita 16,000 H100 GPU producidas por NVIDIA (que es una unidad de procesamiento gráfico de alta gama diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento) para completar el entrenamiento en 30 días. El precio unitario de la versión de 80 GB varía entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación (GPU + chip de red) de entre 400 y 700 millones de dólares, al mismo tiempo que el entrenamiento mensual consume 1,600 millones de kilovatios hora, con un gasto energético mensual de cerca de 20 millones de dólares.
La descompresión de la potencia de cálculo de IA es precisamente el primer campo donde Web3 se cruza con la IA------DePin (Red de Infraestructura Física Descentralizada). Actualmente, el sitio web de datos ha presentado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia GPU incluyen io.net, Aethir, Akash, Render Network, etc.
La lógica principal radica en que: la plataforma permite a personas o entidades que poseen recursos de GPU inactivos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos. A través de un mercado en línea para compradores y vendedores similar a Uber o Airbnb, se mejora la tasa de utilización de recursos de GPU que no se están aprovechando completamente, lo que permite a los usuarios finales obtener recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking también asegura que si se produce una violación del mecanismo de control de calidad o una interrupción de la red, los proveedores de recursos tendrán las sanciones correspondientes.
Su característica es:
Reunir recursos ociosos de GPU: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano, operadores de criptomonedas, etc., que tienen recursos de potencia de cálculo excedentes, hardware de minería con mecanismo de consenso PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con umbrales más bajos, como exolab, que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de potencia de cálculo para la inferencia de grandes modelos.
Enfrentando el mercado de cola larga de la potencia de cálculo de IA:
a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que ofrece una GPU de gran escala, mientras que la inferencia tiene requisitos relativamente bajos en cuanto al rendimiento de la GPU, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. Desde la perspectiva de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios grandes modelos por separado, sino que simplemente elegirán optimizar y ajustar en torno a unos pocos modelos grandes destacados, y estos escenarios son naturalmente adecuados para la utilización de recursos de cálculo distribuidos y ociosos.
Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de los recursos siempre mantienen el control sobre sus recursos, ajustándolo de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.
▎Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como un lirio de agua flotante, y la relación entre los datos y el modelo es como dice el refrán "Basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. Para el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso los valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de IA se centran principalmente en las siguientes cuatro áreas:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los datos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros que alcanza el nivel de billones.
Calidad de los datos: A medida que la IA se integra con diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, también han planteado nuevas exigencias sobre su calidad.
Problemas de privacidad y cumplimiento: Actualmente, diferentes países y empresas están empezando a reconocer la importancia de los conjuntos de datos de calidad y están imponiendo restricciones sobre la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos, proceso complejo de manejo. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:
Recopilación de datos: La disponibilidad de datos del mundo real que se pueden extraer de forma gratuita se está agotando rápidamente, y el gasto de las empresas de IA en datos aumenta año tras año. Sin embargo, al mismo tiempo, este gasto no se devuelve a los verdaderos contribuyentes de datos, ya que las plataformas disfrutan plenamente de la creación de valor que aporta la información, como Reddit, que logró ingresos totales de 203 millones de dólares a través de acuerdos de licencia de datos con empresas de IA.
Permitir que los usuarios que realmente contribuyen participen en la creación de valor que genera los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica mediante redes distribuidas y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y red descentralizada donde los usuarios pueden contribuir con ancho de banda no utilizado y tráfico de retransmisión mediante la ejecución de nodos Grass para capturar datos en tiempo real de toda la Internet y obtener recompensas en tokens;
Vana introduce un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden cargar sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) en un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;
En una plataforma de IA, los usuarios pueden utilizar #AI 或#Web3 como etiqueta de clasificación en la plataforma social y @la plataforma para realizar la recolección de datos.
Preprocesamiento de datos: En el proceso de procesamiento de datos de la IA, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben ser limpiados y convertidos a un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y tratamiento de valores faltantes. Esta etapa es una de las pocas fases manuales en la industria de la IA, y ha dado lugar a la profesión de etiquetador de datos. A medida que las exigencias del modelo sobre la calidad de los datos aumentan, también lo hace el umbral para convertirse en etiquetador de datos, y esta tarea se adapta naturalmente al mecanismo de incentivos descentralizados de Web3.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.
Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Privacidad y seguridad de los datos: es importante aclarar que la privacidad de los datos y la seguridad son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de datos contra el acceso, la destrucción y el robo no autorizados. Por lo tanto, las ventajas de la tecnología de privacidad de Web3 y sus posibles escenarios de aplicación se manifiestan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.
Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:
Entorno de ejecución confiable ( TEE ), como Super Protocol;
Cifrado homomórfico completo (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim, utiliza la tecnología zkTLS para generar pruebas de conocimiento cero del tráfico HTTPS, lo que permite a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.
Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, un dilema actual es que el costo de cálculo es demasiado alto, algunos ejemplos son:
marco zkML E
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
La sinergia entre la IA y Web3: construir un ecosistema de IA Descentralización
AI+Web3: Torres y plazas
TL;DR
Los proyectos de Web3 con concepto de IA se convierten en objetivos de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para agentes de IA.
El principal campo de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos en criptomonedas, comercio, análisis de datos) y el desarrollo asistido.
La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 espera contrarrestar la concentración de AI, y AI espera ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado el botón de aceleración; las alas de la mariposa agitadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han provocado un fuerte oleaje en el Web3 al otro lado.
Con el respaldo del concepto de IA, el impulso de financiamiento en un mercado de criptomonedas que se está desacelerando es evidente. Según estadísticas de los medios, solo en la primera mitad de 2024, se completaron 64 proyectos de Web3+AI en financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto de financiamiento máximo de 100 millones de dólares en su ronda A.
El mercado secundario se ha vuelto más próspero. Según los datos de los sitios web de agregación de criptomonedas, en poco más de un año, la capitalización total del sector de la IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones de 24 horas cercano a los 8.6 mil millones de dólares; los beneficios derivados de los avances en la tecnología de IA son evidentes, después del lanzamiento del modelo de texto a video Sora de OpenAI, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha extendido a uno de los sectores de captación de capital de criptomonedas, Meme: el primer concepto de MemeCoin de AI Agent------GOAT se volvió rápidamente popular y alcanzó una valoración de 1.4 mil millones de dólares, logrando así desencadenar la fiebre de los Meme de IA.
La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y, actualmente, AI Agent y AI DAO, la sensación de FOMO ya no puede seguir el ritmo de la rotación de las nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, es difícil de ver como un matrimonio arreglado por el capital, parece que es difícil distinguir si debajo de esta lujosa capa hay un escenario para especuladores o si es la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará la situación con el otro? ¿Puede beneficiarse de los modelos de la otra parte? En este artículo, también intentamos examinar este patrón apoyándonos en los hombros de los que nos precedieron: ¿cómo puede Web3 jugar un papel en cada etapa de la pila tecnológica de la IA y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Cuáles son las oportunidades de Web3 bajo la pila de IA?
Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Expresado en un lenguaje más sencillo, todo el proceso es el siguiente: el "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar y absorber una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recopilación" de datos. Dado que las computadoras no tienen múltiples sentidos como la vista y el oído humanos, antes del entrenamiento, la gran cantidad de información sin etiquetar del exterior debe transformarse en un formato de información que la computadora pueda entender y utilizar a través de "preprocesamiento".
Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través de "entrenamiento", lo que se puede ver como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como las habilidades lingüísticas que el bebé ajusta constantemente durante su proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a especializarse, o se recibe retroalimentación al interactuar con otras personas y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.
Cuando los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA se aplican en la etapa de razonamiento a diversas tareas específicas después de haber completado su entrenamiento, como la clasificación de imágenes, el reconocimiento de voz, etc.
El Agente de IA se acerca más a la próxima forma de un gran modelo ------ capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en diversas capas, Web3 ha comenzado a formar un ecosistema multidimensional e interconectado que abarca todas las etapas del proceso de modelos de IA.
Uno, Capa básica: Airbnb de poder de cómputo y datos
▎Poder de cálculo
Actualmente, uno de los mayores costos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.
Un ejemplo es que el LLAMA3 de Meta necesita 16,000 H100 GPU producidas por NVIDIA (que es una unidad de procesamiento gráfico de alta gama diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento) para completar el entrenamiento en 30 días. El precio unitario de la versión de 80 GB varía entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación (GPU + chip de red) de entre 400 y 700 millones de dólares, al mismo tiempo que el entrenamiento mensual consume 1,600 millones de kilovatios hora, con un gasto energético mensual de cerca de 20 millones de dólares.
La descompresión de la potencia de cálculo de IA es precisamente el primer campo donde Web3 se cruza con la IA------DePin (Red de Infraestructura Física Descentralizada). Actualmente, el sitio web de datos ha presentado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia GPU incluyen io.net, Aethir, Akash, Render Network, etc.
La lógica principal radica en que: la plataforma permite a personas o entidades que poseen recursos de GPU inactivos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos. A través de un mercado en línea para compradores y vendedores similar a Uber o Airbnb, se mejora la tasa de utilización de recursos de GPU que no se están aprovechando completamente, lo que permite a los usuarios finales obtener recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking también asegura que si se produce una violación del mecanismo de control de calidad o una interrupción de la red, los proveedores de recursos tendrán las sanciones correspondientes.
Su característica es:
Reunir recursos ociosos de GPU: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano, operadores de criptomonedas, etc., que tienen recursos de potencia de cálculo excedentes, hardware de minería con mecanismo de consenso PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con umbrales más bajos, como exolab, que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de potencia de cálculo para la inferencia de grandes modelos.
Enfrentando el mercado de cola larga de la potencia de cálculo de IA:
a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que ofrece una GPU de gran escala, mientras que la inferencia tiene requisitos relativamente bajos en cuanto al rendimiento de la GPU, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. Desde la perspectiva de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios grandes modelos por separado, sino que simplemente elegirán optimizar y ajustar en torno a unos pocos modelos grandes destacados, y estos escenarios son naturalmente adecuados para la utilización de recursos de cálculo distribuidos y ociosos.
▎Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como un lirio de agua flotante, y la relación entre los datos y el modelo es como dice el refrán "Basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. Para el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso los valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de IA se centran principalmente en las siguientes cuatro áreas:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los datos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros que alcanza el nivel de billones.
Calidad de los datos: A medida que la IA se integra con diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, también han planteado nuevas exigencias sobre su calidad.
Problemas de privacidad y cumplimiento: Actualmente, diferentes países y empresas están empezando a reconocer la importancia de los conjuntos de datos de calidad y están imponiendo restricciones sobre la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos, proceso complejo de manejo. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:
Permitir que los usuarios que realmente contribuyen participen en la creación de valor que genera los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica mediante redes distribuidas y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y red descentralizada donde los usuarios pueden contribuir con ancho de banda no utilizado y tráfico de retransmisión mediante la ejecución de nodos Grass para capturar datos en tiempo real de toda la Internet y obtener recompensas en tokens;
Vana introduce un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden cargar sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) en un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;
En una plataforma de IA, los usuarios pueden utilizar #AI 或#Web3 como etiqueta de clasificación en la plataforma social y @la plataforma para realizar la recolección de datos.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.
Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:
Entorno de ejecución confiable ( TEE ), como Super Protocol;
Cifrado homomórfico completo (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim, utiliza la tecnología zkTLS para generar pruebas de conocimiento cero del tráfico HTTPS, lo que permite a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.
Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, un dilema actual es que el costo de cálculo es demasiado alto, algunos ejemplos son: