Fuente: Cointelegraph
Texto original: "OORT AI descentralizado se posiciona entre los mejores en Google Kaggle"
El conjunto de datos de imágenes de entrenamiento de inteligencia artificial desarrollado por el proveedor de soluciones de IA descentralizadas OORT ha tenido un éxito notable en la plataforma Kaggle de Google.
La lista del conjunto de datos "Diverse Tools Kaggle" de OORT se publicó a principios de abril; desde entonces, ha subido a la portada en varias categorías. Kaggle es una plataforma en línea de Google para competiciones de ciencia de datos y aprendizaje automático, así como para el aprendizaje y la colaboración.
El contribuyente principal del proyecto de criptomonedas AI OpenLedger, Ramkumar Subramaniam, dijo a Cointelegraph: "El ranking en la página de inicio de Kaggle es una poderosa señal social que indica que este conjunto de datos está atrayendo la participación activa de comunidades clave como científicos de datos, ingenieros de aprendizaje automático y profesionales."
El fundador y CEO de OORT, Max Li, reveló a Cointelegraph que la compañía "ha observado indicadores de participación alentadores, lo que valida que los datos de entrenamiento recopilados a través de un modelo descentralizado" realmente tienen demanda y relevancia en el mercado temprano". Añadió:
"El interés espontáneo de la comunidad, que incluye un uso activo y contribuciones, demuestra claramente cómo un canal de datos descentralizado y guiado por la comunidad, como OORT, puede lograr una distribución rápida y una amplia participación sin depender de intermediarios centralizados."
Li también señaló que OORT planea lanzar varios conjuntos de datos en los próximos meses. Estos incluyen conjuntos de datos de comandos de voz en el automóvil, conjuntos de datos de comandos de voz para el hogar inteligente y un conjunto de datos de videos de deepfake destinado a mejorar la capacidad de verificación de la autenticidad de los medios impulsada por IA.
Cointelegraph ha verificado de manera independiente que el conjunto de datos mencionado logró aparecer en la página principal de las categorías de IA general, retail y compras, manufactura e ingeniería en Kaggle a principios de este mes. Hasta el momento de redactar, este conjunto de datos ya no mantiene esas posiciones de clasificación después de una posible actualización de un conjunto de datos no relacionado el 6 de mayo y otra actualización el 14 de mayo.
Aunque reconoce este logro, Subramaniam dijo a Cointelegraph: "Esto no es un indicador decisivo de la aplicación práctica o de la calidad a nivel empresarial." Señaló que la singularidad del conjunto de datos OORT "no solo se manifiesta en el ranking, sino también en las fuentes y mecanismos de incentivos detrás del conjunto de datos." Explicó además:
"A diferencia de los proveedores centralizados que pueden depender de procesos opacos, un sistema transparente basado en incentivos de tokens puede ofrecer trazabilidad, gestión comunitaria y la posibilidad de optimización continua, siempre que se establezca una estructura de gobernanza adecuada."
El socio de Generative Ventures, una firma de capital de riesgo en inteligencia artificial, Lex Sokolin, afirmó que aunque cree que estos resultados no son difíciles de replicar, "esto realmente demuestra que los proyectos de criptomonedas pueden utilizar mecanismos de incentivos descentralizados para organizar actividades de valor económico."
Según los datos publicados por la agencia de investigación de inteligencia artificial Epoch AI, se espera que los datos de entrenamiento de texto generados por humanos se agoten en 2028. La presión ha crecido tanto que los inversores están facilitando transacciones para que las empresas de IA obtengan derechos de uso de materiales protegidos por derechos de autor.
Los informes de investigación sobre la creciente escasez de datos de entrenamiento de IA y cómo esto puede limitar el desarrollo en este campo han circulado durante años. Aunque los datos generados por IA sintética ( están siendo cada vez más utilizados y han logrado ciertos resultados, los datos generados por humanos siguen siendo considerados generalmente como la mejor opción, ya que estos datos de alta calidad pueden cultivar modelos de IA de mejor rendimiento.
En el ámbito de la formación de imágenes de IA, la situación se vuelve cada vez más compleja, y los artistas están intencionadamente saboteando el trabajo de entrenamiento. Para proteger sus obras de ser utilizadas sin autorización para el entrenamiento de IA, la herramienta Nightshade permite a los creadores "envenenar" sus imágenes, afectando así gravemente el rendimiento del modelo.
Subramaniam señaló: "Estamos entrando en una era en la que los datos de imágenes de alta calidad son cada vez más escasos." También enfatizó que el uso generalizado de la técnica de envenenamiento de imágenes hace que este desafío sea aún más grave:
"Con el surgimiento de técnicas de ocultación de imágenes y métodos de envenenamiento de datos de entrenamiento con marcas de agua adversariales, los conjuntos de datos de código abierto se enfrentan a un doble desafío en cantidad y credibilidad."
En respuesta a esta situación, Subramaniam indicó que los conjuntos de datos incentivados, verificables y contribuidos por la comunidad "son más valiosos que nunca". Él cree que este tipo de proyectos "no solo pueden servir como una alternativa, sino que también se convertirán en pilares importantes para la alineación de la IA y el rastreo de datos en la economía de datos."
Relación de artículos: Kima se une al sandbox de Mastercard para habilitar la recarga de tarjetas de stablecoin.
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
La data de OORT AI descentralizada se encuentra entre las mejores en Google Kaggle.
Fuente: Cointelegraph Texto original: "OORT AI descentralizado se posiciona entre los mejores en Google Kaggle"
El conjunto de datos de imágenes de entrenamiento de inteligencia artificial desarrollado por el proveedor de soluciones de IA descentralizadas OORT ha tenido un éxito notable en la plataforma Kaggle de Google.
La lista del conjunto de datos "Diverse Tools Kaggle" de OORT se publicó a principios de abril; desde entonces, ha subido a la portada en varias categorías. Kaggle es una plataforma en línea de Google para competiciones de ciencia de datos y aprendizaje automático, así como para el aprendizaje y la colaboración.
El contribuyente principal del proyecto de criptomonedas AI OpenLedger, Ramkumar Subramaniam, dijo a Cointelegraph: "El ranking en la página de inicio de Kaggle es una poderosa señal social que indica que este conjunto de datos está atrayendo la participación activa de comunidades clave como científicos de datos, ingenieros de aprendizaje automático y profesionales."
El fundador y CEO de OORT, Max Li, reveló a Cointelegraph que la compañía "ha observado indicadores de participación alentadores, lo que valida que los datos de entrenamiento recopilados a través de un modelo descentralizado" realmente tienen demanda y relevancia en el mercado temprano". Añadió:
"El interés espontáneo de la comunidad, que incluye un uso activo y contribuciones, demuestra claramente cómo un canal de datos descentralizado y guiado por la comunidad, como OORT, puede lograr una distribución rápida y una amplia participación sin depender de intermediarios centralizados."
Li también señaló que OORT planea lanzar varios conjuntos de datos en los próximos meses. Estos incluyen conjuntos de datos de comandos de voz en el automóvil, conjuntos de datos de comandos de voz para el hogar inteligente y un conjunto de datos de videos de deepfake destinado a mejorar la capacidad de verificación de la autenticidad de los medios impulsada por IA.
Cointelegraph ha verificado de manera independiente que el conjunto de datos mencionado logró aparecer en la página principal de las categorías de IA general, retail y compras, manufactura e ingeniería en Kaggle a principios de este mes. Hasta el momento de redactar, este conjunto de datos ya no mantiene esas posiciones de clasificación después de una posible actualización de un conjunto de datos no relacionado el 6 de mayo y otra actualización el 14 de mayo.
Aunque reconoce este logro, Subramaniam dijo a Cointelegraph: "Esto no es un indicador decisivo de la aplicación práctica o de la calidad a nivel empresarial." Señaló que la singularidad del conjunto de datos OORT "no solo se manifiesta en el ranking, sino también en las fuentes y mecanismos de incentivos detrás del conjunto de datos." Explicó además:
"A diferencia de los proveedores centralizados que pueden depender de procesos opacos, un sistema transparente basado en incentivos de tokens puede ofrecer trazabilidad, gestión comunitaria y la posibilidad de optimización continua, siempre que se establezca una estructura de gobernanza adecuada."
El socio de Generative Ventures, una firma de capital de riesgo en inteligencia artificial, Lex Sokolin, afirmó que aunque cree que estos resultados no son difíciles de replicar, "esto realmente demuestra que los proyectos de criptomonedas pueden utilizar mecanismos de incentivos descentralizados para organizar actividades de valor económico."
Según los datos publicados por la agencia de investigación de inteligencia artificial Epoch AI, se espera que los datos de entrenamiento de texto generados por humanos se agoten en 2028. La presión ha crecido tanto que los inversores están facilitando transacciones para que las empresas de IA obtengan derechos de uso de materiales protegidos por derechos de autor.
Los informes de investigación sobre la creciente escasez de datos de entrenamiento de IA y cómo esto puede limitar el desarrollo en este campo han circulado durante años. Aunque los datos generados por IA sintética ( están siendo cada vez más utilizados y han logrado ciertos resultados, los datos generados por humanos siguen siendo considerados generalmente como la mejor opción, ya que estos datos de alta calidad pueden cultivar modelos de IA de mejor rendimiento.
En el ámbito de la formación de imágenes de IA, la situación se vuelve cada vez más compleja, y los artistas están intencionadamente saboteando el trabajo de entrenamiento. Para proteger sus obras de ser utilizadas sin autorización para el entrenamiento de IA, la herramienta Nightshade permite a los creadores "envenenar" sus imágenes, afectando así gravemente el rendimiento del modelo.
Subramaniam señaló: "Estamos entrando en una era en la que los datos de imágenes de alta calidad son cada vez más escasos." También enfatizó que el uso generalizado de la técnica de envenenamiento de imágenes hace que este desafío sea aún más grave:
"Con el surgimiento de técnicas de ocultación de imágenes y métodos de envenenamiento de datos de entrenamiento con marcas de agua adversariales, los conjuntos de datos de código abierto se enfrentan a un doble desafío en cantidad y credibilidad."
En respuesta a esta situación, Subramaniam indicó que los conjuntos de datos incentivados, verificables y contribuidos por la comunidad "son más valiosos que nunca". Él cree que este tipo de proyectos "no solo pueden servir como una alternativa, sino que también se convertirán en pilares importantes para la alineación de la IA y el rastreo de datos en la economía de datos."
Relación de artículos: Kima se une al sandbox de Mastercard para habilitar la recarga de tarjetas de stablecoin.