Децентрализация OORT AI данные вышли на передовые позиции на Google Kaggle

Источник: Cointelegraph Исходный текст: «Децентрализованные данные OORT AI входят в число лучших на Google Kaggle»

Набор данных для обучения искусственного интеллекта, разработанный дистрибутивным поставщиком решений AI OORT, добился значительного успеха на платформе Kaggle от Google.

Список наборов данных "Diverse Tools Kaggle" от OORT был опубликован в начале апреля; с тех пор он поднялся на главную страницу в нескольких категориях. Kaggle — это онлайн-платформа, принадлежащая Google, для соревнований по Data Science и машинному обучению, обучения и сотрудничества.

Ключевой участник проекта OpenLedger по криптоискусственному интеллекту Рамкумар Субраманиам сообщил Cointelegraph: "Рейтинг на главной странице Kaggle является мощным социальным сигналом, который показывает, что этот набор данных привлекает активное участие ключевых сообществ, таких как специалисты по данным, инженеры машинного обучения и профессионалы."

Основатель и CEO OORT Макс Ли сообщил Cointelegraph, что компания "наблюдала обнадеживающие показатели участия, которые подтверждают, что" собранные через децентрализованную модель тренировочные данные" действительно имеют ранний рыночный спрос и актуальность". Он добавил:

"Спонтанный интерес со стороны сообщества, включая активное использование и вклад, ясно демонстрирует, как распределенные, управляемые сообществом каналы данных, такие как OORT, могут обеспечить быструю дистрибуцию и широкое участие без зависимости от централизованных посредников."

Ли также сказал, что OORT планирует выпустить несколько наборов данных в ближайшие месяцы. К ним относятся наборы данных голосовых команд в автомобиле, наборы данных голосовых команд умного дома и наборы данных видео с дипфейками, предназначенные для улучшения проверки подлинности медиафайлов на основе искусственного интеллекта.

Cointelegraph независимо подтвердил, что вышеупомянутый набор данных ранее в этом месяце успешно попал на главную страницу в категориях общего ИИ, розничной торговли и покупок, производства и инженерии на Kaggle. На момент публикации данный набор данных больше не занимает этих рангов после одного не относящегося к делу обновления 6 мая и еще одного обновления 14 мая.

Хотя он признает это достижение, Субраманиам заявил Cointelegraph, что "это не является решающим показателем фактической реализации или качества на уровне предприятий." Он отметил, что уникальность набора данных OORT "заключается не только в рейтинге, но и в каналах источников и механизмах стимулов, стоящих за набором данных." Он далее объяснил:

"В отличие от централизованных поставщиков, которые могут полагаться на непрозрачные процессы, прозрачная система, основанная на токенных стимулах, может обеспечить возможность отслеживания, совместного управления сообществом и постоянной оптимизации, при условии, что будет установлена соответствующая структура управления."

Партнер венчурной компании по инвестициям в искусственный интеллект Generative Ventures Лекс Соколин заявил, что, хотя он считает, что эти результаты несложно воспроизвести, "это действительно доказывает, что криптопроекты могут использовать механизмы децентрализованного стимулирования для организации экономически ценных действий."

Согласно данным исследовательского института искусственного интеллекта Epoch AI, ожидается, что текстовые данные для обучения ИИ, созданные людьми, иссякнут к 2028 году. Давление стало настолько большим, что инвесторы сейчас способствуют сделкам для получения прав на использование материалов, защищенных авторским правом, для компаний ИИ.

Исследовательский отчет о нехватке данных для обучения ИИ и том, как это может ограничивать развитие этой области, циркулирует уже много лет. Хотя синтетические ( ИИ-генерируемые ) данные все шире применяются и демонстрируют определенные успехи, данные, созданные человеком, по-прежнему широко рассматриваются как более предпочтительный выбор, поскольку такие высококачественные данные могут привести к созданию более производительных моделей ИИ.

В области обучения изображений с использованием ИИ ситуация становится все более сложной, художники сознательно подрывают процесс обучения. Для защиты своих работ от несанкционированного использования в обучении ИИ инструмент Nightshade позволяет создателям "отравлять" свои изображения, что серьезно влияет на производительность модели.

Субраманиам отметил: "Мы вступаем в эпоху, когда высококачественные данные изображений становятся все более дефицитными." Он также подчеркнул, что широкое применение технологий отравления изображений делает эту проблему еще более серьезной:

"С ростом технологий скрытия изображений и методов отравления обучения ИИ, таких как атакующие водяные знаки, открытые наборы данных сталкиваются с двойным вызовом: количеством и надежностью."

В условиях этой ситуации Субраманиам заявил, что проверяемые и предоставленные сообществом наборы данных "имеют большую ценность, чем когда-либо прежде". Он считает, что такие проекты "не только могут служить альтернативой, но и станут важными опорами выравнивания ИИ и отслеживания данных в экономике данных."

Рекомендуемые материалы: Kima присоединилась к песочнице Mastercard для реализации пополнения карт стейблкоинов

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить