Новая эра слияния AI и Web3: стимулы длинного хвоста и рынок моделей с открытым исходным кодом

AI+Web3: Башни и площади

Краткие моменты

  1. Проекты Web3 с концепцией ИИ стали объектами привлечения капитала на первичном и вторичном рынках.

  2. Возможности Web3 в AI-индустрии проявляются в: использовании распределенных стимулов для координации потенциального предложения в длинном хвосте ( через данные, хранение и вычисления ); в то же время создавая открытые модели и децентрализованный рынок AI-агентов.

  3. ИИ в индустрии Web3 в основном используется для цепочечных финансов ( криптоплатежей, торговли, анализа данных ) и вспомогательной разработки.

  4. Эффективность AI+Web3 проявляется в их взаимодополняемости: Web3 обещает противостоять централизации AI, а AI, в свою очередь, может помочь Web3 выйти за рамки.

Введение

За последние два года развитие ИИ словно было запущено на ускорение; этот эффект бабочки, вызванный Chatgpt, не только открыл новый мир генеративного искусственного интеллекта, но и вызвал мощный поток в области Web3.

Под воздействием концепции ИИ финансирование на замедляющемся рынке криптовалют заметно увеличилось. По данным СМИ, только в первой половине 2024 года 64 проекта Web3+AI завершили финансирование, а основанная на искусственном интеллекте операционная система Zyber365 достигла максимального объема финансирования в 100 миллионов долларов на раунде A.

Вторичный рынок стал более процветающим, данные с сайтов агрегаторов криптовалют показывают, что всего за чуть больше года общая рыночная капитализация в области ИИ достигла 48,5 миллиарда долларов, а объем торгов за последние 24 часа составил почти 8,6 миллиарда долларов; положительные результаты, связанные с прогрессом в основных технологиях ИИ, очевидны: после выпуска модели OpenAI Sora для преобразования текста в видео средняя цена в секторе ИИ выросла на 151%; эффект ИИ также распространился на один из сегментов криптовалют, привлекающих инвестиции, Meme: первый мем-криптовалюта с концепцией AI Agent - GOAT быстро стал популярным и получил оценку в 1,4 миллиарда долларов, успешно создав бум AI Meme.

Исследования и темы, связанные с AI+Web3, также горячо обсуждаются, от AI+DePIN до AI Memecoin и, наконец, к текущим AI Agent и AI DAO, эмоции FOMO уже не успевают за скоростью смены новых нарративов.

AI+Web3, эта комбинация терминов, наполненная горячими деньгами, трендами и фантазиями о будущем, неизбежно воспринимается как организованный брак, заключенный капиталом, и нам, похоже, трудно различить, под этой роскошной одеждой, на самом деле ли это поле для спекулянтов или предрассветная ночь взрыва?

Чтобы ответить на этот вопрос, ключевым размышлением для обеих сторон является то, станет ли лучше с другой стороной? Можем ли мы извлечь выгоду из модели другой стороны? В этой статье мы также пытаемся взглянуть на эту картину с плеч предшественников: как Web3 может играть роль на всех этапах стека технологий AI, и какую новую жизнь AI может принести Web3?

! AI+Web3: Башни и площади

Часть 1. Какие возможности предоставляет Web3 в рамках AI-стека?

Перед тем как развивать эту тему, нам нужно понять технологический стек больших моделей ИИ:

Говоря более простым языком, весь процесс можно описать так: «Большая модель» подобна человеческому мозгу, на ранних стадиях этот мозг принадлежит только что появившемуся на свет младенцу, который должен наблюдать и впитывать огромное количество информации из окружающего мира, чтобы понять этот мир — это этап «сбор данных»; поскольку компьютеры не обладают зрением, слухом и другими чувствами, на этапе обучения большая масса неразмеченной информации из внешней среды должна быть преобразована через «предобработку» в формат информации, который может быть понятен компьютеру и пригоден для использования.

После ввода данных ИИ создает модель с пониманием и предсказательной способностью через «обучение», что можно рассматривать как процесс постепенного понимания и обучения ребенка внешнему миру. Параметры модели подобны языковым навыкам, которые ребенок постоянно корректирует в процессе обучения. Когда содержание обучения начинает специализироваться или происходит общение с людьми, получая обратную связь и исправления, это переходит в этап «доработки» большой модели.

Дети, постепенно подрастая и научившись говорить, начинают понимать смысл и выражать свои чувства и мысли в новых диалогах. Этот этап похож на «вывод» в больших моделях ИИ, где модель может предсказывать и анализировать новые языковые и текстовые вводы. Младенцы выражают свои чувства с помощью языковых навыков, описывают предметы и решают различные проблемы, что также похоже на применение больших моделей ИИ в фазе вывода для выполнения различных специфических задач, таких как классификация изображений, распознавание речи и т. д.

AI-агент становится более близким к следующей форме большого моделирования - способным самостоятельно выполнять задачи и стремиться к сложным целям, обладая не только способностью к размышлению, но и памятью, планированием, а также возможностью использовать инструменты для взаимодействия с миром.

В настоящее время, в ответ на болевые точки AI на различных уровнях, Web3 в настоящее время предварительно сформировал многоуровневую, взаимосвязанную экосистему, охватывающую все этапы процесса моделей AI.

! AI+Web3: Башни и площади

Один. Базовый уровень: Airbnb для вычислительной мощности и данных

Хэшрейт

В настоящее время одной из самых высоких затрат на ИИ является вычислительная мощность и энергия, необходимые для обучения модели и вывода модели.

Один из примеров заключается в том, что крупная технологическая компания требует 16 000 высокопроизводительных графических процессоров, произведенных одним из производителей GPU, для завершения обучения своей большой языковой модели за 30 дней. Цена за 80 ГБ версию варьируется от 30 000 до 40 000 долларов, что требует инвестиций в вычислительное оборудование в размере от 400 до 700 миллионов долларов (GPU+сетевые чипы), в то время как ежемесячное обучение требует 1,6 миллиарда киловатт-часов, а расходы на энергию составляют почти 20 миллионов долларов в месяц.

Разгрузка вычислительных мощностей ИИ является одной из самых ранних пересечений Web3 и ИИ - DePIN( децентрализованные сети физической инфраструктуры) в настоящее время соответствующие веб-сайты данных уже представили более 1400 проектов, среди которых проекты по совместному использованию мощности GPU включают несколько известных платформ.

Основная логика заключается в том, что платформа позволяет индивидуумам или организациям, обладающим неиспользуемыми GPU-ресурсами, вносить свой вычислительный потенциал в децентрализованной форме без необходимости получения разрешений. Это создает онлайн-рынок для покупателей и продавцов, похожий на Uber или Airbnb, и повышает коэффициент использования недостаточно задействованных GPU-ресурсов. Конечные пользователи также получают более доступные и эффективные вычислительные ресурсы; в то же время механизм стейкинга гарантирует, что в случае нарушения механизмов контроля качества или прерывания сети поставщики ресурсов будут подвергнуты соответствующим санкциям.

Его особенности заключаются в том, что:

  • Сбор неиспользуемых ресурсов GPU: поставщиками в основном являются независимые центры обработки данных среднего и малого размера от третьих лиц, избыточные вычислительные ресурсы операторов криптодобычи и т.д., а также оборудование для майнинга с механизмом консенсуса PoS, такое как майнеры FileCoin и ETH. В настоящее время также есть проекты, стремящиеся запустить устройства с более низкими барьерами для входа, такие как использование локальных устройств, таких как MacBook, iPhone, iPad и т.д., для создания сети вычислительных ресурсов для выполнения вывода больших моделей.

  • В условиях долгосрочного рынка вычислительной мощности ИИ:

a. С точки зрения технологий, децентрализованный рынок вычислительной мощности более подходит для этапов вывода. Обучение в большей степени зависит от возможностей обработки данных, предоставляемых GPU огромных кластеров, в то время как вывод требует относительно меньшей вычислительной мощности GPU, как это происходит на некоторых платформах, сосредоточенных на рендеринге с низкой задержкой и приложениях ИИ для вывода.

b. С точки зрения спроса, малые и средние потребители вычислительных мощностей не будут самостоятельно обучать свои большие модели, а просто выберут оптимизацию и дообучение вокруг нескольких ведущих больших моделей, и эти сценарии естественно подходят для распределенных неиспользуемых вычислительных ресурсов.

  • Децентрализованная собственность: Технологическое значение блокчейна заключается в том, что владельцы ресурсов всегда сохраняют контроль над своими ресурсами, гибко адаптируя их в зависимости от спроса и одновременно получая доход.

Данные

Данные являются основой ИИ. Без данных вычисления будут бессмысленны, как водоросли на поверхности воды, а связь между данными и моделью напоминает пословицу "Мусор на входе, мусор на выходе". Количество данных и качество ввода определяют качество вывода окончательной модели. Для обучения современных ИИ-моделей данные определяют языковые способности модели, способности к пониманию, а также ее ценности и человечность. В настоящее время проблемы с потребностями ИИ в данных в основном сосредоточены на следующих четырех аспектах:

  • Жажда данных: Обучение моделей ИИ зависит от большого объема входных данных. Открытые данные показывают, что параметры языковой модели, обученной известной компанией ИИ, достигли триллионов.

  • Качество данных: с интеграцией ИИ в различные отрасли возникают новые требования к качеству данных, такие как актуальность данных, разнообразие данных, профессионализм специализированных данных и включение новых источников данных, таких как эмоции из социальных медиа.

  • Проблемы конфиденциальности и соблюдения: В настоящее время различные страны и компании постепенно осознают важность качественных наборов данных и вводят ограничения на сбор данных.

  • Высокие затраты на обработку данных: большой объем данных, сложный процесс обработки. Согласно открытым данным, более 30% затрат на исследования и разработки в AI-компаниях идет на сбор и обработку базовых данных.

В настоящее время решения web3 реализованы в следующих четырех аспектах:

  1. Сбор данных: количество доступных бесплатных реальных данных для сбора стремительно истощается, и расходы компаний ИИ на данные растут с каждым годом. Однако, одновременно с этим, эти расходы не возвращаются к настоящим вкладчикам данных, и платформы полностью наслаждаются созданием ценности, которую предоставляют данные. Например, одна социальная платформа заработала в общей сложности 203 миллиона долларов, подписав соглашение о лицензировании данных с компаниями ИИ.

Позволить действительно вносящим вклад пользователям также участвовать в создании ценности, связанной с данными, а также получать более личные и более ценные данные от пользователей с низкими затратами через распределенные сети и механизмы стимулов — это видение Web3.

  • Некоторые платформы представляют собой децентрализованный уровень данных и сеть, где пользователи могут запускать узлы, вносить вклад в неиспользуемую полосу пропускания и ретранслировать трафик для захвата данных в реальном времени из всего интернета и получать токен-вознаграждения;

  • Некоторые платформы внедрили уникальную концепцию пулов ликвидности данных (DLP), где пользователи могут загружать свои личные данные (, такие как записи покупок, привычки просмотра, активность в социальных сетях и т. д. ) в определенный DLP и гибко выбирать, разрешать ли использование этих данных конкретным третьим лицам;

  • На некоторых платформах пользователи могут использовать определенные теги и @платформу в социальных сетях для сбора данных.

  1. Предобработка данных: В процессе обработки данных ИИ, поскольку собранные данные обычно шумные и содержат ошибки, их необходимо очистить и преобразовать в пригодный формат перед обучением модели, что включает в себя стандартизацию, фильтрацию и обработку недостающих значений в повторяющихся задачах. Этот этап является одним из немногих ручных процессов в индустрии ИИ, что породило профессию аннотаторов данных, и по мере повышения требований модели к качеству данных, порог вхождения аннотаторов данных также увеличивается, а эта задача естественно подходит для децентрализованных механизмов вознаграждения Web3.
  • В настоящее время несколько платформ рассматривают возможность добавления этого ключевого этапа - аннотирования данных.

  • Некоторые проекты предложили концепцию «Train2earn», подчеркивающую качество данных, пользователи могут получить вознаграждение, предоставляя аннотированные данные, комментарии или другие формы ввода.

  • Проект по аннотированию данных превратит задачи разметки в игру и позволит пользователям ставить очки, чтобы заработать больше очков.

  1. Конфиденциальность и безопасность данных: важно уточнить, что конфиденциальность и безопасность данных — это два разных понятия. Конфиденциальность данных касается обработки чувствительной информации, тогда как безопасность данных защищает информацию от несанкционированного доступа, разрушения и кражи. Таким образом, преимущества технологий конфиденциальности Web3 и потенциальные области применения проявляются в двух аспектах: (1) обучение чувствительных данных; (2) сотрудничество данных: несколько владельцев данных могут совместно участвовать в обучении ИИ, не делясь своими исходными данными.

Текущие распространенные технологии конфиденциальности в Web3 включают:

  • Достоверная исполняемая среда(TEE)

  • Полностью гомоморфное шифрование(FHE)

  • Технология нулевых знаний ( zk ), такая как некоторые протоколы, использующие технологию zkTLS, генерирует нулевое доказательство HTTPS-трафика, позволяя пользователям безопасно импортировать активы, репутацию и данные идентификации с внешних сайтов, не раскрывая конфиденциальную информацию.

Тем не менее, в настоящее время эта область все еще находится на ранней стадии, большинство проектов все еще находятся в стадии исследования, текущая проблема заключается в слишком высоких вычислительных затратах, некоторые примеры:

  • Некоторому zkML фрейму требуется около 80 минут для генерации доказательства модели 1M-nanoGPT.

  • Согласно данным одной лаборатории, затраты на zkML превышают затраты на чистые вычисления более чем в 1000 раз.

  1. Хранение данных: после получения данных необходимо место для хранения данных в блокчейне, а также LLM, созданной с использованием этих данных. Основная проблема заключается в доступности данных (DA): до обновления Danksharding на Ethereum его пропускная способность составляла 0.08 МБ. В то же время для обучения AI-моделей и реального вывода обычно требуется пропускная способность данных от 50 до 100 ГБ в секунду. Такой разрыв в масштабах делает существующие решения на блокчейне неэффективными в условиях "ресурсоемких AI-приложений".
  • Некоторые платформы являются представителями этой категории. Это централизованное решение для хранения, разработанное для высокопроизводительных требований ИИ, его ключевые особенности включают: высокая
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Поделиться
комментарий
0/400
MoonBoi42vip
· 16м назад
Инновации движутся вперед
Посмотреть ОригиналОтветить0
GateUser-bd883c58vip
· 21ч назад
Будущее выглядит многообещающе
Посмотреть ОригиналОтветить0
BearMarketBardvip
· 21ч назад
Поговорим, когда будет бычий рынок.
Посмотреть ОригиналОтветить0
GasFeeBarbecuevip
· 21ч назад
炒作 разыгрывайте людей как лохов снова пришло
Посмотреть ОригиналОтветить0
PumpingCroissantvip
· 21ч назад
Рационально смотреть на эту тенденцию
Посмотреть ОригиналОтветить0
AirdropHunterXMvip
· 21ч назад
бычий этот сектор
Посмотреть ОригиналОтветить0
PebbleHandervip
· 21ч назад
Светлый путь впереди
Посмотреть ОригиналОтветить0
BearMarketBuyervip
· 21ч назад
Медвежий рынок безстрашные идут вперед
Посмотреть ОригиналОтветить0
  • Закрепить