Sự hội tụ của AI và Web3 là không thể ngăn cản: Từ khả năng tính toán chia sẻ đến một mô hình mới về khuyến khích dữ liệu.

AI+Web3: Tòa tháp và Quảng trường

TL;DR

  1. Dự án Web3 với khái niệm AI trở thành mục tiêu hút vốn trong thị trường sơ cấp và thứ cấp.

  2. Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng phần thưởng phân tán để phối hợp nguồn cung tiềm năng trong đuôi dài —– qua dữ liệu, lưu trữ và tính toán; đồng thời xây dựng mô hình mã nguồn mở cũng như thị trường phi tập trung cho AI Agent.

  3. AI chủ yếu được sử dụng trong ngành Web3 cho tài chính trên chuỗi ( thanh toán tiền điện tử, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.

  4. Tính hữu ích của AI+Web3 thể hiện ở sự bổ sung cho nhau: Web3 hy vọng chống lại sự tập trung hóa của AI, AI hy vọng giúp Web3 mở rộng ra.

AI+Web3:Tháp và Quảng trường

Giới thiệu

Trong hai năm qua, sự phát triển của AI giống như đã được nhấn nút tăng tốc, hiệu ứng cánh bướm do Chatgpt kích thích không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh sinh mà còn tạo ra một làn sóng trong lĩnh vực Web3.

Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trong thị trường tiền điện tử đang chậm lại rõ rệt. Theo thống kê, chỉ trong nửa đầu năm 2024 đã có 64 dự án Web3+AI hoàn thành huy động vốn, hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt được số tiền huy động cao nhất 100 triệu USD trong vòng A.

Thị trường thứ cấp ngày càng sôi động, trang tổng hợp tiền điện tử Coingecko cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; những tín hiệu tích cực từ tiến bộ công nghệ AI rõ ràng, sau khi OpenAI phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực hút vốn của tiền điện tử là Meme: MemeCoin đầu tiên với khái niệm AI Agent - GOAT nhanh chóng nổi tiếng và đạt được định giá 1,4 tỷ USD, thành công trong việc khơi dậy cơn sốt AI Meme.

Về nghiên cứu và chủ đề AI+Web3 cũng đang rất sôi nổi, từ AI+Depin đến AI Memecoin và hiện tại là AI Agent và AI DAO, cảm xúc FOMO đã không còn theo kịp tốc độ luân chuyển của câu chuyện mới.

AI+Web3, cụm thuật ngữ đầy tiền nóng, cơ hội và ảo tưởng tương lai này, khó tránh khỏi bị người ta coi như một cuộc hôn nhân do vốn đầu tư sắp đặt, dường như chúng ta rất khó phân biệt dưới chiếc áo choàng lộng lẫy này, rốt cuộc đây là sân khấu của những kẻ đầu cơ, hay là đêm trước của sự bùng nổ lúc bình minh?

Để trả lời câu hỏi này, một suy nghĩ quan trọng đối với cả hai bên là liệu có thể trở nên tốt hơn khi có nhau không? Liệu có thể hưởng lợi từ mô hình của nhau không? Trong bài viết này, chúng tôi cũng cố gắng đứng trên vai của những người đi trước để xem xét bức tranh này: Web3 có thể đóng vai trò như thế nào trong từng khâu của công nghệ AI, và AI có thể mang lại điều gì mới mẻ cho Web3?

Phần 1 Web3 có cơ hội gì dưới AI Stack?

Trước khi mở rộng chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:

AI+Web3:Tháp và Quảng Trường

Diễn đạt toàn bộ quá trình bằng ngôn ngữ dễ hiểu hơn: "Mô hình lớn" giống như bộ não của con người, trong giai đoạn đầu, bộ não này thuộc về một em bé mới chào đời, cần quan sát và tiếp nhận lượng thông tin khổng lồ từ môi trường xung quanh để hiểu thế giới này, đó là giai đoạn "thu thập" dữ liệu; do máy tính không có khả năng nhìn, nghe và nhiều giác quan như con người, trước khi huấn luyện, lượng thông tin lớn không có nhãn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.

Sau khi nhập dữ liệu, AI thông qua "huấn luyện" đã xây dựng một mô hình có khả năng hiểu và dự đoán, điều này có thể được coi là quá trình trẻ sơ sinh dần dần hiểu và học hỏi về thế giới xung quanh. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em được điều chỉnh liên tục trong quá trình học tập. Khi nội dung học bắt đầu được phân chia chuyên ngành, hoặc nhận được phản hồi từ việc giao tiếp với con người và được điều chỉnh, thì sẽ bước vào giai đoạn "tinh chỉnh" của mô hình lớn.

Trẻ em dần lớn lên và học nói, sau đó có thể hiểu ý nghĩa và thể hiện cảm xúc cũng như suy nghĩ của mình trong các cuộc đối thoại mới. Giai đoạn này tương tự như "suy diễn" của các mô hình AI lớn, khi mô hình có khả năng dự đoán và phân tích đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh thể hiện cảm xúc, mô tả đối tượng và giải quyết nhiều vấn đề thông qua khả năng ngôn ngữ, điều này cũng tương tự như việc các mô hình AI lớn được áp dụng vào các nhiệm vụ cụ thể trong giai đoạn suy diễn sau khi hoàn tất đào tạo, chẳng hạn như phân loại hình ảnh, nhận diện giọng nói, v.v.

AI Agent thì càng gần với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi mục tiêu phức tạp, không chỉ có khả năng tư duy mà còn có thể ghi nhớ, lập kế hoạch, và có khả năng sử dụng công cụ để tương tác với thế giới.

Hiện tại, để giải quyết các vấn đề đau đầu của AI trong từng lớp, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.

Một, Lớp cơ bản: Airbnb về sức mạnh tính toán và dữ liệu

sức mạnh tính toán

Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết để huấn luyện và suy luận mô hình.

Một ví dụ là, LLAMA3 của Meta cần 16.000 GPU H100 do NVIDIA sản xuất(, đây là một bộ xử lý đồ họa hàng đầu được thiết kế đặc biệt cho trí tuệ nhân tạo và các khối lượng công việc tính toán hiệu suất cao) mất 30 ngày để hoàn thành việc huấn luyện. Giá đơn vị của phiên bản 80GB dao động từ 30.000 đến 40.000 đô la, điều này cần 400-700 triệu đô la đầu tư phần cứng tính toán(GPU + chip mạng), đồng thời, việc huấn luyện hàng tháng cần tiêu thụ 1,6 tỷ kilowatt giờ, chi phí năng lượng hàng tháng gần 20 triệu đô la.

Đối với việc giải nén sức mạnh tính toán AI, đó cũng chính là lĩnh vực đầu tiên mà Web3 giao thoa với AI - DePin( mạng lưới cơ sở hạ tầng vật lý phi tập trung) hiện tại, trang web dữ liệu DePin Ninja đã trưng bày hơn 1400 dự án, trong đó các dự án đại diện cho chia sẻ sức mạnh GPU bao gồm io.net, Aethir, Akash, Render Network và nhiều dự án khác.

Logic chính của nó là: nền tảng cho phép các cá nhân hoặc tổ chức sở hữu tài nguyên GPU nhàn rỗi đóng góp khả năng tính toán của họ theo cách phi tập trung mà không cần xin phép, thông qua một thị trường trực tuyến giữa người mua và người bán tương tự như Uber hoặc Airbnb, tăng cường tỷ lệ sử dụng tài nguyên GPU chưa được khai thác đầy đủ, người dùng cuối cũng vì thế mà có được tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế đặt cọc cũng đảm bảo rằng nếu có sự vi phạm quy trình kiểm soát chất lượng hoặc ngắt kết nối mạng, các nhà cung cấp tài nguyên sẽ bị xử phạt tương ứng.

Đặc điểm của nó là:

  • Tập hợp tài nguyên GPU không sử dụng: Các nguồn cung chủ yếu là tài nguyên tính toán dư thừa của các nhà điều hành trung tâm dữ liệu nhỏ và vừa độc lập bên thứ ba, các mỏ tiền điện tử, v.v., với cơ chế đồng thuận là phần cứng khai thác PoS, như máy khai thác FileCoin và ETH. Hiện tại cũng có những dự án tập trung vào việc khởi động các thiết bị có rào cản gia nhập thấp hơn, chẳng hạn như exolab sử dụng MacBook, iPhone, iPad và các thiết bị địa phương khác để xây dựng mạng lưới tính toán cho việc suy diễn mô hình lớn.

  • Đối mặt với thị trường đuôi dài của sức mạnh tính toán AI:

a. "Về mặt công nghệ", thị trường sức mạnh tính toán phi tập trung phù hợp hơn cho các bước suy luận. Đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu từ GPU quy mô cực lớn, trong khi suy luận yêu cầu hiệu suất tính toán GPU tương đối thấp, như Aethir tập trung vào công việc render độ trễ thấp và ứng dụng suy luận AI.

b. "Về phía nhu cầu" thì các bên có sức mạnh tính toán nhỏ sẽ không tự đào tạo mô hình lớn của riêng họ, mà chỉ chọn tối ưu hóa và tinh chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này đều tự nhiên phù hợp với tài nguyên sức mạnh tính toán phân tán không sử dụng.

  • Quyền sở hữu phi tập trung: Ý nghĩa công nghệ của blockchain nằm ở chỗ người sở hữu tài nguyên luôn giữ quyền kiểm soát đối với tài nguyên, có thể điều chỉnh linh hoạt theo nhu cầu và đồng thời thu được lợi nhuận.

Dữ liệu

Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán giống như bọt nước trôi nổi, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, thậm chí là quan điểm và biểu hiện nhân văn của mô hình. Hiện tại, những khó khăn về nhu cầu dữ liệu của AI chủ yếu tập trung vào bốn lĩnh vực sau:

  • Cơn khát dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào việc nhập vào một lượng lớn dữ liệu. Tài liệu công khai cho thấy, số lượng tham số của OpenAI trong việc huấn luyện GPT-4 đã đạt đến cấp độ hàng nghìn tỷ.

  • Chất lượng dữ liệu: Với sự kết hợp của AI và các ngành công nghiệp, tính kịp thời của dữ liệu, sự đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo lĩnh vực, và việc thu thập các nguồn dữ liệu mới nổi như cảm xúc trên mạng xã hội đã đặt ra những yêu cầu mới đối với chất lượng của nó.

  • Vấn đề quyền riêng tư và tuân thủ: Hiện nay, các quốc gia và doanh nghiệp đang dần nhận thức được tầm quan trọng của các bộ dữ liệu chất lượng cao, và đang áp đặt các hạn chế đối với việc thu thập dữ liệu.

  • Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí nghiên cứu và phát triển của các công ty AI được sử dụng cho việc thu thập và xử lý dữ liệu cơ bản.

Hiện tại, giải pháp web3 được thể hiện ở bốn khía cạnh sau:

  1. Thu thập dữ liệu: Việc cung cấp miễn phí dữ liệu thực tế được thu thập đang nhanh chóng cạn kiệt, chi tiêu của các công ty AI cho dữ liệu đang tăng lên hàng năm. Nhưng đồng thời, chi tiêu này lại không được trả lại cho những người thực sự đóng góp dữ liệu, mà các nền tảng hoàn toàn hưởng lợi từ việc tạo ra giá trị từ dữ liệu.

Cho phép những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, cũng như thông qua mạng lưới phân tán và cơ chế khuyến khích, để có được dữ liệu cá nhân hơn và có giá trị hơn với chi phí thấp, đó là tầm nhìn của Web3.

  • Grass là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút Grass, đóng góp băng thông nhàn rỗi và lưu lượng trung gian để thu thập dữ liệu thời gian thực từ toàn bộ internet, và nhận phần thưởng bằng token;

  • Vana đã giới thiệu một khái niệm độc đáo về bể thanh khoản dữ liệu (DLP), cho phép người dùng tải lên dữ liệu cá nhân của họ ( như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v. ) vào DLP cụ thể và linh hoạt chọn xem có muốn ủy quyền cho bên thứ ba sử dụng những dữ liệu này hay không;

  • Trong PublicAI, người dùng có thể sử dụng #AI或#Web3 làm nhãn phân loại trên X và @PublicAI để thực hiện việc thu thập dữ liệu.

  1. Xử lý dữ liệu: Trong quá trình xử lý dữ liệu của AI, do dữ liệu thu thập thường bị nhiễu và chứa lỗi, nên trước khi đào tạo mô hình, cần phải làm sạch và chuyển đổi chúng thành định dạng có thể sử dụng, bao gồm các nhiệm vụ tiêu chuẩn hóa, lọc và xử lý giá trị thiếu. Giai đoạn này là một trong số ít các bước thủ công trong ngành AI, đã phát triển thành ngành công nghiệp người đánh dấu dữ liệu. Khi yêu cầu chất lượng dữ liệu của mô hình tăng lên, tiêu chuẩn cho người đánh dấu dữ liệu cũng tăng theo, và nhiệm vụ này tự nhiên phù hợp với cơ chế khuyến khích phi tập trung của Web3.
  • Hiện tại, Grass và OpenLayer đều đang xem xét việc tham gia vào giai đoạn quan trọng là gán nhãn dữ liệu.

  • Synesis đã đưa ra khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận được phần thưởng bằng cách cung cấp dữ liệu được gán nhãn, chú thích hoặc các hình thức đầu vào khác.

  • Dự án gán nhãn dữ liệu Sapien đã biến nhiệm vụ gán nhãn thành trò chơi, và cho phép người dùng staking điểm để kiếm thêm điểm.

  1. Quyền riêng tư và an ninh dữ liệu: Cần làm rõ rằng quyền riêng tư dữ liệu và an ninh dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi an ninh dữ liệu bảo vệ thông tin dữ liệu khỏi việc truy cập, phá hoại và đánh cắp trái phép. Do đó, lợi thế về công nghệ quyền riêng tư Web3 và các kịch bản ứng dụng tiềm năng được thể hiện ở hai khía cạnh: (1) đào tạo dữ liệu nhạy cảm; (2) hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu có thể cùng tham gia đào tạo AI mà không cần chia sẻ dữ liệu gốc của họ.

Công nghệ bảo mật phổ biến trong Web3 hiện nay bao gồm:

  • Môi trường thực thi đáng tin cậy(TEE), chẳng hạn như Super Protocol;

  • Mã hóa đồng nhất hoàn toàn ( FHE ), chẳng hạn như BasedAI, Fhenix.io hoặc Inco Network;

  • Công nghệ zero-knowledge ( zk ), như giao thức Reclaim sử dụng công nghệ zkTLS, tạo ra chứng minh zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập hoạt động, danh tiếng và dữ liệu danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.

Tuy nhiên, hiện tại lĩnh vực này vẫn đang ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, một trong những khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:

  • Khung zkML EZKL cần khoảng 80 phút để tạo ra một chứng minh cho mô hình 1M-nanoGPT.

  • Theo dữ liệu của Modulus Labs, chi phí của zkML cao hơn 1000 lần so với tính toán thuần túy.

  1. Lưu trữ dữ liệu: Có dữ liệu rồi, chúng ta cần một nơi để lưu trữ dữ liệu trên chuỗi, cũng như LLM được tạo ra từ dữ liệu đó. Vấn đề cốt lõi là khả năng sẵn có của dữ liệu (DA), trước khi nâng cấp Danksharding của Ethereum, thông lượng của nó là 0.08MB. Trong khi đó, việc đào tạo mô hình AI và suy luận thời gian thực thường cần từ 50 đến 100GB dữ liệu mỗi giây. Sự chênh lệch về quy mô này khiến các giải pháp trên chuỗi hiện tại trở nên bất lực khi đối mặt với "các ứng dụng AI đòi hỏi tài nguyên".
  • 0g.AI là dự án đại diện cho loại này. Nó là một dự án nhắm đến
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
wagmi_eventuallyvip
· 17giờ trước
Lại đến lúc được chơi cho Suckers rồi
Xem bản gốcTrả lời0
GasWastervip
· 17giờ trước
bruh l2s có thể thực sự cứu ai khỏi việc trở thành một cơn ác mộng gas ngầu...
Xem bản gốcTrả lời0
consensus_whisperervip
· 17giờ trước
Chỉ là sự thổi phồng thôi, cái tiếp theo.
Xem bản gốcTrả lời0
OPsychologyvip
· 17giờ trước
啧 bẫy mới thôi
Xem bản gốcTrả lời0
BearMarketBarbervip
· 17giờ trước
Đều chỉ đang thổi phồng khái niệm để kiếm tiền thôi~
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)