Dự án Web3 về khái niệm AI trở thành mục tiêu thu hút vốn trên thị trường sơ cấp và thứ cấp.
Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng động lực phân phối để phối hợp các nhà cung cấp tiềm năng trong đuôi dài ( qua dữ liệu, lưu trữ và tính toán ); đồng thời xây dựng mô hình mã nguồn mở cũng như thị trường phi tập trung cho AI Agent.
AI chủ yếu được sử dụng trong ngành Web3 cho tài chính trên chuỗi ( thanh toán mã hóa, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.
Tính hữu ích của AI+Web3 thể hiện ở sự bổ sung giữa hai bên: Web3 có triển vọng chống lại sự tập trung của AI, AI có triển vọng giúp Web3 vượt ra ngoài giới hạn.
Giới thiệu
Trong hai năm qua, sự phát triển của AI giống như đã bị nhấn nút tăng tốc, hiệu ứng cánh bướm do Chatgpt kích thích không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh ra mà còn tạo ra một làn sóng trong lĩnh vực Web3.
Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trên thị trường tiền mã hóa có dấu hiệu phục hồi rõ rệt so với sự chậm lại. Các phương tiện truyền thông thống kê, chỉ trong nửa đầu năm 2024, đã có 64 dự án Web3+AI hoàn thành việc huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt mức huy động vốn cao nhất 100 triệu USD trong vòng A.
Thị trường thứ cấp phát triển mạnh mẽ hơn, dữ liệu từ các trang tổng hợp tiền điện tử cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; những tiến bộ công nghệ AI chính thống mang lại nhiều lợi ích rõ rệt, sau khi OpenAI phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; Hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực thu hút tiền điện tử là Meme: MemeCoin đầu tiên có khái niệm AI Agent - GOAT nhanh chóng trở nên nổi tiếng và đạt được định giá 1,4 tỷ USD, thành công khơi dậy cơn sốt AI Meme.
Nghiên cứu và chủ đề về AI+Web3 cũng đang rất hot, từ AI+DePIN đến AI Memecoin rồi đến AI Agent và AI DAO hiện tại, cảm xúc FOMO đã không còn theo kịp tốc độ thay đổi của các câu chuyện mới.
AI+Web3, tổ hợp thuật ngữ đầy tiền nóng, cơ hội và tưởng tượng về tương lai này, khó tránh khỏi bị người ta coi như một cuộc hôn nhân do vốn đầu tư sắp đặt, chúng ta dường như rất khó phân biệt dưới chiếc áo choàng lộng lẫy này, rốt cuộc đây là sân khấu của những kẻ đầu cơ, hay là đêm trước của sự bùng nổ?
Để trả lời câu hỏi này, một suy nghĩ then chốt cho cả hai bên là liệu có thể trở nên tốt hơn khi có nhau không? Có thể hưởng lợi từ mô hình của nhau không? Trong bài viết này, chúng tôi cũng cố gắng đứng trên vai những người đi trước để xem xét cấu trúc này: Web3 có thể đóng vai trò như thế nào trong từng khía cạnh của công nghệ AI, và AI có thể mang lại điều gì mới mẻ cho Web3?
Phần 1: Cơ hội nào cho Web3 dưới AI Stack?
Trước khi đi vào chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:
Diễn đạt toàn bộ quá trình bằng ngôn ngữ đơn giản hơn: "Mô hình lớn" giống như bộ não của con người. Ở giai đoạn đầu, bộ não này thuộc về em bé vừa mới chào đời, cần quan sát và tiếp nhận khối lượng thông tin khổng lồ từ thế giới xung quanh để hiểu về thế giới. Đây là giai đoạn "thu thập" dữ liệu; do máy tính không có khả năng nhìn và nghe như con người, trước khi huấn luyện, thông tin không có nhãn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.
Sau khi nhập dữ liệu, AI thông qua "đào tạo" để xây dựng một mô hình có khả năng hiểu và dự đoán, có thể coi đây là quá trình trẻ sơ sinh dần dần hiểu và học hỏi thế giới bên ngoài. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ sơ sinh được điều chỉnh liên tục trong quá trình học tập. Khi nội dung học bắt đầu phân khoa, hoặc giao tiếp với người khác để nhận phản hồi và sửa đổi, thì bước vào giai đoạn "tinh chỉnh" của mô hình lớn.
Trẻ em dần lớn lên, khi biết nói, sẽ có thể hiểu ý nghĩa và diễn đạt cảm xúc cũng như suy nghĩ của mình trong những cuộc đối thoại mới. Giai đoạn này giống như "suy diễn" của các mô hình AI lớn, khi mô hình có khả năng dự đoán và phân tích các đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh thông qua khả năng ngôn ngữ để diễn đạt cảm xúc, mô tả đối tượng và giải quyết các vấn đề khác nhau, điều này cũng tương tự như việc các mô hình AI lớn được áp dụng vào các nhiệm vụ cụ thể sau khi hoàn thành đào tạo và đưa vào sử dụng, chẳng hạn như phân loại hình ảnh, nhận diện giọng nói, v.v.
AI Agent gần gũi hơn với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi các mục tiêu phức tạp, không chỉ có khả năng suy nghĩ mà còn có khả năng ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.
Hiện tại, để giải quyết các vấn đề của AI trong các lớp khác nhau, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.
Một, Lớp cơ bản: Airbnb về sức mạnh tính toán và dữ liệu
Công suất
Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết cho việc đào tạo mô hình và suy luận mô hình.
Một ví dụ là, một mô hình ngôn ngữ lớn của một gã khổng lồ công nghệ cần 16.000 GPU cao cấp do một nhà sản xuất GPU sản xuất trong 30 ngày để hoàn thành việc huấn luyện. Giá đơn vị của phiên bản 80GB dao động từ 30.000 đến 40.000 đô la, điều này yêu cầu đầu tư phần cứng tính toán từ 400 triệu đến 700 triệu đô la (GPU+chip mạng ), trong khi đó, việc huấn luyện hàng tháng cần tiêu thụ 1,6 tỷ kWh, chi phí năng lượng mỗi tháng gần 20 triệu đô la.
Đối với việc giải phóng sức mạnh tính toán AI, đây chính là lĩnh vực giao thoa đầu tiên giữa Web3 và AI - DePIN( mạng lưới cơ sở hạ tầng vật lý phi tập trung) hiện tại, các trang web dữ liệu liên quan đã liệt kê hơn 1400 dự án, trong đó các dự án chia sẻ sức mạnh GPU tiêu biểu bao gồm nhiều nền tảng nổi tiếng.
Logic chính của nó là: Nền tảng cho phép cá nhân hoặc thực thể sở hữu tài nguyên GPU nhàn rỗi đóng góp khả năng tính toán của họ theo cách phi tập trung không cần cấp phép, thông qua một thị trường trực tuyến giữa người mua và người bán tương tự như Uber hoặc Airbnb, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được khai thác. Người dùng cuối cũng vì vậy mà có được nguồn tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế đặt cọc cũng đảm bảo rằng nếu xảy ra vi phạm cơ chế kiểm soát chất lượng hoặc gián đoạn mạng, người cung cấp tài nguyên sẽ phải chịu hình phạt tương ứng.
Đặc điểm của nó là:
Tập trung tài nguyên GPU nhàn rỗi: Các nhà cung cấp chủ yếu là các trung tâm dữ liệu độc lập vừa và nhỏ bên thứ ba, các nhà khai thác mỏ tiền điện tử và các nguồn tài nguyên tính toán thừa, phần cứng khai thác có cơ chế đồng thuận PoS, như máy khai thác FileCoin và ETH. Hiện tại cũng có các dự án tập trung vào việc khởi động các thiết bị có ngưỡng đầu vào thấp hơn, chẳng hạn như sử dụng MacBook, iPhone, iPad và các thiết bị địa phương khác để thiết lập mạng lưới tính toán cho việc suy diễn mô hình lớn.
Đối mặt với thị trường đuôi dài của sức mạnh tính toán AI:
a. "Về mặt kỹ thuật" thị trường sức mạnh tính toán phi tập trung phù hợp hơn cho các bước suy luận. Đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu do GPU quy mô siêu lớn mang lại, trong khi suy luận có yêu cầu hiệu suất tính toán GPU tương đối thấp, như một số nền tảng tập trung vào công việc kết xuất độ trễ thấp và các ứng dụng suy luận AI.
b. "Về phía nhu cầu" thì các bên có sức mạnh tính toán nhỏ sẽ không tự huấn luyện mô hình lớn của riêng mình, mà chỉ chọn tối ưu hóa, điều chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này tự nhiên phù hợp với tài nguyên tính toán nhàn rỗi phân tán.
Quyền sở hữu phi tập trung: Ý nghĩa kỹ thuật của blockchain là các chủ sở hữu tài nguyên luôn giữ quyền kiểm soát đối với tài nguyên, linh hoạt điều chỉnh theo nhu cầu và đồng thời thu lợi nhuận.
Dữ liệu
Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán sẽ như bèo trôi, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo các mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu, thậm chí là giá trị quan và biểu hiện nhân văn của mô hình. Hiện tại, cuộc khủng hoảng nhu cầu dữ liệu của AI chủ yếu tập trung vào bốn khía cạnh sau:
Cơn khát dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào việc nhập vào một lượng lớn dữ liệu. Tài liệu công khai cho thấy, một công ty AI nổi tiếng đã huấn luyện mô hình ngôn ngữ lớn với số lượng tham số đạt tới hàng nghìn tỷ.
Chất lượng dữ liệu: Với sự kết hợp của AI và các ngành, tính kịp thời của dữ liệu, sự đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo ngành, việc tiếp nhận các nguồn dữ liệu mới như cảm xúc trên mạng xã hội đã đặt ra những yêu cầu mới đối với chất lượng của nó.
Vấn đề về quyền riêng tư và tuân thủ: Hiện nay, các quốc gia và doanh nghiệp đang dần nhận thức được tầm quan trọng của các tập dữ liệu chất lượng, và đang áp dụng các hạn chế đối với việc thu thập dữ liệu.
Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí nghiên cứu và phát triển của các công ty AI được sử dụng cho việc thu thập và xử lý dữ liệu cơ bản.
Hiện tại, giải pháp web3 được thể hiện qua bốn khía cạnh sau:
Thu thập dữ liệu: Việc cung cấp miễn phí dữ liệu thế giới thực đang nhanh chóng cạn kiệt, chi phí mà các công ty AI chi trả cho dữ liệu ngày càng tăng theo từng năm. Nhưng đồng thời, chi phí này không được quay trở lại cho những người đóng góp thực sự của dữ liệu, các nền tảng hoàn toàn tận hưởng giá trị tạo ra từ dữ liệu, như một nền tảng xã hội nào đó đã đạt doanh thu tổng cộng 203 triệu USD thông qua các thỏa thuận cấp phép dữ liệu với các công ty AI.
Web3 có tầm nhìn là để những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, và thông qua mạng lưới phân tán cùng với cơ chế khuyến khích, có được dữ liệu cá nhân hơn và có giá trị hơn từ người dùng với chi phí thấp.
Một số nền tảng là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút, đóng góp băng thông nhàn rỗi và tiếp nhận lưu lượng để thu thập dữ liệu thời gian thực từ toàn bộ internet và nhận phần thưởng token;
Một số nền tảng đã giới thiệu khái niệm hồ dữ liệu độc đáo (DLP), người dùng có thể tải lên dữ liệu cá nhân của họ ( như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v. ) vào DLP cụ thể và linh hoạt chọn xem có cho phép các bên thứ ba cụ thể sử dụng dữ liệu này hay không;
Trên một số nền tảng, người dùng có thể sử dụng các thẻ cụ thể trên mạng xã hội và @nền tảng để thu thập dữ liệu.
Tiền xử lý dữ liệu: Trong quá trình xử lý dữ liệu của AI, do dữ liệu thu thập thường ồn ào và chứa lỗi, nó phải được làm sạch và chuyển đổi thành định dạng có thể sử dụng trước khi đào tạo mô hình, liên quan đến các nhiệm vụ lặp đi lặp lại như chuẩn hóa, lọc và xử lý giá trị thiếu. Giai đoạn này là một trong số ít các bước thủ công trong ngành AI, đã phát sinh ra ngành công nghiệp người đánh dấu dữ liệu; khi yêu cầu về chất lượng dữ liệu của mô hình ngày càng cao, tiêu chuẩn đối với người đánh dấu dữ liệu cũng theo đó tăng lên, và nhiệm vụ này phù hợp một cách tự nhiên với cơ chế khuyến khích phi tập trung của Web3.
Hiện nay, nhiều nền tảng đang xem xét việc tham gia vào giai đoạn quan trọng này là gán nhãn dữ liệu.
Một số dự án đã đưa ra khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận phần thưởng bằng cách cung cấp dữ liệu được gán nhãn, chú thích hoặc các hình thức đầu vào khác.
Dự án đánh dấu dữ liệu sẽ gam hóa các nhiệm vụ đánh dấu và cho phép người dùng đặt cọc điểm để kiếm thêm điểm.
Quyền riêng tư và an ninh dữ liệu: Cần làm rõ rằng quyền riêng tư và an ninh dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi an ninh dữ liệu bảo vệ thông tin dữ liệu khỏi việc truy cập, phá hoại và đánh cắp trái phép. Do đó, lợi thế công nghệ quyền riêng tư Web3 và các ứng dụng tiềm năng được thể hiện ở hai khía cạnh: (1) đào tạo dữ liệu nhạy cảm; (2) hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu có thể cùng tham gia đào tạo AI mà không cần chia sẻ dữ liệu gốc của họ.
Các công nghệ bảo mật phổ biến hiện nay trong Web3 bao gồm:
Môi trường thực thi đáng tin cậy(TEE)
Mã hóa đồng nhất hoàn toàn ( FHE )
Công nghệ zero-knowledge ( zk ), như một số giao thức sử dụng công nghệ zkTLS, tạo ra bằng chứng zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập khẩu hoạt động, danh tiếng và dữ liệu danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.
Tuy nhiên, lĩnh vực này vẫn đang ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, một khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:
Một khung zkML cần khoảng 80 phút để tạo ra một chứng nhận cho mô hình 1M-nanoGPT.
Theo dữ liệu từ một phòng thí nghiệm nào đó, chi phí của zkML cao hơn 1000 lần so với tính toán thuần túy.
Lưu trữ dữ liệu: Sau khi có dữ liệu, cần một nơi để lưu trữ dữ liệu trên chuỗi, cũng như LLM được tạo ra từ dữ liệu đó. Vấn đề cốt lõi là khả năng sẵn có của dữ liệu (DA), trước khi nâng cấp Danksharding trên Ethereum, thông lượng chỉ đạt 0.08MB. Trong khi đó, việc đào tạo mô hình AI và suy diễn thời gian thực thường cần từ 50 đến 100GB thông lượng dữ liệu mỗi giây. Sự chênh lệch về quy mô này khiến cho các giải pháp trên chuỗi hiện tại không thể đáp ứng được "các ứng dụng AI tiêu tốn tài nguyên."
Một số nền tảng là dự án đại diện cho thể loại này. Đây là một giải pháp lưu trữ tập trung được thiết kế cho nhu cầu hiệu suất cao của AI, với các đặc điểm chính bao gồm: cao
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Sự kết hợp của AI và Web3: Khuyến khích phân phối đuôi dài và thị trường mô hình Mã nguồn mở
AI+Web3: Tháp và Quảng trường
Tóm tắt điểm chính
Dự án Web3 về khái niệm AI trở thành mục tiêu thu hút vốn trên thị trường sơ cấp và thứ cấp.
Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng động lực phân phối để phối hợp các nhà cung cấp tiềm năng trong đuôi dài ( qua dữ liệu, lưu trữ và tính toán ); đồng thời xây dựng mô hình mã nguồn mở cũng như thị trường phi tập trung cho AI Agent.
AI chủ yếu được sử dụng trong ngành Web3 cho tài chính trên chuỗi ( thanh toán mã hóa, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.
Tính hữu ích của AI+Web3 thể hiện ở sự bổ sung giữa hai bên: Web3 có triển vọng chống lại sự tập trung của AI, AI có triển vọng giúp Web3 vượt ra ngoài giới hạn.
Giới thiệu
Trong hai năm qua, sự phát triển của AI giống như đã bị nhấn nút tăng tốc, hiệu ứng cánh bướm do Chatgpt kích thích không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh ra mà còn tạo ra một làn sóng trong lĩnh vực Web3.
Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trên thị trường tiền mã hóa có dấu hiệu phục hồi rõ rệt so với sự chậm lại. Các phương tiện truyền thông thống kê, chỉ trong nửa đầu năm 2024, đã có 64 dự án Web3+AI hoàn thành việc huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt mức huy động vốn cao nhất 100 triệu USD trong vòng A.
Thị trường thứ cấp phát triển mạnh mẽ hơn, dữ liệu từ các trang tổng hợp tiền điện tử cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; những tiến bộ công nghệ AI chính thống mang lại nhiều lợi ích rõ rệt, sau khi OpenAI phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; Hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực thu hút tiền điện tử là Meme: MemeCoin đầu tiên có khái niệm AI Agent - GOAT nhanh chóng trở nên nổi tiếng và đạt được định giá 1,4 tỷ USD, thành công khơi dậy cơn sốt AI Meme.
Nghiên cứu và chủ đề về AI+Web3 cũng đang rất hot, từ AI+DePIN đến AI Memecoin rồi đến AI Agent và AI DAO hiện tại, cảm xúc FOMO đã không còn theo kịp tốc độ thay đổi của các câu chuyện mới.
AI+Web3, tổ hợp thuật ngữ đầy tiền nóng, cơ hội và tưởng tượng về tương lai này, khó tránh khỏi bị người ta coi như một cuộc hôn nhân do vốn đầu tư sắp đặt, chúng ta dường như rất khó phân biệt dưới chiếc áo choàng lộng lẫy này, rốt cuộc đây là sân khấu của những kẻ đầu cơ, hay là đêm trước của sự bùng nổ?
Để trả lời câu hỏi này, một suy nghĩ then chốt cho cả hai bên là liệu có thể trở nên tốt hơn khi có nhau không? Có thể hưởng lợi từ mô hình của nhau không? Trong bài viết này, chúng tôi cũng cố gắng đứng trên vai những người đi trước để xem xét cấu trúc này: Web3 có thể đóng vai trò như thế nào trong từng khía cạnh của công nghệ AI, và AI có thể mang lại điều gì mới mẻ cho Web3?
Phần 1: Cơ hội nào cho Web3 dưới AI Stack?
Trước khi đi vào chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:
Diễn đạt toàn bộ quá trình bằng ngôn ngữ đơn giản hơn: "Mô hình lớn" giống như bộ não của con người. Ở giai đoạn đầu, bộ não này thuộc về em bé vừa mới chào đời, cần quan sát và tiếp nhận khối lượng thông tin khổng lồ từ thế giới xung quanh để hiểu về thế giới. Đây là giai đoạn "thu thập" dữ liệu; do máy tính không có khả năng nhìn và nghe như con người, trước khi huấn luyện, thông tin không có nhãn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.
Sau khi nhập dữ liệu, AI thông qua "đào tạo" để xây dựng một mô hình có khả năng hiểu và dự đoán, có thể coi đây là quá trình trẻ sơ sinh dần dần hiểu và học hỏi thế giới bên ngoài. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ sơ sinh được điều chỉnh liên tục trong quá trình học tập. Khi nội dung học bắt đầu phân khoa, hoặc giao tiếp với người khác để nhận phản hồi và sửa đổi, thì bước vào giai đoạn "tinh chỉnh" của mô hình lớn.
Trẻ em dần lớn lên, khi biết nói, sẽ có thể hiểu ý nghĩa và diễn đạt cảm xúc cũng như suy nghĩ của mình trong những cuộc đối thoại mới. Giai đoạn này giống như "suy diễn" của các mô hình AI lớn, khi mô hình có khả năng dự đoán và phân tích các đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh thông qua khả năng ngôn ngữ để diễn đạt cảm xúc, mô tả đối tượng và giải quyết các vấn đề khác nhau, điều này cũng tương tự như việc các mô hình AI lớn được áp dụng vào các nhiệm vụ cụ thể sau khi hoàn thành đào tạo và đưa vào sử dụng, chẳng hạn như phân loại hình ảnh, nhận diện giọng nói, v.v.
AI Agent gần gũi hơn với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi các mục tiêu phức tạp, không chỉ có khả năng suy nghĩ mà còn có khả năng ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.
Hiện tại, để giải quyết các vấn đề của AI trong các lớp khác nhau, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.
Một, Lớp cơ bản: Airbnb về sức mạnh tính toán và dữ liệu
Công suất
Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết cho việc đào tạo mô hình và suy luận mô hình.
Một ví dụ là, một mô hình ngôn ngữ lớn của một gã khổng lồ công nghệ cần 16.000 GPU cao cấp do một nhà sản xuất GPU sản xuất trong 30 ngày để hoàn thành việc huấn luyện. Giá đơn vị của phiên bản 80GB dao động từ 30.000 đến 40.000 đô la, điều này yêu cầu đầu tư phần cứng tính toán từ 400 triệu đến 700 triệu đô la (GPU+chip mạng ), trong khi đó, việc huấn luyện hàng tháng cần tiêu thụ 1,6 tỷ kWh, chi phí năng lượng mỗi tháng gần 20 triệu đô la.
Đối với việc giải phóng sức mạnh tính toán AI, đây chính là lĩnh vực giao thoa đầu tiên giữa Web3 và AI - DePIN( mạng lưới cơ sở hạ tầng vật lý phi tập trung) hiện tại, các trang web dữ liệu liên quan đã liệt kê hơn 1400 dự án, trong đó các dự án chia sẻ sức mạnh GPU tiêu biểu bao gồm nhiều nền tảng nổi tiếng.
Logic chính của nó là: Nền tảng cho phép cá nhân hoặc thực thể sở hữu tài nguyên GPU nhàn rỗi đóng góp khả năng tính toán của họ theo cách phi tập trung không cần cấp phép, thông qua một thị trường trực tuyến giữa người mua và người bán tương tự như Uber hoặc Airbnb, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được khai thác. Người dùng cuối cũng vì vậy mà có được nguồn tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế đặt cọc cũng đảm bảo rằng nếu xảy ra vi phạm cơ chế kiểm soát chất lượng hoặc gián đoạn mạng, người cung cấp tài nguyên sẽ phải chịu hình phạt tương ứng.
Đặc điểm của nó là:
Tập trung tài nguyên GPU nhàn rỗi: Các nhà cung cấp chủ yếu là các trung tâm dữ liệu độc lập vừa và nhỏ bên thứ ba, các nhà khai thác mỏ tiền điện tử và các nguồn tài nguyên tính toán thừa, phần cứng khai thác có cơ chế đồng thuận PoS, như máy khai thác FileCoin và ETH. Hiện tại cũng có các dự án tập trung vào việc khởi động các thiết bị có ngưỡng đầu vào thấp hơn, chẳng hạn như sử dụng MacBook, iPhone, iPad và các thiết bị địa phương khác để thiết lập mạng lưới tính toán cho việc suy diễn mô hình lớn.
Đối mặt với thị trường đuôi dài của sức mạnh tính toán AI:
a. "Về mặt kỹ thuật" thị trường sức mạnh tính toán phi tập trung phù hợp hơn cho các bước suy luận. Đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu do GPU quy mô siêu lớn mang lại, trong khi suy luận có yêu cầu hiệu suất tính toán GPU tương đối thấp, như một số nền tảng tập trung vào công việc kết xuất độ trễ thấp và các ứng dụng suy luận AI.
b. "Về phía nhu cầu" thì các bên có sức mạnh tính toán nhỏ sẽ không tự huấn luyện mô hình lớn của riêng mình, mà chỉ chọn tối ưu hóa, điều chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này tự nhiên phù hợp với tài nguyên tính toán nhàn rỗi phân tán.
Dữ liệu
Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán sẽ như bèo trôi, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo các mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu, thậm chí là giá trị quan và biểu hiện nhân văn của mô hình. Hiện tại, cuộc khủng hoảng nhu cầu dữ liệu của AI chủ yếu tập trung vào bốn khía cạnh sau:
Cơn khát dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào việc nhập vào một lượng lớn dữ liệu. Tài liệu công khai cho thấy, một công ty AI nổi tiếng đã huấn luyện mô hình ngôn ngữ lớn với số lượng tham số đạt tới hàng nghìn tỷ.
Chất lượng dữ liệu: Với sự kết hợp của AI và các ngành, tính kịp thời của dữ liệu, sự đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo ngành, việc tiếp nhận các nguồn dữ liệu mới như cảm xúc trên mạng xã hội đã đặt ra những yêu cầu mới đối với chất lượng của nó.
Vấn đề về quyền riêng tư và tuân thủ: Hiện nay, các quốc gia và doanh nghiệp đang dần nhận thức được tầm quan trọng của các tập dữ liệu chất lượng, và đang áp dụng các hạn chế đối với việc thu thập dữ liệu.
Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí nghiên cứu và phát triển của các công ty AI được sử dụng cho việc thu thập và xử lý dữ liệu cơ bản.
Hiện tại, giải pháp web3 được thể hiện qua bốn khía cạnh sau:
Web3 có tầm nhìn là để những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, và thông qua mạng lưới phân tán cùng với cơ chế khuyến khích, có được dữ liệu cá nhân hơn và có giá trị hơn từ người dùng với chi phí thấp.
Một số nền tảng là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút, đóng góp băng thông nhàn rỗi và tiếp nhận lưu lượng để thu thập dữ liệu thời gian thực từ toàn bộ internet và nhận phần thưởng token;
Một số nền tảng đã giới thiệu khái niệm hồ dữ liệu độc đáo (DLP), người dùng có thể tải lên dữ liệu cá nhân của họ ( như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v. ) vào DLP cụ thể và linh hoạt chọn xem có cho phép các bên thứ ba cụ thể sử dụng dữ liệu này hay không;
Trên một số nền tảng, người dùng có thể sử dụng các thẻ cụ thể trên mạng xã hội và @nền tảng để thu thập dữ liệu.
Hiện nay, nhiều nền tảng đang xem xét việc tham gia vào giai đoạn quan trọng này là gán nhãn dữ liệu.
Một số dự án đã đưa ra khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận phần thưởng bằng cách cung cấp dữ liệu được gán nhãn, chú thích hoặc các hình thức đầu vào khác.
Dự án đánh dấu dữ liệu sẽ gam hóa các nhiệm vụ đánh dấu và cho phép người dùng đặt cọc điểm để kiếm thêm điểm.
Các công nghệ bảo mật phổ biến hiện nay trong Web3 bao gồm:
Môi trường thực thi đáng tin cậy(TEE)
Mã hóa đồng nhất hoàn toàn ( FHE )
Công nghệ zero-knowledge ( zk ), như một số giao thức sử dụng công nghệ zkTLS, tạo ra bằng chứng zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập khẩu hoạt động, danh tiếng và dữ liệu danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.
Tuy nhiên, lĩnh vực này vẫn đang ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, một khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:
Một khung zkML cần khoảng 80 phút để tạo ra một chứng nhận cho mô hình 1M-nanoGPT.
Theo dữ liệu từ một phòng thí nghiệm nào đó, chi phí của zkML cao hơn 1000 lần so với tính toán thuần túy.