مشاريع Web3 ذات مفهوم الذكاء الاصطناعي أصبحت هدف جذب الأموال في السوقين الأول والثاني.
تظهر الفرص المتاحة لـ Web3 في صناعة الذكاء الاصطناعي في: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في الذيل الطويل عبر البيانات والتخزين والحساب (؛ وفي نفس الوقت إنشاء نماذج مفتوحة المصدر وكذلك سوق لا مركزي لوكلاء الذكاء الاصطناعي.
يُستخدم الذكاء الاصطناعي بشكل رئيسي في صناعة Web3 في التمويل على السلسلة ) والدفع المشفر، والتداول، وتحليل البيانات ( وكذلك في دعم التطوير.
تظهر فائدة AI+Web3 في تكامل كلاهما: من المتوقع أن تتصدى Web3 لمركزية AI، ومن المتوقع أن تساعد AI Web3 في كسر الحواجز.
المقدمة
على مدى العامين الماضيين، تطور الذكاء الاصطناعي كما لو تم الضغط على زر التسريع، هذه الظاهرة التي أثارتها Chatgpt لا تفتح فقط عالماً جديداً من الذكاء الاصطناعي التوليدي، بل تثير أيضاً تياراً قوياً في مجال Web3.
بدعم من مفهوم الذكاء الاصطناعي، يبدو أن تمويل سوق العملات المشفرة الذي شهد تراجعاً ملحوظاً يتعزز بشكل واضح. ووفقاً لإحصائيات وسائل الإعلام، تم تمويل 64 مشروعاً من مشاريع Web3 + AI فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل المعتمد على الذكاء الاصطناعي Zyber365 أعلى مبلغ تمويل في الجولة الأولى بلغ 100 مليون دولار.
سوق ثانوية أكثر ازدهارًا، تظهر بيانات مواقع تجميع التشفير أنه في غضون عام واحد فقط، وصلت القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي إلى 48.5 مليار دولار، وبلغ حجم التداول خلال 24 ساعة بالقرب من 8.6 مليار دولار؛ الفوائد الناتجة عن التقدم في تقنيات الذكاء الاصطناعي واضحة، بعد إصدار نموذج تحويل النص إلى فيديو Sora من OpenAI، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ تأثير الذكاء الاصطناعي يمتد أيضًا إلى أحد أقسام جذب الأموال في العملات المشفرة، وهو Meme: العملة الميم الأولية بمفهوم الوكيل الذكي - GOAT حققت شهرة بسرعة وحصلت على تقييم قدره 1.4 مليار دولار، مما أدى إلى إثارة حمى الميم الذكي.
تتزايد الأبحاث والمواضيع المتعلقة بـ AI + Web3 بشكل كبير، من AI + DePIN إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، حيث لم يعد بإمكان مشاعر FOMO مواكبة سرعة تبدل السرد الجديد.
AI+Web3، هذا المزيج من المصطلحات المليء بالمال الساخن، والفرص، والأحلام المستقبلية، لا مفر من أن يُنظر إليه على أنه زواج مُرتب بواسطة رأس المال، يبدو أنه من الصعب علينا التمييز بين ما إذا كانت هذه الساحة هي ساحة المضاربين، أم أنها ليلة انفجار الفجر؟
للإجابة على هذا السؤال، فإن فكرة حاسمة لكلا الطرفين هي: هل سيكون وجود الآخر أفضل؟ هل يمكن الاستفادة من نمط الآخر؟ في هذه المقالة، نحاول أيضًا الوقوف على أكتاف السابقين لفحص هذه الديناميكية: كيف يمكن أن تلعب Web3 دورًا في كل حلقة من حلقات تقنية AI، وما الجديد الذي يمكن أن تقدمه AI لـ Web3؟
الجزء 1 ما الفرص المتاحة لـ Web3 تحت كومة الذكاء الاصطناعي؟
قبل مناقشة هذا الموضوع، نحتاج إلى فهم مجموعة تقنيات نماذج الذكاء الاصطناعي الكبيرة:
للتعبير عن العملية بأبسط لغة: "النموذج الكبير" يشبه دماغ البشر، في المراحل المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة يحتاج إلى مراقبة واستيعاب كم هائل من المعلومات المحيطة لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن أجهزة الكمبيوتر لا تمتلك الحواس المتعددة مثل الرؤية والسمع لدى البشر، يجب تحويل المعلومات الضخمة غير المصنفة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة" قبل التدريب.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتبار ذلك كعملية فهم وتعلم تدريجية من قبل الطفل عن العالم الخارجي. تعتبر معلمات النموذج مثل القدرة اللغوية للطفل التي تتعدل باستمرار خلال عملية التعلم. عندما تبدأ المواد التعليمية في التخصص، أو عندما يحصل على ردود فعل من التواصل مع الآخرين ويتم إجراء التصحيحات، يدخل في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال تدريجياً ويتعلمون التحدث، يصبح بإمكانهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات اللغوية والنصية الجديدة. يعبر الأطفال عن مشاعرهم من خلال القدرة اللغوية، ويصفون الأشياء، ويحلون المشكلات المختلفة، وهذا يشبه أيضاً تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد الانتهاء من التدريب واستخدامها في المهام المحددة، مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القادر على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، لا يمتلك فقط القدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويستطيع استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنسبة لنقاط الألم الخاصة بالذكاء الاصطناعي في مختلف الطبقات، فقد شكل Web3 حاليًا نظامًا بيئيًا متعدد الطبقات ومترابطًا، يغطي جميع مراحل عملية نموذج الذكاء الاصطناعي.
) واحد، الطبقة الأساسية: Airbnb للقوة الحاسوبية والبيانات
قوة الحوسبة
حالياً، واحدة من أعلى تكاليف الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة المطلوبة لتدريب النماذج واستنتاج النماذج.
مثال على ذلك هو أن نموذج اللغة الكبير لأحد عمالقة التكنولوجيا يحتاج إلى 16000 وحدة معالجة رسومات عالية الجودة من مصنع معين للوصول إلى التدريب في غضون 30 يومًا. يتراوح سعر الوحدة لنسخة 80 جيجابايت بين 30000 و40000 دولار، مما يتطلب استثمارًا في أجهزة الحاسوب يتراوح بين 400 إلى 700 مليون دولار ### GPU + شريحة الشبكة (، وفي الوقت نفسه، يتطلب التدريب الشهري استهلاك 1.6 مليار كيلو وات ساعة، وتصل النفقات الطاقية شهريًا إلى نحو 20 مليون دولار.
بالنسبة لفك ضغط قوة الحوسبة للذكاء الاصطناعي، فإنها تمثل أيضًا أحد المجالات الأولى التي تتقاطع فيها Web3 مع الذكاء الاصطناعي - DePIN) الشبكة اللامركزية للبنية التحتية الفيزيائية( حاليًا، قامت المواقع المعنية بالبيانات بعرض أكثر من 1400 مشروع، بما في ذلك مشاريع بارزة في مشاركة قوة GPU.
المنطق الرئيسي هنا هو: يسمح النظام للأفراد أو الكيانات التي تمتلك موارد GPU غير مستغلة بالمشاركة في قدرتها الحاسوبية بطريقة لا تتطلب إذنًا، من خلال سوق عبر الإنترنت مماثل لـ Uber أو Airbnb بين المشترين والبائعين، مما يزيد من استخدام موارد GPU غير المستغلة بشكل كافٍ، وبالتالي يحصل المستخدمون النهائيون على موارد حوسبة فعالة بتكلفة أقل؛ وفي الوقت نفسه، تضمن آلية الرهن أنه في حال حدوث انتهاك لآلية التحكم في الجودة أو انقطاع الشبكة، سيتم معاقبة مقدمي الموارد بشكل مناسب.
تتميز بما يلي:
تجميع موارد GPU غير المستخدمة: يتمثل الموردون بشكل أساسي في مراكز البيانات المتوسطة والصغيرة المستقلة من طرف ثالث، ومشغلي مزارع التعدين الذين لديهم فائض من موارد الحوسبة، بالإضافة إلى أجهزة التعدين التي تعتمد آلية توافق الآراء PoS، مثل أجهزة التعدين FileCoin وETH. هناك أيضًا مشاريع تهدف إلى بدء تشغيل أجهزة ذات حد أدنى أقل، مثل بناء شبكة حوسبة لتشغيل استنتاج النماذج الكبيرة باستخدام أجهزة محلية مثل MacBook وiPhone وiPad.
مواجهة سوق الذيل الطويل لقوة الحوسبة AI:
أ. من الناحية التقنية، فإن سوق القوة الحوسبية اللامركزية أكثر ملائمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU العملاقة، في حين أن الاستدلال يتطلب أداءً أقل نسبيًا من GPU، مثل بعض المنصات التي تركز على الأعمال ذات التأخير المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
ب. "من حيث جانب الطلب"، لن تقوم الشركات ذات القدرة الحاسوبية المتوسطة بتدريب نماذجها الكبيرة بشكل منفصل، بل ستختار فقط تحسين وتعديل النماذج الكبيرة الرائدة القليلة، وهذه السيناريوهات تناسب بشكل طبيعي موارد القدرة الحاسوبية الموزعة غير المستخدمة.
الملكية اللامركزية: المعنى التكنولوجي ل blockchain هو أن مالكي الموارد يحتفظون دائمًا بسيطرتهم على الموارد، مما يسمح لهم بضبطها وفقًا للاحتياجات وكسب الأرباح في نفس الوقت.
)# البيانات
البيانات، هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحسابات ستكون بلا فائدة مثل الطحالب العائمة، وعلاقة البيانات بالنموذج تشبه المثل القائل "نفايات في، نفايات خارج"، حيث تحدد كمية البيانات وجودة المدخلات جودة المخرجات النهائية للنموذج. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، فإن البيانات تحدد القدرة اللغوية للنموذج، وقدرته على الفهم، وحتى وجهات نظره وتجسيده للإنسانية. حاليًا، تركز صعوبات طلب البيانات في الذكاء الاصطناعي بشكل رئيسي على النقاط الأربع التالية:
جوع البيانات: يعتمد تدريب نماذج الذكاء الاصطناعي على كميات كبيرة من بيانات الإدخال. تظهر البيانات العامة أن شركة ذكاء اصطناعي مشهورة قد وصلت إلى مستوى تريليونات من معلمات نموذج اللغة المدرب.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، تزايدت المتطلبات الجديدة لجودة البيانات مثل توقيت البيانات، تنوع البيانات، تخصص البيانات العمودية، وموارد البيانات الناشئة مثل استيعاب مشاعر وسائل التواصل الاجتماعي.
مشاكل الخصوصية والامتثال: بدأت الدول والشركات في جميع أنحاء العالم تدريجياً في إدراك أهمية مجموعات البيانات عالية الجودة، وهي تفرض قيوداً على جمع البيانات.
تكاليف معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر البيانات العامة أن أكثر من 30% من تكاليف البحث والتطوير في شركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، تظهر حلول web3 في الجوانب الأربعة التالية:
جمع البيانات: البيانات الحقيقية التي يمكن الحصول عليها مجانًا من العالم الحقيقي تنفد بسرعة، وتزداد النفقات التي تدفعها شركات الذكاء الاصطناعي سنويًا. ولكن في الوقت نفسه، لم تعود هذه النفقات بالنفع على المساهمين الحقيقيين في البيانات، حيث تستفيد المنصات بالكامل من القيمة التي تخلقها البيانات، مثل منصة اجتماعية حققت إيرادات تصل إلى 203 مليون دولار من خلال توقيع اتفاقية ترخيص بيانات مع شركات الذكاء الاصطناعي.
إن إشراك المستخدمين المساهمين الحقيقيين في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة بتكلفة منخفضة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
بعض المنصات هي طبقة بيانات وشبكة غير مركزية، حيث يمكن للمستخدمين من خلال تشغيل العقدة، المساهمة في عرض النطاق الترددي الفائض وإعادة توجيه الحركة لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
قامت بعض المنصات بإدخال مفهوم فريد من نوعه لبرك السيولة للبيانات ###DLP(، حيث يمكن للمستخدمين رفع بياناتهم الخاصة ) مثل سجلات الشراء، عادات التصفح، الأنشطة على وسائل التواصل الاجتماعي، إلخ ( إلى DLP محدد، واختيار ما إذا كانوا يرغبون في منح إذن لاستخدام هذه البيانات لطرف ثالث معين؛
في بعض المنصات، يمكن للمستخدمين استخدام علامات معينة على المنصات الاجتماعية و@المنصة لجمع البيانات.
معالجة البيانات: خلال عملية معالجة بيانات الذكاء الاصطناعي، نظرًا لأن البيانات التي يتم جمعها عادةً ما تكون فوضوية وتحتوي على أخطاء، يجب تنظيفها وتحويلها إلى تنسيق قابل للاستخدام قبل تدريب النموذج، مما يتضمن مهام متكررة مثل المعايرة، والترشيح، ومعالجة القيم المفقودة. هذه المرحلة هي واحدة من القليل من الخطوات اليدوية في صناعة الذكاء الاصطناعي، وقد أوجدت مجالًا متخصصًا في توظيف مُعلمين البيانات، ومع ارتفاع متطلبات جودة البيانات من النماذج، يرتفع أيضًا مستوى التحدي لمعلمي البيانات، وهذه المهمة تناسب بشكل طبيعي آلية التحفيز اللامركزية في Web3.
في الوقت الحالي، تفكر العديد من المنصات في إضافة مرحلة التوصيف البياني هذه.
بعض المشاريع قدمت مفهوم "Train2earn"، مع التأكيد على جودة البيانات، ويمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات مُعلمة أو تعليقات أو أشكال أخرى من المدخلات.
ستقوم مشاريع تعليم البيانات بتحويل مهام الوسم إلى ألعاب، مما يسمح للمستخدمين بربط نقاطهم لكسب المزيد من النقاط.
خصوصية البيانات والأمان: من الضروري توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما يحمي أمان البيانات معلومات البيانات من الوصول غير المصرح به، والتدمير، والسرقة. وبالتالي، تبرز مزايا تقنيات الخصوصية في Web3 والمجالات المحتملة لتطبيقها في جانبين: )1( تدريب البيانات الحساسة؛ )2( تعاون البيانات: يمكن لعدة مالكي بيانات المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
بيئة تنفيذ موثوقة ) TEE (
تشفير متجانس تمامًا ) FHE (
تقنية المعرفة الصفرية ) zk (، مثل بعض البروتوكولات التي تستخدم تقنية zkTLS، تُولِّد إثباتات المعرفة الصفرية لحركة HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة وسمعة وبيانات الهوية من مواقع الويب الخارجية بشكل آمن دون الكشف عن المعلومات الحساسة.
ومع ذلك، لا يزال هذا المجال في مراحله المبكرة، حيث لا تزال معظم المشاريع قيد الاستكشاف، ومن المعضلات الحالية هي ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك:
تحتاج بعض أطر zkML إلى حوالي 80 دقيقة لإنشاء إثبات لنموذج 1M-nanoGPT.
وفقًا لبيانات مختبر معين، فإن تكلفة zkML أعلى بأكثر من 1000 مرة من الحسابات البحتة.
4، تخزين البيانات: بعد الحصول على البيانات، نحتاج أيضًا إلى مكان لتخزين البيانات على السلسلة، بالإضافة إلى LLM الذي تم إنشاؤه باستخدام هذه البيانات. مع اعتبار توافر البيانات )DA( كمسألة مركزية، كانت سعة المعالجة على الإيثريوم قبل ترقية Danksharding 0.08MB. في الوقت نفسه، عادةً ما تتطلب نماذج الذكاء الاصطناعي التدريب والتفسير في الوقت الحقيقي سعة معالجة بيانات تتراوح بين 50 إلى 100GB في الثانية. هذا الفارق في الحجم يجعل الحلول الموجودة على السلسلة غير قادرة على مواجهة "تطبيقات الذكاء الاصطناعي كثيفة الموارد."
بعض المنصات تمثل المشاريع في هذه الفئة. إنها حل تخزين مركزي مصمم لتلبية متطلبات الأداء العالي للذكاء الاصطناعي، وتشمل ميزاتها الرئيسية: عالية
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
دمج الذكاء الاصطناعي وWeb3: تحفيز توزيع الذيل الطويل وسوق النماذج المفتوحة المصدر
الذكاء الاصطناعي + الويب 3: الأبراج والساحات
ملخص النقاط الرئيسية
مشاريع Web3 ذات مفهوم الذكاء الاصطناعي أصبحت هدف جذب الأموال في السوقين الأول والثاني.
تظهر الفرص المتاحة لـ Web3 في صناعة الذكاء الاصطناعي في: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في الذيل الطويل عبر البيانات والتخزين والحساب (؛ وفي نفس الوقت إنشاء نماذج مفتوحة المصدر وكذلك سوق لا مركزي لوكلاء الذكاء الاصطناعي.
يُستخدم الذكاء الاصطناعي بشكل رئيسي في صناعة Web3 في التمويل على السلسلة ) والدفع المشفر، والتداول، وتحليل البيانات ( وكذلك في دعم التطوير.
تظهر فائدة AI+Web3 في تكامل كلاهما: من المتوقع أن تتصدى Web3 لمركزية AI، ومن المتوقع أن تساعد AI Web3 في كسر الحواجز.
المقدمة
على مدى العامين الماضيين، تطور الذكاء الاصطناعي كما لو تم الضغط على زر التسريع، هذه الظاهرة التي أثارتها Chatgpt لا تفتح فقط عالماً جديداً من الذكاء الاصطناعي التوليدي، بل تثير أيضاً تياراً قوياً في مجال Web3.
بدعم من مفهوم الذكاء الاصطناعي، يبدو أن تمويل سوق العملات المشفرة الذي شهد تراجعاً ملحوظاً يتعزز بشكل واضح. ووفقاً لإحصائيات وسائل الإعلام، تم تمويل 64 مشروعاً من مشاريع Web3 + AI فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل المعتمد على الذكاء الاصطناعي Zyber365 أعلى مبلغ تمويل في الجولة الأولى بلغ 100 مليون دولار.
سوق ثانوية أكثر ازدهارًا، تظهر بيانات مواقع تجميع التشفير أنه في غضون عام واحد فقط، وصلت القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي إلى 48.5 مليار دولار، وبلغ حجم التداول خلال 24 ساعة بالقرب من 8.6 مليار دولار؛ الفوائد الناتجة عن التقدم في تقنيات الذكاء الاصطناعي واضحة، بعد إصدار نموذج تحويل النص إلى فيديو Sora من OpenAI، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ تأثير الذكاء الاصطناعي يمتد أيضًا إلى أحد أقسام جذب الأموال في العملات المشفرة، وهو Meme: العملة الميم الأولية بمفهوم الوكيل الذكي - GOAT حققت شهرة بسرعة وحصلت على تقييم قدره 1.4 مليار دولار، مما أدى إلى إثارة حمى الميم الذكي.
تتزايد الأبحاث والمواضيع المتعلقة بـ AI + Web3 بشكل كبير، من AI + DePIN إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، حيث لم يعد بإمكان مشاعر FOMO مواكبة سرعة تبدل السرد الجديد.
AI+Web3، هذا المزيج من المصطلحات المليء بالمال الساخن، والفرص، والأحلام المستقبلية، لا مفر من أن يُنظر إليه على أنه زواج مُرتب بواسطة رأس المال، يبدو أنه من الصعب علينا التمييز بين ما إذا كانت هذه الساحة هي ساحة المضاربين، أم أنها ليلة انفجار الفجر؟
للإجابة على هذا السؤال، فإن فكرة حاسمة لكلا الطرفين هي: هل سيكون وجود الآخر أفضل؟ هل يمكن الاستفادة من نمط الآخر؟ في هذه المقالة، نحاول أيضًا الوقوف على أكتاف السابقين لفحص هذه الديناميكية: كيف يمكن أن تلعب Web3 دورًا في كل حلقة من حلقات تقنية AI، وما الجديد الذي يمكن أن تقدمه AI لـ Web3؟
! [الذكاء الاصطناعي+Web3: الأبراج والساحات])https://img-cdn.gateio.im/webp-social/moments-25bce79fdc74e866d6663cf31b15ee55.webp(
الجزء 1 ما الفرص المتاحة لـ Web3 تحت كومة الذكاء الاصطناعي؟
قبل مناقشة هذا الموضوع، نحتاج إلى فهم مجموعة تقنيات نماذج الذكاء الاصطناعي الكبيرة:
للتعبير عن العملية بأبسط لغة: "النموذج الكبير" يشبه دماغ البشر، في المراحل المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة يحتاج إلى مراقبة واستيعاب كم هائل من المعلومات المحيطة لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن أجهزة الكمبيوتر لا تمتلك الحواس المتعددة مثل الرؤية والسمع لدى البشر، يجب تحويل المعلومات الضخمة غير المصنفة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة" قبل التدريب.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتبار ذلك كعملية فهم وتعلم تدريجية من قبل الطفل عن العالم الخارجي. تعتبر معلمات النموذج مثل القدرة اللغوية للطفل التي تتعدل باستمرار خلال عملية التعلم. عندما تبدأ المواد التعليمية في التخصص، أو عندما يحصل على ردود فعل من التواصل مع الآخرين ويتم إجراء التصحيحات، يدخل في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال تدريجياً ويتعلمون التحدث، يصبح بإمكانهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات اللغوية والنصية الجديدة. يعبر الأطفال عن مشاعرهم من خلال القدرة اللغوية، ويصفون الأشياء، ويحلون المشكلات المختلفة، وهذا يشبه أيضاً تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد الانتهاء من التدريب واستخدامها في المهام المحددة، مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القادر على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، لا يمتلك فقط القدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويستطيع استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنسبة لنقاط الألم الخاصة بالذكاء الاصطناعي في مختلف الطبقات، فقد شكل Web3 حاليًا نظامًا بيئيًا متعدد الطبقات ومترابطًا، يغطي جميع مراحل عملية نموذج الذكاء الاصطناعي.
! [الذكاء الاصطناعي+Web3: الأبراج والمربعات])https://img-cdn.gateio.im/webp-social/moments-cc3bf45e321f9b1d1280bf3bb827d9f4.webp(
) واحد، الطبقة الأساسية: Airbnb للقوة الحاسوبية والبيانات
قوة الحوسبة
حالياً، واحدة من أعلى تكاليف الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة المطلوبة لتدريب النماذج واستنتاج النماذج.
مثال على ذلك هو أن نموذج اللغة الكبير لأحد عمالقة التكنولوجيا يحتاج إلى 16000 وحدة معالجة رسومات عالية الجودة من مصنع معين للوصول إلى التدريب في غضون 30 يومًا. يتراوح سعر الوحدة لنسخة 80 جيجابايت بين 30000 و40000 دولار، مما يتطلب استثمارًا في أجهزة الحاسوب يتراوح بين 400 إلى 700 مليون دولار ### GPU + شريحة الشبكة (، وفي الوقت نفسه، يتطلب التدريب الشهري استهلاك 1.6 مليار كيلو وات ساعة، وتصل النفقات الطاقية شهريًا إلى نحو 20 مليون دولار.
بالنسبة لفك ضغط قوة الحوسبة للذكاء الاصطناعي، فإنها تمثل أيضًا أحد المجالات الأولى التي تتقاطع فيها Web3 مع الذكاء الاصطناعي - DePIN) الشبكة اللامركزية للبنية التحتية الفيزيائية( حاليًا، قامت المواقع المعنية بالبيانات بعرض أكثر من 1400 مشروع، بما في ذلك مشاريع بارزة في مشاركة قوة GPU.
المنطق الرئيسي هنا هو: يسمح النظام للأفراد أو الكيانات التي تمتلك موارد GPU غير مستغلة بالمشاركة في قدرتها الحاسوبية بطريقة لا تتطلب إذنًا، من خلال سوق عبر الإنترنت مماثل لـ Uber أو Airbnb بين المشترين والبائعين، مما يزيد من استخدام موارد GPU غير المستغلة بشكل كافٍ، وبالتالي يحصل المستخدمون النهائيون على موارد حوسبة فعالة بتكلفة أقل؛ وفي الوقت نفسه، تضمن آلية الرهن أنه في حال حدوث انتهاك لآلية التحكم في الجودة أو انقطاع الشبكة، سيتم معاقبة مقدمي الموارد بشكل مناسب.
تتميز بما يلي:
تجميع موارد GPU غير المستخدمة: يتمثل الموردون بشكل أساسي في مراكز البيانات المتوسطة والصغيرة المستقلة من طرف ثالث، ومشغلي مزارع التعدين الذين لديهم فائض من موارد الحوسبة، بالإضافة إلى أجهزة التعدين التي تعتمد آلية توافق الآراء PoS، مثل أجهزة التعدين FileCoin وETH. هناك أيضًا مشاريع تهدف إلى بدء تشغيل أجهزة ذات حد أدنى أقل، مثل بناء شبكة حوسبة لتشغيل استنتاج النماذج الكبيرة باستخدام أجهزة محلية مثل MacBook وiPhone وiPad.
مواجهة سوق الذيل الطويل لقوة الحوسبة AI:
أ. من الناحية التقنية، فإن سوق القوة الحوسبية اللامركزية أكثر ملائمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU العملاقة، في حين أن الاستدلال يتطلب أداءً أقل نسبيًا من GPU، مثل بعض المنصات التي تركز على الأعمال ذات التأخير المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
ب. "من حيث جانب الطلب"، لن تقوم الشركات ذات القدرة الحاسوبية المتوسطة بتدريب نماذجها الكبيرة بشكل منفصل، بل ستختار فقط تحسين وتعديل النماذج الكبيرة الرائدة القليلة، وهذه السيناريوهات تناسب بشكل طبيعي موارد القدرة الحاسوبية الموزعة غير المستخدمة.
)# البيانات
البيانات، هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحسابات ستكون بلا فائدة مثل الطحالب العائمة، وعلاقة البيانات بالنموذج تشبه المثل القائل "نفايات في، نفايات خارج"، حيث تحدد كمية البيانات وجودة المدخلات جودة المخرجات النهائية للنموذج. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، فإن البيانات تحدد القدرة اللغوية للنموذج، وقدرته على الفهم، وحتى وجهات نظره وتجسيده للإنسانية. حاليًا، تركز صعوبات طلب البيانات في الذكاء الاصطناعي بشكل رئيسي على النقاط الأربع التالية:
جوع البيانات: يعتمد تدريب نماذج الذكاء الاصطناعي على كميات كبيرة من بيانات الإدخال. تظهر البيانات العامة أن شركة ذكاء اصطناعي مشهورة قد وصلت إلى مستوى تريليونات من معلمات نموذج اللغة المدرب.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، تزايدت المتطلبات الجديدة لجودة البيانات مثل توقيت البيانات، تنوع البيانات، تخصص البيانات العمودية، وموارد البيانات الناشئة مثل استيعاب مشاعر وسائل التواصل الاجتماعي.
مشاكل الخصوصية والامتثال: بدأت الدول والشركات في جميع أنحاء العالم تدريجياً في إدراك أهمية مجموعات البيانات عالية الجودة، وهي تفرض قيوداً على جمع البيانات.
تكاليف معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر البيانات العامة أن أكثر من 30% من تكاليف البحث والتطوير في شركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، تظهر حلول web3 في الجوانب الأربعة التالية:
إن إشراك المستخدمين المساهمين الحقيقيين في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة بتكلفة منخفضة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
بعض المنصات هي طبقة بيانات وشبكة غير مركزية، حيث يمكن للمستخدمين من خلال تشغيل العقدة، المساهمة في عرض النطاق الترددي الفائض وإعادة توجيه الحركة لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
قامت بعض المنصات بإدخال مفهوم فريد من نوعه لبرك السيولة للبيانات ###DLP(، حيث يمكن للمستخدمين رفع بياناتهم الخاصة ) مثل سجلات الشراء، عادات التصفح، الأنشطة على وسائل التواصل الاجتماعي، إلخ ( إلى DLP محدد، واختيار ما إذا كانوا يرغبون في منح إذن لاستخدام هذه البيانات لطرف ثالث معين؛
في بعض المنصات، يمكن للمستخدمين استخدام علامات معينة على المنصات الاجتماعية و@المنصة لجمع البيانات.
في الوقت الحالي، تفكر العديد من المنصات في إضافة مرحلة التوصيف البياني هذه.
بعض المشاريع قدمت مفهوم "Train2earn"، مع التأكيد على جودة البيانات، ويمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات مُعلمة أو تعليقات أو أشكال أخرى من المدخلات.
ستقوم مشاريع تعليم البيانات بتحويل مهام الوسم إلى ألعاب، مما يسمح للمستخدمين بربط نقاطهم لكسب المزيد من النقاط.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
بيئة تنفيذ موثوقة ) TEE (
تشفير متجانس تمامًا ) FHE (
تقنية المعرفة الصفرية ) zk (، مثل بعض البروتوكولات التي تستخدم تقنية zkTLS، تُولِّد إثباتات المعرفة الصفرية لحركة HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة وسمعة وبيانات الهوية من مواقع الويب الخارجية بشكل آمن دون الكشف عن المعلومات الحساسة.
ومع ذلك، لا يزال هذا المجال في مراحله المبكرة، حيث لا تزال معظم المشاريع قيد الاستكشاف، ومن المعضلات الحالية هي ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك:
تحتاج بعض أطر zkML إلى حوالي 80 دقيقة لإنشاء إثبات لنموذج 1M-nanoGPT.
وفقًا لبيانات مختبر معين، فإن تكلفة zkML أعلى بأكثر من 1000 مرة من الحسابات البحتة.
4، تخزين البيانات: بعد الحصول على البيانات، نحتاج أيضًا إلى مكان لتخزين البيانات على السلسلة، بالإضافة إلى LLM الذي تم إنشاؤه باستخدام هذه البيانات. مع اعتبار توافر البيانات )DA( كمسألة مركزية، كانت سعة المعالجة على الإيثريوم قبل ترقية Danksharding 0.08MB. في الوقت نفسه، عادةً ما تتطلب نماذج الذكاء الاصطناعي التدريب والتفسير في الوقت الحقيقي سعة معالجة بيانات تتراوح بين 50 إلى 100GB في الثانية. هذا الفارق في الحجم يجعل الحلول الموجودة على السلسلة غير قادرة على مواجهة "تطبيقات الذكاء الاصطناعي كثيفة الموارد."