المصدر: كوينتيليغراف
النص الأصلي: 《 بيانات OORT AI اللامركزية تتصدر Google Kaggle 》
حقق مجموعة بيانات تدريب الصور الذكية التي طورتها OORT، وهي مزود حلول الذكاء الاصطناعي الموزعة، نجاحًا ملحوظًا على منصة Kaggle الخاصة بـ Google.
تم إصدار قائمة مجموعة بيانات "Diverse Tools Kaggle" من OORT في أوائل أبريل؛ ومنذ ذلك الحين، ارتفعت إلى الصفحة الرئيسية في عدة فئات. Kaggle هي منصة عبر الإنترنت تابعة لشركة جوجل، مخصصة لمنافسات علم البيانات وتعلم الآلة والتعاون.
أفاد رامكومار سوبرامانيام، المساهم الرئيسي في مشروع OpenLedger المعتمد على الذكاء الاصطناعي، لموقع Cointelegraph: "تصنيف الصفحة الرئيسية لـ Kaggle هو إشارة اجتماعية قوية، تدل على أن مجموعة البيانات هذه تجذب المشاركة النشطة من المجتمعات الرئيسية مثل علماء البيانات، ومهندسي التعلم الآلي، والممارسين."
كشف مؤسس الشركة والرئيس التنفيذي OORT ماكس لي لـ Cointelegraph أن الشركة "لاحظت مؤشرات مشاركة مشجعة، مما يؤكد أن" بيانات التدريب التي تم جمعها من خلال نموذج لامركزي "لها بالفعل طلب سوقي مبكر وذات صلة". وأضاف:
"الاهتمام الطوعي من المجتمع، بما في ذلك الاستخدام النشط والمساهمة - يظهر بوضوح كيف يمكن لقنوات البيانات اللامركزية المدفوعة بالمجتمع مثل OORT أن تحقق توزيعًا سريعًا ومشاركة واسعة دون الاعتماد على وسطاء مركزيين."
قال لي أيضًا إن مشروع OORT يخطط لإصدار عدة مجموعات بيانات في الأشهر المقبلة. ومن بين هذه البيانات مجموعة بيانات أوامر الصوت داخل السيارة، مجموعة بيانات أوامر الصوت للمنزل الذكي، ومجموعة بيانات الفيديو المزيف العميق المصممة لتحسين قدرة التحقق من صحة الوسائط المدفوعة بالذكاء الاصطناعي.
أكدت Cointelegraph بشكل مستقل أن مجموعة البيانات المذكورة قد تصدرت الصفحة الرئيسية في وقت سابق من هذا الشهر في فئات الذكاء الاصطناعي العام، والتجزئة والتسوق، والصناعات التحويلية، والهندسة على Kaggle. حتى وقت كتابة هذا التقرير، لم تعد مجموعة البيانات تحتفظ بهذه المراتب بعد تحديث غير ذي صلة في 6 مايو وتحديث آخر في 14 مايو.
على الرغم من الاعتراف بهذا الإنجاز، صرح Subramaniam لـ Cointelegraph "أن هذا ليس مقياسًا حاسمًا للتطبيق الفعلي أو الجودة على مستوى الشركات." وأشار إلى أن خصوصية مجموعة بيانات OORT "لا تكمن فقط في الترتيب، بل أيضًا في مصادر المجموعة وآلية التحفيز خلفها." وواصل شرحه:
"بخلاف الموردين المركزيين الذين قد يعتمدون على عمليات غير شفافة، يمكن لنظام شفاف يعتمد على حوافز الرموز أن يوفر إمكانية تتبع وإدارة مشتركة من قبل المجتمع وإمكانية تحسين مستمرة، بشرط إنشاء هيكل حوكمة مناسب."
قال ليكس سوكولين، الشريك في مؤسسة Generative Ventures لرأس المال المغامر في الذكاء الاصطناعي، إنه على الرغم من اعتقاده أن هذه النتائج ليست صعبة النسخ، "إلا أن هذا يثبت حقًا أن مشاريع التشفير قادرة على استخدام آليات التحفيز اللامركزية لتنظيم أنشطة ذات قيمة اقتصادية."
أظهرت البيانات التي نشرتها مؤسسة Epoch AI لأبحاث الذكاء الاصطناعي أن البيانات التدريبية الخاصة بالنصوص التي ينتجها البشر من المتوقع أن تنفد بحلول عام 2028. لقد أصبح الضغط كبيرًا لدرجة أن المستثمرين يعملون حاليًا على تسهيل الصفقات للحصول على حقوق استخدام المواد المحمية بحقوق الطبع والنشر لشركات الذكاء الاصطناعي.
لقد تم تداول تقارير بحثية حول نقص بيانات تدريب الذكاء الاصطناعي المتزايد وكيف يمكن أن يقيد ذلك تطور هذا المجال لسنوات عديدة. على الرغم من أن البيانات المولدة بواسطة AI ( تستخدم بشكل متزايد وتحقق بعض النتائج، إلا أن البيانات التي ينتجها البشر لا تزال تُعتبر عمومًا الخيار الأفضل، حيث إن هذه البيانات عالية الجودة يمكن أن تُنتج نماذج ذكاء اصطناعي ذات أداء أفضل.
في مجال تدريب الصور باستخدام الذكاء الاصطناعي، أصبحت الأمور أكثر تعقيدًا، حيث يقوم الفنانون عمداً بتخريب عمليات التدريب. لحماية أعمالهم من الاستخدام غير المصرح به في تدريب الذكاء الاصطناعي، يتيح أداة Nightshade للمبدعين "تسميم" صورهم، مما يؤثر بشكل كبير على أداء النموذج.
وأشار سوبارامانيام: "نحن ندخل عصرًا تزداد فيه ندرة بيانات الصور عالية الجودة." كما أكد أن الاستخدام الواسع لتقنية تسميم الصور يجعل هذا التحدي أكثر صعوبة:
"مع ظهور تقنيات إخفاء الصور وطرق تسميم تدريب الذكاء الاصطناعي مثل العلامات المائية المعادية، تواجه مجموعات البيانات المفتوحة تحديات مزدوجة في الكمية والمصداقية."
في ظل هذه الأوضاع، ذكر سوبارامانيام أن مجموعات البيانات التحفيزية القابلة للتحقق والمساهمة من المجتمع "أصبحت أكثر قيمة من أي وقت مضى". ويعتقد أن هذه الأنواع من المشاريع "لا يمكن أن تكون بديلاً فحسب، بل ستصبح أيضًا دعائم مهمة في اقتصاد البيانات، من حيث توافق الذكاء الاصطناعي وتتبع البيانات."
توصيات ذات صلة: انضمام Kima إلى صندوق Mastercard لتحقيق إعادة شحن بطاقات العملات المستقرة
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
اللامركزية OORT AI البيانات تحتل المراتب العليا على Google Kaggle
المصدر: كوينتيليغراف النص الأصلي: 《 بيانات OORT AI اللامركزية تتصدر Google Kaggle 》
حقق مجموعة بيانات تدريب الصور الذكية التي طورتها OORT، وهي مزود حلول الذكاء الاصطناعي الموزعة، نجاحًا ملحوظًا على منصة Kaggle الخاصة بـ Google.
تم إصدار قائمة مجموعة بيانات "Diverse Tools Kaggle" من OORT في أوائل أبريل؛ ومنذ ذلك الحين، ارتفعت إلى الصفحة الرئيسية في عدة فئات. Kaggle هي منصة عبر الإنترنت تابعة لشركة جوجل، مخصصة لمنافسات علم البيانات وتعلم الآلة والتعاون.
أفاد رامكومار سوبرامانيام، المساهم الرئيسي في مشروع OpenLedger المعتمد على الذكاء الاصطناعي، لموقع Cointelegraph: "تصنيف الصفحة الرئيسية لـ Kaggle هو إشارة اجتماعية قوية، تدل على أن مجموعة البيانات هذه تجذب المشاركة النشطة من المجتمعات الرئيسية مثل علماء البيانات، ومهندسي التعلم الآلي، والممارسين."
كشف مؤسس الشركة والرئيس التنفيذي OORT ماكس لي لـ Cointelegraph أن الشركة "لاحظت مؤشرات مشاركة مشجعة، مما يؤكد أن" بيانات التدريب التي تم جمعها من خلال نموذج لامركزي "لها بالفعل طلب سوقي مبكر وذات صلة". وأضاف:
"الاهتمام الطوعي من المجتمع، بما في ذلك الاستخدام النشط والمساهمة - يظهر بوضوح كيف يمكن لقنوات البيانات اللامركزية المدفوعة بالمجتمع مثل OORT أن تحقق توزيعًا سريعًا ومشاركة واسعة دون الاعتماد على وسطاء مركزيين."
قال لي أيضًا إن مشروع OORT يخطط لإصدار عدة مجموعات بيانات في الأشهر المقبلة. ومن بين هذه البيانات مجموعة بيانات أوامر الصوت داخل السيارة، مجموعة بيانات أوامر الصوت للمنزل الذكي، ومجموعة بيانات الفيديو المزيف العميق المصممة لتحسين قدرة التحقق من صحة الوسائط المدفوعة بالذكاء الاصطناعي.
أكدت Cointelegraph بشكل مستقل أن مجموعة البيانات المذكورة قد تصدرت الصفحة الرئيسية في وقت سابق من هذا الشهر في فئات الذكاء الاصطناعي العام، والتجزئة والتسوق، والصناعات التحويلية، والهندسة على Kaggle. حتى وقت كتابة هذا التقرير، لم تعد مجموعة البيانات تحتفظ بهذه المراتب بعد تحديث غير ذي صلة في 6 مايو وتحديث آخر في 14 مايو.
على الرغم من الاعتراف بهذا الإنجاز، صرح Subramaniam لـ Cointelegraph "أن هذا ليس مقياسًا حاسمًا للتطبيق الفعلي أو الجودة على مستوى الشركات." وأشار إلى أن خصوصية مجموعة بيانات OORT "لا تكمن فقط في الترتيب، بل أيضًا في مصادر المجموعة وآلية التحفيز خلفها." وواصل شرحه:
"بخلاف الموردين المركزيين الذين قد يعتمدون على عمليات غير شفافة، يمكن لنظام شفاف يعتمد على حوافز الرموز أن يوفر إمكانية تتبع وإدارة مشتركة من قبل المجتمع وإمكانية تحسين مستمرة، بشرط إنشاء هيكل حوكمة مناسب."
قال ليكس سوكولين، الشريك في مؤسسة Generative Ventures لرأس المال المغامر في الذكاء الاصطناعي، إنه على الرغم من اعتقاده أن هذه النتائج ليست صعبة النسخ، "إلا أن هذا يثبت حقًا أن مشاريع التشفير قادرة على استخدام آليات التحفيز اللامركزية لتنظيم أنشطة ذات قيمة اقتصادية."
أظهرت البيانات التي نشرتها مؤسسة Epoch AI لأبحاث الذكاء الاصطناعي أن البيانات التدريبية الخاصة بالنصوص التي ينتجها البشر من المتوقع أن تنفد بحلول عام 2028. لقد أصبح الضغط كبيرًا لدرجة أن المستثمرين يعملون حاليًا على تسهيل الصفقات للحصول على حقوق استخدام المواد المحمية بحقوق الطبع والنشر لشركات الذكاء الاصطناعي.
لقد تم تداول تقارير بحثية حول نقص بيانات تدريب الذكاء الاصطناعي المتزايد وكيف يمكن أن يقيد ذلك تطور هذا المجال لسنوات عديدة. على الرغم من أن البيانات المولدة بواسطة AI ( تستخدم بشكل متزايد وتحقق بعض النتائج، إلا أن البيانات التي ينتجها البشر لا تزال تُعتبر عمومًا الخيار الأفضل، حيث إن هذه البيانات عالية الجودة يمكن أن تُنتج نماذج ذكاء اصطناعي ذات أداء أفضل.
في مجال تدريب الصور باستخدام الذكاء الاصطناعي، أصبحت الأمور أكثر تعقيدًا، حيث يقوم الفنانون عمداً بتخريب عمليات التدريب. لحماية أعمالهم من الاستخدام غير المصرح به في تدريب الذكاء الاصطناعي، يتيح أداة Nightshade للمبدعين "تسميم" صورهم، مما يؤثر بشكل كبير على أداء النموذج.
وأشار سوبارامانيام: "نحن ندخل عصرًا تزداد فيه ندرة بيانات الصور عالية الجودة." كما أكد أن الاستخدام الواسع لتقنية تسميم الصور يجعل هذا التحدي أكثر صعوبة:
"مع ظهور تقنيات إخفاء الصور وطرق تسميم تدريب الذكاء الاصطناعي مثل العلامات المائية المعادية، تواجه مجموعات البيانات المفتوحة تحديات مزدوجة في الكمية والمصداقية."
في ظل هذه الأوضاع، ذكر سوبارامانيام أن مجموعات البيانات التحفيزية القابلة للتحقق والمساهمة من المجتمع "أصبحت أكثر قيمة من أي وقت مضى". ويعتقد أن هذه الأنواع من المشاريع "لا يمكن أن تكون بديلاً فحسب، بل ستصبح أيضًا دعائم مهمة في اقتصاد البيانات، من حيث توافق الذكاء الاصطناعي وتتبع البيانات."
توصيات ذات صلة: انضمام Kima إلى صندوق Mastercard لتحقيق إعادة شحن بطاقات العملات المستقرة