Bitget App
تداول بذكاء
شراء العملات المشفرةنظرة عامة على السوقالتداولالعقود الآجلةEarnمربعالمزيد
توسيع بيانات Tether لـ QVAC Genesis II إلى 148 مليار رمز AI

توسيع بيانات Tether لـ QVAC Genesis II إلى 148 مليار رمز AI

CryptotaleCryptotale2025/12/23 08:44
عرض النسخة الأصلية
By:Cryptotale
  • QVAC Genesis II توسع تدريب الذكاء الاصطناعي المفتوح ليشمل 148 مليار رمز عبر 19 مجالاً أكاديمياً.
  • تقوم مجموعة البيانات بتدريب النماذج على شرح الخيارات وتحسين الاستدلال بما يتجاوز السطحية .
  • Tether Data تطرح مجموعة البيانات بشكل مفتوح لدعم الباحثين خارج أنظمة الذكاء الاصطناعي المغلقة.

أصدرت Tether Data مجموعة QVAC Genesis II، موسعةً مجموعة بياناتها التعليمية الاصطناعية المفتوحة للذكاء الاصطناعي لتشمل 148 مليار رمز عبر 19 مجالاً أكاديمياً. يضيف هذا التحديث 107 مليار رمز إلى إصدار Genesis I السابق، ويجعل من مجموعة البيانات هذه أكبر مورد تعليمي اصطناعي متاح للعامة في العالم لتدريب الذكاء الاصطناعي المسبق.

ذكرت QVAC، قسم أبحاث الذكاء الاصطناعي في Tether Data، أن هدف مجموعة البيانات هو تعزيز الاستدلال والشرح واتخاذ القرار في نماذج الذكاء الاصطناعي بدلاً من التعلم السطحي للأنماط. تأتي الإصدار في وقت تظل فيه العديد من مجموعات البيانات التدريبية المتقدمة مقيدة ضمن أنظمة ملكية، مما يحد من وصول الباحثين المستقلين والمؤسسات الأكاديمية إليها.

حجم مجموعة البيانات والتغطية الأكاديمية

تمتد مجموعة البيانات الموسعة عبر 19 مجالاً أكاديمياً وتركز على العمق في الاستدلال التعليمي عبر مهام الاستدلال المنظم. ذكرت QVAC أن زيادة الحجم تدعم تدريباً أكثر اتساقاً للنماذج التي تتطلب مخرجات قائمة على الشرح بدلاً من التنبؤ النصي الاحتمالي فقط.

وبالتالي، تركز مجموعة البيانات على الوضوح والسببية عبر الأسئلة والأجوبة المستخدمة أثناء التدريب المسبق. وتظل مجموعة البيانات متاحة بشكل مفتوح للباحثين والجامعات والمطورين المستقلين الذين يعملون خارج المنصات المغلقة.

Tether Releases QVAC Genesis II, Expanding the World’s Largest Synthetic Educational Dataset to 148 Billion Tokens

تابع @qvac_tether واقرأ المزيد:https://t.co/FhKgwZEKCr

— Tether (@Tether_to) 22 ديسمبر 2025

أصدرت QVAC مجموعة Genesis II بموجب ترخيص Creative Commons Attribution–NonCommercial 4.0، مواصلةً نهج الترخيص المستخدم في Genesis I. وذكرت المنظمة أن الترخيص يدعم الاستخدام البحثي مع الحفاظ على نسب العمل وحدود الاستخدام غير التجاري. تتوفر مجموعة البيانات والنماذج ذات الصلة عبر Hugging Face، إلى جانب وثائق مفصلة وأدوات وصول.

طريقة جديدة للاستدلال على مستوى الخيارات

في قلب Genesis II توجد طريقة جديدة لتوليد البيانات تُسمى الاستدلال على مستوى الخيارات. تقوم الطريقة بتقييم كل خيار إجابة في سؤال متعدد الخيارات، بما في ذلك الخيارات الصحيحة والمفاهيم الخاطئة الشائعة.

بدلاً من اعتبار الإجابات الصحيحة كمخرجات نهائية، يفحص النهج سبب نجاح أو فشل كل خيار. ذكرت QVAC أن هذه العملية تعزز الاستدلال الصحيح مع معالجة الافتراضات الخاطئة مباشرةً ضمن بيانات التدريب.

تعتمد الطريقة على إطار تحليل الفشل الذي تم تقديمه في Genesis I. معاً، يشكل الأسلوبان خط إنتاج مزدوج يضمن أن كل عنصر مولد يساهم في القيمة التعليمية.

أظهرت التقييمات المستقلة التي استشهدت بها QVAC أن النماذج المدربة على بيانات Genesis II تحقق دقة استدلال أعلى وتقدم إجابات أوضح بشكل أكثر اتساقاً. ونتيجة لذلك، تحول مجموعة البيانات تركيز التدريب نحو الفهم المنظم بدلاً من الطلاقة فقط.

ذو صلة: Tether تقدم اقتراحاً للاستحواذ على نادي يوفنتوس لكرة القدم

البحث المفتوح وأهداف الذكاء الاصطناعي اللامركزي

ذكرت QVAC أن الإصدار يتماشى مع جهودها الأوسع لدعم تطوير الذكاء الاصطناعي المحلي واللامركزي. تهدف المبادرة إلى تمكين تدريب النماذج ونشرها دون الاعتماد على منصات السحابة المركزية.

من خلال توسيع أسس التدريب المفتوحة، تهدف Tether Data إلى إزالة الحواجز الهيكلية التي تواجهها مجموعات البحث الأصغر. وقال Paolo Ardoino، الرئيس التنفيذي لشركة Tether: "معظم تدريب الذكاء الاصطناعي اليوم يركز على الطلاقة، وليس الفهم".

وأضاف Ardoino: "مع هذا الإصدار، ندفع إلى ما هو أبعد من الحجم نحو البنية، والاستدلال، والوضوح". وأشار إلى أن الوصول المفتوح يمنح الباحثين الأدوات اللازمة لتطوير أنظمة ذكاء اصطناعي تظل قابلة للتفسير وموثوقة.

الورقة التقنية، بعنوان QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training، متاحة على مدونة أبحاث QVAC. كما نشرت QVAC أسئلة متكررة مفصلة ومواد داعمة على موقعها الرسمي.

مع توسع أنظمة الذكاء الاصطناعي في التعليم والعلوم والخدمات المالية، بما في ذلك تطبيقات التكنولوجيا المالية، هل يمكن لمجموعات البيانات المنظمة أن تعيد تشكيل كيفية تعلم أنظمة الذكاء الاصطناعي وعملها؟

0
0

إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.

منصة PoolX: احتفظ بالعملات لتربح
ما يصل إلى 10% + معدل الفائدة السنوي. عزز أرباحك بزيادة رصيدك من العملات
احتفظ بالعملة الآن!
حقوق النشر محفوظة لمنصة © 2025 Bitget