- QVAC Genesis II ochiq AI o‘qitish hajmini 19 ta akademik sohada 148 milliard tokenlargacha kengaytirdi.
- Ma’lumotlar to‘plami modellarni tanlovlarni tushuntirish va yuzaki o‘rganishdan tashqarida mulohaza yuritishni yaxshilash uchun o‘qitadi.
- Tether Data ushbu ma’lumotlar to‘plamini ochiq tarzda chiqarib, yopiq AI tizimlaridan tashqaridagi tadqiqotchilarni qo‘llab-quvvatlaydi.
Tether Data QVAC Genesis II ni chiqardi va sun’iy intellekt uchun ochiq sintetik ta’lim ma’lumotlar to‘plamini 19 ta akademik sohada 148 milliard tokenlargacha kengaytirdi. Ushbu yangilanish Genesis I versiyasiga 107 milliard token qo‘shdi va ma’lumotlar to‘plamini AI oldindan o‘qitish uchun dunyodagi eng katta ochiq sintetik ta’lim resursiga aylantirdi.
QVAC, Tether Data’ning sun’iy intellekt tadqiqot bo‘limi, ushbu ma’lumotlar to‘plami AI modellarida yuzaki naqshlarni o‘rganishdan ko‘ra, mulohaza yuritish, tushuntirish va qaror qabul qilishni kuchaytirishga qaratilganini bildirdi. Chiqarilish ko‘plab ilg‘or o‘qitish ma’lumotlar to‘plamlari xususiy tizimlarda cheklangan va mustaqil tadqiqotchilar hamda akademik muassasalar uchun kirish imkoniyati cheklangan bir paytda amalga oshirildi.
Ma’lumotlar to‘plami hajmi va akademik qamrovi
Kengaytirilgan ma’lumotlar to‘plami 19 ta akademik sohani qamrab oladi va tuzilmaviy mulohaza yuritish vazifalarida ta’limiy mulohazalarning chuqurligiga qaratilgan. QVAC hajmning oshirilishi tushuntirishga asoslangan natijalarni talab qiladigan modellar uchun yanada izchil o‘qitishni ta’minlashini ta’kidladi.
Natijada, ma’lumotlar to‘plami oldindan o‘qitish jarayonida ishlatiladigan savollar va javoblar bo‘yicha aniqlik va sabab-natijaga e’tibor qaratadi. Ma’lumotlar to‘plami tadqiqotchilar, universitetlar va yopiq platformalardan tashqarida ishlayotgan mustaqil dasturchilar uchun ochiq qoladi.
QVAC Genesis II ni Creative Commons Attribution–NonCommercial 4.0 litsenziyasi ostida chiqardi va Genesis I uchun ishlatilgan litsenziyalash yondashuvini davom ettirdi. Tashkilot ushbu litsenziya tadqiqot maqsadlarida foydalanishni qo‘llab-quvvatlashini, shu bilan birga mualliflik va notijorat cheklovlarini saqlab qolishini bildirdi. Ma’lumotlar to‘plami va tegishli modellar Hugging Face orqali, batafsil hujjatlar va kirish vositalari bilan birga mavjud.
Yangi Variant Darajasida Mulohaza Yuritish Usuli
Genesis II markazida Variant Darajasida Mulohaza Yuritish deb nomlangan yangi ma’lumotlar yaratish usuli joylashgan. Ushbu usul ko‘p variantli savollardagi har bir javob variantini, to‘g‘ri javoblar va keng tarqalgan noto‘g‘ri tushunchalarni ham baholaydi.
To‘g‘ri javoblarni yakuniy natija sifatida qabul qilish o‘rniga, ushbu yondashuv har bir variant nima uchun muvaffaqiyatli yoki muvaffaqiyatsiz bo‘lishini tahlil qiladi. QVAC bu jarayon to‘g‘ri mulohazalarni mustahkamlashini va o‘qitish ma’lumotlaridagi noto‘g‘ri taxminlarni bevosita ko‘rib chiqishini ta’kidladi.
Ushbu usul Genesis I da joriy etilgan muvaffaqiyatsizlik tahlili asosida qurilgan. Ikkala texnika birgalikda har bir yaratilgan element o‘quv qiymatini ta’minlashini kafolatlaydigan ikki bosqichli pipeline hosil qiladi.
QVAC tomonidan keltirilgan mustaqil baholashlar Genesis II ma’lumotlarida o‘qitilgan modellar yuqoriroq mulohaza aniqligiga erishishini va aniqroq javoblarni izchil taqdim etishini ko‘rsatdi. Natijada, ma’lumotlar to‘plami o‘qitish e’tiborini faqat ravonlik emas, balki tuzilmaviy tushunishga qaratadi.
Tegishli: Tether Juventus Football Club’ni sotib olish bo‘yicha taklif berdi
Ochiq Tadqiqot va Markazsizlangan AI Maqsadlari
QVAC ushbu chiqarilish o‘zining mahalliy va markazsizlangan AI rivojlanishini qo‘llab-quvvatlash bo‘yicha kengroq harakatlari bilan mos kelishini bildirdi. Tashabbus modelni o‘qitish va joylashtirishni markazlashtirilgan bulut platformalariga tayanmasdan amalga oshirish imkonini berishni maqsad qilgan.
Ochiq o‘qitish asoslarini kengaytirish orqali Tether Data kichik tadqiqot guruhlari duch keladigan tuzilmaviy to‘siqlarni bartaraf etishni maqsad qilgan. “Hozirgi AI o‘qitishining aksariyati ravonlikka, emas, balki tushunishga yo‘naltirilgan”, dedi Tether bosh direktori Paolo Ardoino.
“Ushbu chiqarilish bilan biz hajmdan tashqariga chiqib, tuzilma, mulohaza va aniqlikka intilmoqdamiz”, dedi Ardoino. U ochiq kirish tadqiqotchilarga tushuntiriladigan va ishonchli AI tizimlarini ishlab chiqish uchun vositalar berishini qo‘shimcha qildi.
QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training nomli texnik maqola QVAC tadqiqot blogida mavjud. QVAC shuningdek, rasmiy veb-saytida batafsil FAQ va qo‘llab-quvvatlovchi materiallarni e’lon qildi.
AI tizimlari ta’lim, fan va moliyaviy xizmatlar, jumladan fintech ilovalariga kengayib borar ekan, tuzilmaviy ma’lumotlar to‘plamlari intellekt tizimlarining o‘rganishi va ishlashini o‘zgartira oladimi?


