Tether, QVAC Genesis II’yi yayımladı: Sentetik eğitim veri seti 148 milyar token’a ulaştı

Tether, QVAC Genesis II’yi yayımladı: Sentetik eğitim veri seti 148 milyar token’a ulaştı

Vakıfbank 970x250

Sentetik yapay zeka eğitim verileri alanında önemli bir genişlemeye giden QVAC, Genesis II sürümünü yayımladı. Yeni sürümle birlikte 107 milyar token veri setine eklenirken, toplam hacim 19 eğitim alanında 148 milyar token’a ulaştı. Genesis II, kimya, bilgisayar bilimi, makine öğrenimi, istatistik ve fizik gibi temel STEM alanlarını kapsayan Genesis I üzerine inşa edilerek üniversite düzeyinde doğrulanmış, daha derin ve çok disiplinli bir sentetik veri altyapısı sunuyor.

QVAC Genesis II’nin merkezinde, yalnızca doğru sonuçlara değil, bu sonuçlara götüren muhakeme süreçlerine odaklanan Seçenek Düzeyinde Muhakeme (Option-Level Reasoning) yaklaşımı yer alıyor. Bu yöntem, çoktan seçmeli sorulardaki tüm yanıt seçeneklerini sistematik biçimde analiz ederek doğru muhakemeyi güçlendirirken yaygın hataları da açıkça ele alıyor; Genesis I’deki Hata Analizi yöntemiyle birlikte çalışarak her sorunun yüksek eğitsel değer taşımasını sağlıyor. Bağımsız değerlendirmeler, bu yaklaşımla üretilen verilerle eğitilen modellerin muhakeme doğruluğunda ve yanıt netliğinde belirgin iyileşmeler gösterdiğini ortaya koyuyor.

Bu yayın, yalnızca ölçeğin büyümesini değil, eğitim amaçlı yapay zeka verilerinin nasıl tasarlanması gerektiğine dair bilinçli bir yön değişimini temsil ediyor. QVAC’in yaklaşımı, metin hacmini artırmak yerine modellere nasıl düşüneceklerini, muhakeme edeceklerini ve açıklayacaklarını öğretmeyi hedefleyerek zekayı taklitten anlayışa taşıyor.

“Günümüzde yapay zeka eğitiminin çoğu, anlama değil, akıcılığa odaklanıyor”

Tether CEO’su Paolo Ardoino, “Günümüzde yapay zeka eğitiminin çoğu, anlama değil, akıcılığa odaklanıyor. Bu sürümle, hacmin ötesine geçerek yapıya, mantığa ve açıklığa yöneliyoruz. Zeka, sadece kulağa doğru gelen şeyi tahmin etmekle değil, bir şeyin neden doğru olduğunu anlamakla inşa edilmelidir. Bu veri setini açık hale getirerek, araştırmacılara ve geliştiricilere daha güvenilir, daha açıklanabilir ve nihayetinde topluma daha faydalı yapay zeka geliştirmek için araçlar sağlıyoruz.” dedi.

Genesis I’de olduğu gibi QVAC Genesis II veri seti de kapalı ve mülkiyetli sistemlerin dışında çalışan araştırmacıları, akademik kurumları ve bağımsız geliştiricileri desteklemek amacıyla Creative Commons Atıf–Ticari Olmayan (CC-BY-NC 4.0) lisansı altında açık olarak yayımlanıyor. Bu yayın, QVAC ve Tether Data’nın merkezi bulut platformlarına bağımlı olmayan, yerel ve merkeziyetsiz yapay zeka geliştirmeyi destekleyen daha geniş vizyonunun bir parçası olarak, yüksek kaliteli eğitim verilerine küresel erişimi güçlendirmeyi hedefliyor. Veri setine ve modellere Hugging Face üzerinden erişilebilirken, teknik ayrıntılar QVAC araştırma blogunda yayımlanan kapsamlı dokümanda ve QVAC web sitesindeki ek kaynaklarda paylaşılıyor.

  Hibya Haber Ajansı