Yandex, öneri sistemleri için açık veri seti Yambda’yı yayınladı

Yandex, öneri sistemleri için açık veri seti Yambda’yı yayınladı

Yandex, öneri sistemleri için açık veri seti Yambda’yı yayınladı

, öneri sistemleri alanındaki araştırmaları desteklemek amacıyla, müzik akış servisi ’teki etkileşimini içeren açık veri seti adıyla erişime açtı.

Şirketten yapılan açıklamaya göre, , öneri sistemlerinin kullanıldığı e-ticaret, sosyal ağlar ve kısa video platformları gibi alanlarda algoritmaların test edilmesi için evrensel bir ölçüt sunuyor. Araştırmacılar, bu veri setiyle yeni öneri algoritmalarını geliştirme ve test etme imkânı bulurken; sınırlı veriyle çalışan girişimler de ürünlerini ölçeklendirmeden önce sistemlerini Yambda ile test edebiliyor.

Yandex Öneri Sistemleri Başkanı , öneri sistemlerinin doğası gereği hassas veriler içerdiğine dikkat çekerek, “Sektör liderleri zor kazanılan araçları ve verileri paylaştığında, yükselen bir dalga etkisi yaratır. Araştırmacılar gerçek dünya ölçütlerine kavuşur, startuplar sadece teknoloji devlerinin erişebildiği kaynaklara erişir ve kullanıcılar da daha iyi bir kullanım deneyiminin keyfini çıkarır” ifadelerini kullandı.

Gerçek dünya koşulları için gerçekçi testler

Veri seti, öneri modellerinin zaman bağlamında değerlendirilmesine imkân tanıyan yöntemiyle yapılandırıldı. Böylece test ve eğitim verileri arasında zamansal kopukluklar yaşanmadan, gerçek dünya senaryolarına daha yakın bir modelleme yapılabiliyor.

Yambda, üç farklı boyutta sunularak farklı ölçek ve hesaplama ihtiyaçlarına sahip araştırmacı ve geliştiricilere hitap ediyor. Veri seti; formatında, ve gibi sistemlerle uyumlu olarak yayınlandı.

Gizliliğe büyük önem verilen veri setinde, tüm kullanıcı ve dinleme bilgileri anonimleştirildi ve sayısal tanımlayıcılarla değiştirildi.

Akademiden startuplara herkes için açık

Savushkin, öneri sistemlerinin yapay zeka alanındaki ilerlemelere rağmen, büyük ölçekli açık veri setlerinin azlığı nedeniyle geride kaldığını vurguladı. Yambda’nın, bu boşluğu kapatarak akademik dünyayla sektör arasında bir köprü kurduğunu ifade etti.

Veri setiyle birlikte sunulan temel modeller arasında ve gibi yöntemler yer alıyor. Bu modeller, araştırmacıların yeni algoritmalarını karşılaştırabilecekleri standartlar sağlıyor.

Yorum gönder