Mozilla’nın Common Voice Projesi
2017 yılında Mozilla, Common Voice adı altında yenilikçi bir proje başlattı. Bu proje, dünya genelinden gönüllülerin ses kayıtlarını toplayarak, ses tanıma yapay zekâsının eğitiminde kullanılacak geniş bir veri seti oluşturmayı hedefliyordu. Bugüne dek 180 dilde toplam 30 bin saatlik konuşma verisi toplandı. Bu veriler, ses dosyalarının kamuya açık kaynaklar olarak sunulmasıyla herkesin kullanımına açıldı. Mozilla, bu verilerin kimler tarafından kullanıldığına dair çok fazla bilgiye sahip değil; ancak, kullananlar arasında büyük teknoloji şirketleri, küçük bağımsız geliştiriciler ve çeşitli projelerde çalışan ekipler yer alıyor.
Verilerin Kullanım Alanları
Mozilla’nın Common Voice projesi, toplanan ses örneklerinin her projede farklı oranlarda kullanılmasına olanak sağlıyor. Örneğin, hukuki danışmanlık hizmetleri sunan modeller veya müşteri temsilcisi sohbet botları gibi uygulamalar, veri setinin daha küçük parçalarını tercih ediyor. Şu ana kadar bu veri setinin milyonlarca kez indirildiği belirtiliyor.
Kültürel Çeşitlilik ve Katılım
Common Voice, farklı kültürlerden ve bölgelerden katılımcıların dahil olmasıyla sürekli olarak büyümeye devam ediyor. Projeye, yapay zekânın gelişmesine katkıda bulunmak isteyen teknoloji meraklılarının yanı sıra, kendi dillerinin ve kültürlerinin korunmasına yönelik çaba gösteren gruplar da büyük ilgi göstermektedir. Özellikle, kaybolmaya yüz tutmuş dillerden biri olan Gallerce’nin kayıtlarının korunması amacıyla bu proje, Galler hükümeti tarafından da desteklenmektedir.
Afrika Dilleri Üzerine Çalışmalar
Mozilla, ayrıca Afrika dilleri için de özel bir proje geliştirmektedir. Bu projeyle, kıtanın zengin dil çeşitliliğini korumak ve bu dillerin dijital dünyada temsil edilmesini sağlamak hedeflenmektedir. Böylece, hem kültürel mirasın korunması hem de teknolojik gelişmelere katkı sağlanması amaçlanmaktadır.