Meta ha annunciato che i suoi modelli di ricerca MMS (Massively Multilingual Speech) open source basati sull'intelligenza artificiale possono identificare più di 4.000 lingue parlate, 40 volte più di qualsiasi tecnologia precedente conosciuta, ed estendere la tecnologia text-to-speech e speech-to-text da circa 100 lingue a più di 1.100, che è più di 10 volte di più rispetto a prima.
Questo tipo di tecnologia potrebbe essere utilizzato per applicazioni VR e AR nella lingua preferita di una persona e in grado di comprendere la voce di tutti.
L'azienda afferma che molte delle lingue del mondo rischiano di scomparire e le limitazioni dell'attuale tecnologia di riconoscimento vocale non faranno che accelerare questa tendenza. Per rendere più facile per le persone accedere alle informazioni e utilizzare i dispositivi nella loro lingua preferita, stanno introducendo una serie di modelli di intelligenza artificiale (AI) che potrebbero aiutarli a farlo. Nella sua dichiarazione, Meta afferma di aver raccolto dati audio per l'addestramento all'intelligenza artificiale utilizzando testi religiosi come la Bibbia, che sono stati tradotti in molte lingue diverse e le cui traduzioni sono state ampiamente studiate per la ricerca sulla traduzione linguistica basata su testo.
Queste traduzioni hanno registrazioni audio pubblicamente disponibili di persone che leggono questi testi in diverse lingue. "Come parte del progetto MMS, abbiamo creato un dataset di letture del Nuovo Testamento in più di 1.100 lingue, che ha fornito in media 32 ore di dati per lingua. Considerando registrazioni non etichettate di varie altre letture religiose cristiane, abbiamo aumentato il numero di lingue disponibili a più di 4.000."
Sebbene questi dati provengano da un dominio specifico e siano spesso letti da parlanti maschi, l'analisi di Meta mostra che i loro modelli funzionano ugualmente bene per voci maschili e femminili.
Meta ha reso i suoi modelli linguistici e il suo codice open source in modo che altri membri della comunità di ricerca possano basarsi sul loro lavoro e aiutare a preservare le lingue del mondo e avvicinare il mondo. In futuro, vogliono aumentare la copertura MMS per supportare ancora più lingue, affrontando anche la sfida della gestione dei dialetti, che è spesso difficile per la tecnologia vocale esistente.