Occhiali intelligenti a controllo labiale

I ricercatori della Cornell hanno creato un nuovo tipo di dispositivo indossabile in grado di leggere le labbra dell'utente, anche se non parla ad alta voce e anche se non ha una fotocamera.

Gli occhiali dall'aspetto abbastanza normale, chiamati EchoSpeech, sono dotate di un'interfaccia di riconoscimento vocale silenzioso che utilizza il rilevamento acustico e l'intelligenza artificiale per riconoscere continuamente fino a 31 comandi non vocali, basati sui movimenti delle labbra e della bocca.

L'interfaccia indossabile a basso consumo, sviluppata dallo Smart Computer Interfaces for Future Interactions (SciFi) Lab di Cornell, richiede solo pochi minuti di dati di addestramento dell'utente prima che riconosca i comandi e possa essere eseguita su uno smartphone, hanno detto i ricercatori.

Dotati di un paio di microfoni e altoparlanti più piccoli delle gomme da matita, gli occhiali EchoSpeech diventano un sistema sonar indossabile basato sull'intelligenza artificiale, che invia e riceve onde sonore attraverso il viso e rileva i movimenti della bocca. Un algoritmo di deep learning, anch'esso sviluppato dai ricercatori di SciFi Lab, analizza quindi questi profili di eco in tempo reale, con una precisione di circa il 95%.

Inoltre, poiché gli occhiali non utilizzano la fotocamera, non rappresentano un problema di privacy sia per i loro utenti che per le persone che li circondano. Anche la durata della batteria migliora in modo esponenziale: dieci ore con rilevamento acustico contro 30 minuti con una fotocamera.

Secondo gli scienziati, l'uso potenziale della tecnologia, ovviamente con un ulteriore sviluppo, sarebbe per le persone che non possono vocalizzare il suono poiché questa tecnologia del parlato silenzioso potrebbe essere un eccellente input per un sintetizzatore vocale. Questo potrebbe restituire ai pazienti la loro voce.

Nella sua forma attuale, EchoSpeech potrebbe essere utilizzato per comunicare con altri tramite smartphone in luoghi in cui parlare è scomodo o inappropriato, come un ristorante rumoroso o una biblioteca tranquilla. L'interfaccia vocale silenziosa può anche essere abbinata a uno stilo e utilizzata con software di progettazione come CAD, eliminando del tutto la necessità di tastiera e mouse.


Followme

497 blog messaggi

Commenti