Hai mai fatto una telefonata ad un amico che era in una festa rumorosa? Se è così, probabilmente sai che è complicato capire il suo corrispondente nel bel mezzo di una confusione. La ragione è semplice: a differenza di un essere umano, un microfono raramente distingue tra diverse sorgenti sonore e ritrasmette tutto ciò che ascolta.

Un fenomeno che potrebbe presto sparire. I ricercatori di Google hanno sviluppato un’intelligenza artificiale in grado di isolare le voci e il risultato è piuttosto impressionante.

Diverse colonne sonore e video

Per funzionare, Google ha guidato un’IA attraverso una tecnica, ora classica, di apprendimento approfondito . Il suo obiettivo: distinguere diverse sorgenti sonore da una singola registrazione. Il software analizza un ascolto e lo divide in tutte le tracce audio necessarie. La sua particolarità: l’analisi dell’immagine. L’intelligenza artificiale osserva i movimenti della bocca di una persona, identifica la fonte di una sorgente sonora e crea una traccia associata. Diventa possibile eliminare completamente il rumore di fondo di un video.

In un dibattito, il risultato è ancora più bluffante. Due persone parlano allo stesso tempo, ma puoi completamente tagliare il suono di uno dei due protagonisti, quindi ascoltare i loro testi separatamente. Google spiega che sono stati analizzati 100.000 video, ottenendo 2000 ore di video in cui è stato eliminato qualsiasi rumore di fondo. Google ha pubblicato quattro esempi sul suo blog dedicato alla ricerca, in cui si nota che l’intelligenza artificiale può selezionare una persona e ascoltare solo la sua voce.

Usi diversi

Grazie alla sua intelligenza artificiale, Google afferma di poter migliorare i sottotitoli automatici dei video di YouTube, che hanno la tendenza ad essere intrappolati non appena l’applauso o il rumore esterno vengono aggiunti ai testi. La società ha pubblicato un video che illustra la sua tecnologia e la sottotitolazione è effettivamente più rappresentativa della realtà una volta che il suono è stato tagliato.

Infine, il sistema potrebbe beneficiare direttamente gli utenti. Se riesci a immaginare che Google lo aggiunga a Hangouts o Duo per migliorare la qualità delle videochiamate, possiamo anche presumere che una futura versione di un oratore di  Google Home potrebbe anche trarne vantaggio. Tuttavia, essendo in grado di isolare tutti in una stanza, il rilevamento di una parola chiave come “OK Google” potrebbe essere migliorato.

Per ora, Google sta ancora pensando ai diversi usi della sua tecnologia.

Lascia una recensione

Please Login to comment
avatar
  Subscribe  
Notificami