I suoni dei materiali, un algoritmo per riconoscerli

Posted in , , ,

Direttamente dal MIT, arriva un algoritmo in grado di predire i suoni dei materiali.

I ricercatori, per raggiungere il loro scopo, hanno dovuto creare un video in cui, utilizzando delle semplici bacchette di legno, colpivano/toccavano diversi materiali/elementi producendo suoni per così dire “normali”, come ad esempio il fruscio delle foglie. Tuttavia, molti di questi suoni erano in realtà falsi. Sono stati aggiunti al video, che non aveva alcun suono, da un algoritmo di deep-learning creato da ricercatori del MIT stessi.

suoni-dei-materiali

 

Nel corso di diversi mesi, infatti, i ricercatori hanno fatto oltre un migliaio di registrazioni di materiali diversi colpiti con una bacchetta. Quando ebbero finito, avevano ottenuto una biblioteca di 46.000 suoni. Poi, dopo aver inserito tutti i dati in un computer deep-learning, hanno analizzato il rapporto tra ogni traccia audio e le proprietà fisiche che si potevano percepire nel video. Da qui, è nato un algoritmo in grado di prevedere il suono che farà qualsiasi superficie colpita da una bacchetta. Il sistema talvolta recupera i suoni corretti dalla sua vasta biblioteca e, talvolta, sintetizza nuovi suoni in base alle proprietà dei materiali che vede nel video.

I ricercatori pensano che questo tipo di tecnologia potrebbe essere utilizzata per produrre automaticamente effetti sonori per film e spettacoli televisivi. Ma ancora più importante, potrebbe anche portare alla creazione di robot con potenzialità elevate, capaci di comprendere l’ambiente circostante.

L’intelligenza artificiale, dunque, è in grado di produrre suoni realistici capaci di ingannare gli stessi esseri umani. Questo “Test di Turing per il suono” rappresenta molto di più che un trucco dei computer intelligenti: i ricercatori, infatti, prevedono future versioni di algoritmi simili per aiutare i robot a comprendere meglio le proprietà degli oggetti.

suoni-dei-materiali1

Quando si sfrega il dito sulla superficie di un bicchiere di vino, il tipo di suono prodotto riflette la quantità di liquido che è in esso“, afferma Andrew Owens, ricercatore del “Computer Science and Artificial Intelligence Laboratory” (CSAIL). “Un algoritmo che simula tali suoni può rivelare informazioni chiave sulle forme degli oggetti e sui diversi tipi di materiali, così come la forza e il movimento delle loro interazioni con il mondo“.
Il team ha utilizzato delle tecniche dal campo del “deep-learning”, utilizzando computer didattici per setacciare grandi quantità di dati e modelli senza, quindi, dover ricorrere all’utilizzo di ulteriori algoritmi.
I co-autori della ricerca includono il neolaureato PhD Phillip Isola e i professori del MIT Edward Adelson, Bill Freeman, Josh McDermot e Antonio Torralba. Il documento è stato anche presentato alla conferenza annuale sulla Computer Vision e Pattern Recognition (CVPR) di Las Vegas.