DeepMind, l'IA de Google parvient à lire sur les lèvres.

DeepMind, l'IA de Google parvient à lire sur les lèvres.

Plus efficace que l’être humain.

– Article rédigé le par - 7

Nous avions déjà évoqué .
Elle avait réussi à , le coréen Lee Sedol.

L’IA s’affine et mime à la perfection le fonctionnement du cerveau humain, parfois elle le dépasse, et on l’a constaté lors de cette partie de jeu de Go, la logique de la machine a été infaillible.
Cette fois-ci, l’équipe de chercheurs de la filiale de Google, , s’est associée aux chercheurs de l’université d’Oxford afin de mettre au point une solution de lecture des mots sur les lèvres appelé WLAS : Watch, Listen, Attend, Spell.

Pour cela, les chercheurs ont entraîné la machine en lui faisant visionner 5000 heures de programmes télévisés, diffusées entre 2010 et 2015 à la BBC.
L’apprentissage a porté sur 118 000 phrases et 17 500 mots différents. Parmi les six émissions concernées se trouvaient Newsnight, BBC Breakfast, Question Time et The World Today.
Après avoir visionné et assimilé ces séquences, l’IA a été testée sur des émissions diffusées en mars et septembre 2016.
La lecture sur les lèvres opérée par L’IA a été un succès. La solution WLAS a réussi à reconnaître 46,8% des mots prononcés. Un expert humain en lecture sur les lèvres n’a pu en lire que 12,4%, malgré la possibilité de visionner plusieurs fois les émissions.
Il y a quelques jours déjà, les chercheurs de l’université d’Oxford avaient procédé à des tests avec leur solution appelée LipNet, les résultats avaient été probants puisque le taux de réussite de lecture était de 93,4%, en revanche ce test avait été effectué sur 51 mots seulement.
Il est à signaler également que le système WLAS parvient à différencier les homophones, les mots ayant un sens différent mais se prononçant de la même façon. Le mouvement des lèvres pour les homophones est identique mais l’IA fait la différence grâce à son avancée dans la compréhension et la logique de la langue.
Cette annonce en matière de lecture des mots sur les lèvres laisse à penser que de grands pas vont être franchis, notamment au travers d’applications d’aides aux malentendants.
L’avancée permettra d’améliorer les performances des applications de reconnaissance vocale mais également de doubler des films muets…
La liste des possibilités ouvertes dorénavant sur ce terrain, est infinie et pourrait même inquiéter si certains s’en emparaient à des fins d’espionnage.

Téléphonie VoIP IP, standards, centrex, connexions et abonnements internet pour les entreprises
Catégories :
AI (Intelligence Artificielle) Google High-tech Innovation