L'intelligence artificielle de Google sait désormais lire sur les lèvres
- 1278 lectures
DeepMind, une filiale de Google, et l'université d'Oxford ont mis au point un programme capable de convertir les mouvements des lèvres en texte. Les applications concrètes de ce programme sont nombreuses.
Après avoir triomphé du champion du monde du jeu de Go, DeepMind revient. Cette fois-ci la société britannique a développé une intelligence artificielle capable de lire sur les lèvres et de convertir la voix humaine en texte.
Le taux d'exactitude de ce programme est supérieur à celui des meilleurs spécialistes humains. Baptisé LipNet, il parvient à un taux d'exactitude de 46,9% dans la reconnaissance des phrases prononcées, contre 23,8% pour le professionnel ayant servi de témoin. Et alors que jusqu'à présent les logiciels de reconnaissance labiale travaillaient sur des mots isolés, LipNet va plus loin et prédit désormais des phrases entières.
Pour apprendre à lire sur les lèvres des humains, le logiciel a écouté pas moins de 5000 heures d'émission de la BBC.
Message à un téléphone, transcription, doublage de films
Ce programme a été développé par les chercheurs de DeepMind en association avec des scientifiques de l'université d'Oxford.
Dans les conclusions de leur étude, les chercheurs ont déjà trouvé les potentielles applications de cette nouvelle forme d'intelligence artificielle: "Une machine capable de lire sur les lèvres ouvre la voie à de multiples applications comme la dictée d'instructions, la dictée de message à un téléphone dans un environnement bruyant, la transcription et le doublage de films sans son, la compréhension de discours où plusieurs personnes s'expriment et, plus largement, l'amélioration de la performance de la reconnaissance vocale".
On ne peut également s'empêcher de penser à ce que l'utilisation d'un tel programme pourrait donner entre les mains d'agences de renseignement.