ZOE, la relation de demain avec nos machines

Mar 26

Je vais vous présenter ZOE, un visage digital qui peut exprimer les émotions humaines à la demande avec un réalisme sans précédent et qui va être l’expression d’une nouvelle ère de l’interface homme-machine (IHM).

Zoe : Qu’est-ce que c’est ?

ZoeListerLe système, appelé « Zoe », est le résultat de la collaboration entre les chercheurs du laboratoire de recherche Toshiba de Cambrige etle département ingénierie de l’Université de Cambrigde. Les étudiants ont fait ressembler le visage de Zoe à celui de Holly de la comédie britannique Red Dwarf. Mais en réalité, ils se sont inspirés du visage l’actrice Zoe Lister plus connue sous le nom de Zoe Carpenter dans la série Hollyoaks. Pour recréer le visage et la voix, les chercheurs ont passé plusieurs jours à enregistrer la voix et les expressions faciales de la vraie Zoe. L’idée ultime du système, est de permettre aux personnes d’utiliser leur propre voix et visage. Si bien que dans le futur, les utilisateurs pourront personnaliser leurs propres assistants digitaux avec des expressions émotionnelles.

Si cela peut être développé, l’utilisateur pourra par exemple écrire le message « Je serai en retard » et demander à créer une expression de déception. Leurs correspondants pourront recevoir un message avec un visage qui ressemblera à celui de l’expéditeur, qui répètera le message avec une expression de déception.

L’équipe qui a crée Zoe test aussi son application en travaillant avec une école pour autiste et enfants sourds. La technologie leur permettra d’aider les enfants à lire les émotions et lire sur les lèvres.

Le système pourra avoir des usages multiples – comme pour les jeux vidéo, pour les livres audiovisuels, comme moyen pour la mise en place de conférences en ligne et dans d’autres interfaces.

« this technology could be the start of a whole new generation of interfaces which make interacting with a computer much more like talking to another humain being » (cette technologie est le début d’une nouvelle génération d’interfaces qui permettront d’intéragir avec les ordinateurs mais plus proche de notre relation entre humains.) déclare le Professeur Roberto Cipolla du département ingénierie de l’Université de Cambridge.

 

Fonctionnement de Zoe

Zoe fonctionne avec les fondamentaux, les « couleurs primaires » des émotions. La voix de Zoe a, par exemple, 6 réglages de base : Heureux, Triste, Tendre, Enervé, Peur et Neutre. L’utilisateur peut ajuster ces réglages sur plusieurs niveaux, mais aussi modifier le son, la vitesse et la profondeur de la voix.

En combinant ces niveaux, il devient possible de créer presque toutes les émotions à l’infini. Par exemple, en combinant la joie avec la tendresse et en augmentant légèrement la vitesse et la profondeur de la voix, cela ressemble à une conversation accueillante et amicale. Une combinaison entre la vitesse, la colère et la peur transforme la voix de Zoe qui traduit l’expression de la panique.

Pour rendre le système le plus proche de la réalité, l’équipe de recherche a collecté des milliers de phrases.

 

Test de son fonctionnement sur des volontaires

Le système a été testé sur des volontaires. On a donné aux participants une vidéo ou un clip audio d’une phrase et il leur a été demandé d’identifier laquelle des 6 émotions est exprimée. 10 phrases ont été évaluées, chacune par 20 personnes différentes.

Les volontaires qui avaient une vidéo sans son, ont reconnu les émotions dans 52% des cas. Ceux qui ont eu seulement l’audio ont reconnu l’émotion dans 68% des cas. Ceux qui ont eux le son et l’image ont eu le meilleur résultat avec 77% de reconnaissance – même un peu supérieur au taux de reconnaissance de la Zoe réelle qui était de 73%.

Actuellement la IHM se limite à taper sur le clavier et utiliser une souris. Pour un grand nombre de personnes, cela rend l’utilisation de l’ordinateur difficile et frustrante. Dans le futur, il sera possible d’ouvrir l’utilisation de l’ordinateur à une plus grande proportion puisqu’ils pourront parler et interagir avec leur machine de manière plus naturelle. C’est ce pour quoi ils ont créé Zoe – une réponse plus expressive et émotionnelle, qui permettra d’avoir une conversation très proche de celle que l’on a avec un humain.

Traduction de la fin de la vidéo : Bientôt, je pourrai interagir en 3D et je serai capable de m’adapter à vos besoins. Mes créateurs veulent que je sois l’interface du futur. Un jour, je serai dans vos téléphones, dans vos assistants personnels. Je pourrai être votre tuteur, ou votre aidant. Je serai peut-être dans vos jeux vidéo, dans des publicités ou même dans des films.

Source : face of the future rears its heads

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *