Assistants vocaux : quelle voix pour l’information ?

Article  par  Xavier EUTROPE  •  Publié le 23.10.2018  •  Mis à jour le 02.11.2018
Nouveaux formats de l’info, 4e épisode : vous n’avez peut-être pas encore d’assistant vocal chez vous, mais les titres de presse se préparent activement à leur arrivée. Ils travaillent à la construction d’une offre pour Google Home ou encore Amazon Echo. Mais pourquoi ? Et surtout, comment ?
Le futur est vocal. En tout cas c’est ce que semblent croire de nombreuses sociétés de la Sillicon Valley. Et pour être plus concret, il faudrait préciser que ce sont les interfaces vocales qui semblent être promises à un brillant avenir. Les manifestations physiques des assistants vocaux, qui prennent la forme d’enceintes intelligentes, se multiplient.
 
Ces appareils doivent comprendre puis exécuter les demandes que leur soumet leur propriétaire. Parmi celles-ci, on peut retrouver des requêtes aussi basiques que le fait de déclencher un minuteur lorsque l’on cuisine, ou d’avoir la température qu’il fera le lendemain, afin de s’habiller en conséquence, voire l’actualité du jour…
 
Dans l’interview qu’il a accordée à InaGlobal en janvier 2018, Laurent Frisch, directeur du numérique à Radio France, désignait les assistants vocaux comme l’une de grandes tendances dans l’année pour les radios. En effet, quoi de plus logique pour une radio que de s’intéresser de près à des technologies et des services qui lui permettent d’étendre son audience potentielle, tout en capitalisant sur un savoir-faire reconnu dans le travail de la voix et, plus largement, du son.
 
Mais les assistants vocaux intéressent aussi des médias qui n’ont pas nécessairement pour habitude de travailler le son, notamment les titres de presse écrite. Marie Turcan, dans un article de Numerama, explique ainsi qu’Amazon a multiplié les partenariats avec différents journaux. Google Home permet aussi de consulter les contenus mis à disposition par des journaux. Mais ces plateformes n’ont pas les mêmes demandes ni les même fonctionnements. Qu’espèrent trouver les journaux  avec les assistants vocaux ? Cela modifie-t-il leur travail et leur façon de développer les contenus ? Entretien avec Clémence Lemaistre, rédactrice en chef numérique des Échos, acteur présent sur les appareils et services de Google et Amazon.



Pourriez-vous présenter l'offre des Échos concernant les différentes enceintes intelligentes ?

Clémence Lemaistre : Nous en sommes encore stade des expérimentations. Tout d’abord, nous sommes présents sur la Google Home avec une application – comme on pourrait en avoir une sur mobile. Pour la lancer, vous pouvez lui dire : « OK Google lance Les Échos » ou « mets Les Échos ». Une voix synthétique lit d'abord les titres de la une du site, puis les dernières infos affichées dans notre fil en direct qui se trouve sur l'application mobile mais pas sur le site. Il s’agit de petits textes d’environ 300 signes rédigés par les journalistes.
 
 Nous avons sorti l’application juste avant Noël. L'idée, pour être disponible avant les fêtes et les cadeaux. En plus de cela nous proposons quelques petits bonus. Les utilisateurs peuvent par exemple discuter avec les éditorialistes des Échos : il suffit de dire « je voudrais parler à Nicolas Barré », le directeur de la rédaction, et c'est sa voix qui répond. Ils sont plusieurs à avoir enregistré leur voix et préparé un petit message qu'on ne peut retrouver que sur Google Home. Nous avons sorti l’application en décembre [2017, ndlr], juste avant Noël. L'idée était d'être disponible avant les fêtes et les cadeaux.
 
Nous sommes aussi présents sur l’Amazon Echo, sorti mi-juin. Ce que nous proposons-là est complètement différent, car les demandes et les possibilités de développement des constructeurs ne sont pas les mêmes. Du côté d’Amazon, l’accent est mis sur leur flash briefing, un résumé de l’actualité qui peut contenir du sport, de l’actualité généraliste, de la politique internationale. Nous avons donc créé une petite capsule qui s'intègre à ce briefing, disponible sur Amazon Echo tous les matins à sept heures. Il s’agit d’un édito des Échos prononcé par un éditorialiste. C'est une vraie voix humaine qui raconte son texte.

 
Vous n’êtes pas présents sur le HomePod d’Apple ?

 Le plus important est de décider en amont ce que l'on veut faire et comment cela doit fonctionner. Clémence Lemaistre : Nos podcasts sont sur iTunes et donc, de fait, présents dans le HomePod. Mais nous n’avons pas développé d’application ou de skill [nom donné aux applications développées pour les appareils d’Amazon, ndlr] spécifique, et nous ne l’avons pas testé. C'est toujours plus compliqué de travailler avec Apple. C’était assez simple avec Google et Amazon, même s’ils ne font pas du tout les choses de la même manière. Pour l’application Google Home, nous avons dû réfléchir à des parcours de type « si la personne dit ça, il faut que ça fasse ça », « Si la personne dit autre chose, il faut que ça fasse ça ». C'était assez compliqué et nous avons travaillé avec une agence extérieure, Artefact, qui avait déjà fait des applications vocales. Si mes souvenirs sont bons, nous avons réalisé l’application en un mois et demi, ce qui est quand même assez rapide. Je pense que le plus important est de décider en amont ce que l'on veut faire et comment cela doit fonctionner. Pour nous, il y a une réelle logique : nous avons une stratégie ambitieuse et volontaire sur le digital,  proposer de nouveaux formats sur le site, être présent sur les nouveaux supports d’informations : cela forme un tout, tourné vers le digital.

 
Quel a été le cheminement au sein des Échos pour développer la présence du journal sur les assistants vocaux ?

Clémence Lemaistre : Nous essayons de toujours être dans l'innovation, que ce soit sur papier ou en numérique. Nous avons observé que les assistants vocaux arrivaient, que nous n’en étions qu’au tout début, certes, mais qu’il fallait y être le plus tôt possible pour pouvoir tester et apprendre, voir ce qu’il est possible de faire et commencer à prendre des positions. On l'a observé avec les applications mobiles : si vous vous lancez cinq ans après tout le monde, les gens n'ont plus de place dans leur téléphone pour la vôtre. La direction numérique et la rédaction ont travaillé main dans la main, en se demandant ce que nous pouvions proposer pour ces assistants vocaux. Ce que nous mettons en avant est encore assez simple, notamment parce que la voix n'est pas notre cœur de métier – c'est sans doute plus facile pour les radios. Mais c'est là que seront nos lecteurs dans quelques années. Il faut que l’on essaie de coller aux nouveaux usages.
 
 Avec l'assistant vocal, nous touchons notre public plus tôt [qu'avec le site], un peu comme avec le mobile. Notre réflexion continue, car nous sommes encore aux débuts de l’exploration. Amazon nous communique plus de chiffres que Google et nous observons un pic à 7 heures du matin sur leur assistant, c’est-à-dire dès que notre capsule est mise en ligne. Cela nous permet de trouver les lecteurs à un autre moment de la journée. La meilleure audience du site se situe entre 9h et 18h. Notre lectorat, y compris sur Internet, est plutôt CSP+, voire CSP++. Nous sentons que les gens arrivent au bureau et qu’une des premières choses qu'ils font est de regarder le site des Échos. Avec l'assistant vocal, nous touchons notre public plus tôt, un peu comme avec le mobile. L’autre pic se situe entre 18h et 20h, au moment où les gens rentrent chez eux.
 
Ces assistants vocaux nous permettent de créer de nouveaux liens avec des usagers, des lecteurs, des internautes, des auditeurs : de nouveaux points de contact apparaissent. Il faut donc réfléchir à ce que nous allons proposer, mais aussi déterminer comment nous allons répondre à la recherche vocale. C’est une pratique qui se développe beaucoup et nous sommes en train de réfléchir à la façon dont nous pourrions répondre à des questions comme : « OK Google, qu'a dit Emmanuel Macron au sommet de l'Union africaine ? ». Cela pose des questions de référencement vocal, un champ dont tout le monde cherche à comprendre le fonctionnement. Nous réfléchissons à développer un flux audio que nous pourrions diffuser via les assistants vocaux.
 
Nous discutons beaucoup avec Google par exemple, afin de savoir comment ils font évoluer leur Google Home pour déterminer comment nous pouvons répondre aux nouveaux besoins qui se créent, de coller au mieux aux nouveaux usages.
 

Pensez-vous qu'un média aujourd'hui, s'il veut rester dans la course, se doit d’être présent sur les assistants vocaux ?

 Lorsque les ventes décolleront, si un média n’y est pas, ce sera trop tard pour lui. Clémence Lemaistre : Je pense qu'il faut vraiment y réfléchir maintenant. Faut-il se lancer aujourd'hui ou dans six mois ? Il est peut-être possible d’attendre six mois, mais il faut vraiment entamer la réflexion maintenant sur la façon d’y être et de bien répondre aux besoins. Plus on engage la réflexion tard et plus on accusera du retard par rapport aux autres. Je ne crois pas que les ventes d’assistants vont exploser tout de suite en France, où elles sont plus faibles qu'aux États-Unis. Mais lorsque les ventes décolleront, si un média n’y est pas, ce sera trop tard pour lui.
 
Il est  important aujourd’hui de définir l’identité de l’offre. Pour Google Home, nous avons par exemple réfléchi à « la voix » des Échos : est-elle masculine, féminine ? Nous avons opté pour une voix d’homme qui donne l'impression à la personne qui pose la question, que la voix est celle de son secrétaire particulier, de son conseiller économique – ce qui correspond aux Échos. Si nous avions été le magazine Elle, nous n'aurions pas choisi le même genre de voix. Il faut prendre le temps de réfléchir à tout ça, et ce le plus tôt possible.


Quelles différences percevez-vous entre les différentes plateformes ?

Clémence Lemaistre : Amazon se situe davantage dans le marketing d'usage, notamment avec le Flash Briefing. Google a développé les Morning Briefing, ce qui est exactement la même chose, mais ce n’est pas mis en avant, alors qu’Amazon insiste énormément là-dessus. Je pense qu'il y a vraiment une volonté chez eux d’ancrer les usages dans leur communication, peut-être parce qu'ils sont arrivés avec six mois de retard par rapport à Google Home. Nous avons échangé avec des chefs de produit de Google qui nous ont montrés, ainsi qu’aux autres médias, comment cela fonctionnait. Nous avons pu faire des suggestions en expliquant ce qui allait fonctionner ou au contraire poser problème. Il y avait une certaine flexibilité, alors qu'Amazon nous a dit : « nous avons notre Flash Briefing, si vous souhaitez être inclus, il faut nous donner un flux RSS ». Les approches sont donc différentes et peut-être liées aux cultures des entreprises.

 
Pensez-vous qu’il soit compliqué aujourd'hui pour une rédaction de travailler avec les assistants vocaux ? Existe-t-il une barrière à l'adoption ?

Clémence Lemaistre : Ce n'est pas facile. Aux Échos, il y a une sorte de fascination pour quelque chose de nouveau, qui s’installe petit à petit. Il y a aussi beaucoup d'interrogations. Ce que nous savons faire, c’est écrire. En français, la langue n'est pas exactement la même à l’écrit qu’à l’oral, il y a plus de différence qu’en anglais, en tout cas au niveau journalistique. Et cela se voit dans le cadre de la synthèse vocale faite à partir des petits articles de notre flux de news : cela fonctionne mieux en anglais. J’ai écouté ce que fait le Financial Times, qui propose des articles lus, et c’est tout à fait écoutable. En français, si vous vous mettez à lire mot-à-mot une analyse des Échos avec une voix de synthèse, les gens vont s'endormir. C'est une vraie difficulté pour nous et pour toutes les rédactions de presse écrite. Prenons un papier de 6 000 signes : comment faire pour que, une fois passé par l’enceinte, celui-ci garde la même profondeur et reste de qualité, même s’il sera très probablement raccourci ? Il y a donc une difficulté dans l’adaptation de notre mode journalistique à un nouveau média.
 
Mais il s’est passé la même chose avec la vidéo, pour laquelle nous avons embauché des journalistes spécialisés. Si vous demandez à un spécialiste de l'automobile qui travaille dans la rédaction depuis 20 ans de faire une vidéo, cela risque de ne pas marcher. Ce sont les mêmes réflexions qui reviennent, ne serait-ce que pour monter le son. Embauche-t-on quelqu'un ? Fait-on venir un pigiste ? Pour l'instant, c’est le service vidéo qui monte les sons, mais ce n'est pas sa spécialité non plus, donc il peut arriver qu’il ne sache pas résoudre certains problèmes.


Vous envisagez donc d’avoir une équipe qui serait dédiée à la création des contenus pour les assistants vocaux ?

Clémence Lemaistre : Rien n'est décidé mais cela fait partie des réflexions en cours.


Quelles limites percevez-vous concernant l'utilisation de ces assistants vocaux, que ce soit du côté des journalistes ou de celui des lecteurs/auditeurs ?

 La mobilité est à la fois un frein et un accélérateur au développement des assistants vocaux. Clémence Lemaistre : Que ce soit aux Échos ou ailleurs, vous allez avoir cinquante journalistes qui sont à fond, vingt qui ne seront pas intéressés mais qui, si on va les voir, diront « Pourquoi pas ? », et puis vingt autres qui seront contre. La peur de ne pas savoir faire, tout simplement, ainsi que la crainte d’une surcharge de travail peuvent être des freins pour les journalistes.
Du côté des auditeurs, je vois deux choses. La première concerne les questions de données personnelles et d'atteinte à la vie privée – il y a beaucoup de débats autour de ça. Rappelez-vous cette histoire d'Alexa qui a enregistré une conversation qui n’était pas destinée à l’être et l’a envoyée ensuite à un destinataire sous forme de message. La seconde est liée à la mobilité des usages. Vous utilisez les assistants lorsque vous êtes chez vous, mais vous n'en avez pas forcément au bureau. Vous pourrez l’utiliser en voiture, mais ce n’est pas encore très répandu. La mobilité est à la fois un frein et un accélérateur au développement des assistants vocaux.


En sens inverse, quels peuvent être selon vous les avantages apportés par les assistants vocaux ?

Clémence Lemaistre : Du côté du journaliste, je vois deux choses. Cela peut renforcer un lien avec les lecteurs qui aiment déjà la marque Les Échos, qui vont ainsi pouvoir être en contact plus longtemps avec elle dans la journée. Mais ça peut aussi permettre de chercher de nouveaux lecteurs/auditeurs qui nous apprécient. J'aurais tendance à dire que c'est un peu comme au début d'Internet. Il y a des journaux qui ont dit qu’ils n’iraient jamais sur le web, mais finalement, il faut aller là où sont les gens. C’est la même chose avec les assistants vocaux. Les usages vont se développer dans les années à venir. Ce n'est pas inintéressant pour Les Échos d’y être, car les utilisateurs de ces appareils sont plutôt des gens un peu plus jeunes que nos lecteurs habituels. Et en même temps les personnes qui achètent des assistants vocaux ne sont pas tant différentes que ça de notre lectorat traditionnel.


Voyez-vous les assistants vocaux comme étant quelque chose de complémentaire à l'offre existante des Échos, ou juste comme une énième plateforme sur laquelle vous pouvez diffuser vos contenus disponibles ailleurs ?

Clémence Lemaistre : Dans un premier temps, nous commençons à transformer légèrement ce que nous avons déjà, pour tester et voir comment l'audience réagit. C’est ce qui nous a permis de réaliser l’application aussi vite et d’être présents à la sortie d’Amazon Echo et de Google Home. À terme, je pense que ça ne marchera pas si nous en restons-là. Il faut vraiment plancher sur une offre ad hoc, destinée à ces assistants vocaux. Il peut y avoir un mix des deux. À mon sens, cela nous ramène à certaines réflexions que l’on a connues au début d’internet, comme « c’est facile, on va mettre le papier sur le web ».
 
 Il faut à la fois adapter ce que l'on a déjà et créer de nouveaux formats. Mais si on se contente de mettre simplement le papier sur Internet, ce n’est pas suffisant. Sur le web, nous publions des articles qui viennent du journal et qui sont légèrement réédités. C'est un peu ce que nous faisons actuellement avec Amazon Echo. Nous proposons aussi sur le web des articles qui ne pourraient pas paraître dans le journal papier, parce qu’il y a des infographies au milieu, des vidéos, un éditing particulier, etc. Il faut réfléchir de la même façon pour les assistants vocaux : à la fois adapter ce que l'on a déjà, mais aussi créer des nouveaux formats spécifiques à ces assistants vocaux, pour lesquels l'usage est différent de celui de lire un journal ou de surfer sur un site web.


De bonnes pratiques doivent commencer à se dégager dans votre rédaction. Quels conseils donneriez-vous pour travailler avec des assistants vocaux ?

Clémence Lemaistre : Il faut parvenir à créer des petits sons de trente secondes ou une minute sur un point d'actualité. Il faut aussi essayer de proposer des analyses, du décryptage audio, qui ne seront pas simplement un article lu, car il faut adapter le ton, la vitesse, mettre du rythme, afin que les gens aient envie d'écouter, un peu comme une multitude de petits flashs radio ou comme le fil de l'AFP, mais dits oralement, qui pourraient permettre de répondre à des questions.
La grande question soulevée par les assistants vocaux, c'est que les gens ne vont pas forcément avoir l'idée de dire « je veux écouter Les Échos ». Ils vont plutôt poser une question et attendre une réponse. D'ailleurs on le voit bien, ce qui marche le mieux actuellement ce sont les questions concernant la météo. Imaginons qu’un utilisateur demande « quelle est la clôture de la Bourse ? ». Là, il faudrait que nous ayons un flux RSS son et que Google Home ou Alexa décident de dire, « selon Les Échos, le CAC 40 a terminé en hausse de 0,34 % ».
 
Derrière les assistants vocaux, il y a la recherche vocale. Le défi avec la recherche sur Google était d’être sur la première page [de résultats, ndlr], plutôt vers le haut. Mais avec les assistants vocaux vous n’avez qu’une seule réponse, un peu comme si vous appuyiez sur le bouton « j’ai de la chance ».


Les journaux écrits ne partent-ils pas avec un désavantage face aux radios, qui diffusent déjà leurs contenus sous forme audio ?

Clémence Lemaistre : Ça, c'est sûr.


Mais alors la compétition n’est-elle pas perdue, ou bien déséquilibrée, pour les médias écrits ?

 Nous partons avec un handicap mais nous en sommes tout à fait conscients. Clémence Lemaistre : Les médias radio ont eu énormément de difficultés avec le web. À part Franceinfo, les sites web de radio ne marchent pas très bien. Avec les assistants vocaux, nous assistons en quelque sorte à une revanche de la radio. Elles vont pouvoir « délinéariser » leurs flux. Il est évident qu'elles partent avec une longueur d'avance. C'est pour cela qu’il faut y aller tout de suite, car nous partons avec un handicap, comme si nous devions courir un 100 mètres mais que les radios n’en avaient plus que 50 à faire. Mais nous en sommes tout à fait conscients.


Votre expérience des podcasts vous procure-t-elle un avantage par rapport à certains médias qui n'ont pas du tout investi dans l’audio natif ?

Clémence Lemaistre : Oui, je pense que ça nous aide parce que cela nous a déjà permis d’appréhender le son. Avant nous n’en faisions pas du tout. Même si des journalistes peuvent s’adapter, il reste toute une technicité que nous n’avons pas. Avoir un studio d'enregistrement et un bon micro, c’est déjà un pas dans la bonne direction, car il y a des médias qui n'ont pas de cabine d'enregistrement. Or le son ne supporte pas la médiocrité. On peut s'habituer à une image un peu floue mais si on entend mal, c'est insupportable.


Peut-on écouter les podcasts que vous produisez sur les assistants vocaux où vous êtes présent ?

Clémence Lemaistre : Vous pouvez écouter n'importe quel podcast sur les assistants vocaux, ce qui n’est pas forcément spécifique aux Échos. En revanche, nos podcasts ne sont pas disponibles dans notre appli Google Home. Nous travaillons actuellement sur une nouvelle offre de podcasts, en étudiant deux pistes. Tout d’abord, des podcasts d'actualité, où l'on parlerait de ce qui se passe dans le monde à la manière des Échos, le but n’étant pas de faire un flash actu généraliste. En parallèle nous travaillons sur des podcasts qui sont un peu plus comme Business of Music ou Tech Off, sur des thèmes qui sont dans l'univers des Échos, assez affinitaires.
 
Nous sommes déjà présents dans le skill d'Amazon avec les éditos de la rédaction. Si nous lançons un podcast d'actualité quotidien, il faudra le mettre sur des assistants vocaux. Car les utilisateurs peuvent chercher les infos économiques du jour, et là nous pourrions y répondre. Nous nous interrogeons sur l’opportunité de proposer, dans l’application Google Home, les autres podcasts que nous produisons, car on peut de façon naturelle appeler les podcasts sur les assistants vocaux. Cela sert à poser des premiers jalons dans les assistants vocaux, mais aussi à faire en sorte que les utilisateurs, encore assez peu nombreux en France, se disent « ah tiens les Échos sont déjà là ».


Quels sont les retours de vos auditeurs ?

Clémence Lemaistre : Les retours sur les podcasts, notamment Tech Off, lancé il y a presqu’un an, sont plutôt favorables. Nous n’en avons pas tellement sur les assistants vocaux. Mais les gens sont intéressés. Je suis allée parler de ce que nous faisons aux Échos au Hub Institute et quelqu’un est venu me voir en me demandant s’il pourrait avoir la radio des Échos au lieu de Franceinfo sur son enceinte. Ce à quoi j’ai répondu « pas tout de suite, mais on y travaille ». Pour Franceinfo, c'est facile, ils ont un flash toutes les sept minutes, ce qui n’est pas notre cas. Si nous voulons faire la même chose, nous devrons recruter !
 
Le site internet classique doit continuer à se développer mais nous devons aussi explorer de nouvelles possibilités. Je crois aux assistants vocaux. Ils vont peut-être mettre un peu de temps à s’installer à cause des freins dont nous avons parlé, mais ils vont se répandre notamment grâce au développement des enceintes connectées dans les voitures qui va permettre une continuité de l’offre : vous commencez à écouter une émission, un podcast chez vous et vous poursuivrez l’écoute dans votre auto, sans rupture. À partir d'un certain âge je crois que l’on se dit « je suis en train de parler à un objet ». C’est un peu bizarre quand on y pense, ce n'est pas dans nos habitudes, mais ça ne pose pas de problème aux enfants. Les nouvelles générations utiliseront les assistants vocaux beaucoup plus facilement que nous.


Les Échos fêteront bientôt leur premier anniversaire de présence sur les assistants vocaux, j’imagine que vous ferez un bilan ?

Absolument, nous allons avoir des statistiques qui vont commencer à être intéressantes. Comme il n’y a pas énormément de gens sur les assistants vocaux, nous avons du mal à avoir des données qui veulent dire quelque chose. Je pense qu'il sera intéressant de s’y pencher à nouveau vers mars ou avril prochain, parce que beaucoup d’enceintes connectées devraient être offertes à Noël, donc nous pourrons voir si les usages suivent, que ce soit pour les Échos et tous les autres acteurs.

--
Crédit : 
Illustration : Ina. Yann Bastard
Vous souhaitez nous apporter un complément, rectifier une information ? Contactez la rédaction