« L’IA est là pour de bon, que ce soit à la télévision ou à la radio »

Article  par  Xavier EUTROPE  •  Publié le 30.11.2018  •  Mis à jour le 30.11.2018
Quelle place pour la R&D au sein des grands médias ? Entretien avec George Wright de la BBC, entre expérimentation de l’intelligence artificielle et démontage d’enceinte intelligentes.

George Wright est responsable de la recherche Internet et des services du futur de la BBC


Vous êtes responsable du « Internet Research and Future Services for BBC Research & Development ». Qu'est-ce que cela signifie exactement ?

 Nous sommes ce que l’on pourrait appeler un laboratoire moderne de recherche industrielle George Wright : Nous avons une équipe composée d'ingénieurs, de chercheurs, de spécialistes de l'expérience utilisateur, de personnel de production et de personnes chargées de l'assurance qualité. Nous construisons de nouveaux services pour tester des hypothèses sur les futurs médias, mais dans le but de travailler avec des collègues du côté de la production à la BBC, afin d'améliorer leurs offres. Nous entretenons un grand nombre de collaborations à travers le monde, au Portugal par exemple avec Portugal Telecom, mais aussi en France avec un grand nombre de personnes. Nous sommes ce que l’on pourrait appeler un laboratoire moderne de recherche industrielle, avec l’espoir qu'il permette de faire le pont entre le meilleur du monde universitaire et le meilleur de la production télévisuelle et radiophonique.

 
Est-il vital pour un organisme de presse ou un radiodiffuseur public d'avoir un tel service ?

George Wright : C'est certainement très utile. C'était beaucoup plus courant auparavant, la plupart des radiodiffuseurs publics avaient un laboratoire semblable au nôtre. Beaucoup en ont encore. Au Japon, la NHK, le radiodiffuseur d'État, dispose d’un grand laboratoire avec lequel nous travaillons beaucoup. En Allemagne, l'IRT(Institut für Rundfunktechnik) n'est pas rattaché à un radiodiffuseur en particulier, mais il est là pour servir l’ensemble des radiodiffuseurs allemands et autrichiens. En France, je sais que France Télévision et Radio France ont des activités d'innovation similaires. Je pense qu'autrement, les médias deviennent ossifiés, ou alors ils sont soumis à la domination d’un oligopole d’organisations médiatiques de la côte Ouest des États-Unis, qui n'existent pas pour servir le public mais leurs actionnaires.


Quels sont les sujets les plus importants sur lesquels vous travaillez en ce moment ?

George Wright : Sur le futur des médias, comme toujours. Nous travaillons beaucoup sur les haut-parleurs connectés et la voix, particulièrement pour nous assurer que ce n'est pas seulement de la radio transposée sur un petit haut-parleur. Nous avons donc mené une série d'expériences interactives dans le but de tester les limites de ces nouveaux appareils. C’est en général ce que nous faisons avec la plupart des nouveaux appareils : nous les démontons, nous voyons ce qu'ils contiennent, si nous pouvons construire le nôtre, si nous pouvons travailler avec d'autres personnes qui font des choses intéressantes avec eux. Cela nous amène à travailler régulièrement avec des fournisseurs.

 Nous travaillons sur des solutions qui permettent, par exemple, de retrouver une photo de Theresa May qui parle de défense en France Nous travaillons aussi beaucoup sur l'analyse des contenus à grande échelle ainsi que sur l'extraction automatique des métadonnées et le classement par sujet. Par exemple, nous examinons les empreintes vocales dans le but d’identifier le locuteur, puis nous les triangulons avec la reconnaissance faciale et la détection des sous-titres, ce qui peut nous permettre, non seulement de trouver une photo de Theresa May, mais de retrouver une photo de Theresa May qui parle de défense en France. Et c'est le genre de chose qu'il est pratiquement impossible de faire manuellement. La BBC produit 1080 heures d'émissions chaque heure, en incluant toutes nos chaînes de télévision et de radio. Comment pouvons-nous apprivoiser ce contenu, le trier et permettre qu'il soit consulté ?

L'un des projets sur lesquels nous travaillons énormément est un programme destiné à être diffusé sur BBC4. Nous l’avons construit en utilisant l'intelligence artificielle et l'apprentissage machine afin de chercher des extraits et des programmes qui ont été automatiquement édités. C'est, nous semble-t-il, la première émission diffusée au monde à avoir été créée par des ordinateurs : non seulement les ordinateurs ont aidé à la sélection des extraits, mais les ordinateurs ont fait le montage.


Pensez-vous qu’il soit intéressant pour les médias de se diriger vers les enceintes connectées, même quand il s’agit d’organisations qui ne font pas habituellement des contenus audio ?

George Wright : Ce qui est intéressant, c'est de voir que certaines des organisations médiatiques qui ont le plus contribué à l'élaboration de certains des contenus sur ces appareils sont bien installées, comme NPR par exemple, qui s’en sort très bien. Mais comment créer du contenu pour ces appareils ? Vous ne pouvez pas simplement saisir votre contenu dans un logiciel de synthèse vocale et récupérer ce qui en ressort, vous devez savoir comment raconter des histoires. À la BBC, nous pensons être assez bons sur ce terrain, que ce soit avec les images et le son, donc nous avons adopté les smart speakers. Dans le domaine de la R&D, nous sommes assez sceptiques à l'égard de tous les nouveaux appareils qui sortent. Une fois, j’ai parlé à un fournisseur de matériel qui était très enthousiaste à propos d’un produit. Je lui ai alors dit que j'avais, stockés dans un laboratoire, de nombreux appareils qui étaient, à un moment, supposés être l'avenir des médias un jour. Il a ri et je lui ai montré une photo où l’on pouvait voir toutes ces machines empilées.

 Ce qui nous intéresse dans ces appareils, c’est qu’ils peuvent permettre de fournir du bon contenu aux utilisateurs Je pense que pour certaines de ces entreprises, ces appareils sont d’abord destinés à être des terminaux de recherche ou des systèmes dédiés au shopping. Il y a une sorte d'approche transactionnelle qui ressort des interactions, « rappelle-moi mes rendez-vous de demain », ou « je veux une pizza », et c’est très bien, c’est un usage comme un autre. Mais ce qui nous intéresse dans ces appareils, c’est qu’ils peuvent permettre de fournir du bon contenu aux auditeurs et aux utilisateurs en général. Aujourd’hui, la radio linéaire représente 51 % de l'écoute par le biais d'enceintes connectées au Royaume-Uni. Donc le défi ne consiste pas seulement à « pousser » n'importe quel contenu radio à travers elles, mais aussi à proposer quelque chose qui va au-delà des services audio à la demande existants.


La BBC a expérimenté l’intégration de chatbots dans certains articles pour essayer de donner plus de contexte aux lecteurs sur certains sujets, par exemple ce qui se passe en Amérique. Dans quelle mesure est-il intéressant pour un organe de presse d’avoir ce genre de service ou de se pencher dessus ? Est-ce difficile à mettre en œuvre ?

George Wright : Dans ce genre de recherche sur les médias, vous devez donner de l'autonomie à vos chercheurs : nous ne sommes pas dans une configuration où je dis vers quoi ils doivent aller d’ailleurs, ni ce qu’ils doivent faire. Personnellement, je ne suis pas un grand fan des chatbots, mais certains membres de mon équipe le sont, donc ils procèdent à des recherches dans ce domaine. Il faut qu'il y ait un débouché au-delà de la simple intégration d'un chatbot dans une histoire, il doit y avoir une utilité supplémentaire. Beaucoup des chatbots que j'ai vus au début pouvaient se comporter comme un serveur vocal interactif qui essaie de deviner pour moi ce que je veux. Si on leur avait donné une chose aussi simple et démodée que le plan d’un site web, vous auriez pu leur dire « je veux aller à cet endroit-là ». Mais vous auriez aussi pu leur demander comment changer votre vol avec vois points fidélité. L'attrait des chatbots réside dans le fait qu'ils peuvent être déployés entre plusieurs interfaces différentes, dont l'une est la voix. Pour ma part, je sais que je ferme la fenêtre que je consulte si je suis sur un site et que l'un d'eux apparaît.


Les chatbots amènent un autre sujet : l'intelligence artificielle. Dans quelle mesure est-il important pour un média de comprendre comment fonctionne l'IA ? Les médias doivent-ils faire appel à des ingénieurs pour qu'ils y réfléchissent ?

 En production et en archivage, l’IA ne prend pas de décisions pour les humains mais leur présente des solutions George Wright : C'est un exemple de sujet sur lequel nous sommes très investis. L’intelligence artificielle est là pour de bon, que ce soit à la télévision ou dans la production radiophonique. Nous l'utilisons déjà pour la détection de plans et de scènes, lorsque nous sommes en direct en délocalisation. Elle permet de rechercher ou de scruter des choses dans des cas où les humains sont incapables de le faire, ou juste quand ces derniers ont autre chose à faire. En production et en archivage, l’IA ne prend pas de décisions pour les humains mais leur présente des solutions. Elle pourrait vous dire « j'ai cherché les gens que vous vouliez trouver, je pense que ce sont eux ». Ce qui est beaucoup plus intéressant (et important) pour nous, c'est que la machine dise qu’elle a vu juste lorsqu’elle a effectivement raison. Nous préférons de loin qu'elle ne dise pas trop souvent que ce qu’elle nous propose est correct, et que ce qu’elle nous donne soit bon à 100 % dans ce cas-là. Nous évaluons et examinons les quatre ou cinq principaux grands fournisseurs de cloud computing, les services d'intelligence artificielle. Nous en utilisons nous-mêmes certains dans la production.
 
Pour nous, il s'agit d’avoir notre destin en main. La BBC a des façons de fonctionner bien particulières – et c’est aussi probablement le cas de l’audiovisuel public français – et elles ne sont pas au centre des préoccupations de certains des grands fournisseurs de cloud, si je puis dire. Donc, pour nous, il s'agit de produire des choses dans des domaines où nous avons une connaissance. Une grande partie de ce que nous faisons n'est pas de l'IA polyvalente, ce n'est d’ailleurs pas ce que les entreprises révolutionnaires qui travaillent dans le domaine appellent de l'IA. Mais pour nous, il s'agit d'apprentissage machine appliqué, avec la capacité de prendre des décisions et de présenter ensuite les résultats au producteur, ou même à l'utilisateur final.


Quel est alors le rôle des gens dans une salle de rédaction ? Sont-ils mis à contribution ?

 Toute IA est biaisée George Wright : Nous travaillons avec nos collègues qui se chargent de la production ainsi qu’avec les utilisateurs et essayons d'observer leur flux de travail. Il s'agit moins de leur demander ce qu'ils veulent que de voir ce dont ils ont besoin. Ce n'est pas la même chose. Il y a aussi un autre domaine de l'IA où nous travaillons en étroite collaboration avec eux… Toute IA est biaisée mais nous essayons de détecter quand elle l’a été de façon délibérée, ainsi que l’endroit où le biais a été introduit.
 
Il y a une autre problématique qui est en train d’émerger, et qui est vraiment effrayante, c’est celle des videos deepfake, dans lesquelles les voix et les propos des personnes qui apparaissent peuvent être modifiés sans que cela puisse se voir. En termes pratiques, cela donnera aux guerres d’édition de Wikipédia des allures de promenades au parc. Nous pensons donc qu'il est vital d'apporter nos connaissances, là où nous sommes bons, sur la façon dont l'IA peut être utilisée dans la production afin de voir où de mauvais acteurs ont pu être impliqués ailleurs.


Que pensez-vous de la réalité virtuelle (VR,), qui a été vue comme une technologie extrêmement prometteuse à un moment donné et qui semble aujourd’hui un peu plus discrète ? [voir notre série sur la réalité virtuelle]

 On a pu croire que le prix du kit de visionnage diminuerait au point où il serait presque gratuit, et que le montage s’améliorerait George Wright : Le problème, c'est le kit de visionnage, mais aussi le montage des contenus. Les deux étaient onéreux ou poussifs. Je pense que l’on a pu croire que le prix du kit de visionnage diminuerait au point où il serait presque gratuit, et que le montage s’améliorerait. Sur ce dernier point, il n’y a pas eu l’évolution espérée : il semble qu'il existe encore une série d'approches de montage propriétaites, ce qui est totalement contraire au mode de fonctionnement standardisé des kits de diffusion, ainsi qu'une source de regrets pour nous.
 
La BBC continue de produire des programmes de réalité virtuelle primés. La réalité augmentée fait toujours partie des activités de recherche et de développement de la BBC : nous avons des laboratoires dédiés au sujet, où un certain nombre de travaux sont menés. Pour revenir à la réalité virtuelle : a-t-elle été aussi populaire que les gens s'y attendaient ? Non. Cela veut-il pour autant dire que c'est fini ? Non, je ne le crois pas.


Revenons à l’audio : la BBC expérimente avec de courts contenus qui sont publiés sur les réseaux sociaux. Pourriez-vous nous en dire un peu plus ?

George Wright : Cela vient du travail réalisé dans mon équipe. Cela a vu le jour en partie à cause d'un défi de distribution purement technique, qui était que les réseaux vidéo populaires n'acceptaient pas les contributions exclusivement audio. Nous avions donc construit quelque chose qui permet d’analyser automatiquement la parole, le timbre et de détecter les sujets. À la BBC, quelqu'un a récupéré cela et l'a utilisé pour produire un outil assez sophistiqué qui vous permet d'ingérer le flux de nos réseaux radio et d'ajouter, si c'est de la musique, le nom de l’interprète, des formes d'ondes, ce qui peut ensuite être automatiquement ajouté à divers sites de médias sociaux. C'est un exemple de recherche fondamentale effectuée par la R&D avec une mise en œuvre effectuée par les équipes de production. C’est aussi un exemple fantastique de quelque chose qui a une vie bien plus intéressante que prévu, car au sein de la BBC, 250 personnes l’utilisent chaque semaine. C'est un exemple d’outil qui a été développé pour un usage spécifique mais qui a apporté une réelle valeur ajoutée et qui intéresse les gens.

 
Vous travaillez avec beaucoup d'appareils et de services proposés par de grandes entreprises des nouvelles technologies, vous arrive-t-il d'être confronté à des limitations qui vous empêchent de faire ce que vous voulez ?

George Wright : C'est une réalité de la vie. Nous procédons régulièrement à des démontages et des hackathons pour nous permettre de construire nos propres prototypes. Nous avions l’habitude de construire nos propres caméras et haut-parleurs à la BBC. Nous avons une forte tradition qui consiste à acheter du matériel ou à le construire nous-même, et nous sommes heureux de fabriquer, physiquement, des appareils. Il est possible aujourd'hui de faire des choses qui n'auraient pas été possibles il y a dix ans, avec un croisement entre arduinos, Raspberry Pi et le micro bit I de la BBC. Et ce à un coût très bas ainsi qu’avec des fonctionnalités complètes. L'idée qu'il est possible d'obtenir pour 4 € un boîtier Linux alimenté par batterie avec des interfaces de 2 Go de la taille d'un paquet de cigarettes est incroyable. La nature de certains des appareils qui sortent est de plus en plus propriétaire et fermée, mais d'un autre côté, il y a cet écosystème fantastique dans lequel il est possible de construire nos propres solutions.


--
Crédit photo : BBC R&D

Vous souhaitez nous apporter un complément, rectifier une information ? Contactez la rédaction