La Revue des médias
De plus en plus installé, le journalisme automatisé interroge toujours

Illustration représentant un homme (en rouge) dont le torse sort d'un écran d'ordinateur. Il serre la main à un autre homme (en bleu) assis derrière son bureau.

De plus en plus installé, le journalisme automatisé interroge toujours

Apparu au tournant des années 2010, le journalisme automatisé s’est frayé un chemin au sein des salles de rédaction, notamment pour communiquer des résultats sportifs ou électoraux. Si cette technologie ouvre de nouveaux horizons, elle s’accompagne aussi de questions plus larges reliées à son utilisation.

par Samuel Danzon-Chambaud

Publié le 26 février 2020

Temps de lecture : 7 min

Assis à son poste de travail, une étiquette portant la mention « Presse » glissée dans la lanière d’un chapeau en feutre, un robot d’apparence humanoïde semble être en pleine réflexion devant sa machine à écrire. Cette image, dont des dizaines de variantes existent sur Internet, est devenue monnaie courante pour illustrer un phénomène nouveau, apparu au tournant des années 2010 : le robot-journalisme ou journalisme robotisé. Un peu bancale, cette appellation sert à désigner la production automatisée de textes au sein d’une salle de rédaction. En fait, il s’agit essentiellement d’une solution informatique qui fonctionne à partir de données puisées en ligne, lesquelles viennent se greffer à des modèles de textes pré-rédigés, le tout orchestré par un jeu d’algorithmes.

S’il convient mieux de parler de « journalisme automatisé », à l’instar de nombreuses études publiées sur le sujet, l’usage de ces métaphores robotiques n’en a pas moins suscité tout un émoi au sein de la profession journalistique. Des craintes que les propos d’un responsable d’une startup générant ce type de textes, Narrative Science, n’ont guère atténuées, puisque celui-ci affirmait dès 2011 qu’un article écrit par l’ordinateur remporterait un prix Pulitzer d’ici cinq ans. Un tel succès n’a évidemment pas été au rendez-vous, mais cela n’a pas empêché le journalisme automatisé de connaître des progrès considérables au cours des dernières années, lesquels se sont tout de même accompagnés d’interrogations multiples.

Des États-Unis à l’Asie, du sport à l’économie

Dès le début des années 2010, alors que Narrative Science, nouvellement créée, travaille essentiellement sur des articles économiques et sportifs, le Los Angeles Times marque également les débuts du journalisme automatisé. D’abord en couvrant de manière automatique tous les meurtres et homicides du comté de Los Angeles, puis plus tard en développant un programme capable de générer des alertes de tremblements de terre, l’organisation médiatique a fait de nombreuses émules, parmi lesquelles l’agence de presse Associated Press. En 2014, cette dernière annonce un partenariat avec la startup Automated Insights pour automatiser une partie de sa couverture financière. Dans la foulée, le Washington Post développe son propre programme pour couvrir les Jeux olympiques de Rio de Janeiro.

En Europe, en particulier dans les pays nordiques, la technologie est employée dès 2015 pour automatiser des articles économiques de l’agence danoise Ritzau, ou encore des résultats sportifs au sein du groupe de médias suédois Mittmedia. En Norvège, l’agence de presse NTB développe, peu de temps après, un programme informatique pour suivre les matchs de football. Ailleurs en Europe, d’autres poids lourds de l’industrie médiatique, comme Le Monde ou la BBC, ont recours au journalisme automatisé via des fournisseurs externes. En ce qui concerne la Chine, peu d’informations ont filtré à l’égard d’un public occidental, bien qu’il soit établi que des stratégies d’automatisation sont en place dans certains médias (1) .

Une couverture micro-locale des résultats électoraux

Puisque son fonctionnement requiert des textes écrits à l’avance et dépend des bases de données disponibles, le journalisme automatisé est un candidat de choix pour délivrer des informations simples telles que les résultats des marchés financiers, de rencontres sportives ou encore de campagnes électorales ou référendaires. Quelques grands médias se sont d’ailleurs fait la main sur ce dernier point, en générant des textes personnalisés à destination d'un public micro-local.

Dès 2015, Le Monde s’est ainsi associé à la startup française Syllabs afin de couvrir les résultats des élections départementales de manière automatisée. Selon le directeur général et co-fondateur de Syllabs, Claude de Loupy, le journalisme automatisé peut s’avérer particulièrement utile dans des circonstances où le journaliste serait dépassé par le volume d'informations à traiter. Des propos dont la rédaction du Monde se fait l’écho, en assurant que « les journalistes du Monde n'avaient de toute façon pas la capacité de produire 30 000 articles sur 30 000 communes en une nuit ».

Trois ans plus tard, en 2018, le groupe de presse suisse Tamedia mobilise entre autres la startup Automated Insights afin de couvrir les résultats d’un référendum, avec toutefois un défi supplémentaire : communiquer les résultats dans deux des langues officielles, le français et l’allemand. Le service politique de Tamedia a préalablement été mis à contribution afin de déterminer les scénarios possibles et écrire les modèles de textes permettant à la technologie de fonctionner. Au final, 40 000 articles ont été publiés en quelques minutes, alors que, selon les responsables du projet, plus de 800 jours de travail auraient été nécessaire à un journaliste.

Plus récemment encore, après avoir tâté prudemment le terrain, la BBC s’est à son tour pleinement investie dans le journalisme automatisé lors des dernières élections générales au Royaume-Uni. Pour l’occasion, elle s’est associée à la startup britannique Arria afin de bâtir une véritable chaîne de production d’articles automatisés que ses journalistes concevaient en amont, mais aussi vérifiaient et complétaient avant publication. Cette forme de « journalisme semi-automatisé » a permis de publier près de 700 articles couvrant chacune des circonscriptions électorales, dont une quarantaine en gallois.

Pour l’heure, le journalisme automatisé reste limité à la simple communication de résultat

À l’instar de rencontres sportives ou de la Bourse, les soirées électorales et référendaires s’avèrent être un laboratoire d’essais efficace pour le journalisme automatisé. Cette année encore, de grands médias et groupes de presse renouent avec la technologie pour les prochaines échéances électorales. En France, une quinzaine de médias, dont Ouest-France et France Bleu, auront recours aux services de Syllabs pour les prochaines élections municipales ; aux États-Unis, le Washington Post a créé, conjointement avec l’expert en journalisme automatisé de l’université Northwestern Nick Diakopoulos, un « laboratoire de journalisme computationnel » qui sera à l’œuvre lors des prochaines élections présidentielles.

Pour l’heure, le journalisme automatisé reste limité à la simple communication de résultats, le plus souvent extraits d’une base de données en ligne. Si plusieurs études ont montré que l’information produite de manière automatisée est suffisamment digne de confiance aux yeux des lecteurs, créer des textes agréables à lire se révèle plus ardu.

Des limitations claires

À l’université d’Helsinki, en Finlande, un groupe de chercheurs travaille sur une possible avancée : mêler les méthodes de génération de textes automatisés employés jusqu’à présent à des techniques de machine learning (ou apprentissage automatique) plus pointues, lesquelles reproduisent le style qui se dégage d’un grand nombre d’articles grâce à des analyses avancées. Cette approche hybride est notamment à l’œuvre au sein du projet européen Embeddia, qui s’attèle à transposer le sens général d’un texte vers une autre langue, en analysant la manière dont les mots sont reliés entre eux, en fonction du contexte. À terme, cette démarche qui diffère de la traduction devrait permettre à des langues moins communément parlées, comme le finnois, de bénéficier du même accès à l’information que celles ayant une meilleure visibilité sur la scène mondiale. Les chercheurs d’Embeddia espèrent aussi, par là même, ajouter un peu de couleur et de créativité aux textes générés par ordinateur, les programmes informatiques pouvant en partie apprendre la structure qui se dégage des métaphores.

Le style d’un texte n’apparaît toutefois pas comme la seule limitation du journalisme automatisé. On constate ainsi que la génération de milliers d’articles en l’espace de quelques minutes, comme dans le cas du Monde et de Tamedia, rend impossible toute vérification à taille humaine. Et lorsque les sources sont erronées, les conséquences peuvent être calamiteuses : en 2017, une alerte de tremblement de terre a malencontreusement été envoyée à des rédactions après que l’Institut d'études géologiques des États-Unis eut révisé l’emplacement d’un séisme s’étant déroulé en 1925, au large de la Californie. Le programme du Los Angeles Times s'occupant d’écrire des alertes de tremblement de terre automatisées n’y a vu que du feu, ce qui l’a conduit à publier une alerte pour un séisme vieux de près d’un siècle que le journal a par la suite rétractée.

Ce nouveau cheminement journalistique donne aussi matière à réflexion d’un point de vue sociétal

Ce nouveau cheminement journalistique donne aussi matière à réflexion d’un point de vue sociétal. La production de textes personnalisés adaptés aux préférences des lecteurs peut paraître bénigne lorsqu’il s’agit de rencontres sportives, mais quand il est question de leurs inclinations politiques, cela ne risquerait-il pas à terme d’alimenter la « bulle de filtres »(2) décrite par l’activiste d’Internet Eli Pariser ? Quant aux journalistes, à l’heure où les effectifs diminuent (environ 35 000 en France) et où la situation de nombre d’entre eux se précarise, il reste à savoir si cette technologie permettra bien à l’homme et à la machine de travailler en symbiose, ou si les professionnels de l’information perdront progressivement leur savoir-faire journalistique au profit de systèmes automatisés.

La première hypothèse, défendue par la journaliste Meredith Broussard dans Artificial unintelligence: how computers misunderstand the world (2018), verrait l’émergence de systèmes où les machines brasseraient une quantité énorme d’informations pour mener à bien les tâches les plus rudimentaires, mais où les humains prendraient soin des cas spécifiques qui demandent plus d’attention. C’est du moins ce que l’agence américaine Associated Press affirme avoir réussi : dans un rapport publié en 2017, l’organisation soutient que sa couverture automatisée des résultats financiers a permis de libérer ses journalistes de 20 % de leur temps de travail, leur permettant de le réinvestir vers des tâches plus complexes et davantage qualitatives. La seconde hypothèse, portée par l’écrivain Nicholas Carr dans Remplacer l'humain : Critique de l'automatisation de la société (2017), soutient à l’opposé que l’automatisation croissante des tâches équivaudrait à une perte de moyens, à l’image de pilotes ne sachant plus manœuvrer un avion à force de s’être trop habitués au pilotage automatique. Aussi, il s’agira de voir si les journalistes ayant recours à des phrases toutes faites suggérées par l’ordinateur, à l’instar de ce qui avait été écrit au sujet de l’agence Reuters, ne se sentiront pas diminués dans l’exercice de leurs fonctions.

Au final, le journalisme automatisé rebat bien les cartes dans le domaine de l’information, mais inciterait aussi paradoxalement les journalistes à renouer avec ce qu’ils ont de plus humain pour maintenir leur avantage compétitif : faire preuve de sensibilité, développer son flair journalistique, ou encore entretenir ses sources… Tout ce qui manque à leurs congénères informatiques.

(1)

LINDÉN, Carl-Gustav (dir.). TUULONEN, Hanna (dir.). News automation: The rewards, risks and realities of ‘machine journalism’, Francfort-sur-le-Main, WAN-IFRA, 2019.

(2)

Développé dans The filter bubble: what the Internet is hiding from you,le concept de « bulle de filtre » évoque l’idée selon laquelle un internaute se verrait renforcé dans ses propres convictions à force qu’un jeu d’algorithmes lui suggère continuellement des contenus similaires à ce qu’il pense déjà, notamment sur les réseaux sociaux. Cela aurait pour effet de ne plus le confronter à des opinions qui divergent des siennes, renforçant le phénomène de polarisation du public.

Samuel Danzon-Chambaud

Chercheur à l’Institute for Future Media and Journalism

Ne passez pas à côté de nos analyses

Pour ne rien rater de l’analyse des médias par nos experts,
abonnez-vous gratuitement aux alertes La Revue des médias.

Retrouvez-nous sur vos réseaux sociaux favoris

Le journalisme de données

De la collecte à la scénarisation de larges bases de données pour en extraire de l’information compréhensible par tous, cette technique génère de nouveaux défis.

par

Caroline

Goulard

le 31 août 2010

La radio, premier média en Afrique - épisode 1/4

Les radios internationales en Afrique

L'hégémonie des radios internationales en Afrique repose sur la faillite des médias publics remise en cause aujourd'hui par la montée en puissance des radios privées.

par

Pierre

Barrot

le 20 octobre 2010