Retour à la source : le contenu généré par l’IA doit-il être étiqueté ?

Les éditeurs doivent labelliser leurs articles générés par l’IA. C’est du moins ce que pense la majorité des lecteurs d’après une nouvelle étude menée par Benjamin Toff de l’Université du Minnesota et Felix M. Simon de l’Oxford Internet Institute. Voici un aperçu du pour et du contre avec – le cas échéant – une citation correcte des sources.

Aujourd’hui, les éditeurs sont de plus en plus nombreux à générer des messages de blog via l’IA. Ce n’est pas illogique : de cette façon, le contenu destiné aux blogs est en effet livré facilement et efficacement. Grâce à l’IA, les éditeurs sont en mesure d’optimiser leur temps en confiant à des machines les tâches répétitives, telles que les corrections grammaticales et le traitement de texte, ce qui leur permet de se concentrer sur la création de contenus engageants de haute qualité.

Jusque-là, tout va bien, même si, dans le monde des éditeurs, la question se pose de plus en plus de savoir si ces articles doivent être étiquetés comme étant générés par l’IA. Et aussi : de savoir comment l’étiquetage ou non de ces articles impacte la perception du lecteur. Les deux questions ont récemment été investiguées par Benjamin Toff de l’Université du Minnesota et Felix M. Simon de l’Oxford Internet Institute. Dans la foulée, leur document de travail ‘Or They Could Just Not Use It?: The Paradox of AI Disclosure for Audience Trust in News’ est une des premières expériences où l’on étudie la perception par le public de l’information générée par l’IA.

Expérience

Lors de l’expérience menée en 2023, les participants ont dû lire des articles d’actualité avec des contenus politiques différents – allant d’un article sur la sortie du film ‘Barbie’ à un reportage sur une enquête concernant Hunter – fils de – Biden. Certains récits étaient clairement identifiés comme étant générés par l’IA et certains articles étiquetés ‘IA’ étaient accompagnés d’une liste d’articles d’actualité ayant servis de source.

Bien que les articles d’information soumis aux participants provenaient de la start-up technologique HeyWire AI, qui vend ‘de vrais contenus journalistiques générés par l’IA’, ils étaient présentés sous le couvert d’un organe de presse factice. En outre, l’ensemble des quelque 1.500 personnes interrogées était légèrement plus éduquées et libérales que le public américain en général.

Résultat

Les résultats ont été publiés à la fin de l’année dernière sur le site Web journalistique Niemanlab.org et il s’est avéré qu’ils étaient quelque peu paradoxaux. Car si, d’une part, la plupart des lecteurs indiquaient qu’ils s’attendaient à ce que les éditeurs étiquètent les articles générés par l’IA, d’autre part ils leur faisaient moins confiance s’ils le faisaient. Sur ce point, l’étude s’inscrit en tout cas dans la lignée d’études antérieures. Mieux encore, il s’est avéré qu’une écrasante majorité – plus de 80 % de tous les répondants – était d’avis que les organismes d’information « doivent alerter les lecteurs ou les téléspectateurs en cas d’utilisation de l’IA ». En outre, 78 % de ceux qui indiquaient qu’ils souhaitaient voir une explication ont déclaré que les organismes d’information « doivent également indiquer comment est utilisé l’IA ».

Il semblerait donc que l’étiquetage de contenus générés par l’IA soit absolument nécessaire. Cependant, les avis divergent bel et bien considérablement quant à l’interprétation de ce label. Quelques idées lancées par les répondants ? Un « symbole universellement accepté » ou « des labels sectoriels », comparables aux « mode standard d’affichage des informations nutritionnelles sur les produits alimentaires ». Il s’agit donc de suggestions pratiques, même si d’autres voix se sont par ailleurs élevées pour manifester leur désapprobation générale. Quelqu’un a même écrit (car les réponses ouvertes étaient également autorisées) : « Ou alors, ils pourraient ne pas s’en servir » (faisant référence à l’utilisation de l’IA en tant que source), des paroles dont Toff et Simon se sont inspirés pour façonner le titre de leur étude.

Fiabilité

Bref, les lecteurs souhaitent plus que jamais qu’on ne trahisse pas leur confiance et exigent, d’une part, la transparence sur les sources. D’autre part, cette même transparence – en l’occurrence un label IA – ne fait cependant que susciter la méfiance, justement. La même étude a en effet révélé que les organismes d’information publiant des récits sous le label de ‘généré par l’IA’ étaient considérés comme moins fiables.

Ainsi, les répondants voyant les messages d’information identifiés par le label ‘généré par l’IA’ attribuaient à l’organe de presse factice une note inférieure sur l’échelle de confiance que ceux qui se voyaient présenter l’article sans étiquette. La plus grande différence de confiance a été constatée chez les amateurs d’information qui savent « ce que comporte une production ou un reportage d’information ».

Bien que la question qui se pose alors est de savoir si, de prime abord, ceux qui ont (davantage) une aversion pour les médias traditionnels sont enclins à faire confiance à quelqu’un – ou dans ce cas-ci quelque chose, à savoir un chatbot piloté par des algorithmes. Compte tenu de la confiance historiquement faible dans les médias, certains publics cibles verraient-ils l’IA générative comme une amélioration éventuelle par rapport aux journalistes professionnels ? L’IA générative pourrait-elle augmenter la confiance des sceptiques des médias dans ces mêmes médias ? Déjà, il semblerait que l’hypothèse que certains consommateurs d’information critiques considèrent l’information générée par l’IA comme plus honnête et plus neutre soit soutenue par ce que l’on appelle ‘l’heuristique automatique’, impliquant que les gens considèrent la technologie comme un organe fonctionnel dépourvu de choses gênantes comme les émotions humaines ou les arrière-pensées.

C’est plausible, même si les co-auteurs Toff et Simon n’ont pas trouvé de preuves de cette hypothèse. Leur étude n’a pas révélé d’améliorations ou de changements en termes de confiance après que l’IA ait été rendue publique auprès des catégories de gens qui ont le moins confiance dans les médias. Selon Toff, des recherches supplémentaires à venir pourraient toutefois jeter plus de lumière sur le fait ou non que l’étiquetage de l’IA peut susciter des associations plus positives chez certains segments spécifiques du public.

Transparence

Quoi qu’il en soit, la clé pour renforcer la confiance du consommateur dans le journalisme semble résider dans l’augmentation de la transparence. Comme il arrive encore régulièrement que les outils d’IA servent de fausses informations et hallucinent en termes de sources, de plus en plus de voix s’élèvent pour au moins avoir la possibilité de revérifier le matériel source original. C’est la raison pour laquelle certains répondants de l’étude se sont vu présenter une liste de sources d’information authentiques que l’IA avait utilisées pour générer l’article.

Et que s’est-il avéré ? Qu’en cas de citation de source, la confiance du lecteur ne diminuait pas. Les chercheurs ont en effet découvert que la confiance du lecteur restait intacte lorsque, en regard de l’article d’information généré par l’IA, une liste de sources était affichée. En d’autres mots, les effets négatifs associés à la fiabilité perçue étaient largement annulés lorsque les articles publiaient la liste des sources utilisées pour générer le contenu.

Selon Simon, ce constat devrait pousser les organismes d’information à établir des règles pour l’utilisation responsable et la divulgation ultérieure de l’IA – un processus qui, aux dires du chercheur, est déjà bien engagé. Dans ce contexte, il est d’avis que les organismes d’information devraient vérifier où la divulgation a un sens – par exemple lorsqu’un article a été rédigé en grande partie par l’IA – ou non, à savoir lorsque les journalistes se sont servis d’un outil de transcription IA pour transcrire des interviews en tant qu’informations pour le récit.

Autorisation

La conclusion ? L’utilisation de l’IA pour générer du contenu de blog semble être confrontée aux mêmes défis que l’utilisation de l’IA dans d’autres secteurs de la société. Il est certain que l’IA peut contribuer à la production efficace de contenus et la découverte de nouvelles idées, mais elle suscite aussi des questions importantes sur la fiabilité, l’éthique et l’impact sur la qualité de l’information.

Comme pour l’utilisation de l’IA dans la couverture traditionnelle de l’actualité, il s’agit donc pour les créateurs de contenu de prêter attention à ces questions et de continuer à s’efforcer à être transparents, responsables et respectueux des valeurs humaines.

AVEZ-VOUS DÉJÀ LU CECI ?

Cookies