Terug naar de bron: moet door AI-gegenereerde content gelabeld worden?

AI-gegenereerde content

Uitgevers moeten hun door AI-gegenereerde artikels labelen. Dat vindt althans een meerderheid van de lezers, zo blijkt uit een nieuw onderzoek van Benjamin Toff van de Universiteit van Minnesota en Felix M. Simon van het Oxford Internet Institute. Een overzicht van de pro’s en con’s met – waar nodig – correcte bronvermelding.

Steeds meer uitgevers genereren vandaag de dag blogberichten via AI. Niet onlogisch: content die bestemd is voor blogs wordt op deze manier immers eenvoudig en efficiënt aangeleverd. Dankzij AI kunnen redacteurs hun tijd optimaliseren door repetitieve taken zoals grammaticale correcties en tekstbewerking aan machines over te laten, wat hen in staat stelt om zich te concentreren op het creëren van hoogwaardige en boeiende content.

So far so good, al dringt in de uitgeverswereld de vraag zich steeds meer op of deze artikels het label ‘AI-gegenereerd content’ moeten krijgen. En ook: wat het al dan niet labelen van deze artikels met de perceptie van de lezer doet. Beide zaken werden onlangs onderzocht door Benjamin Toff van de Universiteit van Minnesota en Felix M. Simon van het Oxford Internet Institute. Hun werkdocument “Or They Could Just Not Use It? The paradox of AI disclosure for audience trust in news” is daarmee een van de eerste experimenten waarin de perceptie van AI-gegenereerd nieuws door het publiek wordt onderzocht.

Experiment

In het in 2023 uitgevoerde experiment kregen deelnemers nieuwsartikels te lezen met verschillende politieke inhoud – variërend van een stuk over de release van de “Barbie”-film tot verslaggeving over een onderzoek naar Hunter – zoon van – Biden. Bij sommige verhalen werd duidelijk aangegeven dat ze door AI waren gegenereerd en bepaalde AI-gelabelde artikelen gingen vergezeld van een lijst met nieuwsberichten die als bron waren gebruikt.

De nieuwsartikels die de deelnemers kregen voorgeschoteld, waren weliswaar afkomstig van de technische start-up HeyWire AI die “echte AI-gegenereerde journalistieke inhoud” verkoopt, maar werden weergegeven onder het mom van een nep-nieuwsorganisatie. Bovendien was het ondervraagde publiek van bijna 1.500 mensen ook iets hoger opgeleid en liberaler dan het Amerikaanse publiek in het algemeen.

Resultaten

De resultaten werden eind vorig jaar gepubliceerd op de journalistieke website Niemanlab.org. En die waren, zo blijkt, enigszins paradoxaal. Want gaven de meeste lezers enerzijds aan dat ze verwachtten dat uitgevers AI-gegenereerde artikels labelen, dan vertrouwden ze diezelfde uitgevers anderzijds minder als ze dat deden. Daarmee lag het onderzoek alvast in de lijn van eerdere studies. Sterker nog: een overweldigende meerderheid – meer dan 80% van alle respondenten – bleek ditmaal van mening dat nieuwsorganisaties “lezers of kijkers moeten waarschuwen in het geval er AI is gebruikt”. Van degenen die aangaven een toelichting te willen zien, verklaarde 78% bovendien dat nieuwsorganisaties “ook moeten duiden hoé AI is gebruikt”.

Het labelen van door AI-gegenereerde content lijkt dus broodnodig. Maar over de invulling van dat label verschillen de meningen wel danig. Enkele ideeën van de ondervraagden? Een “universeel geaccepteerd symbool” of “industriebrede labels”, vergelijkbaar met de “standaard manier waarop voedingsinformatie wordt weergegeven op voedingsmiddelen”. Praktische suggesties dus, al lieten andere stemmen dan weer hun algemene afkeuring blijken. “Of ze zouden dit (verwijzend naar het gebruik van AI als bron) gewoon niet kunnen doen”, schreef zelfs iemand (want ook open antwoorden waren toegelaten), een uitspraak die Toff en Simon meteen ook tot titel van hun studie doopten.

Betrouwbaarheid

Kortom: lezers willen meer dan ooit tevoren hun vertrouwen niet beschaamd zien en eisen vandaag enerzijds transparantie op het vlak van bronnen. Maar anderzijds zorgt die transparantie – in dit geval een AI-label – ook net voor wantrouwen. Uit hetzelfde onderzoek kwam namelijk naar voren dat ze nieuwsorganisaties die als AI-gegenereerd gelabelde verhalen publiceerden minder betrouwbaar vonden.

Zo beoordeelden respondenten die de nieuwsberichten met het label AI-gegenereerd zagen de nepnieuwsorganisatie lager op een vertrouwensschaal dan degenen die het artikel zonder het label te zien kregen. Het grootste verschil in vertrouwen constateerden de onderzoekers bij nieuwszoekers die bekend waren met “wat legitieme nieuwsproductie en -verslaggeving inhoudt”.

Al stelt zich hierbij de vraag of mensen die afkerig(er) staan tegenover de traditionele media überhaupt geneigd zijn om iemand, of in dit geval iéts, zijnde een door algoritmes aangestuurde chatbot, te vertrouwen. Zouden sommige doelgroepen – gezien het historisch lage vertrouwen in de media – generatieve AI beschouwen als een mogelijke verbetering ten opzichte van professionele journalisten? En zou generatieve AI het vertrouwen van media sceptici in diezelfde media kunnen vergroten? Dat bepaalde kritische nieuwsconsumenten door AI gegenereerd nieuws als eerlijker en neutraler aanzien, lijkt alvast een hypothese die ondersteund wordt door de zogenaamde “machine-heuristiek” wat impliceert dat mensen naar technologie kijken als een werkend orgaan zonder vervelende zaken als menselijke emoties of bijbedoelingen.

Plausibel, al vonden coauteurs Toff en Simon hiervoor geen bewijzen. Hun onderzoek liet op het vlak van vertrouwen geen verbeteringen of veranderingen zien na AI-openbaarmakingen onder de segmenten van het publiek die het minste vertrouwen hebben in de media. Toch zou toekomstig bijkomend onderzoek volgens Toff nog verder uitsluitsel kunnen geven over het feit of het labelen van AI meer positieve associaties zou kunnen opwekken bij bepaalde specifieke segmenten van het publiek.

Transparantie

Hoe dan ook lijkt het vergroten van de transparantie de sleutel om het vertrouwen van de consument in de journalistiek op te krikken. Aangezien AI-tools nog steeds regelmatig verkeerde informatie serveren en bronnen hallucineren, gaan daarbij steeds meer stemmen op om op zijn minst de mogelijkheid te krijgen om origineel bronmateriaal dubbel te controleren. Daarom kregen sommige respondenten van het onderzoek een lijst met echte nieuwsbronnen te zien die AI had gebruikt om het artikel te genereren.

En wat bleek? Dat bij bronvermelding het vertrouwen van de lezer niet zakte. De onderzoekers ontdekten namelijk dat het vertrouwen van de lezer overeind bleef wanneer naast het door AI-gegenereerde nieuwsartikel een lijst met bronnen werd weergegeven. Met andere woorden: de negatieve effecten die samenhangen met de waargenomen betrouwbaarheid werden grotendeels tenietgedaan wanneer artikelen de lijst met bronnen publiceren die zijn gebruikt om de inhoud te genereren.

Deze bevinding zou nieuwsorganisaties volgens Simon moeten aanzetten om regels op te stellen voor het verantwoord gebruik en de verdere openbaarmaking van AI – een proces dat volgens de onderzoeker reeds volop aan de gang is. Daarbij zouden nieuwsorganisaties volgens hem moeten nagaan waar openbaarmaking zinvol is – wanneer een artikel bijvoorbeeld grotendeels door AI is geschreven – en waar niet, namelijk wanneer journalisten een AI-transcriptietool hebben gebruikt om interviews te transcriberen als informatie voor het verhaal.

Toestemming

Conclusie? Het gebruik van AI voor het genereren van blogcontent lijkt voor dezelfde uitdagingen te staan als het gebruik van AI in andere takken van de maatschappij. AI kan zeker bijdragen aan het efficiënt produceren van inhoud en het ontdekken van nieuwe ideeën, maar roept ook belangrijke vragen op over betrouwbaarheid, ethiek en de impact op de kwaliteit van informatie.

Net zoals bij het gebruik van AI in traditionele nieuwsberichtgeving wordt het dus zaak voor contentmakers om aandacht te besteden aan deze kwesties en naar transparantie, verantwoordelijkheid en respect voor de menselijke waarden te blijven streven.

LAS U DIT AL?