Du följer nu ämnet: STOCKHOLMS STAD (sparas i Mitt DN)
Kultur

AI-teknik tar falska nyheter till ny nivå

01:58. Tre saker som kan öka genomslaget för falska nyheter i framtiden.

Stefan Löfven på film i en nazistmarsch, din moster i en porrfilm och du själv fångad som terrorist av en övervakningskamera – de mest otänkbara filmerna kan snart vara en del av vår digitala vardag. DN:s Kristofer Ahlström har talat med forskare och journalister om vad den nya AI-tekniken gör med vår tilltro till rörliga bilder.

I somras sa Barack Obama något han aldrig sagt.

Han tittade in i kameran och sa att nu när hans presidentskap snart var över kände han att det viktigaste för hans politiska arv var att fokusera på sitt golfspelande. 

Det var Obama på filmen, det var Obamas röst. Men det var inte Obama som sa det. 

Exemplet var skapat av teknikjournalisten Simon Adler, som även läst in replikerna, för att demonstrera den självlärande datorteknik som kan omvandla ljud till läpprörelser på en filmad person. Effekten blir att det både låter och ser ut som att personen på filmen säger det. Ansiktsuttryck går att skapa och förändra. Personen blir ett slags marionettdocka för den agenda som filmens redigerare vill framhäva. 

Och ljudfilerna behöver inte ens vara äkta.

Företaget Adobe var tidigt ute med att påverka vår verklighetsuppfattning när de skapade bildredigeringsverktyget Photoshop. I november 2016 hade de en demonstration av sitt nya program ”Voco”. Det är ett ljudredigeringsprogram där man kan klippa och klistra i personers tal. Men har man bara tillgång till cirka 20 minuter ljudupptagning med en människa – tillräckligt med data för att registrera intonation, språkrytm och fonetik – så kan man få denne att säga vad man vill, med den röst och på det sätt som personen brukar prata. 

Adobes teknikansvariga tog det hela till sin spets på uppvisningen genom att exemplifiera med komikern Jordan Peele, som var demonstrationens konferencier: bara genom att skriva in ord och fraser i en ruta i programmet sades de med Peeles röst, på det sätt som han skulle ha sagt det. 

Läs mer: Max Tegmark rädd att skräckscenariot med artificiell intelligens ska bli verklighet 

Så om man kan skapa påståenden ur tomma intet, och lägga dessa ord i munnen på en känd och inflytelserik person, så att vi både ser och hör personen säga det, vilka följder kan det få?

– Vi lär se en hel del djävulskap, är jag rädd. Det är ingen slump att det är fejkad porr som dragit i gång det här, säger Marcus Jerräng, chefredaktör för Computer Sweden, som skrivit om fenomenet som även kallas ”deepfakes”.

Porren han syftar på var fejkade filmklipp som började dyka upp i januari där riktiga kändisars ansikten med AI-tekniken mappats över skådespelare i porrfilmer. Det ser alltså ut som att Daisey Ridley från ”Star wars” eller Gal Gadot från ”Wonder woman” deltar i grova sexuella aktiviteter framför kameran.

– Men det finns också en risk att man använder tekniken för att hänga ut okända människor för allvarliga brott eller liknande. För den som vill kommer det snart vara trivialt att till exempel klistra in någon annans ansikte på en övervakningsfilm från ett terrorbrott. 

Det sistnämnda har vi redan sett exempel på. Efter terrordådet i Stockholm användes en bild på en kvinna i hijab som till synes oberörd promenerade förbi de liggande kropparna på Drottninggatan. Kvinnan var i själva verket inklippt från ett helt annat tillfälle. Då var det stillbilder, men samma sak skulle i dag gå att göra med videomaterial. Adobe utvecklar ett nytt videoredigeringsprogram, ”Cloak”, som är tillräckligt avancerat för att kunna särskilja för- och bakgrund. Hela föremål kan tas bort ur ett klipp genom att bara sudda ut det. Nya föremål kan föras in med ett klick.

Och en förfalskning behöver bara tala till våra mest grundläggande uppfattningar för att tas för sann. Politisk desinformation har visat sig få konkreta följder. Under valrörelsen i USA 2016 gick en man in på en pizzeria i Washington med ett automatgevär och avfyrade tre skott i lokalen. Detta efter att ha läst ryktet på internet att medlemmar i demokraternas parti styrde en pedofilring från källaren på pizzerian. 

I dag hade det varit möjligt att underblåsa konspirationsteorin ytterligare med ett filmklipp där kända demokratiska politiker talar sig varma för sex med minderåriga. När ett sådant klipp sedan når sociala medier och alternativmedier kan det få stor spridning. Stora konsekvenser. Hackarna kan bli de nya spinndoktorerna. 

Eftersom tekniken drivs av artificiell intelligens blir den också hela tiden bättre, mer finjusterad och effektiv, genom så kallad maskininlärning. Ofta bygger tekniken på en duell mellan två AI-system, där en AI skapar en fejkad bild och en annan AI bedömer den. Den första AI:n försöker sedan igen och igen med nya resultat, tills den andra AI:n är tillräckligt nöjd. Hela tiden förbättrar båda dessa AI-system sin förståelse för hur verkligheten ska avbildas.

Det här skiljer sig alltså från Hollywoods specialeffektsmakeri, som sedan länge kunnat föryngra eller återuppleva skådespelare med datorteknik och noggrant animerade ansiktsrörelser. Den nya tekniken utför allt i realtid och intuitivt: på skärmen skapas zebror samtidigt som kameran filmar hästar, det finns filmer där en snöslaskig vinterväg omtolkas till prunkande sommarmiljö, eller dag till natt.

Den hela tiden kraftfullare tekniken och effektivare algoritmen gör att man inte behöver vara särskilt tekniskt kunnig eller ha dyrbar utrustning för att manipulera data. Det som är nytt i dag, säger Hedvig Kjellström, professor och chef för Avdelningen för robotik, perception och lärande vid KTH, är att både utbildning och verktyg är tillgängligt för vem som helst på internet. På gott och ont.

– Det är en fantastisk utveckling och ger hopp för världen tycker jag – att till exempel en tonåring i Pakistan kan läsa kurser i maskininlärning på Stanford. Men det gör ju också att vem som helst kan lära sig använda allmänt tillgängliga programpaket för video- och ljudmanipulering och publicera manipulerad video på internet, säger hon.

Vissa ser AI-utvecklingen som en informationsteknologisk kapprustning i ett stundande, eller redan pågående, propagandakrig. Kjellström tycker att man ska ta det på största allvar.

– Det är väldigt oroande när länder eller organisationer försöker påverka valutgången i ett annat land. Jag hoppas en diskussion om AI-risken kommer i gång innan valet i höst, säger Kjellström.

Även Marcus Jerräng nämner farorna det kan innebära. 

– Putin själv har sagt att den som vinner AI-matchen får makten över världen, och det ligger kanske något i det. Men då pratar vi om alla möjliga tillämpningar, inte minst AI-styrda drönare som öppnar för en helt ny typ av krigföring. Sedan är det ingen vild gissning att AI-fejkat material kommer bli effektivt propagandaverktyg i händerna på allehanda trollarméer på nätet.

Knäckfrågan blir då hur medier och mediekonsumenter – tittare och lyssnare – ska förhålla sig till fenomenet när vi inte längre vet om vi kan lita på det vi ser och hör. 

Josephine Sullivan, som undervisar i bland annat maskininlärning på KTH, säger att den här tekniska utvecklingen innebär att vi nu går in i en ny fas vad gäller videoframställning. Men att alla mynt har två sidor:

– Medan verktygen för videomanipulation blir allt bättre kommer samtidigt verktygen för att upptäcka att filmklipp manipulerats att bli bättre, säger hon och pekar ut delarna som är särskilt svåra att manipulera: området kring munnen, tänderna, långt eller yvigt hår. Där kan man leta efter bristfälligheter i uttrycket.

Jack Werner är journalist och i vår aktuell med en bok om hur internet påverkar vår verklighetsuppfattning, ”Ja skiter i att det är fejk det är förjävligt ändå”. Han tror att upplösningen av tilltron till att rörlig bild eller ljud alltid måste vara autentisk kan vara en bra sak för medierna. 

Läs mer: Ny undersökning visar att många svenskar oroar sig för AI 

– Om vi vet att vi inte kan lita på bilder, ljud eller filmklipp, vad kan vi då lita på? Jo, aktörer vi har förtroende för och som har något att förlora på att ljuga. Och just det råkar ju beskriva journalister rätt väl. Alltså är det tänkbart att vi som arbetar med att försöka kvalificera information kan få större förtroende genom detta. 

Han tror även att den nya formen av desinformation är något vi över tid kommer vänja oss vid.

– Vår förväntan på någonting som ska spegla sanningen är relativt. Förr i tiden tyckte vi att det var skitläskigt att en cowboy sköt mot oss på filmduken. Sannolikt är även detta tekniska trappsteg ett vi ska kunna få ordentligt fotfäste på.

Kommentera artikeln
I samarbete med tjänsten Ifrågasätt erbjuder DN möjligheten att kommentera vissa artiklar. Håll dig till ämnet och håll en god ton. Visa respekt för andra skribenter och berörda personer i artikeln. Vi tar bort inlägg som vi bedömer är olämpliga.