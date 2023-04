Är det här början till slutet för lärarna? För journalisterna och översättarna? För konstnärerna, författarna och programmerarna? Alltsedan AI-skrällen i slutet av förra året rider ångesten alla icke-artificiella intelligenser. Den bländande kombinationen av blixtsnabb, stringent mjukvara och människoliknande finurlighet hänför, samtidigt som den potentiella dystopin står i fokus; den ödesdigra morgondag då människan vaknar upp bara för att inse att hon blivit sin egen framtid överflödig. Bakom denna farhåga ligger föreställningen att ju smartare och mer avancerade AI-systemen blir, desto mer undandrar de sig människans styrning och påverkan. Utvecklingen och den samhälleliga implementeringen av algoritmer och AI anses föra oss längre och längre bort från behovet av mänsklig tanke- och arbetskraft, mot den fullständiga automationens horisont.

Och det är nog inte en helt osann föreställning. Problemet är dess enögda fokus på en falsk dikotomi mellan automation och mänsklig arbetskraft, som gör oss blinda för vad som faktiskt försiggår bakom kulisserna på de stora techbolagen. De senaste AI-systemen – som Chat GPT och nu även GPT-4 – är inte mindre utan mer beroende av mänsklig omdömesförmåga och styrning, och därmed av mer mänsklig arbetskraft, än tidigare. Anledningen till att de nya AI-modellerna upplevs som så smarta är inte för att de har uppnått en ny, revolutionerande grad av autonomi. Snarare beror det på andelen mänsklig värdering och bedömning i deras konstruktion. Men den enorma arbetskraft som detta kräver kommer inte från Silicon Valley i första hand, utan från hundratusentals exploaterade digitala arbetare i andra delar av världen.

Denna aspekt av de senaste AI-genombrotten har hittills fått väldigt lite utrymme. För ett tag sedan skrev Kristina Lindquist (DN 26/2) en välbehövlig text utifrån Times rapportering om hur bolaget Open AI outsourcar det ohyggliga uppdraget att lära Chat GPT känna igen stötande material till underbetalda arbetare i Kenya. Men som artikeln i Time klargör, sträcker sig utnyttjandet av den dolda mänskliga arbetskraften bortom AI:ns säkerhetsmekanismer. AI-modellernas hela existens kan sägas vila på de digitala arbetarnas axlar, något som döljs bakom glamorösa typer som Elon Musk och mystifierande utlåtanden om att AI nu börjar bli ”läskigt bra”. Men innan vi går närmre in på de mörklagda villkoren för det massiva, manuella arbetet bakom AI-branschens mirakel, måste vi säga något om grunderna.

Tesla, Meta, Google, Microsoft, Apple, Youtube. Alla företag, tjänster och plattformar som bygger på avancerad AI av olika grad – inte minst forskningsbolaget Open AI, som ligger bakom språkmodellen GPT – sysslar med djupinlärning. Det är en typ av maskininlärning där algoritmer tränas upp med hjälp av enorma mängder data. All data kan i allmänhet indelas i fyra övergripande format: text, ljud, bild och video. Att det krävs just enorma mängder data är något som ofta understryks i rapporteringen kring de nya AI-systemen. Något som inte understryks lika ofta är att träningen bara är effektiv om den data som används är av hög kvalitet. För att en AI ska kunna lära sig någonting alls måste all träningsdata vara noga kategoriserad och märkt – ju mer ingående och detaljerat, desto bättre.

Att klassificera och beteckna data kallas för datamärkning och den utförs i stor utsträckning av människor. Det kan handla om att markera alla rödljus i en sekvens trafikbilder, bedöma tonen i en kort text eller avgöra om ett videoklipp visar två personer som dansar eller som slåss. Det är tack vare datamärkning som AI-modellen över huvud taget kan lära sig identifiera skillnader och mönster mellan olika typer av data.

Men denna grundläggande form av datamärkning krävs för i princip all AI-utveckling. Och nu är de senaste GPT-modellerna inte som vilken AI som helst, utan banbrytande kompetenta, människolika och nästan sällskapliga. GPT-4 kan göra allt som sin föregångare, fast lite bättre: den har ännu större förmåga att anta olika personligheter och tonlägen efter behov, den kan tolka komplexa bilder och på högskoleprov gör den bättre ifrån sig än nittio procent av de mänskliga deltagarna. Så vad är det som skiljer GPT-modellerna från annan AI? Varför är de så bra?

Det korta svaret är att deras utveckling involverar ännu mer mänskligt omdöme. Metoden kallas för RLHF (Reinforcement Learning with Human Feedback) och är också en form av datamärkning, men i ett senare skede av AI-modellens träning. Den går ut på att människor betygsätter modellens resultat: höga poäng till önskade beteenden, minuspoäng till oönskade. Modellen kan också generera flera resultat på ett och samma kommando, vilka sedan graderas från bäst till sämst. Det är genom den här sortens manuella arbete som GPT lär sig vilka specifika beteenden som uppskattas och kan utveckla något som exempelvis uppfattas som ”charm”.

Hur intelligent en AI-modell uppfattas vara beror alltså till stor del på datamärkning, manuellt utförd av människor, och just GPT-modellernas extraordinära förmågor beror till stor del på den utökade tillämpningen av mänskligt omdöme i deras träning. Eftersom datamärkningen är oumbärlig har den blivit till själva livsblodet för hela AI-branschen, där efterfrågan på högkvalitativ märkning följaktligen är enorm.

Föga förvånande har en uppsjö tredjepartsföretag uppstått som köper och säljer den efterfrågade arbetskraften. Just Open AI anlitar en av bjässarna bland datamärkningsföretagen, vid namn Scale AI. Det grundades 2016 av en tonårig student på Massachusetts institute of technology (MIT) och blev en så kallad ”enhörning” i Silicon Valley, ett privat företag som på kort tid når en värdering över en miljard dollar. Succén berodde på företagets förmåga att snabbt och billigt tillhandahålla datamärkning av hög kvalitet, vilket de kunde göra tack vare en enorm arbetsstyrka. Deras affärsidé bygger på crowdsourcing och bärs upp av en global pool av billiga, temporära kontraktsarbetare från företrädesvis fattiga och krisdrabbade länder, för att möjliggöra lägsta tänkbara arvoden.

Scale AI består av två noga åtskilda sidor. Den ena vänder sig mot världens stora techbolag och framgångsrika startups för att sälja företagets tjänster. Den andra riktar sig mot befintliga och potentiella arbetstagare och går under ett helt annat namn (som inte nämns någonstans på Scale AI:s hemsida): Remotasks. Det är deras crowdsourcing-plattform, där US dollar utlovas som betalning för mikrojobb som bara kräver en dator och internetuppkoppling. Remotasks hemsida basunerar ut att ingen tidigare erfarenhet krävs och strösslar med framgångssagor i form av citat och inställsamma Youtubevideor med arkivfoton på sedelbuntar. De menar att det går att ansluta sig från över 90 länder (ingenstans anges just vilka), men en stor andel av arbetarna verkar befinna sig i antingen Kenya, Filippinerna eller Venezuela – det vill säga länder där många talar utmärkt engelska och som, framför allt, tillhör världens billigaste arbetsmarknader.

Datamärkningsuppdragen är ofta enformiga, men fordrar ändå oerhörd precision och utförs alltid under tidspress.

Remotasks framställer sig som en räddare i nöden. I länder med skenande arbetslöshet erbjuder de jobb i form av enkla uppgifter som kan utföras på arbetstagarens villkor. Det skulle också kunna beskrivas så här: Remotasks erbjuder jobb med så usla villkor, att det i princip bara är personer i verkligt prekära situationer som tvingas vända sig till plattformen som en inkomstkälla. Förra året publicerades en belysande reportageserie av MIT Technology Review, som handlar om hur AI-industrin är på väg att skapa en ny slags kolonial världsordning. I ett av reportagen hörs flera personer som anslutit sig till Remotasks, och journalisterna granskar arbetet genom att skapa ett eget konto från Venezuela. Arbetsförhållandena de rapporterar om är bedrövliga. Först och främst kräver plattformen timtal av obetald träning. Datamärkningsuppdragen är ofta enformiga, men fordrar ändå oerhörd precision och utförs alltid under tidspress. Lönen är direkt kopplad till prestationen, vilken betygsätts på en skala från 0 - 100 procent. Att nå full pott är i princip omöjligt – att göra sitt noggrannaste riskerar avdrag för att vara för långsam, att göra sitt snabbaste riskerar avdrag för att inte vara exakt nog.

Vad tjänar en arbetare via Remotasks? I reportaget får vi höra Matt Park, ”senior vice president of operations” på Scale AI, som menar att den genomsnittliga timlönen i Venezuela är motsvarande 9 kronor och 48 öre. Det är alarmerande lågt i sig. Men när reportagejournalisterna hade arbetat i drygt två timmar, hade de inte lyckats tjäna mer än motsvarande 1 krona. Utbetalningarna ska ske en gång i veckan, men är ofta försenade. Om man letar upp Remotasks på recensionssidan Trustpilot kan man läsa inlägg från ett stort antal arbetare som bara de senaste dagarna klagar på att de inte har fått betalt alls.

Vad är egentligen det obehagligaste med en ”läskigt bra” AI? I takt med att AI-branschens skuggsidor fortsätter att belysas, kan uppfattningen komma att ändras. Tanken på en framtid där mänsklig kreativitet, tankekraft och omdömesförmåga ersätts av AI är skrämmande. Men än mer skrämmande är kanske insikten att vi lever i en samtid där mäktiga techbolag är fullständigt beroende av människors omdömesförmåga för att utveckla duktiga robotar, och inte tvekar att exploatera dessa människor. Techbolagen är inte ute efter ren automation, för det är inte där magin uppstår. Den uppstår i den förhöjda kombinationen mellan AI och mänskligt omdöme.

Alice Berggren är är redaktör på bokförlaget Daidalos och tidskriften Glänta.

Läs mer:

Britt Östlund: Den mänskliga själen glöms bort i AI-ingenjörernas visioner