Nyheter

Siffror i massor hotar bli vår nya storebror

Genom att analysera enorma mängder data lyckades en varuhuskedja räkna ut att en ung kund var gravid, innan hennes pappa visste det. De använde sig av big data.
Frågan är om fenomenet är mänsklig­hetens räddning eller den slutgiltiga segern för över­vakningssamhället?

Företag och myndigheter har samlat stora mängder information sedan decennier. Men det är först på senare år som big data har seglat upp som ett av den ständigt uppkopplade samtidens mest om­susade begrepp. Anledningen är att mängden data som mänskligheten genererar i dag verkligen är stor. På riktigt.

Men denna flodvåg av data har inget egenvärde. Det är först när informationen analyseras som den blir användbar. Då blir det möjligt att identifiera statistiska mönster. Dessa kan sedan användas för att förutspå både beteenden och skeenden.

– Vi tenderar att likställa data med kunskap. Data har inget värde förrän den analyserats. Med rätt verktyg låter big data oss generera nya hypoteser. Men ny kunskap når vi först när vi testar hypoteserna, säger Martin Rosvall, docent i fysik vid Umeå universitet.
En annan förklaring till att intresset kring big data har brakat i höjden är att kostnaderna för att lagra och granska kolossala datamängder har sjunkit dramatiskt.

Ett exempel på vad som kan åstadkommas med hjälp av big data är att göra en sökning på Google. Innan du har hunnit halvvägs vet megaföretaget vad du är på väg att skriva. Tack vare genialt konstruerade algoritmer som hanterar astronomiska mängder sökhistorik kan Google beräkna vad du är ute efter med en närmast magisk träffsäkerhet. Det liknar ett slags digital klärvoajans.

Möjligheterna är hisnande. Big data-analyser kan användas som ett redskap för att förutsäga allt från naturkatastrofer till valresultat. Enligt en omtalad bok av Financial Times-journalisten Kenneth Cukier och professorn Viktor Mayer-Schönberger kommer big data att revolutionera mänskligheten.

Det är fascinerande, men också kusligt. Datainspektionen uppger att man inte börjat titta specifikt på big data men att det finns på myndighetens agenda.

– Vi har identifierat det som ett potentiellt problem för den personliga integriteten, säger Mikael Ejner, IT-säkerhetsspecialist på Data­inspektionen.

Han understryker att det framför allt är möjligheterna till kartläggning som är oroande.

– Har du tillräckligt mycket data kan du förutsäga en individs beteende. Till slut vet den som analyserar datamängderna mer om individen än individen vet om sig själv.

Mikael Ejner anser att det finns all anledning att reflektera över den stora mängd information som vi lämnar ifrån oss i våra rörelser på nätet. Här finns ett pedagogiskt problem. Många tenderar att avfärda sina avtryck som banala. Var för sig är de också det. Men sammanställda formar de avslöjande mönster.

– Den biinformation som bildas när du använder din mobiltelefon kan användas för att förstå hur individer och hela populationer rör sig i samhället. Här finns mängder med tillämpningsområden. Informationen kan bland annat användas inom beräkningsepidemiologi för att hantera influensautbrott, säger Markus Bylund, forskningsledare på SICS, Swedish ICT, ett svenskt forskningsinstitut inom datavetenskap.

Det här är information som ringar in människors vanor och beteenden. Information som, enligt Markus Bylund, ger ett maktövertag för den som äger den.

– Det är rätt obehagligt. Det blir lite löjligt att fråga politiker vad de tycker om det här, för de förstår inte vad man kan åstadkomma med alla dessa data. Jag vill därför att man hjälper policymakare, beslutsfattare och politiker att begripa det. Men jag upplever närmast ett aktivt ointresse när det gäller de här frågorna.

Markus Bylund är bekymrad över den utbredda evangelistiska hållningen till big data. Om vi låter oss förföras av statistiska samband finns det en risk att vi glömmer att ta hänsyn till kausalitet, alltså orsak och verkan. Markus Bylund ser en allvarlig fara i att lyfta fram statistiska samband genererade av big data eftersom de kan sakna orsakssamband. Två relaterade händelser kan lika gärna bero på en tredje händelse.

– Här kan man använda Sverige­demokraternas retorik som ett exempel. De försöker utvinna kunskap ur triviala statistiska samband och hoppar över orsakssambanden. Jag tänker bland annat på hur statistiska samband mellan människors ursprung och brottsut­övning används för förutsägelser om brottsbenägenhet. I dag finns en övertro kring de samband som går att hitta med hjälp av big data. Ur ett samhällsperspektiv är det läskigt, säger han.

Fakta. Digital information

1993 var nära nog all data i världen analog. I dag beräknas över 98 procent av jordens samlade information vara digital.

Enligt siffror från Berkeley genererade mänskligheten fem exabyte med data varannan dag 2011. En exabyte motsvarar en triljon bytes, det vill säga en etta följd av arton nollor.

Vilket i sin tur motsvarar 4 803 839 602 528 böcker på 200 sidor. I dag produceras fem exabyte data var tionde minut.

Begreppet big data syftar på jättelika datamängder. Någon svensk översättning finns inte.