Logga in på Dagens Nyheter

Här kan du som DN-kund logga in för obegränsad läsning av DN.se, e-DN och DN.Prio.

Med ett gratiskonto kan du följa skribenter och ämnen samt spara artiklar.

Vetenskap

Nu kan datorerna även bluffa och slå oss i poker

Professor Tuomas Sandholm och pokerspelaren Jason Les under turneringen med programmet Libratus.
Professor Tuomas Sandholm och pokerspelaren Jason Les under turneringen med programmet Libratus. Foto: Tim Kaulen - Carnegie Mellon Uni

Efter dam, schack och go: förra veckan besegrade programmet Libratus fyra av världens bästa pokerspelare. Därmed finns det nästan inga spel kvar där människan är överlägsen maskinen.

– Nu är poker det enda spelet som datorerna inte kan slå oss i, sa Svenska Go-förbundets ordförande Daniel Jensen till DN i mars förra året när programmet Alphago besegrade mästaren Lee Sedol i det urgamla asiatiska spelet go.

Men nu, mindre än ett år senare, har den artificiella intelligensen passerat även den milstolpen. I slutet av januari vann dataprogrammet Libratus en 20 dagar lång turnering mot några av världens bästa pokerspelare: Jimmy Chou, Dong Kim, Jason Les och Daniel McAulay.

– Att två forskare som inte är professionella spelare kan skapa ett program som själv har lärt sig att bli så bra att det kan slå oss säger en del om hur långt utvecklingen av artificiell intelligens har kommit, säger Jason Les.

Sedan mer än tolv år försörjer han sig helt på att spela den typ av poker som Libratus har lärt sig, Heads-up No-Limit Texas Hold’em.

– Det är den pokervariant som spelas på tv och i världsmästerskapen. Det är nog den folk tänker på när de tänker på poker, säger Noam Brown, doktorand i datavetenskap vid Carnegie Mellon University.

Tillsammans med sin handledare Tuomas Sandholm har han utvecklat Libratus sedan deras förra pokerprogram Claudico förlorade en liknande turnering i maj 2015.

– Vi är otroligt imponerade av hur mycket de två har åstadkommit på bara 18 månader, säger Jason Les, som var en av deltagarna även vid den förra turneringen.

Läs mer: Hemlig artificiell intelligens härskade på nätet

Det är många år sedan datorer blev bättre än människor på spel som dam och schack. Spelet go var en mycket större utmaning, eftersom antalet möjliga kombinationer av stenar på brädet är fler än alla atomer i hela universum. Därför är det omöjligt för datorn att räkna ut konsekvenserna av alla tänkbara drag. I stället valde Alphago nästa drag med något som påminner om mänsklig intuition.

För poker finns det andra och knepigare utmaningar.

– Poker är totalt annorlunda. I schack, dam och go har man tillgång till all information, och båda spelarna ser hela tiden exakt vad som händer på brädet. Men i poker ser du inte motståndarens kort. Det blir mycket mer komplicerat, och teknikerna som utvecklats för de andra spelen går inte att använda. Vi fick hitta en helt ny strategi, säger Noam Brown.

Dessutom måste datorn genomskåda om motspelaren bluffar, och också kunna bluffa själv.

– Programmet bluffar definitivt, men det ser inte på det som vi gör. Det har bara lärt sig att det ibland kan vara lönsamt att satsa även när man har en dålig hand. För datorn är det inte att ljuga eller stjäla, utan bara rätt sätt att spela poker, säger Noam Brown.

Libratus analyserar inte motspelarnas ansiktsuttryck eller hur de spelar.

– Nej, datorn ser inte på människorna, och bryr sig inte heller om hur lång tid de tar på sig för att välja insats. Den försöker bara spela poker perfekt, säger Noam Brown.

Läs mer: Världen tar stormsteg mot tänkande maskiner

Han och Tuomas Sandholm talade inte om för programmet hur det skulle lyckas. De matade bara in spelets regler, och sedan fick datorn spela mot sig själv och lära sig vad som fungerar.

– Programmet började helt slumpmässigt och testade olika strategier, och lärde sig så småningom att det till exempel är bra att satsa om man har en bra hand, och att undvika strategier som leder till att man förlorar pengar. Det lärde sig spela poker på samma sätt som människor lär sig, säger Noam Brown.

Vid turneringen mötte Libratus mänskliga spelare för första gången.

– Då hade programmet aldrig sett hur människor spelar. Det hade bara hittat ett sätt att spela poker som det tyckte var optimalt, säger Noam Brown.

Programmet Libratus består av tre delar. I den första försöker programmet hitta den ideala strategin för att spela.

Foto: Tim Kaulen - Carnegie Mellon UniPokerproffsen Daniel McAulay och Jimmy Chou, forskarna Tuomas Sandholm och Noam Brown, och pokerproffsen Jason Les och Dong Kim. Foto: Tim Kaulen

– Vi vet rent teoretiskt att det finns en perfekt strategi för spel som schack, go och poker som garanterar vinst i slutändan. Men den är mycket svår att hitta. Vårt mål är att komma så nära den som möjligt. Även om vi inte kan hitta den perfekta strategin vill vi komma närmare den än någon annan har lyckats med, säger Noam Brown.

I den andra delen av programmet räknar Libratus om sin strategi halvvägs genom varje spel, och tar med och analyserar misstag som motståndaren kan ha gjort.

– På så sätt kan programmet svara på unika sätt på nya situationer. Den delen är en förbättring jämfört med det förra programmet, och en stor anledning till att vi kunde vinna, säger Noam Brown.

I den tredje delen gick programmet igenom sina egna misstag varje natt för att komma fram till hur det skulle spela bättre nästa dag.

– När de andra spelarna gick hem och åt och sov ägnade Libratus natten åt att hitta sina egna svagheter och träna sig själv, säger Noam Brown.

– Från början trodde vi att vi skulle vinna, men det blev svårare och svårare för varje dag. Programmet blev verkligen märkbart bättre och bättre, säger Jason Les.

Ulf Engström, ordförande i Svenska Pokerförbundet, är glad över Libratus seger, eftersom den en gång för alla avlivar myten att poker skulle vara ett turspel.

– Poker är ett seriöst spel, och i det långa loppet blir det den som har mest hjärnkraft och bäst förmåga som vinner. Det här visar hur mycket skicklighet som krävs. Det skulle vara mycket svårt att argumentera för att datorn bara hade mer tur än sina motspelare, säger han.

Trots att de förlorade mot datorn fick Jason Les och de andra mänskliga spelarna dela på priset, 200 000 dollar, fördelat efter hur väl de presterade.

Jason Les är glad att han fått vara med i båda turneringarna.

– Det är verkligen en ära, och en fantastisk erfarenhet, men också väldigt svårt och fysiskt utmattande att spela så länge, säger han.

Noam Brown planerar nu att ägna sig åt andra problem än poker.

– Nu har vi ju passerat milstolpen och slagit världens bästa spelare, säger han.

I stället vill han utveckla liknande program som kan användas i den verkliga världen, där det finns många fler situationer som påminner om poker än om schack. Artificiell intelligens som fungerar som Libratus är därför mycket mer användbar än schack- och go-datorer, menar han.

– I förhandlingar och budgivningar och liknande finns det massor av osäkerheter och dold information. Det är mycket ovanligt att all fakta är tillgängliga för alla, som pjäserna på ett schackbräde, säger han.

Fakta. Heads-up No-Limit Texas Hold’em

No-Limit Texas Hold’em är den populäraste varianten av poker, som spelas vid Main Event på World Series of Poker i Las Vegas, som ses som världsmästerskapen i poker. Texas Hold’em tros ha uppkommit i Texas i början av 1900-talet. Spelarna försöker få en så bra hand som möjligt från sina två dolda kort och fem öppna gemensamma kort.

No-Limit betyder att spelarna får satsa eller höja med vilken summa som helst mellan minsta tillåtna satsning och alla sina marker.

Heads-up innebär att bara två spelare spelar mot varandra.

Källa: NE, Svenska Pokerförbundet

Rättelse 2017-02-13 11:43
I kortspelet Bridge är människan fortfarande överlägsen datorn.
Så här jobbar DN med kvalitetsjournalistik: uppgifter som publiceras ska vara sanna och relevanta. Rykten räcker inte. Vi strävar efter förstahandskällor och att vara på plats där det händer. Trovärdighet och opartiskhet är centrala värden för vår nyhetsjournalistik. Läs mer här.