Forventning, varians og det lange

 

1. Innledning

Denne artikkelen er først og fremst skrevet for pokerspillere som ønsker å vinne mye over tid og samtidig holde styring på risikomomentet. Limit holdem er brukt som utgangspunkt for de fleste eksemplene, men alle resultatene overføres til andre spill, som no-limit holdem, turneringer, blackjack, aksjespekulasjoner, oddstipping og andre veddemål. Så lenge man har en positiv forventning på noe man foretar seg, og det er et usikkerhetsmoment til stede, så vil teorien i denne artikkelen gjelde. Det er tatt med nok eksempler til at den ivrige leser kan greie å analysere sitt eget spesialspill.

For å kunne leve av å spille poker, må to betingelser være oppfylt: Man må ha en positiv forventning som gir en tilstrekkelig timelønn, og de tilfeldige variasjonene i resultatene må ikke være så store at man risikerer å gå blakk. Det er gjerne slik at høyere forventning medfører større risiko, og det gjelder å finne et balansepunkt.

Artikkelen bygger på noen resultater og begreper i statistikk. Her har vi ikke ønsket å forklare alt i minste detalj, men håper at eksemplene viser hvordan beregningene skal utføres.

I de fleste eksemplene er beløpene tenkt å være angitt i USD, men det spiller ingen rolle om man heller vil tenke kroner eller pund. Der hvor det har betydning er det angitt hvilken valuta som brukes.

2. Forventning og varians

En solid spiller vil i et fullt 10/20 limit holdem lag tjene noe slikt som 30 per time. Hvis han skriver ned gevinsten/tapet for hver time, så vil gjennomsnittet av tallene etter hvert nærme seg 30. Men i noen av timene vil han gjøre det bedre enn andre. Standardavviket er et mål for spredningen av tallene. Rent intuitivt kan man tenke på standardavviket som et slags gjennomsnitt for hvor mye resultatene varierer fra det forventede. Mer presist defineres variansen som gjennomsnittet av andrepotensene av avvikene fra forventningen, og standardavviket som kvadratroten av variansen.

Eksempel 1.

Frode spiller 10/20 limit holdem og noterer resultatene for hver time. Etter 10 timer har han skrevet ned:

220, 60, -320, 180, 480, -180, 140, -100, 80, -160

Summen av disse tallene er 400, så Frode har i gjennomsnitt vunnet 40 per time. For å regne ut variansen, så trekker man fra 40 fra hvert tall, kvadrerer alle tallene, og tar gjennomsnittet. Dette vil gi 49520. Standardavviket blir dermed omtrent 222.

Selv om Frode har vunnet 40 per time så langt, er det ikke sikkert at dette resultatet vil holde seg dersom han fortsetter. Vi skal senere se hvordan Frode kan finne ut hva hans forventning er over tid, og hvilken rolle variansen spiller for dette.

I et fullt lag limit holdem vil standardavviket (per time) til en stram spiller som ser under 20% av floppene, ligge på rundt 10 BB (big bets). En løsere spiller kan ha standardavvik opp mot 20 BB. Standardavviket er en vesentlig faktor når man skal analysere sine utsikter til fremtidig inntjening.

3. I det lange løp

La oss nå anta at Frode har funnet ut at han har en forventning på 30 per time i sitt 10/20 lag, og at standardavviket ligger på 300. Hva kan Frode forvente seg dersom han spiller i 100 timer, 400 timer, 1000 timer? Hvor lenge må Frode spille for å være rimelig sikker på å vinne minst 27 per time?

Etter 100 timer så vil Frode være forventet en gevinst på 100*30 = 3000, men i virkeligheten kan resultatet ha blitt et ganske annet. Standardavviket på en 100 timers økt er 10 ganger så stort som standardavviket på 1 times spill. (Generelt vokser standardavviket proporsjonalt med kvadratroten av tiden.) Standardavviket blir her altså 3000.

Nå trenger vi et resultat fra grunnleggende statistikk. Det sier at under visse forutsetninger (som er oppfylt i alle eksempler i denne artikkelen), så gjelder følgende: Et resultat ligger mindre enn ett standardavvik fra forventningen med 68% sannsynlighet, mindre enn to standardavvik unna med 95% sannsynlighet og mindre enn tre standardavvik unna med 99, 73% sannsynlighet.

I Frodes tilfelle er det dermed 68% sannsynlighet for at gevinsten ligger mellom 0 og 6000. Videre er det 16% sjanse for at Frode har vunnet mer enn 6000 og 16% for at han har tapt penger på de 100 timene. (16 = (100-68)/2)

Etter 400 timer er forventningen 12000, og standardavviket er 300*20 = 6000. Det er dermed 95% sjanse for at gevinsten ligger mellom 0 og 24000 (dvs. innenfor to standardavvik fra forventningen). Men det er 2, 5% sjanse for at Frode har tapt penger – selv om han har spilt noenlunde disiplinert og korrekt holdem i en måned med kun pause for noen måltider og normal søvn.

Etter 1000 timer er forventningen 30000, og standardavviket er 300*√1000 ≈ 10000. Det er nå 99, 86% sjanse for at Frode er i pluss, og det er 84% sannsynlig at plussen er på over 20 per time.

For å være minst 84% sikker på at gevinsten overstiger 27 per time, så må Frode spille i 10000 timer. Da er forventningen 300000, mens standardavviket er 30000, det vil si 3 per time. Konklusjonen er at selv om man i teorien vet hva man er forventet å tjene, så kan det hende man må spille i årevis før man med rimelig grad av sikkerhet kan oppnå noe i nærheten av denne forventningen.

Til tross for disse usikkerhetene bestemmer Frode seg for å bli profesjonell 10/20-spiller. Han synes 30 dollar i timen er greit og regner med å spille 200 timer i måneden. Forventningen per måned er da 6000 og standardavviket omtrent 4000. Det betyr at i et normalt år vil han gå 11 måneder i pluss og en måned i minus. Men hva om minusmåneden kommer først? Vil han ha nok penger til å overleve den? Hvor mye må Frode ha i startkapital? Svaret vil bli gitt av bankerottformelen.

4. Bankerottformelen

I mange artikler/innlegg/bøker er det skrevet noe om hva slags bankroll man bør ha for å spille på forskjellige kurser. Det de aller fleste ikke sier noe om, er hvor sikkert det er at man overlever på denne kursen. Bankerottformelen gir konkret informasjon om nettopp dette.

Bankerottformelen:
Anta at vi har et spill som per tidsenhet eller per spill har en forventning E og et standarddavvik s. Anta videre at vi starter med en bankroll K, og at vi skal spille til vi enten har tapt alt eller har doblet bankrollen. Da vil sannsynligheten for å gå blakk være meget godt tilnærmet ved
P = 1/(1+e2t) der t=EK/s2.

(P står for sannsynlighet, og e = 2, 71828…. Bevisskisse for denne formelen står sist i artikkelen. Formelen forutsetter at spillet normalt vil vare lenge nok før konkurs eller dobling inntreffer. Dette vil vi ikke presisere nærmere, men for våre praktiske formål så er dette oppfylt.)

Tabellen under gjør bruk av denne formelen litt lettere. Tallet til venstre er t, det vil si forventningen ganger bankrollen delt på kvadratet av standardavviket. P er sannsynligheten for å gå konkurs før dobling, og Q er sannsynligheten for å gå konkurs en eller annen gang.

t P Q
0 50% 100%
0, 05 48% 91%
0, 1 45% 82%
0, 2 40% 67%
0, 4 31% 45%
0, 6 23% 30%
0, 8 17% 20%
1, 0 12% 14%
1, 2 8, 3% 9, 1%
1, 4 5, 7% 6, 0%
1, 6 3, 9% 4, 1%
1, 8 2, 7% 2, 8%
2, 0 1, 8% 1, 8%
2, 2 1, 2% 1, 2%
2, 4 0, 82% 0, 83%
2, 6 0, 55% 0, 56%
2, 8 0, 37% 0, 37%
3, 0 0, 25% 0, 25%
4, 0 0, 03% 0, 03%
5, 0 0, 005% 0, 005%

Eksempel 2.

La oss nå gå tilbake til Frode og se hvor stor bankroll han må ha for å spille 10/20 limit holdem. Vi antar at Frode spiller med en forventning på 30 per time, med et standardavvik på 300, og at han ønsker å være minst 98% sikker på ikke å gå konkurs. Fra tabellen ser vi da at verdien for t må være minst 2. Løser vi likningen 2 = EK/s2, får vi K = 2*90000/30 = 6000. Frode må altså sette av 6000 for å føle seg noenlunde trygg på ikke å gå konkurs. Her ser vi også betydningen av variansen. Dersom Frode hadde spilt litt mer konservativt, og holdt et standardavvik på 200, så hadde han ikke trengt mer enn 2*40000/30 = 2667.

Eksempel 3.

Erik setter inn 500 på et nettsted og vil prøve å bygge seg opp på 3/6 limit holdem. Han spiller med en forventning på 1 BB og standardavvik på 15 BB. Hva er sannsynligheten for at Erik går konk på dette nettstedet?

Vi regner ut t = EK/s2 = 500*6/902 = 0, 37. Fra tabellen over ser vi at Erik har omtrent 50% sjanse for å overleve.

Eksempel 4.

Øystein er en saklig og suksessfull pokerspiller som aldri satser noe uten å ha tilstrekkelig vinnersjanse. Han spiller med en bankroll på $100000 som han vil være 98% sikker på ikke å tape. Det betyr at han kan satse penger på spill så lenge verdien av t er minst 2. Blant annet kan han spille $200/400 med forventning 1 BB i timen og standardavvik 10 BB (dette gir t=2, 5). En dag i den lokale kortklubben vil Christian spille ”høyeste kort vinner” med Øystein for 5000 kroner. Det vil si at begge satser 5000 kroner, det gis ett kort til hver, og høyeste kort tar potten. Hvis kortene er like høye vil fargen avgjøre. Dette er et spill med null i forventning, så Øystein takker høflig nei. Men Christian gir seg ikke, han sier ”OK, la meg satse 5100, og du 5000, er du med da?” Store innsatser skremmer ikke Øystein, og her er det jo også en 50-lapp i forventning. Bør Øystein spille med Christian?

Regner vi alt i kroner, blir forventning ganger bankroll 35 millioner, mens standardavviket i andre er 25 millioner. Dermed blir t=1, 4 og det betyr at Øystein har 6% sjanse for å gå konkurs dersom han spiller lenge nok med Christian. Siden dette er for risikabelt i det lange løp, så er dette spillet ikke spillbart for Øystein, selv om han bare skulle spille det én gang.

Til slutt i dette kapittelet tar vi med en tabell over bankrollkrav for limit holdem. Her antar vi at forventningen er på 1 BB i timen, og at standardavviket er på 15 BB. Dersom forventningen er en annen, må tallet i tabellen deles på forventningen. For eksempel kreves det dobbelt så stor bankroll dersom forventningen er 0, 5 BB, men bare halvparten så stor dersom forventningen er 2 BB. Hvis standardavviket er noe annet enn 15, så må man justere med kvadratet av endringen. En spiller med standardavvik på 10 BB, kan for eksempel dele alle tallene i tabellen med 2, 25. Med bankroll som angitt i den midterste kolonnen er det 80% sjanse for at man overlever, mens i kolonnen til høyre er det 98% sjanse.

Limit 80% 98%
1/2 360 900
2/4 720 1800
3/6 1080 2700
5/10 1800 4500
10/20 3600 9000
15/30 5400 13500
20/40 7200 18000
30/60 10800 27000
100/200 36000 90000

 

5. Hvordan finner man forventningen?

Frode overlever den første måneden i sitt liv som profesjonell, men overskuddet ble bare 1000, dvs. 5 i snitt per time. Dette kan jo bero på tilfeldigheter, men Frode begynner å bli usikker. Er han virkelig så god at han er forventet å vinne 30 per time? Hvordan kan Frode finne ut av dette?

Måten å estimere forventning i poker er å loggføre resultatene og spille lenge nok. Teorien er tilsvarende det vi skrev om i kapittel 3, men med unntak av at vi nå også må estimere variansen.

Frode begynner å notere resultatet for hver time. Etter 400 timer viser det seg at fortjenesten er 15 per time, mens estimert standardavvik per time er 240. (Gjennomsnittlig fortjeneste og standardavvik beregnes som i eksempelet i kapittel 2.). Men hvor nøyaktig er tallet 15 i forhold til Frodes faktiske forventning?

Unøyaktigheten i et slikt gjennomsnitt kan man finne på følgende måte: Ta standardavviket per time og del på kvadratroten av antall timer. Da vil du få standardavviket til den estimerte timelønnen.

For Frode gir dette 240/20 = 12 i standardavvik. Vi kan dermed si at Frodes forventning er innenfor 15 ± 12 med 68% sannsynlighet, eller
15 ± 24 med 95% sannsynlighet. Frode har altså ingen klar indikasjon på hvor mye han er forventet, ikke engang om han er en vinnende spiller!

Etter 8 måneders spill og 1600 timer så har Frode kanskje et gjennomsnitt på 20, det vil si 1 BB, mens standardavviket per time fremdeles ligger på 240. (Standardavviket er mye lettere å få nøyaktig enn forventningen.) Vi får nå at forventningen er 20 ± 6 med 68% sannsynlighet og 20 ± 12 med 95% sannsynlighet. (Tallet 6 er 240 delt på kvadratroten av 1600.) Det synes nå klart at Frode er en vinnende spiller og at forventningen ligger et sted mellom 10 og 30 per time. Jo lenger han spiller, desto mer presis blir den estimerte forventningen. Mer presist gjelder at for å halvere usikkerheten, kreves det at man spiller fire ganger så lenge.

Dersom Frode ønsket en usikkerhet på ± 2 med 95% sannsynlighet måtte han ha spilt i 500000 timer eller 57 år i strekk. Det er derfor urealistisk å få et så nøyaktig estimat på forventningen; man må nøye seg med mer romslige anslag som for eksempel 20 ± 12.

I denne tenkte historien om Frode har vi operert med en forventet gevinst på 1-1, 5 BB. Svært gode spillere kan på enkelte nettsteder oppnå betydelig mer enn dette, og i tillegg spille to bord samtidig. Neste eksempel er basert på erfaringene til en god norsk pokerspiller.

Eksempel 5.

Per har spilt 100 timer på 15/30 på et nettsted. Han har spilt to bord samtidig og har et snitt på 2 BB per time per bord. Per er en stram spiller, han spiller mindre enn 20% av hendene, og standardavviket er på ca. 10 BB. Hva kan vi si om Pers forventning per time?

I gjennomsnitt har altså Per tjent 2 BB per time per bord. Unøyaktigheten i dette i forhold til Pers faktiske forventning finner vi ved å dele 10 på √200. Vi får da et standardavvik på 0, 7 BB. Forventningen er dermed med 68% sannsynlighet 2 ± 0, 7 BB for hver halvtimes arbeid, eller $ 120 ± 42 per time. Med 95% sannsynlighet er forventningen $ 120 ± 84. Det er dermed overveiende sannsynlig at Pers forventede timelønn vil være nok til å leve av. Dersom Per forsetter å spille med samme inntjening i 300 timer til, så vil forventningen bli $120 ± 42 med 95% sannsynlighet. Dette betyr at Per for fremtiden kan forvente seg en timelønn på minst $78 med 97, 5% sannsynlighet (og minst $57 med 99, 86% sannsynlighet).

Eksempel 6.

Hvis Frank har spilt har spilt 200 1-bordsturneringer med 215 i innsats og 1000-600-400 i premier til de tre beste, og han har totalt tjent 14000 på dette, hva kan man da si om forventningen per turnering?

Frank har altså i snitt tjent 70 per turnering. Dersom det er en rimelig jevn fordeling av 1., 2. og 3. plasser, så vil standardavviket per turnering bli rundt 350. Deler vi 350 på kvadratroten av 200, får vi omtrent 25. Forventningen til Frank er dermed 70 ± 25 med 68% sannsynlighet, og 70 ± 50 med 95% sannsynlighet. Vi ser at 200 turneringer ikke er nok for å estimere forventningen med en rimelig grad av nøyaktighet. Hadde Frank hatt 70 i snitt etter 5000 turneringer, ville forventningen vært 70 ± 10 med 95% sannsynlighet.

6. Konklusjon

Dette at man kan være forventet 1-2 BB per time når man spiller limit holdem er noe de fleste har hørt og lest. Men det er dessverre ingen menneskerett å ha en slik forventning. De aller fleste er forventet å tape, og vil tape, selv om de tror de er vinnere eller nullspillere. Det denne artikkelen prøver å få fram, er at selv om man i teorien er en vinnende spiller, så kan man ikke uten videre få realisert betydelige gevinster på en risikofri måte. Man må holde på veldig lenge både for å beregne fordelen man eventuelt har og for å oppnå den forventede gevinsten. Dette kommer i tillegg til all den tid man har brukt på å opparbeide seg den dyktigheten som kreves for å bli en solid spiller. Men har man denne dyktigheten, og i tillegg passer på å holde et balansert forhold mellom forventning og risiko, så kan man over tid hente mye penger på poker.

Appendix. Beviskisse for bankerottformelen

La oss erstatte spillet med n2 ”veddemål” om s/n der vi for hvert veddemål vinner med sannsynlighet (1+ E/ns)/2. Et slikt veddemål vil ha forventning E/n2 og standardavvik godt tilnærmet av s/n, der tilnærmingen er bedre jo større n er. Disse n2 veddemålene vil dermed ha samme forventning og standardavvik som vårt opprinnelige spill, så vi kan regne med disse veddemålene isteden.

Spillet består nå av slike små veddemål, og etter en stund vil vi enten ha doblet kapitalen, dvs. ha vunnet Kn/s flere slike veddemål enn vi har tapt, eller vi har tapt hele kapitalen, dvs. tapt Kn/s flere veddemål enn vi har vunnet. Sannsynligheten for at vi går blakk viser seg å bli

(1- E/ns)Kn/s
P = —————————————–
(1- E/ns)Kn/s + (1+ E/ns)Kn/s

Dette kan man innse på følgende måte: Hvis spillet er slutt etter Kn/s veddemål, er formelen opplagt riktig. (Uttrykket i telleren er sannsynligheten for Kn/s tap på rad, mens uttrykket i nevneren er sannsynligheten for å bli ferdig etter Kn/s veddemål.) Dersom spillet krever x veddemål for å bli ferdig, kan man sette opp tilsvarende sannsynligheter, og det viser seg at vi står igjen med akkurat det samme uttrykket!

Setter vi nå t = EK/s2, og bruker at lim(1+ x/n)n = ex når n går mot uendelig, så står vi igjen med P = 1/(1+e2t).