Štatistická analýza počítačom generovaných rozdaní

Mnohí hráči mávajú dojem, že rozdania miešané počítačom sa štatisticky výrazne líšia od rozdaní miešaných ručne, hlavne majú dojem, že počítačom generované rozdania majú extrémnejšie rozhlohy a extrémnejšie rozloženie figúrových bodov.

 

Pokiaľ vedúci turnaja nezadá nejaké špeciálne obmedzujúce podmienky alebo nerobí selekciu vygenerovaných rozdaní, tak počítačom vygenerované rozdania, ak je generátor pseudonáhodných čísel korektne navrhnutý, sa budú blížiť skutočným pravdepodobnostiam. Ručne miešané rozdania sú možno naopak voči pravdepodobnosti vychýlené, pretože pri zohrávke majú karty s rovnakou farbou tendenciu byť vedľa seba, zároveň všetky štyri karty zdvihu sú počas zohrávky obvykle rovnakej farby, takže ak karty poriadne nezamiešame, môžu na jednej strane vznikať extrémne dlhé farby a na druhej strane zas môže vznikať rovnomernejšie rozloženie farieb. O rozdávaní typu po tri karty každému hráčovi a len v poslednom kolečku po jednej nehovoriac.

Takže v tomto slova zmysle bude nejaký rozdiel medzi ručne miešanými a programovo generovanými rozdaniami, ak by niekto chcel, tak kým sme nemali miešačku, mohol by naše ručne miešané rozdania nejako zosumarizovať a mohli by sme ich vyhodnotiť, ale bolo by to dosť pracné, keďže sme ich väčšinou nemali na webe zverejňované v bežných bridžových formátoch, takže ťažko napísať program, ktorý by to vyhodnotil plne automaticky.

Keďže som mal dnes s Alicou diskusiu na tému, že včera boli extrémne rozlohy a priveľa sedemlistov, tak som sa rozhodol štatisticky zanalyzovať doteraz vygenerované rozdania.

Najprv trocha teórie. Pravdepodobnosť 7 listu v liste je 3,53% a 8 listu 0,47%, spolu sú to okrúhle 4%. Keďže v rozdaní sú štyri listy, tak pravdepodobnosť že ani v jednom liste nie je sedem alebo osemlist je 0,96x0,96x0,96x0,96=0,849, takže je až 15,1% pravdepodobnosť, že v rozdaní aspoň jeden sedemlist bude. Pri 28 rozdaniach teda priemerne možno očakávať, že v 4,23 rozdaniach bude aspoň jeden sedem či osemlist. Prirodzene, že v jednotlivých turnajoch počet mnoholistov kolíše, teoreticky sa môže stať, že nebude žiaden a čisto teoreticky, ale s veľmi malou pravdepodobnosťou by sa mohlo stať, že v každom rozdaní nejaký sedem plus list bude. Z tohto pohľadu bol včerajší večer extrémny, priemerný počet sedem plus listov pri 28 rozdaniach je 4,48, včera však bolo až 9 sedemlistov.

Vygenerovaných rozdaní na klubovom notebooku je 3382, v nasledujúcej tabuľke sú skutočné a očakávané hodnoty:

 

3382 deals   N HPC E HPC S HPC W HPC |-----Voids-----| |-----Singletons----||-- >=7suit --| |-----Balanced------|
Average/Totals 10,48 9,88 9,78 9,87  176 170 212 223  1005 1164 1104 1072  123 129 165 151  2041 1830 1909 1928
Expected    10.00 10.00 10.00 10.00 173 173 173 173  1042 1042 1042 1042  137 137 137 137  2159 2159 2159 2159

Vyskakujú dva extrémy. Sever má priemerne oproti očakávaným 10 FB až 10,48 FB ostatné parametre sú viacmenej podľa očakávania, iba pravidelných listov je výrazne menej, než by malo byť, namiesto 8636 ich je len 7708, čiže až o 11% menej. Medzi týmito rozdaniami sú však aj turnaje, kde rozdania generovali Dušan Šlachta alebo Adam Kubica, plus rozdania zo simultánky, takže sa na to budem musieť ešte znova pozrieť a očistiť to, ale zas takýchto turnajov nebolo až tak mnoho, aby to mohli výraznejšie ovplyvniť.

Záhada je vyriešená, mal som v databáze aj rozdania, keď som testoval metódou Monte Carlo pravdepodobnosť štvorlistu u otvárajúceho s 5 listom. Takže štatistiky sú po očistení nasledovné ( z 2887 rozdaní):

2887 deals   N HPC E HPC S HPC W HPC |-----Voids-----| |---Singletons--||-- >=7suit --| |-----Balanced------|
Average/Totals 10,02 9,97 10,05 9,96  145 137 158 156  868 932 912 899  123 115 129 120  1714 1658 1670 1697
Expected    10.00 10.00 10.00 10.00 148 148 148 148  889 889 889 889  117 117 117 117  1843 1843 1843 1843

Všetky parametre vygenerovaných rozdaní korešpondujú s očakávaním, len pri pravidelných rozlohách je posun, oproti 7372 očakávaných pravidelných listov bolo len 6739 čo je o 8,6% menej. Ak by to bolo do 2% bolo by to OK, takto neviem prečo tam mám naďalej nejakú systematickú chybu.

blog comments powered by Disqus