maandag 26 augustus 2024

Statistiek deel 2

De Belgische schaakbond heeft een nieuwe site: blog.frbe-kbsb-ksb.be waarmee we eensklaps van het stenen tijdperk naar de moderne tijd springen. Tags, reacties, iedereen kan artikels publiceren, een nieuwsbrief, up to date kalender... Het ziet er veelbelovend uit en ik ben dan ook van plan er aan mee te werken.

Voorlopig is dit uit tijdsgebrek gebleven bij het reageren op artikels maar in de nabije toekomst wil ik ook geregeld een artikel publiceren die beter past op de bondsite dan deze blog. Ik hoop dat anderen mijn voorbeeld volgen maar ik vrees er een beetje voor. Vorige week werd "Schaaksite zoekt met spoed vrijwilligers" gepubliceerd en toont nogmaals aan dat het erg lastig is om schakers te motiveren om artikels te schrijven.

Trouwens een reactie op Gm Daniel Dardha: verkennen van een mogelijke samenwerking legt ook een tweede obstakel bloot. Topspelers maar breder genomen ambitieuze spelers (zie Geheim) zijn vaak bijzonder karig met het gratis delen van kennis. Ik was dan laatst ook blij om te horen dat de Belgische FM Adrian Roos mij na onze onderlinge partij wou vertellen hoe hij mij had verrast met een zeer vreemde voortzetting in een opening die ik een paar maanden eerder nog in Marienbad op het bord had tegengekregen (zie Identiteitsfraude). "Statistiek" was zijn antwoord.
Volgens mijn openingsboek is het zeer vreemde 6.Pe2 statistisch interessant

In bovenstaande stelling had ik al eens 6.Ld3 en 6.Le2 tegengekregen maar Adrian verraste mij compleet met 6.Pe2. Ik had uiteraard onmiddellijk door dat ik weer gelopen was in een venijnige partijvoorbereiding. Het was puur geluk dat ik niet alleen een flinke tijdshandicap maar ook groot stellingsnadeel overleefde en later zelfs de partij won (zie Chess960 deel 3). Ik zeg geluk want recent in Dortmund ging ik 3 keer voor de bijl door eenzelfde type handicaps (hiermee wil ik sommigen tegenspreken die succes in de opening niet willen linken aan partijresultaten op mijn niveau).

Statistiek gebruiken om een openingskeuze te maken is niets nieuw voor mij want ik doe het al vele jaren maar het is wel de eerste keer dat ik het expliciet hoor van een andere speler. Sinds 2013 maak ik al mijn eigen openingsboeken in Chessbase (zie Groene zetten). Toen was het uitsluitend om de diverse opties elk afzonderlijk te onderzoeken maar vandaag is het ook vaak een handig instrument om bij weinig tijd heel snel een selectie te maken. Er zijn 3 parameters die hierbij belangrijk zijn.
  • Aantal partijen gespeeld met een zet. Als een zet meer wordt gespeeld dan is dat meestal omdat het als betrouwbaarder wordt beschouwd. Nadeel is uiteraard dat de meest gespeelde zetten ook het bekendst zijn.
  • Gemiddelde elo van de spelers bij een keuze van een zet. Hogere elo's selecteren vaak de betere voortzettingen al dan niet door voorafgaande studie. 
  • Over- of onder-score van een zet: (Verschil tussen gemiddelde eloprestatie - eigen gemiddelde elo van de spelers bij een keuze van een zet). Dit vind ik persoonlijk de belangrijkste parameter want vertelt ons het best of we elowinst of eloverlies mogen verwachten.
Als we kijken naar bovenstaand voorbeeld dan zien we in een oogopslag dat 6.Pe2 statistisch interessant is. Het staat in de top 2 van gespeeld door de hoogste elo's. Het heeft een overscore van 2513 - 2466 = 47 elo. Tenslotte werd 6.Pe2 in slechts 4% van de partijen gekozen dus het is zeer waarschijnlijk een uitstekend verrassingswapen.

Vervolgens is de logische stap dan ook om AI in te schakelen en een compleet repertoire op basis van statistiek te bouwen. Ondertussen bestaan al meer dan een jaar minstens 2 websites hiervoor: BookBuilder en aichesscoach dus ik vermoed dat al sommige professionals dit gebruiken.

Anderzijds geldt zoals bij veel AI-output ook hier dat garbage in is garbage out. Vooral de laatste paar jaar zie ik een enorme devaluatie van de kwaliteit van de publieke databases (Megadatabase ...) door de massale dumping van Titled Tuesday-partijen. Van sommige spelers zoals mijn tegenstander uit de derde ronde van Open Dortmund de Duitse FM Moritz Weishaeutel merkte ik op dat bijna alle gepubliceerde partijen zulke online blitzpartijtjes zijn.
384/574 partijen in de Megadatabase zijn van Moritz Weishaeutel online blitzpartijtjes

In Extra tijd deel 2 schreef ik dat blitzpartijtjes makkelijk 500 punten lager gespeeld worden van niveau dan klassieke partijen maar ook het online repertoire is soms helemaal misleidend. Dat zien we heel duidelijk in de partijen in de Megadatabase van 2024 voor Moritz.
Volgens de megadabase speelt Moritz bijna uitsluitend 1.e4

Een voorbereiding puur gebaseerd op statistiek zonder te kijken naar de afkomst van de partijen leverde al heel snel een winnend voordeel op.
Het spreekt voor zich dat een 2400 speler dit niet speelt in een klassieke bordpartij dus ik was dan ook niet verrast toen Moritz voor 1.d4 koos ipv volgens de statistiek 1.e4 in onze onderlinge partij.

Trouwens ik vind bovenstaande analyse evenmin weggesmeten tijd/ energie. Sterker online schaken is een belangrijk onderdeel in het trainen van een openingsrepertoire en bepaalde fouten blijf je zonder computeranalyses herhalen (ik 43 keer in bovenstaand voorbeeld).

Het is ook zo dat dankzij de Titled Tuesday-partijen er interessante ideeën van minder bekende openingen gepubliceerd worden die soms heel populair zijn bij amateurschakers. M.a.w. zoals ik al vermeldde in spatiebalk deel 2 is het niet een zwart-wit verhaal die Titled Tuesdays in de databases. Het creëren van aparte openingsboeken met en zonder is technisch niet al te lastig en lijkt mij daarom de oplossing om van beide werelden optimaal te genieten.

Brabo

Geen opmerkingen:

Een reactie posten