maandag 7 oktober 2013

ICCF

Dat kennis belangrijk is om punten te scoren, weten we allemaal. Het is dan niet verwonderlijk dat heel wat ambitieuze schakers een verzamelwoede hebben als het op databases aankomt. In een reeds eerder op deze blog vermeld youtubefimpje, zie schaakintuitie deel 2 vertelt Anand dat hij vandaag over een database van ongeveer 20 miljoen partijen beschikt. De auteur van het boek Grandmaster repertoire 10 The Tarrasch Defense, Nikos Ntirilis meende aanvankelijk dat dit allemaal kwalitatieve partijen zijn maar op Quality chess blog gaf ik al aan dat dit onmogelijk correct kon zijn. We mogen veronderstellen dat een regerende wereldkampioen pas zal spreken over een kwalitatieve partij als de spelers uit de top 100 komen en de partij gespeeld werd op een serieus tempo. De top 100 speelt erg ruim genomen, 100 partijen per jaar dus als we niet met overlappingen rekening houden, tellen we slechts 10.000 partijen per jaar.  Dit zou betekenen dat we 2000 jaar nodig hebben om aan 20 miljoen kwalitatieve partijen te geraken. 

Een wereldkampioen houdt dus veel meer bij dan enkel kwalitatieve partijen. Ik ken uiteraard niet de exacte samenstelling van Anand's database maar ik ben er vrij zeker van dat ze opgebouwd is rond een Chessbase product (Mega of Big database) waardoor ook heel veel partijen van een heel beperkte kwaliteit aanwezig zijn. Nu kan je jezelf inderdaad de vraag stellen of het niet verstandiger zou zijn om die minder interessante partijen eruit te gooien. Wel vooreerst ben ik van mening dat er meestal wel iets leerzaam aanwezig is in een serieus gespeelde partij. Dit aspect besprak ik uitvoerig in mijn vorig blogartikeltje welke partijen analyseren. Tevens zijn databases een goede bron om informatie te winnen over tegenstanders. De meeste wereldtoppers spelen niet uitsluitend tegen hun peers (denk aan simultaans, open tornooien, ...). Ook mogen we niet vergeten dat bepaalde jonge spelers later sterk zullen worden. Tenslotte is het ook zo dat het bewaren van grote databases spotgoedkoop is en bovendien beschikken we vandaag over instrumenten die in een minimum van tijd grote databases kunnen doorzoeken naar specifieke informatie.  Ik wil hierbij wel nog opmerken dat we beter chessbase als formaat van database gebruiken want ik ondervond dat bij pgn formaat de zoektijd serieus kan oplopen bij grote bestanden.

Nu zelfs al bewaren we ook de partijen met mindere kwaliteit, dan nog is 20 miljoen een erg hoog aantal. De meest recente commerciële Mega Database telt 5,4 miljoen partijen. Zelf heb ik er nu meer dan 7 miljoen waarvan ik een gedetailleerde opsomming maakte in een commentaar onder mijn blogartikeltje groene zetten. Onlangs voegde ik dankzij een hint van hypekiller5000 nog een mooie collectie kwalitatieve partijen aan toe die gespeeld werden tussen schaakprogramma's onderling zie computerchess. Killers van openingsnieuwtjes zal je nauwelijks vinden in zulke enginedatabases maar het is wel een erg handig hulpmiddel om een snelle en accurate evaluatie te krijgen van bepaalde bestaande openingsvarianten. Op openingmaster kan je vandaag tegen betaling 8,7 miljoen partijen vinden. Meer vind je wellicht niet als gewone schaker op het internet dus Anand beschikt duidelijk over enkele exclusieve kanalen. Mark Uniacke beweert op de Hiarcs website dat Anand gebruik maakt van hun schaakprogramma en dus ook wellicht toegang heeft tot extra enginedatabases. Daarnaast is ook geweten dat Anand bevriend is met Frederic Friedel en dus naar alle waarschijnlijkheid ook toegang heeft tot de partijen gespeeld op de webportal playchess. Momenteel staat de teller op playchess al op 660 miljoen partijen dus het moet een koud kunstje zijn om daar een 10 miljoen betere partijen uit te selecteren door gebruik te maken van rating en tempo als criteria.

Uiteraard bestaat er naast een continu zoeken naar kwantiteit ook een gelijkaardige zoektocht naar kwaliteit. Een paar decennia geleden werd kwaliteit uitsluitend gelinkt aan bordpartijen gespeeld door de wereldtoppers. Vandaag zijn die partijen vanzelfsprekend ook nog belangrijk maar ondertussen hebben de meeste spelers ontdekt dat iccf een ware schat aan erg hoogstaande partijen levert. In heel wat recente bordpartijen zien we dan ook dat het openingsnieuwtje stamt uit de correspondentiewereld. Soms leidt dit tot vreemde wilde partijen als beide spelers gebruik maken van dezelfde informatie. Zo vond ik via chessvibes de partij Vachier-Lagrave Gelfand waar beide spelers een iccf-partij volgden uit 2012. Maxime week af op zet 18 met een voortzetting waarvan ik vermoed (rekening houdend met het tijdsverbruik voor de hele partij) dat hij wist op voorhand dat zwart bij correct spel remise zou kunnen behalen. Echter Boris had zijn huiswerk ook gemaakt want in een mum van tijd werd afgewikkeld met enkele fantastische tactische zetten naar een eeuwig schaak. Het voorbeeldje toont trouwens ook mooi aan hoe uitgebreid die spelers hun openingen voorbereiden dus niet alleen op de hoogte zijn van de sleutelpartijen maar tevens kritisch kijken naar allerlei alternatieven. Hieronder kan je beide partijen naspelen.
De bordpartij werd gespeeld in de voorbije Wereldbeker die gewonnen werd door Kramnik.
Zelf mocht ik enkele maanden geleden een gelijkaardige ervaring meemaken. Echter in tegenstelling met het vorige voorbeeld is hier minder duidelijk wie eerst was want het verhaal start eigenlijk al in 2010. Op chesspub publiceerde ik toen eigen gemaakte analyses over het Stautongambiet met De2 naar aanleiding van mijn partij tegen Pieter Saligo. In 2011 werd een correspondentiepartij gespeeld met exact de hoofdlijn die ik toen had aanbevolen.
Het kan uiteraard toeval zijn maar heel wat correspondentiespelers zijn erg actief op chesspub dus het zou mij niet verwonderen dat 1 of beide spelers op de hoogte waren van mijn eerder gepubliceerde analyses. Ik was dan weer op mijn beurt op de hoogte van de correspondentiepartij door een webpagina over het Stautongambiet. Trouwens als je een liefhebber bent van gambieten dan is de Ian Simpson's Chess Site zeker eens de moeite om rond te neuzen. Aanvankelijk had ik enkel notie genomen van de partij en het was pas nadat Stefan Docx mij erop wees (tijdens Open Leuven 2012?) dat zwart in de slotstelling ook met het spectaculaire Lxc3 remise had kunnen maken dat ik de moeite deed om enkele varianten eens met een computer te bekijken.
Vele maanden later kwam het allemaal op het bord tijdens de 6de ronde Open Gent. In het uurtje voorbereiden tegen Arno Bezemer had ik enkel mijn oorspronkelijke analyses over de Stautongambiet met De2 opgefrist waardoor ik de exacte zetten van de correspondentiepartij mij niet meer tijdens de partij kon herinneren. Echter door beiden logisch te redeneren, bereikten we toch de slotstelling van de correspondentiepartij en toen kreeg ik een déjà-vue want zag opslag de eindcombinatie met Lxc3 die ik eerder had bestudeerd.

De partij trok uiteraard wat toeschouwers die benieuwd waren wat er precies gebeurd was. Toen ik en Stefan Docx vertelden dat alles al bekend was, droop men stilletjes af. Net zoals in mijn artikeltje over de wetenschappelijke aanpak waren de reacties opnieuw erg varierend van verwondering tot afgrijzen.

Of dit soort bordpartijen een goede of slechte zaak is voor het competitief bordschaken, laat ik in het midden. Feit is dat je als titelhouder min of meer verplicht bent om op de hoogte te zijn van deze correspondentiepartijen om gelijke tred te kunnen houden in de opening. Hieruit mogen we dus afleiden dat correspondentiepartijen gespeeld op iccf waardevol zijn. Iccf heeft zich dit ook beginnen realiseren en kwam zo uiteindelijk tot de beslissing om hun database volledig af te schermen voor niet-leden. Sinds eind vorig jaar (zie ICCF Congress 2012) is de database afgeschermd, iets wat ik pas ontdekte in juli daar ik toen pas als voorbereiding op Open Gent trachtte de meest recente partijen te downloaden. Mijn pogingen op chesspub om deze blokkering te omzeilen, vingen bod dus lezers die mij hiermee kunnen helpen, zouden mij zeker een plezier doen. Ik vermoed dat sommige bordspelers nog via exclusieve kanalen toegang zullen hebben tot de iccf-database en dan behoor ik uiteraard graag tot deze groep bordspelers. Op chessvibes merk ik al op dat er geen referenties meer worden gemaakt naar recente correspondentiepartijen van 2013. Het is een spijtige evolutie die ik al eens eerder heb besproken in mijn blogartikeltje partijpublicaties.

Dat iccf verkiest om zich te distantiëren van bordschaak werd onlangs bevestigd door een belangrijke wijziging in hun statuten. In het ICCF Congress 2013 werd beslist om niet meer de basisregels te volgen van het bordschaak en dus de fide. Nu verwacht ik niet dat iccf de loop van de stukken zoals een paard of loper zal wijzigen maar wel dat de klemtoon meer gelegd zal worden op het correspondentieaspect dus de analyse. Een opmerkelijke beslissing vind ik dan ook de invoering van een ratingsysteem voor Chess 960 schaak. Een andere opmerkelijke beslissing is de afschaffing van de 50 zettenregel (artikel 9.3) als een tablebase wordt bereikt in een correspondentiepartij. Spelers kunnen nu met een tablebase remise of winst claimen bij de tornooileiding. Het grote voordeel is dat men niet meer verplicht kan worden om nog vele maanden te wachten op het resultaat dat iedereen al kende. Een nadeel is dat we nu mogelijks voor eenzelfde tablebasestelling een verschillend resultaat hebben voor een bordpartij t.o.v. een correspondentiepartij. Wat dit precies inhoudt en waarom iccf dit beslist heeft, zal ik trachten uit te leggen met een stelling die ik al eens eerder heb vermeld in mijn blogartikeltje schaakintuitie deel 2.

In bovenstaande screenshot zien we finalgen als output geven dat zwart wint in 85 zetten. Ik heb ook de hoofdlijn geafficheerd en daar zien we dat de 50 zettenregel niet in werking treedt dus zowel in bordschaak als correspondentieschaak zou zwart winnen indien deze lijn zou worden gevolgd. Echter hiermee is de kous niet af. Als ik op zetten 49 en 50 op het eerste zicht sneller verliezende voortzettingen kies dan wordt het een ander verhaal.


Zwart wint in 48+1+22 = 71 zetten maar nu treedt wel de 50 zettenregel in werking (pas op zet 55 wordt een pion verschoven). In bordschaak zou dit betekenen dat de partij remise wordt gegeven terwijl met het nieuwe reglement in correspondentie zwart toch nog steeds de winst kan claimen. Het omgekeerde zouden we nu kunnen doen voor zwart. We zoeken een minder snel winnende variant die opnieuw voldoet aan de 50 zettenregel. Dit proces kunnen we voor wit en zwart vele malen herhalen. Ik meen in bepaalde stellingen dat we makkelijk miljoenen iteraties moeten doen om zekerheid te hebben of een stelling volgens de 50 zettenregel al dan niet gewonnen kan worden. Manueel is dit dus vaak onmogelijk correct uit te voeren. Tablebases die rekening houden met de 50 zettenregel zijn in een veel beperktere mate beschikbaar dan het type dat ik besprak ik mijn blogartikel tablebases. De enige website die ik ken waar een zekere selectie aan tablebases met de 50 zettenregel staan (of DTZ50 genoemd) is chess.jaet.org/endings/. In de computation status kan je zien dat we spreken over een erg bescheiden dekking van de bestaande tablebases.

Nu kan je jezelf uiteraard afvragen of zulk soort conflictsituaties niet uiterst zeldzaam zijn. In bordschaak mogen we veronderstellen dat niemand erin kan slagen om 50 of meer opeenvolgende beste zetten te spelen zoals de tablebases weergeven dus het is sowieso iets wat enkel relevant is voor correspondentieschaak of puur vanuit analytisch oogpunt. Op chesspub refereerde de correspondentiespeler Vass naar een fantastisch artikeltje waar 24 voorbeelden van eindspelen met de 50 zettenregel in detail werden besproken (in het Russisch maar met googletranslate mag dat zelfs voor niet-Russisch sprekenden geen probleem zijn). 24 voorbeeldjes blijft weinig maar het toont wel aan dat er een zekere grens is overschreden door iccf. Iccf koos om een maximum aan tablebases te kunnen gebruiken zonder afhankelijk te zijn van de 50 zettenregel. Bovendien mogen we niet vergeten dat de 50 zettenregel iets arbitrair is (wat ik reeds uitgelegd heb in mijn blogartikeltje sportiviteit) en dus bekeken kan worden als slechts een middel om de partij te kunnen laten stoppen als de spelers technisch niet in staat zijn om te winnen. In correspondentieschaak is technisch veel meer mogelijk dus logisch om af te stappen van de menselijke limieten in bordschaak.

Alhoewel ik de stappen dus begrijp, ben ik als theoreticus bedroefd om deze evolutie. Databases exclusief maken voor een selecte groep, hanteren van andere reglementen, ... maakt mijn taak om onderzoek te doen niet makkelijk. Ook zorgt het voor een verdere versnippering van het al erg gemarginaliseerde schaken. Misschien moeten we inderdaad specialiseren om de toekomst te vrijwaren maar ik heb mijn twijfels want vaak is samen trekken aan dezelfde kar een betere strategie.

Brabo

8 opmerkingen:

  1. Zoiets als in je partij tegen Bezemer heb ik een dikke 20 jaar geleden meegemaakt. Ik had zwart tegen een goede vriend van me en we waren destijds enorm geïnteresseerd in het Koningsgambiet, dat we allebei met wit speelden. We hadden met name tijd gestoken in een variant van de Beckerverdediging (3...h6), met een stukoffer en een tegenoffer. Ik was tot de conclusie gekomen dat er geforceerd een volstrekt gelijk eindspel uit voort zou komen en wilde dat uitproberen. Het kwam precies zo uit.
    De omstanders keken vol verbazing toe, maar waren behoorlijk teleurgesteld toen ze hoorden dat de partij voor het overgrote deel het resultaat was van huiswerk.

    "Of dit soort bordpartijen een goede of slechte zaak is"
    Wat mij betreft kun je je net zozeer afvragen of het een goede of slechte zaak is dat we allemaal ouder worden. Je doet er toch niets aan.

    "Databases exclusief maken voor een selecte groep"
    Ik ben het met je eens, hoor, maar er is nog iets anders. ICCF draait op vrijwilligers en databases samenstellen kost ook tijd en geld. Het lidmaatschap van de ICCF is niet bepaald duur - MegaBase is vele malen duurder. Ik begrijp heel goed dat de ICCF op deze manier probeert de kosten een beetje te dekken. Of dat ook lukt is een tweede.

    BeantwoordenVerwijderen
  2. Als het ICCF om centen is te doen dan snap ik niet waarom ze hun database niet tegen betaling aanbieden. Ik was zelfs bereid om 40 euro per jaar te betalen aan openingmaster zodat ik de correspondentiepartijen zou kunnen downloaden maar zag daar op het laatste moment van af toen ik las dat openingmaster geen overeenkomst had met iccf en dus evenmin beschikte over de meest recente partijen.
    Lidmaatschap van de iccf is meer dan puur centen maar betekent ook akkoord gaan met een minimum hoeveelheid aan wedstrijden spelen. Dit laatste is er voor mij teveel aan want als je op voorhand niet van plan bent om te spelen dan is dit niet fair t.o.v. de gedupeerde tegenstanders en/of tornooileiding.

    BeantwoordenVerwijderen
  3. Zoals aangegeven, is de regel kwantiteit is gelijk aan kwaliteit niet van toepassing op de grootte van een databank. Om aan 20 miljoen partijen te raken, moeten er zeker cr-partijen (zeer goed), computerpartijen (niet slecht) en internet blitzpartijen (minder goed, maar misschien interessant voor iemand als Anand, om zo te weten wat zijn tegenstanders in hun vrije tijd spelen) zitten. Anderzijds, zitten er nog (honderd)duizenden partijen niet in de elektronische databanken. Sla er een oud tornooiboek of een biografie/partijenverzameling maar eens op na - gegarandeerd vind je dat veel (relevante) partijen ontbreken. Inspanningen om nationale databanken (type belbase, zoals op schaakhistorie) aan te maken zijn dan ook een belangrijke driver om tot "volledigheid" te komen.

    BeantwoordenVerwijderen
  4. Ik geloof niet dat je met het verzamelen van gedigitaliseerde tornooiboeken of biografieën/ partijenverzameling vandaag een gat betreffende kwantiteit kunt slaan t.o.v. de commercieel verkrijgbare databases zelfs al beschik je over een team van helpers. Vooreerst zijn het aantal sites zoals schaakhistorie die onder de radar van de commerciële databases blijven, erg beperkt. Daarnaast kan je met een x personen manueel evenmin grote hoeveelheden digitaliseren. Per partij heb je toch al snel een paar minuten nodig. Als we slechts 100.000 partijen willen digitaliseren dan heb je met een rate van 2 minuten/ partij, 50.000 minuten nodig of 833 uren. Dit soort monotoon vervelend werk zullen bitter weinig vrijwilligers willen doen/ volhouden en een commercieel werkbaar model zie ik evenmin.

    Vandaag groeien de commerciële databases in hoog tempo aan omdat ze voorlopig toegang hebben tot vrij verkrijgbare mini-databases bestaande uit partijen die ofwel door talloze vrijwilligers tijdens of net na het tornooi werden gedigitaliseerd of door de steeds vaker beschikbare elektronische live-borden automatisch worden ontvangen. Het verzamelen van deze mini-databases is makkelijk beheerbaar en daarom ook commercieel goed te exploiteren.

    BeantwoordenVerwijderen
  5. Uiteindelijk is Chessbase wel zo begonnen natuurlijk, met het manueel ingeven van partijen (ik herinner me nog advertenties die medewerkers hiervoor ronselden). Het gaat hem er vooral om waardevolle partijen te inventariseren (bv the unknown capablanca).
    Je regel van 2 à 3 minuten per partij klopt ongeveer, maar gezien het hier om maximaal 100.000 partijen gaat, zou zoiets best doenbaar zijn voor een chessbase (hun databanken worden de jongste jaren ook vollediger wat betreft "oude partijen").

    Wat betreft ICCF - naast het afschermen van partijen (enkel voor leden), zit in die andere regel (die van tablebases) ook een financieel aspect aan: de Lomonosov databases zijn enkel toegankelijk voor mensen die de jongste producten van Chess Assistant hebben gekocht.

    Persoonlijk vind ik dit verschil tussen bordschaak en cr trouwens terecht - bordschaak bevat veel meer het sportelement (met alle organisatorische aspecten die erbij horen), terwijl het in cr meer om de perfecte partij gaat. Het kunnen bewijzen van een winst of remise met tablebases kan in cr trouwens voor een versnelde afhandeling van eindspelen zorgen.

    BeantwoordenVerwijderen
  6. Waar is de tijd dat Chessbase nog met floppy's op de markt kwam? Het internet stond in die beginjaren (jaren 90) nog in de kinderschoenen. Er bestonden toen geen of nauwelijks websites die mini-databases gratis ter beschikking stelden dus men was wel verplicht om manueel de partijen te digitaliseren als men een database wou creëren.

    Ik geloof niet dat Chessbase vandaag dit nog doet of tenminste het % aan partijen die manueel ingevoerd wordt door betaald Chessbase personeel zal erg klein zijn t.o.v. het totaal pakket.

    Bedoel je dat ICCF of personen van ICCF belangen hebben bij Chess Assistant? Niet onmogelijk uiteraard maar het zou wel straf zijn dat daarom reglementen worden aangepast. Heb je daar bewijzen van?

    BeantwoordenVerwijderen
  7. Neen, mijn punt was gewoon dat niet de beste cr-speler wint, maar deze met het meeste resources - vroeger was een IGM als vriend (of "secretaris") handig om wereldtop te worden. Nu moet je superhardware hebben en toegang tot de meest uitgebreide tablebases (lees: de financiële middelen om dit te bekostigen en up to date te blijven). Internet 2.0 houdt in dat minder en minder waardevolle dingen gratis blijven.

    BeantwoordenVerwijderen
  8. Als je kijkt naar de wereldtop in iccf dan valt het inderdaad op dat een absolute meerderheid van de spelers uit de rijke Westerse landen komt. Dat is niet te verklaren door enkel te wijzen naar het aantal leden van de federaties maar ook financiele middelen zullen een belangrijke rol spelen. Echter we mogen ons ook niet blindstaren op de financiele middelen. Ook tussen de Westerse spelers zijn grote verschillen in niveau die we niet uitsluitend kunnen verklaren door de financiele middelen. Ik vermoed dat de meeste Westerse correspondentiespelers wel een paar computers, engines, tablebases,... kunnen aanschaffen waardoor ze slechts een klein (wellicht verwaarloosbaar) nadeel hebben t.o.v. een superrijke met superhardware.

    BeantwoordenVerwijderen