donderdag 14 februari 2019

Big Database

Steeds minder schakers zijn nog bereid om te investeren in een grote database. Je kan steeds meer gratis online vinden (zie de introductie van mijn artikel ultracorr-x) en zonder de (te) dure automatische updates vinden de meesten niet de motivatie om een database up to date te houden. Tenslotte kan je vandaag beter kijken naar de evaluatie van een topengine dan de zetten gespeeld door een grootmeester die veel zwakker zijn.

In Chessbase deel 1 gaf ik aan dat veel CB gebruikers 95% van de functies nooit gebruiken. Ik ben ervan overtuigd dat we dit grotendeels kunnen toeschrijven aan het ontbreken van een kwalitatieve gemakkelijk toegankelijke database. CB15 en in mindere mate Fritz doen (bijna) niets zonder een databank.
  • Automatische partij-analyse met referenties naar partijen gespeeld met dezelfde opening
  • Openingsreferentiefunctie
  • Creëren van een openingsboek naar keuze van gespeelde partijen
  • Opzoeken van thema's
  • Plan Explorer
  • Endgame functie
  • Automatische voorbereiding op een tegenstander
  • elo-ratings berekenen op basis van een selectie partijen
  • snelheid opzoekingen en beheren van databases
  • verkennen van databases
In elk geval vind ik het vreemd om CB uberhaupt aan te kopen wanneer je niet van plan bent om bovenstaande functionaliteit te gebruiken.

Dus ik raad schakers met CB en ook Fritz aan om een database te onderhouden die ze als referentie kunnen gebruiken. Dan is natuurlijk de volgende vraag welke database. Hierbij moeten we een aantal criteria bekijken:
  • Het prijskaartje niet alleen om de database aan te kopen maar ook om die up to date te houden
  • Hoe vaak wordt de database bijgewerkt?
  • Is het mogelijk om partijen van lagere elo's te vinden om een partijvoorbereiding op hen te kunnen maken?
  • In hoeverre worden partijen uit diverse landen verzameld in de database?
  • Zijn computerpartijen, anonieme online gespeelde partijen (veelal blitz) in de database toegevoegd om het aantal op te drijven?
  • Zijn er historische partijen in de database en doet men een poging om die nog verder uit te breiden?
  • In hoeverre zijn de namen, elo, plaats,... correct vermeld bij elke partij?
  • Bestaan er automatische updates voor de database?
  • Zijn de partijen becommentarieerd?

Nu het is onbegonnen werk om alle mogelijke databases in de wereld te vergelijken. Op chessgameslinks.lars-balzer.info kan je meer dan 100 links vinden naar diverse databases en dat overzicht is zeker niet volledig.  Anderzijds als we de prijs even buiten beschouwing laten dan denk ik niet dat er een betere keuze is dan de jaarlijkse Mega Database upgrade (van de vorige bigbase of vorige mega database).  Kwaliteit, kwantiteit en service worden door geen enkele concurrent geëvenaard. Echter 120 euro per jaar is een heel stevig prijskaartje. Bovendien kan je jezelf afvragen of partijen met commentaar zinvol zijn. Binnen een paar jaar zijn de analyses achterhaald zie mijn artikel uit 2016 waarin ik aangaf dat de topengine gemiddeld 55 elo per jaar sterker wordt.

M.a.w. als je een serieuze besparing kan doen door geen becommentarieerde partijen te kiezen dan zou ik dat zeker aanraden. Schakers die CB bezitten kunnen bijgevolg beter kiezen voor de online update referentie-database voor slechts 60 euro per jaar. Schakers die werken met de Fritz interface kiezen best tussen ofwel big database 2019 voor 70 euro per jaar ofwel otb-openingmaster voor 59 euro per jaar. De otb-openingmaster is iets goedkoper en je krijgt ook nog eens 3 updates tijdens het jaar. De nadelen zijn dat je de database slechts kunt verkrijgen via een downloadlink en het geen product is van CB.

Tenslotte het goedkoopste alternatief zonder te veel verlies aan kwaliteit is misschien nog altijd wel good old TWIC. Mits maximum 10 minuten per week te investeren, kan je er telkens een mooie collectie aan recent gespeelde partijen gratis downloaden en vervolgens toevoegen aan de referentiedatabase. Of als het minder belangrijk is om elke week altijd de laatste partijen down te loaden dan kan je zoals ik het bundelen in 2 keer 1 uur per jaar. In 2 uren werken heb ik dus minstens 60 euro bespaard of zie ik het te rooskleurig? Ik deed de proef op de som door een vergelijking te maken tussen een Mega database 2016 aangevuld met twics en een Big database 2019. Ik denk dat er ongeveer 1 of 2 weken verschil is tussen beide in het voordeel van de twics waarmee we voor kleine verschillen rekening moeten houden. Onderstaande tabel toont een gedetailleerde vergelijking op basis van aantal partijen in diverse domeinen: globaal, +2500, +2300, wereldtop 10, Belgische top 10,  Belgen en geschiedenis. Ik geef ook nog ter info de aantallen mee van de gratis online database chess.db.

Meer partijen in een database betekent zeker niet een interessantere database. Zo zien we dat chess.db claimt meer dan 2 miljoen groter te zijn dan de Big Database maar toch beduidend minder partijen bevat van de Belgen.

Betreffende twic valt het op dat je betreffende recente grootmeesterpartijen niets mist. Daarnaast is het moeilijk om de 650.000 gemiste partijen over 3 jaar te negeren. Chessbase doet duidelijk een extra inspanning om ook de partijen van de gewone sterveling te verzamelen want begrijpt dat ze hiermee het verschil kunnen maken voor hun klanten. De meeste klanten zijn niet topschakers maar wel clubschakers die het minstens even interessant vinden wat er rond zich afspeelt.

Alhoewel de 1800 "nieuwe" historische partijen wellicht weinigen als waardevol beschouwen en het zonder twijfel financieel voor Chessbase niet interessant is, vind ik het persoonlijk wel een leuke bonus. Chessbase kijkt gelukkig niet enkel naar het commerciële belang van de database maar ziet zichzelf ook als archivaris van de schaakgeschiedenis. Het digitaliseren van oude kranten en tijdschriften is een zeer tijdrovende bezigheid en staat in schril contrast met hoe recente partijcollecties met een paar klikken van websites worden geplukt.

Elk jaar een big database aankopen vind ik persoonlijk nogal duur voor het verschil t.o.v. twic maar 1 keer om de 3 jaar is wel de moeite. Trouwens ik ontdekte nog een belangrijk bijkomend voordeel van de big database t.o.v. twic. Zo blijkt twic enkel de initiaal van een voornaam te bewaren en loopt het ook geregeld fout bij de familienamen van o.a. Chinezen. De gegevens van partijen in de big database zijn een stuk completer waardoor het zoeken van informatie ook vaak makkelijker en sneller kan.

Dit jaar kocht ik mij dus opnieuw een big database aan met de overgebleven cadeau-bonnen van mijn zoon. Bovendien gaf ik mij hierdoor ook opnieuw een up to date powerboek cadeau. Weinig schakers weten het maar powerbook 2019 die door Chessbase aangeboden wordt voor 70 euro kan je zelf perfect creëren uit de Big Database. Ik creëerde er zelfs ineens 2 verschillende: 1 openingsboek met partijen waarbij minstens 1 speler + 2300 elo had en 1 openingsboek met partijen waarbij beide spelers +2500 elo hebben. Je moet wel enig geduld hebben want mijn 4 jaar oude laptop had 12 uren nodig voor het 1ste en een kleine 2 uren voor de 2de.
Openingsboek met minstens 1 speler +2300 gefilterd uit de big database 2019
Openingsboek met beide spelers +2500 gefilterd uit de big database 2019
Het is opmerkelijk dat rating nauwelijks invloed heeft op de populariteit van de eerste zet. Dat heeft misschien te maken met dat de meeste spelers volgen wat de topspelers kiezen. Anderzijds is het wel zo dat het voordeel van de eerste zet iets groter blijkt te zijn bij de hogere elo's. Zo stijgt het voordeel bij 1.e4 van 62 elo naar 78 elo, bij 1.d4 van 60 elo naar 74 elo, bij 1. Pf3 van 42 elo naar 64 elo en bij 1.c4 van 40 elo naar 60 elo.

Statistiek is natuurlijk 1 van de belangrijkste troeven van een database. Echter de grootste waarde van een database blijft natuurlijk verscholen in de partijen zelf. Ik begon mijn artikel met dat sommigen de engine voldoende vinden om een evaluatie te krijgen in een opening. Wel ik ben er zeker van dat hiermee onrecht wordt aangedaan tegenover onze rijke schaakgeschiedenis. Tal van vergeten schatten zijn er te ontdekken in de big database die af en toe zelfs onze beste engines niet kunnen vinden. Nee denk maar niet dat onze top-engines het altijd weten. Kijk naar de lopende TCEC superfinale seizoen 14 waarin het ongenaakbaar geachte Stockfish momenteel 2 punten achterstaat terwijl we voorbij halfweg zijn. LeelaChessZero (afgeleid van Alphazero) is bezig geschiedenis aan het schrijven.

Brabo 

Geen opmerkingen:

Een reactie posten