donderdag 14 november 2013

Stockfish 4

Vorige maand werd mij attent gemaakt door hypekiller5000 dat er een nieuwe release was van Stockfish die opmerkelijk goed scoorde in de ccrl (computer chess rating list) met een 3de plaats. Opmerkelijk detail is dat het programma gratis te downloaden is. Nu zelf sta ik een beetje argwanend t.o.v. gratis software omdat ik dan onmiddellijk denk aan illegale kopijen maar uiteindelijk liet ik mij toch verleiden om het programma te testen en gebruiken in mijn analyses. De belangrijkste reden hiervoor is dat mijn analysemethode gebaseerd is op 2 schaakprogramma's (zie blogartikeltje analyseren met de computer) en je met zulke analysemethode dan best beschikt over 2 ongeveer evenwaardige (en liefst ook complementerende programma's). Vorig jaar vertelde ik op deze blog dat ik Houdini 2.0 had aangeschaft waarmee ik Fritz 11 verving. Hierdoor bleef Rybka 3 over als 2de programma maar ik ondervond al snel dat het gat in speelsterkte iets te groot was geworden om nog van een goed rendement te kunnen spreken met mijn analysemethode. We mogen niet vergeten dat de release-datum van Rybka 3, augustus 2008 was dus we mogen stellen dat het programma voorbij de houdbaarheidsdatum was. 

Het eerste wat opvalt aan Stockfish is hoe het programma de stellingen evalueert. Als je gewoon bent van klassieke evaluaties met Rybka, Fritz en Houdini dan is het toch wel even schrikken. Ik bedoel dat je met Stockfish makkelijk evaluaties kunt hebben die 1 of zelfs meerdere pionnen (dus 100/100sten) kan schelen met de andere programma's. Een absoluut record detecteerde ik in een analysestelling van mijn recente partij tegen Steven Geirnaert, zie onderstaande screenshot.
Stockfish toont een evaluatie van 94 punten voor zwart !

Stockfish geeft dus een voordeel van 94 punten voor zwart. Zelfs als je alle resterende zwarte pionnen laat promoveren dan kan je nooit aan dit totaal komen. Houdini geeft hier trouwens slechts 11 punten voordeel aan voor zwart na 10 minuten rekenen. Op chesspub werd dit aangegeven als een negatieve eigenschap van Stockfish maar dit moet toch enigszins genuanceerd worden. Het programma is in de eerste plaats gemaakt om zo goed mogelijk te schaken en gebruikt hiervoor een evaluatiemechanisme dat optimaal helpt. Deze evaluaties worden puur informatief meegedeeld aan de eindgebruiker maar het is geenszins de bedoeling om met deze evaluaties een absoluut oordeel te vellen over wie welk voordeel heeft en hoe groot dit voordeel is.

Nu zou je verwachten dat zulk programma wel erg tactisch sterk zal zijn als het met zulke hoge evaluaties op de proppen komt. Echter in vergelijking met Houdini, vind ik het toch een stuk zwakker. Vooral bij stille onverwachte offers heeft Stockfish problemen. De oplossing in onderstaande analysestelling van mijn partij in Open Gent tegen Groffen, vindt Houdini binnen de seconde maar Stockfish na 10 minuten nog steeds niet !
Het is ongelooflijk dat Houdini deze breekzet e4 zo snel ziet en correct uitrekent. De sleutelzet doet mij trouwens denken aan de enige keer dat ik in mijn correspondentiecarriere (20 partijen gespeeld tussen 1998-2003) totaal verrast werd door mijn tegenstander. Het was met enige moeite dat ik nog weg kwam met een remise.
Opnieuw vindt Houdini de zet ogenblikkelijk (in 1999 kwam de zet nooit op het computerscherm !) terwijl Stockfish er toch ruim 4 minuten over doet. Ik kan nog andere tactische voorbeelden geven (bv. 8.g4 in mijn artikeltje over Houdini 2.0) maar ik veronderstel dat het ondertussen wel duidelijk is dat Stockfish heel wat snijdt in de variantenboom om een evaluatie te maken waardoor het geregeld tactisch iets mist. Nu kan je jezelf afvragen hoe het mogelijk is dat het gat in speelsterkte met Houdini slechts 25 elopunten bedraagt als je kijkt naar de elorankings voor computerprogramma's. Wel er is duidelijk meer belangrijk dan puur tactiek. Het is erg moeilijk te kwantificeren maar als ik kijk hoe Stockfish speelt in stonewall-stellingen dan merk ik op dat het programma sneller dan Houdini begrijpt welke plannen mogelijk zijn. In stellingen met gesloten pionketens zoals bv. de Portisch Hookvariant zie ik dan weer geen merkbaar verschil met Houdini. Ik leid daaruit af dat pionzetten wel eens een erg belangrijk onderdeel zouden kunnen zijn bij de evaluatiemethode van Stockfish.

Het spreekt voor zich dat dit effect nog wordt uitvergroot in het eindspel. Dit wordt ook bevestigd in mijn eerste analyses. In deze fase van het spel overvleugelt Stockfish helemaal Houdini. Eerst toon ik een analysestelling van mijn partij tegen Raetsky die ik in mijn vorig blogartikeltje al terloops aanhaalde.
Tot 3 keer toe verliest Houdini het eindspel terwijl Stockfish het wonderbaarlijk wel kan houden (wat niet wil zeggen dat ik zeker ben dan het tegen perfect spel remise zal zijn). Ook in de 2 eindspelen besproken in mijn blogartikeltje over Houdini 2.0 toont Stockfish zich superieur. 42...Th4! wordt door Stockfish 4 gevonden in slechts enkele seconden t.o.v. meer dan 3 minuten voor Houdini 2.0. Houdini 2.0 vindt niet het fantastische 48...,Kd5! terwijl Stockfish dit wel doet in ongeveer 7 minuten. Echter Shirovs briljante Lh3 vindt Stockfish dan weer niet op mijn computer binnen de 10 minuten maar daar is uiteraard tactiek mee gemoeid.

Het is voor mij ondertussen duidelijk dat het programma erg goed complementeert bij Houdini 2.0. Ik ben verrast dat zulk sterk programma als gratis wordt aangeboden. Anderzijds besef ik ook wel goed dat een collectief aan vrijwilligers vaak mooiere resultaten kan neerzetten dan 1 of 2 professionals. Bovendien verwacht men van een nieuwe release dat Stockfish wel eens de nieuwe nummer 1 in computerschaak zou kunnen worden. Nu geen paniek want men staat nog mijlenver van schaken als puzzel op te lossen dus er blijft nog vele jaren plezier over om te zoeken naar het onbekende.

Brabo

Geen opmerkingen:

Een reactie posten