dinsdag 18 december 2012

Elo inflatie

Met het elorecord van Magnus Carlsen zagen we recent op bijna alle schaaksites het spook van de elo inflatie opduiken. Voor velen was het duidelijk dat 2861 vandaag niet beter is dan 2851 in 1999 omdat zonder de inflatie er geen sprake zou zijn van een record. Er werd door sommigen zelfs aangetoond dat er 2,2% inflatie is t.o.v. het vorige record. Dus als ik mijn speelsterkte wil vergelijken met 1999 moet ik volgens hen mijn huidige elo met 2,2% corrigeren. Vreemd en de aangebrachte cijfertjes vond ik op zijn zachtst gezegd dubieus zodat ik zelf op onderzoek trok.

Om de evolutie in speelsterkte t.o.v. de elo te bepalen kijken we eerst eens naar de top 100 spelers in de wereld. Ik heb een vergelijking gemaakt tussen 2 snapshots : 1/10/2012 en 1/10/2002 wat mogelijk was dankzij de beschikbare tabellen op de fidewebsite.


Uit die tabel kunnen we heel wat informatie rapen:
Top 10: 2752,7 elo -> 2789,8 elo dus een stijging van 37,1 elo
Top 20: 2722,1 elo -> 2767,1 elo dus een stijging van 45 elo
Top 100: 2650,2 elo -> 2704,9 elo dus een stijging van 54,8 elo

Een eerste fabeltje die met deze cijfertjes weerlegd wordt, is dat de eloinflatie t.o.v. de ranking iets constant is. De 54,8 elo is een gemiddelde voor de top 100 maar voor individuele elo's kan er een serieuze afwijking op zitten.

Vervolgens kijken we even naar de gemiddelde leeftijden.
Top 10: 29,5 jaar -> 30,4 jaar dus een stijging van 0,6 jaar
Top 20: 31,1 jaar -> 31,2 jaar dus een stijging van 0,1 jaar
Top 100: 32,7 jaar -> 30,6 jaar dus een daling van 2,1 jaar

Hieruit kunnen we een belangrijke regel ontdekken van de eloinflatie t.o.v. de ranking. De eloinflatie t.o.v. de ranking is omgekeerd evenredig met de stijging van de gemiddelde leeftijd. M.a.w. hoe minder jonge spelers erbij zijn gekomen, hoe minder er eloinflatie t.o.v. de ranking gebeurt. 

Eveneens interessant is te kijken naar het aantal nieuwe spelers.
Top 10: 5 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 23,92 jaar
Top 20: 9 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 26,09 jaar
Top 100: 60 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 26,55 jaar

Er is dus een echte aardverschuiving gebeurd in de top 100 waardoor de samenstelling nog nauwelijks lijkt op die van 10 jaar geleden. Om eloinflatie t.o.v. speelsterkte te bepalen is het dus onvoldoende om de 2 tabellen naast elkaar te leggen omdat je teveel verschillende spelers met elkaar vergelijkt op speelsterkte. Nauwkeuriger is enkel de spelers te nemen die in beide tabellen voorkomen en die te vergelijken. Echter ook dat gaat nog te ver want dit houdt geen rekening met bv. jonge spelers die nog volop verbeteren en 10 jaar later qua speelsterkte sterk geëvolueerd zijn. 

Vandaag bestaan er geen officiële elografieken die de speelsterkte van een modale actieve schaker over zijn ganse schaakloopbaan weergeven. De belangrijkste reden is uiteraard dat de elos pas geintroduceerd zijn in 1970 wat betekent dat er nog geen elogegevens beschikbaar zijn over een complete schaakloopbaan. Desalniettemin mits enige creativeit door het plakken van de elocurves van een jonge, van middelbare leeftijd en oudere schaker kan je toch onderstaande grafiek creëren.

Hierin zien we dus een snelle stijging van de speelsterkte in de jeugdjaren die sterk afbuigt op 20 jaar. Tussen 20 en 30 zien we een kleine gemiddelde stijging van een extra 50 elopunten. Rond 30 jaar speelt men op zijn best en kan men door ervaring en voldoende spelen dit niveau vasthouden tot ongeveer 50 jaar. Vanaf 50 begint het onvermijdelijk verval in een vrij gestaag tempo. 

Vooreerst wil ik stellen dat de curve de gemiddelde speelsterkte toont van de gemiddelde speler die gans zijn loopbaan actief blijft. In realiteit zullen er zeer grote afwijkingen bestaan maar voor het bepalen van de elo-inflatie t.o.v. de speelsterkte is dit m.i. wel bruikbaar omdat we net geïnteresseerd zijn in gemiddelden en niet in individuele gevallen.

Ik besef tevens dat deze grafiek de zwakke schakel is in mijn blogartikeltje want ik heb geen harde bewijzen dat tussen 30 en 50 jaar een actieve speler zijn beste niveau kan houden. Ik kan enkel verwijzen naar het voorbij wereldkampioenschap waar 2 plus veertigers (Anand & Gelfand) bepaalden wie wereldkampioen zou worden. Lasker, Steinitz, Alekhine, Botvinnik waren zelfs wereldkampioen boven hun 50tigste maar dit waren uiteraard andere tijden. Ik trek een arbitraire grens op 50.

Rekening houdend met bovenstaande grafiek kunnen we uiteindelijk uit de oorspronkelijke tabellen, de spelers selecteren die 2 keer voorkomen en tevens steeds binnen de leeftijdsgrenzen 30-50 zich bevinden.

Uit die tabel halen we 2 gegevens:
Rating: 2685,5 elo -> 2708,3 elo = 22,8 elo
Ranking: 25,62ste plaats -> 46,62ste plaats

Het aantal spelers is eigenlijk te klein om serieuze conclusies te trekken maar ik doe het toch bij gebrek aan beter. De ranking is gemiddeld serieus gedaald ondanks dat we mogen verwachten dat deze spelers niet aan speelsterkte hebben ingeboet dus opnieuw een aanwijzing dat de ranking enorm is beïnvloed in het laatste decennium door nieuwe jonge spelers. Echter belangrijker is de elowinst van de spelers. Alhoewel die veel kleiner is dan wat de eloinflatie t.o.v. de ranking aantoont, laat het wel vermoeden dat er toch enige inflatie is opgetreden. 

Hebben de fanaten van de elo-inflatie dan toch gelijk maar hun inflatieindex is gewoon te groot genomen? Zo simpel zit het niet in elkaar want in bovenstaande tabel houden we enkel rekening met de actieve spelers tussen de leeftijdsgrenzen 30-50 die in beide tabellen van de top 100 voorkomen. Er is helemaal geen rekening gehouden met actieve spelers tussen de leeftijdsgrenzen 30-50 die slechts in 1 van beide tabellen voorkomen. Als we dat wel doen dan valt onmiddellijk op dat er geen enkele actieve speler tussen de leeftijdsgrenzen 30-50 erbij is gekomen maar wel dat er 17 uit de top 100 zijn gevallen. Die 17 actieve spelers (dus zonder rekening te houden met Kasparov, Bareev,...) hebben echter in het laatste decennium gemiddeld 44,7 elo verloren dus ruimschoots de 22,8 elo inflatie compenserend van de 13 spelers. Toppers in de negatieve zin en vandaag nog steeds actief zijn o.a. Kharlov Andrei met - 132 elo,  Neverov Valeriy met - 102 elo , Lutz Chistopher - 86 elo. Of al die ex-top 100 spelers nog echt als een voltijds actieve prof mogen worden gerekend is twijfelachtig maar het geeft wel duidelijk aan dat de 22,8 elo, gebaseerd op slechts 13 spelers naar alle waarschijnlijkheid geen indicatie is voor een algemene inflatie.

Dezelfde oefening voerde ik ook eens uit op ons Belgisch eloklassement. De fide geeft geen publieke nationale fidelijsten weer in diverse jaren. Echter de Belgische elo staat gekoppeld aan de fide (alle officiële partijen tegen fidespelers dus ook in het buitenland gespeeld, tellen mee) dus m.i. voldoende betrouwbaar om een onderzoek op eloinflatie uit te voeren eens dieper in de buik van het eloklassement. Op de KBSB-site is de oudste propere elolijst van de topspelers gedateerd januari 2006. Die elolijst vergelijk ik met de meest recente dus juli 2012. M.a.w. we kijken over een periode van 6,5 jaar.

Ook hier kunnen we opnieuw heel wat interessante informatie uit halen.

Top 10: 2455,4 elo -> 2483,4 elo dus een stijging van 28 elo
Top 20: 2420,7 elo -> 2437,3 elo dus een stijging van 16,6 elo
Top 100: 2301,6 elo -> 2303,6 elo dus een stijging van 2 elo

In tegenstelling met de wereldtop zien we dus een veel kleinere eloinflatie t.o.v. de ranking. We zien zelfs dat je voor plaats 100, 4 elopunten minder moet hebben dan 6,5 jaar geleden wat naar alle waarschijnlijkheid betekent dat er over het complete ledenbestand een elodeflatie t.o.v. de ranking zal zijn. Een belangrijke reden hiervoor is het krimpend actief ledenbestand (4552 leden -> 3873 leden of -15%).

Vervolgens kijken we even naar de gemiddelde leeftijden.
Top 10: 34,13 jaar -> 36,49 jaar dus een stijging van 2,36 jaar
Top 20: 37,29 jaar -> 37,87 jaar dus een stijging van 0,58 jaar
Top 100: 38,37 jaar -> 38,06 jaar dus een daling van 0,31 jaar

In tegenstelling met de wereldtop zien we een gemiddelde leeftijd die 6 tot 8 jaar ouder ligt. Dit gegeven, gecombineerd met het feit dat er nauwelijks een daling is van de gemiddelde leeftijd, wijst erop dat er heel weinig jonge spelers (-30 jaar) zijn bijgekomen. Dit wordt tevens bevestigd als ik kijk naar het aantal nieuwe spelers en hun gemiddelde leeftijd.

Top 10: 2 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 27,09 jaar
Top 20: 3 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 26,52 jaar
Top 100: 25 spelers die 10 jaar geleden nog niet in de top 100 stonden met gemiddelde leeftijd 33,59 jaar

Ik vind het normaal dat het aantal nieuwe topspelers in België veel kleiner is dan het aantal nieuwe topspelers in de wereld want we kijken over een kortere termijn (6,5 jaar t.o.v. 10 jaar) en we beschikken niet over een groeiende markt zoals Oost-Azië. Echter dat de gemiddelde nieuwe Belgische topspeler bijna 7 jaar ouder is dan de gemiddelde nieuwe wereldtopspeler (ondanks we spreken over een veel lagere niveau) is helemaal geen goed signaal. Dit is deels te wijten aan het krimpend actief ledenbestand (oudere leden schuiven op) maar vooral omdat we zeer slecht onze beste talenten begeleiden en dus er helemaal niet inslagen om hun volle potentieel aan te boren. Ik leg even dit laatste statement uit. Als onze beste talenten beter worden begeleid dan zal je automatisch zien dat ze een (veel) hoger niveau zullen bereiken. Jongeren die een veel hoger niveau bereiken, zullen automatisch sneller in de Belgische top 100 verschijnen. Jongeren die sneller in de top 100 verschijnen zullen automatisch de gemiddelde leeftijd van de nieuwe spelers omlaag brengen. 

Het aantal partijen verwerkt voor elo vond ik tevens eens interessant om te bekijken.
Top 10: 624,6 partijen -> 922,4 partijen
Top 20: 696,1 partijen -> 975,2 partijen
Top 100: 636,8 partijen -> 713,1 partijen

We zien een drastische stijging die ik vooral wijt aan het feit dat de laatste jaren fidepartijen in het buitenland gespeeld, nu wel meetellen voor de Belgische rating. Het is dan ook geen toeval dat de top 20 spelers die veel vaker in het buitenland spelen net de grootste aangroei aan partijen hebben. Ik vermoed dat dit effect nog wel eventjes zal duren daar we geen grootschalige verjonging van de top 100 onmiddellijk moeten verwachten.

Tenslotte wou ik ook nog eens kijken naar wat de eloinflatie is t.o.v. de speelsterkte met de Belgische eloratings. Hiervoor selecteerde ik opnieuw de spelers die 2 keer voorkomen en steeds binnen de leeftijdsgrenzen 30-50 jaar zich bevinden.

Uit die tabel halen we 2 gegevens:
Rating: 2358,8 elo -> 2336,8 elo = -22 elo
Ranking: 29,23ste plaats -> 40,19ste plaats

Met 26 spelers hebben we een groep 2 keer zo groot dan bij de wereldtop dus betrouwbaarder. De gemiddelde ranking is gedaald wat niet verwonderlijk is met een elodaling. Echter het is wel vreemd dat we een elodeflatie hebben t.o.v. de speelsterkte tenminste als we veronderstellen dat we binnen de leeftijdsgrenzen ongeveer dezelfde sterkte behouden. Minder vreemd wordt het als we kijken wie de spelers zijn. Velen hebben vandaag een gezin, een drukke job,... waardoor er veel minder tijd voor het schaken overblijft en er dus automatisch elopunten worden afgegeven. Dit betekent ook dat weinigen aan de standaard loopbaangrafiek voldoen. Het is trouwens geen toeval dat net de professionals (top 3) niet deze trend volgen. 

Eindconclusies
  • Eloinflatie t.o.v. de ranking heeft een rechtstreeks verband met het totale ledenbestand en met het aantal jonge talentvolle nieuwe spelers.
  • Eloinflatie t.o.v. de ranking heeft geen enkel rechtstreeks verband met eloinflatie t.o.v. de speelsterkte
  • Bovenstaand onderzoek toont duidelijk aan dat de eloinflatie t.o.v. speelsterkte klein is en misschien zelfs negatief. Een gelijkaardige conclusie maar vanuit een totaal andere invalshoek kan je vinden in het wetenschappelijk onderzoek van Kenneth Regan en Guy Haworth, zie uitgebreide versie of korte samenvatting .
  • Er kan geen uitsluitsel worden gegeven dat 2861 elo vandaag, beter is dan 2851 elo in 1999. Het is een feit dat speelsterkte over de tijd niet stilstaat t.o.v. de elorating. Rekening houdend met de tabellen waarbij we keken binnen de leeftijdsgrenzen van 30 - 50 jaar, durf ik te stellen dat de fluctuatie tussen de -20 elo  en + 20 elo is. 10 elo valt binnen deze fluctatie vandaar ik niet durf te stellen welk elorecord nu de hoogste speelsterkte vertegenwoordigt.
  • Het is mogelijk om zelfs op middelbare leeftijd nog te winnen in rating/ speelsterkte mits veel spelen en een zeker professionalisme.
  • De tabellen van de Belgische topspelers zijn een duidelijk alarmsignaal dat het (nog) niet de juiste kant opgaat in ons landje. De KBSB moet dringend een nieuw/ beter plan maken om zowel de kwaliteit (meer spelers) en de kwantiteit (meer topspelers) te verbeteren. 

Brabo

28 opmerkingen:

  1. Jouw grafiek over 'verbeteren in het schaken en leeftijd' suggereert dat je na +- 22 jaar niet meer kan verbeteren. Dat slaat toch op niet veel hoor!

    BeantwoordenVerwijderen
  2. @Anoniem: Ik geef toe dat die grafiek moeilijk leesbaar is. Dat is deels met opzet omdat ik niet wou dat de lezer er specifieke ratings zou opplakken. Echter als je de bijhorende tekst leest dan zul je zien dat ik vertel dat er progressie is tot de leeftijd van 30 jaar en dus niet 22 jaar. Nu dat kan wel kloppen als je begint zoals vele jeugdspelers rond 10 jaar. Als je begint op je 40tigste dan klopt die grafiek uiteraard niet maar ik meen dat dit een zeer kleine minderheid is en bijgevolg geen referentie voor een normale schaakloopbaan.

    BeantwoordenVerwijderen
  3. KBSB niet goed bezig? Kan zijn, maar dat kan je niet afleiden uit het eloklassement. Belgische Elo's zijn overgewaardeerd. Dat wordt nu stilaan wat getemperd omdat men sinds kort systematisch ook alle in het buitenland gespeelde partijen meerekent in de nationale Elo.

    BeantwoordenVerwijderen
  4. Een aspect dat volgens mij vaak onderschat wordt, is de grootte van de groep. Het aantal schakers met rating stijgt nog steeds (zie recente FIDE plannen om bijna iedereen een FIDE-rating te geven). Gezien de sterkteverdeling een Gausscurve is, betekent dat wanneer de groep groter is, er automatisch meer spelers met +2600, +2700, +2800 zullen zijn. Een inflatieonderzoek zou zich moeten richten op de mediaan, niet op de top.
    Let op, ik geef zeker toe dat er inflatie is - al was het maar door die FIDE-ingreep om alle vrouwelijke speelsters behalve Zsuzsa Polgar er 100 punten gratis bij te geven.

    BeantwoordenVerwijderen
  5. @Marcel Van Herck:
    Partijen gespeeld in het buitenland tellen reeds mee sinds het klassement van januari 2005. Voor de top 100 spelers (waarop ik mijn studie gebaseerd heb) zie je het corrigerende effect op de ratings onmiddellijk. Bovendien start ik pas vanaf 2006 met mijn studie dus de grootste correcties t.o.v. de fiderating voor de top 100 spelers zijn reeds gebeurd in de vorige 2 klassementen dus in 2005. Ik durf dus te stellen dat voor de top 100 spelers, de Belgische ratings gekoppeld zijn aan de Fide ratings sedert 2006 en er dus onterecht sprake is van een overwaardering. Wellicht blijft er een groot verschil bestaan met KNSB ratings maar ik beschouw de fide als referentie en niet de KNSB om te bepalen of de ratings al dan niet overgewaardeerd zijn.

    BeantwoordenVerwijderen
  6. @hypekiller:
    We moeten wel een onderscheid maken in het soort uitbreiding van de groep spelers.
    Als je simpel de floorrating verlaagt dan krijg je niet meer top 100 spelers. Het enige effect dat je krijgt, is dat spelers die geen fiderating hadden, nu plots wel in de tabellen verschijnen. M.a.w. de (zwakkere) spelers zijn er altijd al geweest maar worden nu pas officieel erkend.
    Echter als bepaalde geografische gebieden zoals Oost-Azië een boom kennen in populariteit voor het schaken dan boor je een compleet nieuwe groep van spelers aan waaruit automatisch een aantal extra top 100 spelers zullen boven drijven.
    Beiden zijn dus uitbreidingen van het aantal schakers met een fiderating maar slechts 1 van beiden, leidt effectief tot extra topspelers.

    BeantwoordenVerwijderen
  7. @Marcel Van Herck:
    Ik wil er tevens op wijzen dat voor veel Belgen, de Belgische rating een betere weergave van de speelsterkte geeft dan de fide rating. Slechts een beperkt aantal Belgen (veelal de topspelers zoals aangetoond in de studie) spelen voldoende fidepartijen om te kunnen stellen dat hun fiderating betrouwbaar is.
    Als ik kijk naar mezelf dan is er vandaag een verschil van 33 elopunten tussen mijn fide en Belgische. De belangrijkste reden is dat er veel minder partijen voor fide worden verwerkt dan voor Belgische waardoor de stijging in de laatste jaren veel trager werd doorgerekend in de fiderating dan de Belgische rating.

    BeantwoordenVerwijderen
  8. @Hypekiller:
    Een grotere groep leidt inderdaad tot meer +2600, +2700, + 2800 spelers. Echter dit mogen we niet verwarren met een elorecord. Als een een groep verdubbelt in omvang met ongewijzigde samenstelling dan krijg je een verdubbeling van aantal + 2600, + 2700, + 2800 spelers. Voor een elorecord die x aantal punten hoger ligt, heb je statistisch een vergroting van de groep nodig die exponentieel toeneemt volgens x. Die vergroting ligt al snel in een veel grotere orde dan 2.

    De aangroei van het aantal + 2600, + 2700, + 2800 spelers kan deels worden herleid naar een vergroting van de groep maar voor een elorecord is die link veel minder evident.

    Bovendien tonen de veel hogere ratings van de jongere spelers ook aan dat er nog een ander effect speelt dan enkel de vergroting van de groep (computers !!).

    Tenslotte de aangroei van een groep heeft geen directe link met de eloinflatie t.o.v. de speelsterkte. (iets wat je min of meer al kunt afleiden uit de conclusies in mijn artikeltje)

    BeantwoordenVerwijderen
  9. @Hypekiller:
    Een inflatieonderzoek is het best uit te voeren op zowel de mediaan, de top als onderaan. In theorie werkt het elosysteem zoals communicerende vaten maar de traagheid zorgt ervoor dat er wel degelijk verschillen kunnen zijn in de inflatie in de diverse eloregionen. Echter voor zulk grootschalig onderzoek beschik ik niet de data. Desalniettemin heeft de studie zeker zijn nut want 2 totaal verschillende polls spreken elkaar niet tegen en tonen m.i. enkele duidelijke tendensen.

    Tenslotte moet het effect van de inflatie door de eenmalige ondoordachte injectie van 100 punten bij de vrouwen (behalve Polgar !!) niet overroepen worden. Die injectie gebeurde in November 1986 waardoor het effect in 1999 (Kasparovs record) al lang was uitgewerkt. Bovendien maakt het aantal vrouwen t.o.v. de totale schaakpopulatie een zeer kleine minderheid uit. Ik zou zelfs durven stellen voor de spelers met een fiderating dat je voor elke vrouw, 99 mannen hebt. Dit betekent dat na de injectie en de werking via de communicerende vaten, elke speler welgeteld 1 elopunt heeft bijgekregen zonder dat er sprake was van een verbetering in speelsterkte. Dat 1 elopuntje is verwaarloosbaar in het hele inflatieverhaal.

    BeantwoordenVerwijderen
  10. Wat is er exact gebeurt in 1986? Hebben ze zomaar alle vrouwen 100 elo meer gegeven? Op welke grond?

    Ik vind hier geen info over terug, kan iemand dit verhaal verduidelijken?

    BeantwoordenVerwijderen
  11. @Anoniem:
    Je kan het verhaal lezen op http://en.wikipedia.org/wiki/Susan_Polgar (long live the internet !!).

    De officiële versie was dat Susan Polgar voornamelijk speelde in mannencompetities terwijl alle andere vrouwen voornamelijk onderling speelden. De ratings van de vrouwen waren deflated door slechts onderling te spelen t.o.v. de rating van de mannen vandaar dat ze 100 punten extra moesten krijgen.

    De non officiele versie: Susan Polgar was de nummer 1 op de vrouwelijke elolijst en de Russen konden dit niet vertikken. Door alle andere vrouwen 100 punten extra te geven, viel Susan Polgar terug naar de 3de plaats.

    De schaakgeschiedenis staat bol van dit soort politieke manipulerende regelgevingen dus 't zou mij niet verwonderen dat de officieuze versie wel eens de waarheid benadert.

    BeantwoordenVerwijderen
  12. We mogen ook niet vergeten dat elo een relatieve schaal is. In het extreme geval dat een speler altijd alles wint, kan hij volgens Elo "maar" een circa 700 punten hogere rating hebben dan de nr 2 (en als die "maar" 2000 zou hebben, is het plafond dus 2700).
    Een vergelijking met absolute records is dus nonsens - het enige relevante wat je zou kunnen zeggen is het verschil met de tweede (of bv het gemiddelde van de top tien).
    @anoniem: de argumentatie was dat Zsuzsa (actueel Susan) Polgar door enkel in mannentornooien te spelen, een normale rating had, terwijl de rest van de vrouwen ondergekwoteerd was, omdat die wel vnl in vrouwentornooien speelden - hun rating was zogezegd losgekoppeld van de "realiteit" van de mannenratings. Zie bv hier.

    BeantwoordenVerwijderen
  13. @hypekiller5000:
    Het effect van circa 700 punten hogere rating is hier helemaal irrelevant. Carlsen/ Kasparov behaalden hun elo voornamelijk tegen spelers die relatief dicht aanleunden bij hun rating waardoor we hun prestaties zeer goed kunnen kwalificeren. Jouw argument zou wel gebruikt kunnen worden indien we de rating van Houdini bepalen t.o.v. de beste topspelers. Daar is het gat zo groot geworden dat er een zeer grote onnauwkeurigheid kan verschijnen op de elo van een schaakprogramma. Dit is tevens een goede reden om de gepubliceerde ratings van schaakprogramma's nooit als correcte fideratings te beschouwen.

    Ik blijf dus bij mijn conclusie dat een vergelijking tussen records mogelijk is mits rekening te houden met een onzekerheidsinterval. Ik durf stellen als Carlsen 2880 haalt dat het 99% zeker is dat zijn record betreffende pure speelsterkte beter is dan Kasparovs. Vandaag ligt dit % veel lager met 2861.

    BeantwoordenVerwijderen
  14. Brabo
    enkele bedenkingen

    alleen naar de top kijken is bedrieglijk. vroeger lag de fide grens voor elo op 2200, vandaag is het volledig opengegooid naar 1100/1200. dat genereert veel meer elopunten die naar boven doorschuiven. van mij kon men vroeger nooit punten afpakken, nu wel.

    speelt men vandaag beter? op bepaalde vlakken wel maar ik denk dat bvb de eindspelkennis 30j geleden hoger lag (de Sovjetinvloed/afgebroken partijen etc) als nu.

    in de praktijk zie ik mensen als short, Kortschnoi en andere oudjes die over decennia heen redelijk weinig elo verliezen terwijl je een hoger verval zou verwachten (leeftijd, minder energie, minder intensief ermee bezig zijn,...)
    Short vandaag zou theoretisch zwakker moeten zijn als die wk kandidaat van 90. de Short nu heeft net geen 2700 en 20j geleden had hij gewoon evenveel.
    computertijdperk verklaart een stuk maar niet alles.
    Kortschnoi uit de jaren 70/80 had evenveel elo als de kortschnoi uit 2000 (ca 2650).
    ik vermoed dat het bij Hubner, Ulf Andersson etc niet anders zal uitzien

    ik ken de winstverwachting tussen een 2800 en 2700 niet maar ik vrees dat de huidige 2800 niet aan de verwachting voldoen als ze tegen de jaren 80 Karpov aan de bak moeten (met diens 2700 elo'tjes).

    er is een gedeeltelijke sterktegroei maar inflatie ook (kijk naar blitzservers en de 3500 elo daar)

    BeantwoordenVerwijderen
  15. @Anoniem:
    Door de ondergrens te verlagen kan je ook veel meer elo verliezen. M.a.w. je kan onmogelijk zeker zijn dat dit een positief of negatief effect op de elo van de topsspelers geeft. Ik had gelezen dat de fide het effect van heel nabij opvolgt want zelfs voor hen is het gissen.

    Het spelletje vandaag wordt op een andere wijze gespeeld dan 30 jaar geleden. De tempo's zijn veel sneller, niet meer afbreken, veel meer openingskennis,... Dit betekent ook dat er andere vaardigheden belangrijk zijn geworden. Speelsterkte fluctueert dus niet alleen t.o.v. de elo maar ook t.o.v. het type schaak. Ik geef je dus gelijk dat het eindspel van een 2600 die 30 jaar geleden speelde, wellicht beter was dan een 2600 vandaag. Echter dit betekent niet dat de speelsterkte beter was maar gewoon dat de speelsterkte verschoven is naar andere aspecten. Je kan het best vergelijken met 2 spelers waarbij de ene 2000 elo haalt terwijl hij slechts de helft van de bedenktijd gebruikt terwijl de andere 2000 elo speler de volle bedenktijd gebruikt. Als je de bedenktijd halveert dan ga je plots verschuivingen in de elo en dus ook speelsterkte zien.

    Spelers zoals Short, Van Wely, Khenkin,.. zijn zeer actieve professionals die voortdurend het repertoire bijschaven en kunnen buigen op een enorme tornooiervaring. Het is niet dat je op je 40tigste al seniel wordt. Je rekent misschien een tikkeltje minder snel maar dit wordt ruimschoots gecompenseerd door opgebouwde schaakkennis. Het is niet dat Short na zijn wkfinale gespeeld in 1993 niets meer heeft geleerd in het schaken.

    Ulf Anderson (geboren in 1951 dus 61 jaar) heeft in het laatste decennium ongeveer 50 puntjes moeten afgeven. Robert Huebener (geboren in 1943 dus nu 69 jaar) heeft eveneens in het laatste decennium ongeveer 50 punten moeten afgeven. Beiden volgen dus precies mijn curve van een actieve loopbaan. Ik heb geen gegevens van Kortchnoi die dateren uit de de jaren 70-80 maar ik kan best geloven dat hij de uitzondering is op de regel. Het is niet voor niets dat hij bijnamen heeft gekregen zoals 'De verschrikkelijke' en 'De onvermoeibare'. Korchnoi als maatstaf gebruiken voor een eloinflatie is dus m.i. ongepast.

    100 punten verschil betekent ongeveer een score van 62,5% - 38,5%. Ik geloof dat Karpov uit de jaren 80 raar zou kijken naar het spel vandaag met 40 zetten in 90 minuten + 30 seconden increment, geen afbreken, ...

    Serverratings worden vaak via een totaal ander mechanisme berekend dan de fideratings. Een vergelijking tussen beiden is dus onmogelijk.

    Tenslotte zijn er voor blitz totaal andere vaardigheden nodig dan voor gewoon schaak waardoor automatisch de verschillen anders zullen zijn.

    BeantwoordenVerwijderen
  16. correctie : Robert Hübner is van 1948. Ik weet dat toevallig omdat ik van hetzelfde jaar ben. En hier ga je nu eens echt niets meer kunnen op antwoorden om toch maar gelijk te krijgen.

    BeantwoordenVerwijderen
  17. uiteindelijk dient elo om de aktuele spelers met mekaar te vergelijken en winstverwachtingen te bepalen.
    jij hebt een hogrter winstverwachtingen tegen mij en een lagere tegen Michiels

    er zijn x aantal spelers waar je dezelfde evolutie ziet (het is niet enkel kortschnoi).
    ik ga ze nu niet allemaal opzoeken en oplijsten waarna jij speler per speler een alternatieve uitleg verzint.
    we spreken over dertigjarigen die tussen 50 en 60 nog steeds dezelfde elo als op hun toppunt hebben.
    dat is een sterke indicatie want voor hen allemaal is het tempo ingekort, wordt er gn partijen meer afgebroken, soms 2 partijen op een dag etc.
    die elementen zouden hun verval qua elo eigenlijk moeten versnellen (minder handig met computer, ouderdom vertraagd rekenkracht,...).

    voor mij indicaties voor die inflatie.

    BeantwoordenVerwijderen
  18. Je hebt gelijk Marcel, mea culpa. Ik had in mijn haast de 8 als een 3 gelezen vandaar de fout. Nu dat detail verandert niets aan het feit dat Robert 50 punten verloren heeft in het laatste decennium dus als + 50tiger.

    BeantwoordenVerwijderen
  19. @Anoniem:
    Ik heb mijn studie geconcentreerd rond de leeftijd van 30-50. Echter het staat iedereen vrij om een gelijkaardige studie op poten te zetten van + 50 jarige spelers die aantoont dat hun rating nog dezelfde is van toen ze pakweg 30 jaar waren. Zolang ik geen tabellen zie dan geloof ik gewoon niet jouw bewering dat de algemene regel zegt dat de elo van een + 50 jarige = de elo van een 30jarige. Ulf Anderson en Robert Huebner zouden al uitzonderingen zijn op jouw regel. Short is slechts 47 jaar dus die telt nog niet mee. Ik vrees dat je heel veel uitzonderingen zult vinden.

    BeantwoordenVerwijderen
  20. De link die ik wou doorsturen was deze, maar de html-link vertikt het: http://www.anusha.com/elo.htm

    BeantwoordenVerwijderen
  21. Hartelijk dank voor de link! Als je de boeken van Kasparov hebt gelezen volumes 2 and 3 Modern Chess (zonet volume 4 aangeschaft om te lezen tijdens het kerstverlof) dan ben je niet meer verwonderd over de corruptie en smerige taktieken binnen de fide.

    BeantwoordenVerwijderen
  22. Historische FIDE-ratings vind je bv op
    http://www.mark-weeks.com/chess/ratings/. Let op, het zijn textfiles, dus werk aan de winkel. Eentje eruit gepikt: Kortchnoi had in 1970 2670 elo.

    BeantwoordenVerwijderen
  23. Misschien zijn ook chessmetrics en de Edo-ratings (http://www.edochess.ca/) interessant voor de vorser. Edo begint bij het prille begin van het moderne schaak, en wordt chronologisch opgevolgd door chessmetrics. Het zou leuk zijn moest Sonas zijn chessmetrics site eens updaten naar vandaag.

    BeantwoordenVerwijderen
  24. @ Brabo: wat ik bedoelde met die 700 gap, was dat een sterke nummer één een andere elo zal krijgen bij een sterke groep 2 tot 50, dan wanneer die groep bv gemiddeld 50 elo zwakker is. Statistisch gezien (vroeger waren er minder schakers, dus was ook de top van de piramide smaller) zou bv een Capa, Lasker, Aljechin hogere ratings moeten halen, indien ze enkel toptornooien speelden (zoals nu het geval).
    Dat FIDE de ratings beschikbaar maakt voor de zwakkere spelers heeft inderdaad geen effect voor de top. We kunnen wat dat betreft uitkijken naar de eerste speler met een negatieve rating.

    BeantwoordenVerwijderen
  25. @hypekiller 5000:
    Bedankt voor de historische data. Alhoewel het wel eens een interessante oefening zou kunnen zijn, ga ik mij beperken tot de periode tussen de laatste 2 elorecords dus ongeveer het laatste decennium. Ik ben voornamelijk geïnteresseerd of er daar een inflatie was of niet.

    Ik wil zeker niet denigrerend doen t.o.v. Korchnoi maar aan de inflatie-believers wil ik even aangeven dat vandaag Korchnoi geen 2500 elo meer heeft dus ook hij moest ondanks de zogenaamde inflatie bijna 200 punten afgeven t.o.v. zijn piekrating.

    BeantwoordenVerwijderen
  26. @hypekiller5000:
    Zowel chessmetrics en edo gebruiken een sterk afwijkend ratingmechanisme dan fide. De ratings kun je dus onmogelijk gebruiken als je een inflatie van de fideratings wil bepalen.

    1 voorbeeldje van het afwijkend gedrag van chessmetricsratings. Als je niet speelt dan zakt je rating bij chessmetrics wat uiteraard niet het geval is bij de fide.

    BeantwoordenVerwijderen
  27. @hypekiller5000:
    Goendi op schaakfabriek maakt net dezelfde redenering als jij. Met sterkere tegenstanders win je meer punten per partij dus is de toprating hoger. Op zich logisch maar er wordt vergeten waarom men meer punten per partij krijgt. Elo kent meer punten per partij toe tegen stekere tegenstanders omdat je ook meer verlieskansen hebt. Het mechanisme zit zo in elkaar dat uiteindelijk de extra verlieskansen compenseren voor de extra elo die je kunt winnen.

    M.a.w. Capa, Lasker,Aljechin of dichter bij vandaag, een Karpov uit de jaren 80 zullen nooit dezelfde hoge score als in hun tijd kunnen halen in de hedendaagse toptornooien.

    Tenslotte wil ik er ook op wijzen dat er individueel soms grote verschillen kunnen zijn in TPR tegen zwakkere of sterkere spelers. Sommige spelers hebben moeilijkheden met hun motivatie tegen zwakkere spelers. Andere spelers kennen een glazen plafond betreffende sterkere spelers waar ze nog nauwelijks iets kunnen halen. Stijl en karakter speelt dus ook een rol.

    BeantwoordenVerwijderen