Schlagwort-Archive: Zufall

WM-Tippspiel: Menschenen vs. Algorithmen

Zur diesjährigen Fußball-WM habe ich mich mal wieder breit schlagen lassen, an einem Tippspiel teilzunehmen. 41 Leute sind dabei, also schon eine ordentliche Runde. Tippspiele habe ich früher ab und zu mitgemacht und es dann aber wieder sein lassen, weil ich sie zunehmend für ziemlichen Blödsinn halte. Warum? Das versuche ich zum einen in diesem Artikel etwas auszuführen, und zum anderen mit einem kleinen Experiment während dieser Weltmeisterschaft zu demonstrieren. Das Experiment läuft parallel zur WM, und die ersten Ergebnisse untermauern meine Blödsinn-These. Auf geht’s.

1. Der Durchschnitts-Tipp

Alle MitspielerInnen eines Tippspiels haben im Wesentlichen die gleichen Informationen und sind dazu in ihrer Meinung geprägt von dem gleichen Pool an Meinungsmachern. Expertenmeinungen sind vor Spielen ja oft ziemlich ähnlich. Entsprechend wird auch die Mehrzahl der Leute tippen: Dem Trend folgend, plus minus statisch verteilte Bauchgefühl-Abweichungen. Tippt man nun wie der plausible Durschschnitt, dann landet man zwangsläufig im Durchschnitt, also in der Mitte der Tabelle.

Erfahrungsgemäß setzen sich trotzdem einzelne Leute von eben diesem Durschschnitt ab, und zwar sowohl nach hinten als auch nach vorne. Das kann zwei Gründe haben: Entweder jemand hat so unglaublich viel Ahnung und kann mehrfach Ergebnisse wie das 1:1 von Argentinien gegen Island und auch noch das von Brasilien gegen die Schweiz voraussehen (der „Experten-Abweichler“), oder jemand hat einfach überhaupt keine Ahnung und weicht deshalb von der durchschnittlichen Meinung ab (der „Deppen-Abweichler“). In jedem Fall braucht man ein exotisches Tippverhalten, um nicht im breiten Mittelfeld der Tipprunde zu landen.

Jetzt ist es allerdings keinesfalls so, dass die Experten-Abweichler immer vorne und die Deppen-Abweichler immer hinten in der Tipptabelle landen würden. Beide Gruppen landen mit ähnlicher Wahrscheinlichkeit entweder deppenhaft relativ weit hinten, oder (was deutlich unwahrscheinlicher ist) expertenhaft ganz vorne. Es wird da schon einen statistischen Unterschied geben, meine Behauptung ist aber, dass der nicht besonders groß ist.

Diskussionen zwischen Mitspielenden während eines Turniers liefern dagegen ein anderes Bild: Liegt jemand ganz hinten wird er ob seiner aberwitzigen Tipps ausgelacht. Liegt er dagegen ganz vorne zollt man ihm für seine unfassbar fachkundigen Tipps Respekt, Nicht immer, aber doch recht oft wird mit Glück mit Kompetenz und Pech mit Unvermögen verwechselt.

2. Wunschdenken vs. Wahrscheinlichkeit

Ein zweiter Grund dafür, dass ein Tippspiel eigentlich Blödsinn ist liegt in der schlichten Frage, wie man eigentlich tippen soll. Es gibt da verschiedene Konzepte: Soll man so tippen, wie man das Spiel realistisch einschätzt, oder so, wie man sich ein Ergebnis gerne wünscht? Oder einfach nach den Wettquoten? Oder tippt man absichtlich vom Mainstream abweichende Ergebnisse, um sich vielleicht mit einem Glücksgriff vom Durchschnitt absetzen zu können? Oft geht das auch durcheinander. Nehmen wir das Spiel Deutschland vs. Mexiko: Bei allen anderen Spielen mit Favoriten gab es immer Mitspieler, die gegen den Trend getippt haben, sei es nun aus Überzeugung oder schlicht in der Hoffnung, mit einer abweichenden Meinung zufällig alleine Punkte machen zu können. Bei diesem Spiel gab es keinen einzigen Abweichler. Ausnahmslos alle haben auf einen Sieg Deutschlands getippt. Bei dem Spiel Brasilien vs. Schweiz dagegen gab es immerhin drei SpielerInnen, die das Unentschieden „vorhergesehen“ haben und sogar zwei SpielerInnen, die auf einen Sieg der Eidgenossen tippten. Ganz ehrlich, dafür gibt es keine fussballerischen Gründe. Das ist ein Bias, der immer auf den Tipps liegt und der deutlich macht, wie wenig es letztendlich um fussballerische Kompetenz geht.

3. Live: Kognitive Dissonanz

Das ganze setzt sich fort, wenn man ein Fußballspiel live verfolgt: Spielt eine Mannschft, ein Underdog, unerwartet gut mutig, presst hoch, spiel mit offenem Visier gegen einen Favoriten, so ist man geneigt, dieser Mannschaft im Lauf des Spiels auch Erfolg zu wünschen. Schaut man dann aber auf seinen eigenen, eigentlich plausiblen, Tipp, so ist die „kognitive Dissonanz“ schon vorprogrammiert.

Das Experiment

Aus den oben beschriebenen Gründen mag ich also keine Tippspiele und habe vor einigen Jahren beschlossen, nicht mehr mitzuspielen, Und falls doch dann nur mit einem Experiment, und zwar genau mit diesem: Ich spiele mit mehreren Accounts. Einer davon bin einfach ich, die anderen funktionieren nach recht einfachen Mustern und sind sozusagen Bot-Accounts, schlichte Algorithmus-Accounts. Das Experiment besteht nun darin zu schauen, wo diese Bot-Accounts am Ende in der Tabelle landen. Dazu ist ein Tippspiel mit 41 TeilnehmerInnen ein ganz brauchbares Experimentierfeld. Aufgrund von Zeitnot habe ich das Experiment diesmal nur mit drei verschiedenen Accounts laufen lassen:

1. Einfach ich

Der erste Account ist mein echter, mit dem spiele ich wirklich. Mit all den oben beschriebenen menschlichen Einschränkungen. Ich bin jetzt nicht der Super-Fußballprofi, aber ganz blank bin ich auch nicht. Immerhin habe ich mich im Vorfeld dieser WM tatsächlich kurz mit allen Teams auseinander gesetzt, ein paar Sachen gelesen und gehört und versucht, das in plausible Tipps einzuarbeiten. Mit diesem persönlichen Account stehe ich aktuell auf Platz 35 von 41. Erfolg sieht anders aus. Und ich glaube (ganz selbstbewusst) einfach nicht, dass wirklich 34 MitspielerInnen mehr Plan haben als ich. Wobei, ausgeschlossen ist das auch nicht. Aber: An dieser Stelle kommen die anderen beiden Accounts ins Spiel.

3. Der 2:1-Bot

Dieser Tipp-Bot ist ein schlichtes Gemüt. Er hat irgendwann einmal gehört, dass das wahrscheinlichste Ergbnis im Fußball ein 2:1 ist. Und so tippt er einfach immer ein 2:1 für die Mannschaft, die bei den Buchmachern vorne liegt. Fertig. Mit diesem Account stehe ich auf Platz 5 von 41 in unserer Tipp-Tabelle. Wow, sooo viel fussballerische Kompetenz!

3. Der Quoten-Bot

Der Quoten-Bot ist etwas schlauer als der schlichte 2:1-Bot. Er orientiert sich nicht einfach an den Wettquoten und tippt 2:1, sondern er versucht, aus den Wettquoten Ergebnisse zu „berechnen“. Wenn dich die einzelnen Schritte nicht interessieren kannst du sie gerne überspringen, ich erkläre sie hier trotzdem kurz. Dabei werden einige Dinge aber nicht im Detail verraten, den Grund nenne ich am Ende des Artikels.

  1. Nimm die Wettquoten und erreche daraus Wahrscheinlichkeiten für Sieg, Unentschieden oder Niederlage. (Das alleine ist schon ein fragwürdiges Unterfangen, aber erst der Anfang einer haarsträubenden Rechnerei).
  2. Ziehe eine Zufallszahl zwischen 0 und 100. Diese entscheidet anhand der in Schritt 1 berechneten Wahrscheinlichkeiten, ob das Spiel als gewonnen, unentschieden oder verloren getippt wird.
  3. Nachdem die Tendenz festliegt muss noch das genaue Ergebnis „errechnet“ werden. Ich habe das so gelöst, dass ich unabhängig voneinander eine Tordifferenz und einen „Tor-Offset“ berechnet habe. Bei einem 3:1 wäre die Tordifferenz +2, der Tor-Offset gleich 1.
    • Den Tor-Offset berechne ich rein statistisch, also unabhängig von von den Wettquoten oder sonstigen Daten. So viel sei verraten: Die Verteilung der Tor-Offsets ist keine Gleichverteilung.
    • Die Tor-Differenz ist etwas komplizierter: Bei einem Tipp, der zufällig der Tendenz in den Wettquoten entspricht gehen in die Berechnung der Tordifferenz die Wettquoten für Sieg und Niederlage mit ein. Wird zufällig gegen den Trend der Wettquoten getippt setze ich die Tordifferenz immer auf 1. Bei einem Unentschieden ist sie (Überraschung!) immer gleich 0.
  4. Über die Berechnung der Halbfinalteilnehmer etc. schweige ich mich hier aus, das bleibt Betriebsgeheimnis.

Mit dieser überaus fragwürdigen Rechnerei erzeugt dieser Quoten-Account Spielergebnisse, mit denen er aktuell immerhin auf Platz 10 von 41 liegt und damit deutlich über meinem „Einfach ich“-Account und auch sonst deutlich im oberen Teil der Tabelle.

Man könnte dieses Tipp-Verhalten natürlich beliebig kompliziert ausbauen. Meine Tipps sind beispielsweise alle statistisch unabhängig, sie basieren allein auf Wett-Quoten (eine lausige Datenbasis), sie werden im Laufe des Turniers nicht angepasst, lassen mathematische Überlegungen von richtigen Fachleuten außer Acht (wie beispielsweise diverse Formeln, die sich auf die Poisson-Verteilung stützen) und so weiter. Und damit kommen wir zum letzten Punkt:

Die Herausforderung

Der bisherige Verlauf der WM und unseres Tippspiels steigert ehrlich gesagt nicht meine Lust und Vorfreude auf weitere Tippspiele. Nur auf ein ganz spezielles Tippspiel hätte ich mal Lust: Ein Tippspiel der Bots, der mathematischen Modelle, der Algorithmen. Jeder Mitspieler denkt sich einen Algorithmus aus, füttert ihn mit einer vorher zu schaffenden gemeinsamen Datenbasis und gibt die Ergebnisse in das Tippspiel ein. Und dann schauen wir mal. Gerne können auch menschliche Mitspieler mitmachen, aber bitte nur richtig kompetente.

Das wird ein Spaß!

Update 1: Zwischenstand

Zwischenstand

Die ganze Sache hat sich etwas eingespielt, die Vorrunde ist ca. zur Hälfte vorbei. Und siehe da, der Quoten-Bot liegt nach dem Schweiz-Spiel auf Platz 7, der 2:1-Bot sogar auf Platz 2! Und hätte der Isländer vorhin den Elfer nicht über das Tor gezimmert, dann, ja dann wäre es aktuell sogar ganz vorne 😀

Update 2: Zwischenstand

Zwischenstand: Platz 1!

Seit einigen Tagen auf Platz 1!

Update 3: Der Endstand

Endstand: Platz 1!

So, die WM ist seit fast einer Woche vorbei, und damit auch unser Tippspiel. Ich hätte wirklich niemals gedadacht, dass das so enden würde:

  • Mein 2:1-Bot hat es tatsächlich auf Platz 1 geschafft. Unfassbar. Das mag auch an der spielerisch etwas langweiligen WM gelegen haben, trotzdem sind 153 Punkte und damit 20 Punkte Vorsprung auf Platz 2 ein Wort.
  • Der Quoten-Bot ist immerhin auf Platz 15 von 41 gelandet. Damit gewinnt er keinen Blumentopf, hat sich aber auch nicht blamiert.
  • Blamiert hätte ich mich fast mit meinem „normalen“ Account, jedenfalls sah es relativ lange danach aus. Gestartet bin ich auf einem der letzten Plätze, hab mich dort relativ lange aufgehalten und mich auf einmal kontinuierlich nach vorne gearbeitet. OK, ich gebe zu, ab und zu 2:1 zu tippen hat dabei nicht geschadet… Am Ende wurde es Platz 4, so gut war ich noch nie. Oder sagen wir nach den Erfahrungen dieses Tippspiels: So viel Glück hatte ich noch nie.

Was lernen wir daraus? Tippspiele bei Turnieren versprechen mehr, als sie halten. Letztendlich ziehen uns menschliche Faktoren und irrationales Tippverhalten eher nach unten, dazu kommt einfach eine gehörige Portion Zufall und Glück. Ich habe hier nochmal einen interessanten Artikel gefunden, der verschiedene Tippstrategieen gut strukturiert zusammenfasst: „Die wichtigsten Erfolgsfaktoren für Ihren Tippspiel-Sieg„. Hätte ich das mal vorher gelesen, dann wäre mein Quoten-Bot vielleicht noch etwas weiter nach oben gekommen. Aber das können wir ja wie bereits vorgeschlagen dann in 2 oder 4 Jahren machen mit einem Tippspiel der Algorithmen. Bis dahin!

Survivorship Bias

Wir alle lieben Erfolge. Wir bewundern erfolgreiche Leute, und wenn wir uns für reflektiert halten fragen wir uns dabei noch, welche Faktoren zu diesem Erfolg beigetragen haben. Mit ziemlicher Sicherheit wird diese Analyse allerdings fehlerhaft sein. Sogar dann, wenn wir nicht nur einen erfolgreichen Player untersuchen, sondern viele davon. „Viele“ hört sich für den Statistiker immer gut an, aber der Fehler liegt hier schon im Ansatz. Man nennt diesen Fehler „Survivorship Bias“. Wikipedia erzählt eine schöne Geschichte, von der der Begriff kommen angeblich kommen soll. Ob wahr oder nicht spielt keine Rolle, sie verdeutlicht den Denkfehler sehr schön:

Der Begriff geht auf die Arbeit englischer Ingenieure im Zweiten Weltkrieg zurück, welche die Panzerung der Flugzeuge verbessern und somit die Überlebensrate der Piloten steigern wollten. Sie verstärkten zunächst die Panzerung der zurückgekehrten Maschinen an den Stellen mit den meisten Einschusslöchern. Allerdings verbesserte sich dadurch die Überlebensrate nicht. Der Mathematiker Abraham Wald erkannte schließlich den Irrtum und regte an, die Flugzeuge dort stärker zu panzern, wo sie keine Einschusslöcher aufwiesen, da Treffer an diesen Stellen offensichtlich einen Absturz auslösten und somit die Rückkehr unmöglich machten.

Quelle: „Auf die Verlierer kommt es an“

Vor einigen Jahren habe ich das Buch „Die Kunst des klaren Denkens“ von Rolf Dobelli gelesen, in welchem er sich mit genau solchen Denkfehlern auseinander setzt. Nicht ohne Grund wird der „Survivorship Bias“ gleich im ersten Kapitel behandelt (eine „Leseprobe“ dieses kurzen Kapitels findest du hier, lohnt sich). Rolf Dobelli schreibt am Ende des Kapitels, und das sollte man sich merken, wenn man mal wieder Studien liest, die irgend etwas komisches „beweisen“, wenn man auf der Suche nach Erfolgsfaktoren ist, erfolgreichen Menschen zuhört oder selbst ein erfolgreicher Mensch ist und andere einem zuhören:

Survivorship Bias bedeutet: Sie überschätzen systematisch die Erfolgswahrscheinlichkeit. Zur Gegensteuerung: Besuchen Sie möglichst oft die Grabstätten der einst vielversprechenden Projekte, Investments und Karrieren. Ein trauriger Spaziergang, aber ein gesunder.

In diesem Video wird die Sache noch einmal eindrücklich erklärt:

Seit 2012 gibt es weltweit sogenannte Fuckup Nights: Gescheiterte erzählen von ihren Erfahrungen des Scheiterns:

https://youtu.be/xtH6zGSeuDI

Das ist sicher interessant und im Sinne des Survivorship Bias auch sehr wichtig, trotzdem beschleicht mich das Gefühl, dass das Vorgehen der Analyse von gescheiterten Projekten den gleichen Bias erzeugt wie die Analyse von erfolgreichen Projekten. Ausgewogen wird es nur, wenn man beides betrachtet und sich dabei auch eingesteht, dass die Kriterien, nach denen man die Projekte untersucht, schon in die Analyse gesteckt werden und nicht vorwissensfrei aus der Analyse erzeugt werden. Vielleicht sind Faktoren entscheidend, die wir überhaupt nicht auf dem Schirm haben. Oder vieles ist schlicht und einfach – so enttäuschend das auch sein mag – zufällig.