Schlagwort-Archive: Statistik

Wie man 2017 gratuliert

Jetzt hätte ich ihn doch beinahe vergessen, den jährlichen Geburtstagsstatistik-Post. Die Vergesslichkeit würde ich ja gerne auf das fortgeschrittene Alter schieben, aber das würde jeder, der mich kennt, sofort als billige Ausrede entlarven…

Wir kommen diesmal ohne große Umschweife direkt zu den Zahlen:

Wie immer ein paar Bemerkungen dazu:

  • So viele persönliche Glückwünsche wie in diesem Jahr hatte ich seit Aufzeichnugsbeginn noch nie. Das lag einfach daran, dass ich einen runden Geburtstag hatte und es diverse Feierlichkeiten gab: Von vorher eine größere mit der Familie, am Tag selbst eine auf der Arbeit und eine größere private am Abend. Dadurch kam einiges zusammen.
  • Die hohe Zahl an persönlich Gratulanten könnte natürlich die restliche Statistik verfälschen. Zum einen, weil damit die absoluten Zahlen nach unten und damit der Fehler nach oben geht, zum anderen, weil ich nicht ausschließen kann, dass die persönlich Gratulanten eine ähnliche Verteilung abgegeben hätten wie die Gesamtverteilung (also keine „repräsentative Stichprobe“ darstellt).
  • Es gab noch ein paar nicht-signifikante Gratulationsarten, die es nicht als separater Punkt in die Statistik geschafft haben. Mal sehen, wenn sie sich etablieren werde ich sie irgendwann auch für die letzten Jahre nachtragen. Dazu gehört z.B. das explizite persönliche Nichtgratulieren bei gleichzeitiger Überreichung signierter Senf-Portionsbeutel. Nice try!

Bis nächstes Jahr!

Survivorship Bias

Wir alle lieben Erfolge. Wir bewundern erfolgreiche Leute, und wenn wir uns für reflektiert halten fragen wir uns dabei noch, welche Faktoren zu diesem Erfolg beigetragen haben. Mit ziemlicher Sicherheit wird diese Analyse allerdings fehlerhaft sein. Sogar dann, wenn wir nicht nur einen erfolgreichen Player untersuchen, sondern viele davon. „Viele“ hört sich für den Statistiker immer gut an, aber der Fehler liegt hier schon im Ansatz. Man nennt diesen Fehler „Survivorship Bias“. Wikipedia erzählt eine schöne Geschichte, von der der Begriff kommen angeblich kommen soll. Ob wahr oder nicht spielt keine Rolle, sie verdeutlicht den Denkfehler sehr schön:

Der Begriff geht auf die Arbeit englischer Ingenieure im Zweiten Weltkrieg zurück, welche die Panzerung der Flugzeuge verbessern und somit die Überlebensrate der Piloten steigern wollten. Sie verstärkten zunächst die Panzerung der zurückgekehrten Maschinen an den Stellen mit den meisten Einschusslöchern. Allerdings verbesserte sich dadurch die Überlebensrate nicht. Der Mathematiker Abraham Wald erkannte schließlich den Irrtum und regte an, die Flugzeuge dort stärker zu panzern, wo sie keine Einschusslöcher aufwiesen, da Treffer an diesen Stellen offensichtlich einen Absturz auslösten und somit die Rückkehr unmöglich machten.

Quelle: „Auf die Verlierer kommt es an“

Vor einigen Jahren habe ich das Buch „Die Kunst des klaren Denkens“ von Rolf Dobelli gelesen, in welchem er sich mit genau solchen Denkfehlern auseinander setzt. Nicht ohne Grund wird der „Survivorship Bias“ gleich im ersten Kapitel behandelt (eine „Leseprobe“ dieses kurzen Kapitels findest du hier, lohnt sich). Rolf Dobelli schreibt am Ende des Kapitels, und das sollte man sich merken, wenn man mal wieder Studien liest, die irgend etwas komisches „beweisen“, wenn man auf der Suche nach Erfolgsfaktoren ist, erfolgreichen Menschen zuhört oder selbst ein erfolgreicher Mensch ist und andere einem zuhören:

Survivorship Bias bedeutet: Sie überschätzen systematisch die Erfolgswahrscheinlichkeit. Zur Gegensteuerung: Besuchen Sie möglichst oft die Grabstätten der einst vielversprechenden Projekte, Investments und Karrieren. Ein trauriger Spaziergang, aber ein gesunder.

In diesem Video wird die Sache noch einmal eindrücklich erklärt:

Seit 2012 gibt es weltweit sogenannte Fuckup Nights: Gescheiterte erzählen von ihren Erfahrungen des Scheiterns:

https://www.youtube.com/watch?v=xtH6zGSeuDIv

Das ist sicher interessant und im Sinne des Survivorship Bias auch sehr wichtig, trotzdem beschleicht mich das Gefühl, dass das Vorgehen der Analyse von gescheiterten Projekten den gleichen Bias erzeugt wie die Analyse von erfolgreichen Projekten. Ausgewogen wird es nur, wenn man beides betrachtet und sich dabei auch eingesteht, dass die Kriterien, nach denen man die Projekte untersucht, schon in die Analyse gesteckt werden und nicht vorwissensfrei aus der Analyse erzeugt werden. Vielleicht sind Faktoren entscheidend, die wir überhaupt nicht auf dem Schirm haben. Oder vieles ist schlicht und einfach – so enttäuschend das auch sein mag – zufällig.

Wie man 2016 gratuliert

Auch wenn ich gerade wenig zum Bloggen komme, der jährliche Geburtstagsstatistik-Post ist natürlich Pflicht. Die Datenerfassung habe ich mir in diesem Jahr mit einer Counter-App erleichtert. Letztes Jahr hatte ich genau so etwas gesucht, aber nichts passendes gefunden. Die App war sehr hilfreich, um persönliche Glückwünsche, Telefonanrufe etc. zu erfassen. Also die Gratulationen, die sich nicht im Nachhinein digital zählen und auswerten lassen.

Bevor wir zu den Zahlen und einigen wenigen Beobachtungen kommen: In diesem Jahr haben sich etliche Leute einen Spaß daraus gemacht, mir auf diversen Kanälen mehrfach zu gratulieren. Einfach mal austesten, wie der Herr Wissenschaftler so mit widrigen statistischen Bedingungen umzugehen vermag. Zählt er die Glückwünsche dann auf allen Kanälen? Unterschlägt er einfach Daten? ? Wie so oft im Leben – übrigens auch im wissenschaftlichen – gibt es kein richtig oder falsch. Statistiken sind immer Interpretation, und das hat nichts mit Mutwillen oder Manipulation zu tun, sondern liegt einfach in der Natur dieser Welt. Schwarz-weiß, richtig-falsch, Eins-Null, das klappt nicht. Ich kann diese Statistik also nur auf die eine Weise „fälschen“ oder auf die andere. Ich habe mich dafür entschieden, bei Gratulationen von einer Person auf mehreren Kanälen immer den zuerst gewählten in meine Zählung aufzunehmen, weil das für die Person der intuitivste sein könnte.

Jetzt aber zu den Zahlen von 2016:

Geburtstag 2016 - Verteilung Geburtstag 2016 - Zeitverlauf absolut Geburtstag 2016 - Zeitverlauf prozentual

Kleine Anmerkung zu den beiden letzten Grafiken: In diesem Jahr habe ich die Zeitachse gedreht, damit die aktuellen Zahlen gut sichtbar vorne liegen und die Vergangenheit langsam hinten verblassen kann.

Weiterlesen

Wie man 2015 gratuliert

Und schon wieder ist ein Jahr vorbei. Ich habe fast den Eindruck, dieses Blog besteht nur aus Geburtstagsstatistik-Posts… Manchem Leser geht das wohl genauso, einer hat mir sogar ungefragt Zettel und Stift angeboten, um Glückwünsche zu notieren. Sehr aufmerksam, ohne ihn hätte ich aus Vergesslichkeit dieses Jahr wirklich ein Problem mit der Datenerfassung gehabt. Ich werde alt.

Genug der Vorrede, hier sind die Zahlen von 2015:

Geburtstag 2015 - Verteilung
Geburtstag 2015 - Zeitverlauf absolut
Geburtstag 2015 - Zeitverlauf prozentual

Weiterlesen

Konstanter Mailverkehr?

Seit gut drei Wochen sind hier in Bayern die Sommerferien vorüber, und damit haben auch wieder einige andere Aktivitäten eingesetzt, die vorher pausierten. Auch der Posteingang schien wieder deutlich erhöhte Aktivität zu zeigen. Ich habe mich gefragt, ob das wirklich objektiv so ist, also ob mehr Mail hereinflattern, oder ob es gleichbleibend viele Mails sind, diese aber aufgrund der wieder ansteigenden sonstigen Aktivitäten mehr Stress erzeugen. Um das herauszufinden müsste man sich einfach mal ansehen, wie viele Mails man z.B. pro Woche so bekommt und auch schreibt.

Gedacht, gemacht: Ich habe aus Thunderbird mit dem Add-on ImportExportTools mal die Metadaten (weiß heutzutage ja eigentlich jeder, was das ist) der entsprechenden Mails des vergangenen Schuljahrs 2013/2014 exportiert und anschließend in Excel ganz grob analysiert. Dabei habe ich versucht, nur „echte“ Mails zu nehmen, also technische Mails wie Serverlogs etc. wegzulassen. Nur Mails, von menschlicher Aktivität zeugen und auch gewisse Aktionen oder Reaktionen erfordern. Eingeschlossen waren daher auch Mails mit Benachrichtigungen über Facebook-Kommentare, Twitter-Favs etc., die monitoren ja auch eine gewisse Umtriebigkeit. Und natürlich enthalten die Mails nicht nur privaten Mailverkehr, sondern zu einem sehr großen Teil betreffen sich auch die Schule der Kinder, Fußballaktivitäten der Kinder, mein Volleyball-Team und natürlich die CityChurch… Ausgenommen sind natürlich berufliche Mails, die laufen komplett separat.

Hier das Ergebnis:

Mailstatistik 2013-2014 absolut

Nach rechts aufgetragen sind die Kalenderwochen, nach oben die Summer der Mails über eine KW. Die blaue Linie zeigt die eingegangenen Mails, die rote die verschickten. Die grünen Bereiche stellen grob die Schulferien dar. In einer zweiten Darstellung habe ich die absoluten Zahlen jetzt mal auf den Mittelwert der jeweiligen Kurve normiert, damit man ggf. eine Korrelation besser erkennen kann:

Mailstatistik 2013-2014 normiert

Zwei Korrelationen lassen sich aus auf die Schnelle den Daten lesen:

  • Die Ausgangsfrage lässt sich eindeutig beantworten: Mails werden im Alltag nicht nur stressender wahrgenommen, es sind auch deutlich mehr als in den Ferienzeiten (gut sichtbar in der ersten Grafik). Gerade auch in den Sommerferien ruhen neben der Schule auch andere Aktivitäten nahezu komplett (Fußball der Kinder, Volleyball, CityChurch, …), außerdem sind andere Menschen im Urlaub und man selbst ggf. auch. Es gibt also eine eindeutige Korrelation zwischen Ferienzeiten und Mailaufkommen. Und die gefühlte Stressexplosion am Ende der Sommerferien (Ende August / Anfang September) ist sehr gut sichtbar.
  • Eine weitere Korrelation ist die zwischen den empfangenen und gesendeten Mails (siehe untere Grafik). Beides bedingt sich gegenseitig. Wobei man mit solchen offensichtlichen Korrelationen vorsichtig sein muss, wie wir ja wissen.

Mit diesen Erkenntnissen kann man nicht viel anfangen, schön fand ich sie trotzdem. Und ich weiß jetzt immerhin, dass ich im Jahresschnitt 7,5 Mails/Tag schreibe und 27,5 lese. Und ich weiß (nicht erst jetzt), was man mit so einfachen Metadaten (in diesem Fall nur das Datum) von Mails so alles machen kann.

PS: Mir ist bewusste, dass ich den Begriff „Korrelation“ hier sehr hemdsärmlig verwendet habe. War mir aber jetzt mal egal.

Shared Space

ShareSpaceSchild.svg

ShareSpaceSchild“ von unbekannt – Eigene Arbeit, basierend auf einer Fotografie von AP Photo/Joerg Sarbach in der EpochTimes Deutschland (online), 2008 (siehe: Imke Zimmermann: Bohmte hat EU-Projekt mit Straßenfest übergeben. In: EpochTimes Deutschland. 22. Juni 2008 (http://www.epochtimes.de/articles/2008/06/22/301574.html).). Über Wikipedia.

Als ich Mitte des Jahres eine Woche in Mailand unterwegs war fiel mir auf, dass der Straßenverkehr dort anders funktioniert als bei uns. Will man z.B. als Fußgänger über einen Zebrastreifen gehen, dann wird kein Auto anhalten und einen einfach über die Straße lassen. Läuft man aber mutig los, dann stellt man fest, dass die Autofahrer entgegen des Anscheins ziemlich aufmerksam und bremsbereit sind und einen über die Straße lassen. Offensichtlich führt der etwas lockerere Umgang mit den starren Verkehrsregeln zu mehr Aufmerksamkeit, denn jedem ist klar, dass der andere sich ggf. nicht 100% regelkonform verhält. Dafür muss man das selbst eben auch nicht. Etwas mehr gesunder Menschenverstand, etwas mehr Mitdenken, etwas mehr Vertrauen in den Anderen und etwas mehr Rücksicht auf den anderen führt zu deutlich mehr Freiheit und einer deutlich angenehmeren Stimmung auf der Straße.

Vorgestern gab es bei Spiegel Online einen Artikel „Verkehr ohne Regelwut: Ein Dorf schafft den Schilderwald ab„, den man unbedingt lesen sollte. Darin wird der niederländische Verkehrsplaner Hans Monderman zitiert:

Wenn man die Leute wie Idioten behandelt, werden sie sich auch so benehmen.

Einen „Shared Space“ hat Mondermann diese Planungsphilosophie genannt. Der Begriff gefällt mir, genau wie die ganze Idee dahinter. Die lässt sich nämlich auf viele Bereiche des Lebens übertragen, in denen Menschen interagieren. Gerade auch in christlichen Gemeinden wird gerne mal ein „Schilderwald“ aufgestellt, und auch hier gilt: Etwas mehr gesunder Menschenverstand, etwas mehr Mitdenken, etwas mehr Vertrauen in den Anderen und etwas mehr Rücksicht auf den anderen führt zu deutlich mehr Freiheit und einer deutlich angenehmeren Stimmung. Schon ganz am Anfang der Bibel der Straßenverkehrsordnung heißt es:

Die Teilnahme am Straßenverkehr erfordert ständige Vorsicht und gegenseitige Rücksicht.

Vermögensverteilung: ideal vs. gedacht vs. real

Ich dachte eigentlich, dass ich das folgende Video hier schon einmal empfohlen hätte. Hab ich aber wohl nicht. Es geht darum, wie das Geld der Welt der USA

  1. idealerweise verteilt sein sollte,
  2. wie die Leute sich dagegen die reale Verteilung vorstellen und
  3. wie sie wirklich ist.

Muss man gesehen haben, um eine Ahnung davon zu bekommen, wie schief diese Welt gewickelt ist:

Nachtrag:

Auf Facebook hat netterweise jemand in einem Kommentar eine Grafik zur Vermögensverteilung in Deutschland gepostet, die ich hier nachreiche:

Vermögensverteilung DeutschlandQuelle: http://www.crp-infotec.de/01deu/finanzen/privat_verteilung.html

Man sieht, dass das Problem noch nicht so stark ausgeprägt ist wie in den USA, die Tendenz aber die gleiche ist. Erschreckend finde ich die dargestellte Entwicklung zwischen 2003 und 2007.

 

Wie man 2013 gratuliert

Wahnsinn, wie die Zeit vergeht. Das dachte ich mir an meinem Geburtstag, und das dachte ich mir gerade eben, als mir auffiel, dass eben dieser Geburtstag auch schon wieder fast vier Wochen zurück liegt. Und ich habe immer noch keine Statistik veröffentlicht, obwohl das doch schon fast Tradition hat. Also los, hier ist sie:

Gratulationsverhalten 2013 Weiterlesen

Macht Geld glücklich?

Keine einfachen Antworten auf schwierige Fragen – dieser Grundsatz wird bei der Frage nach dem Zusammenhang von Glück und Geld oftmals außer Acht gelassen. Ein Video aus dem gestern schon vorgestellten Youtube-Kanal „AsapScience“ geht dieser Frage dagegen in unter 3 Minuten erstaunlich differenziert nach, wie ich finde. Gerade der Zusammenhang zwischen dem Weggeben von Geld und dem erfahrenen Glück ist bedenkenswert.