Meine mathematische Denkecke

      Daß viele Leute mit Grausen an den Matheunterricht in der Schule zurückdenken, ist ja schon schlimm genug. Um so wichtiger wäre es, wenn wenigstens die Leute, die in der Öffentlichkeit mit Zahlen hantieren, das verstehen, was sie von sich geben. Wenn Politiker fehlendes Interesse (oder einfach die Unwissenheit) von uns einfachen Bürgern für ihre Interessen nutzen, dann ist das zwar nicht gerade fein, aber von der Motivation her wenigstens noch zu verstehen. Spätestens wenn Journalisten diesen Datenmüll dann aber kommentarlos weiterverbreiten, empfinde ich, daß die Schmerzgrenze überschritten ist.

      (Meine Sammlung soll natürlich noch umfangreicher werden. Ich werde daran bei Gelegenheit weiterarbeiten. Anregungen, Ergänzungen, Hinweise etc. sind mir jederzeit willkommen.)


      Themenverzeichnis

      Statistik im Allgemeinen
      Was ist denn eigentlich Statistik ?
      Der Mittelwert

      Beliebte "Fehlerquellen"
      Prozent und Prozentpunkt
      Weniger und mehr
      Die Wahl der Bezugsgröße ...
       ... geht auch mal bei Profis daneben

      Die Beweiskraft von Statistiken
      Geschichten vom Storch
      Kriminalstatistik
      Sonstige Abhängigkeiten

      Kuriositäten
      Die Regenwahrscheinlichkeit
      Aus den Medien

      Und dann gibt es da noch meine allgemeine Bildungslücken Denkecke


      Statistik im Allgemeinen

      Was ist denn eigentlich Statistik ?

      Auch wenn es manchem in der Schule sehr kompliziert vorkam, die Statistik ist eigentlich etwas ganz einfaches. Sie hat vor allem die Aufgabe große Zahlenmengen überschaubar zu machen. (Ich merke mir nicht, wieviel ein Handy in jedem der mir bekannten Läden kostet, sondern nur was es durchschnittlich kostet - naja, bei dem Beispiel wäre vielleicht der Mindestwert interessanter.)

      Und wenn man einmal so viele Zahlen ausgewertet hat, kann man Wahrscheinlichkeiten für noch nicht untersuchte "Ereignisse" angeben. (Wenn ich einen mir unbekannten Laden betrete kann ich vermuten, wieviel das Handy hier kosten wird.)
       

      Der Mittelwert

      Der bekannteste statistische Vertreter ist sicherlich der Mittelwert. Daher ist er zwangsweise auch die am häufigsten falsch verstandene und mißbrauchte statistische Größe.

      Erfundenes Beispiel: Ein Land hat 200 Millionen Einwohner. Einer von denen hat ein Vermögen von 50 Milliarden US$. Nun zieht dieser Mann in ein anderes Land. Die übliche Interpretation des Mittelwertes würde zu dem Ergebnis führen, daß "jeder Bürger durchschnittlich 250 US$ ärmer geworden ist".

      Noch besser: Wenn diese erfundene Person (nennen wir Sie Gill Bates) in ein Land mit 20 Millionen Einwohnern zieht, dann wird plötzlich "jeder Bürger dieses Landes durchschnittlich um 2500 US$ reicher".

      Für viele Anwendungen wäre eigentlich der 'Median' wesentlich aussagekräftiger. Aber wer kennt den schon ?
      (Für ganz Neugierige: der Median ist der 'mittlere Wert'. Fiktives Beispiel, das Monatseinkommen einiger Ärzte: A=5.000,-  B=6.000,-  C=9.000,-  D=15.000,-  und  E=65.000,-.  Der Mittelwert beträgt 20.000,- [100.000,- / 5].  Der Median nur 9.000,-  [C]  )

      Zurück zum Themenverzeichnis, zu meiner Denkecke oder zu meiner Homepage.


      Beliebte "Fehlerquellen"

      Prozent und Prozentpunkt

      Sehr beliebt ist das Verwechseln dieser beiden Begriffe. So hat es sich bei unseren Politikern mittlerweile eingebürgert, bei Steuererhöhungen (oder ähnlichem) den Unterschied zwischen beiden dezent zu übersehen. Wenn beispielsweise die Mehrwertsteuer von 15% auf 16% angehoben wird, dann klingt es natürlich viel harmloser, wenn von einer 1%-igen Erhöhung gesprochen wird. Zumal das ja irgendwie fast richtig zu sein scheint.

      Nur: Wer ein Handy für € 100,- (netto) kauft, war zuvor mit € 15.- (eben 15%) als persönlichem Märchensteuerbeitrag dabei. Seit der Erhöhung darf sich Vater Staat über € 16.- freuen. Korrekterweise hätte man also von einer Erhöhung um 1 Prozentpunkt oder, fairerweise, von einer Erhöhung um 6,67 Prozent sprechen müssen. Eine solche Erhöhung mit 1 Prozent zu bezeichnen ist jedenfalls, vorsichtig ausgedrückt, falsch.

      Eigentlich erstaunlich, daß man uns nicht erklärt, der Anstieg der Preise hatte aufgrund dieser Mehrwertsteuererhöhung nur 0,87% betragen. (Oder sollte das einigen Leuten nicht klar sein ???)
       

      Weniger und mehr

      Vertrackt wird es auch bei Erklärungsversuchen, wieviel (mehr) jetzt etwas weniger kostet.

      Zum Beispiel die März98-Tarife der Telekom: Auf Ferngespräche bekommen analoge Teilnehmer ab der 11. Minute 10% Rabatt, ISDN-Teilnehmer sogar 30%. Ein 20-minütiges Ferngespräch kostet einen analogen Teilnehmer also 5%, einen ISDNler dagegen 15% weniger als vorher. In einem Anfall der üblichen Übertreibungen (oder können die nicht anders ?) wird also behauptet, ISDN-Teilnehmer sparen dreimal mehr als Teilnehmer eines herkömmlichen Telefonanschlusses. ('Dreimal soviel' oder 'zweimal mehr' wäre richtig gewesen). Hey Telekomiker, ich hätte da einen Tip, der ISDN noch beser aussehen ließe: Senkt die Ersparnis für ISDN-Verweigerer doch einfach auf 5%. Dann sparen die ISDNler sechsmal soviel !  Das könnte man dann doch als 600-prozentigen Preisvorteil von ISDN verkaufen.

      Die Steigerung davon ist allerdings die Phrase 'doppelt soviel weniger'. Wenn etwas vorher doppelt soviel gekostet hat, oder es jetzt zum gleichen Preis die doppelte Menge gibt, dann ist der neue Preis also 'doppelt soviel weniger'. Hmm. Ich versuche jetzt mal die Rechenkünste der Grundschule zu bemühen: Alter Preis ist 10 Mark. Davon das doppelte ist 20 Mark. 10 Mark weniger 20 Mark ist ..... jedenfalls nicht die Hälfte von 10 Mark.
       

      Die Wahl der Bezugsgröße ...

      Eine weitere beliebte "Fehlerquelle" ist die falsche Wahl der Bezugsgröße.

      Ganz einfaches Beispiel zur Reduzierung der Arbeitslosigkeit: Die Arbeitslosenquote ist ja ein Verhältnis von zwei Zahlen. Über dem Bruchstrich steht die Zahl der Arbeitslosen und unter dem Bruchstrich eine Bezugsgröße. (Wird so ein Bruch dann mit 100 multipliziert, erhält man die bei Kaufleuten und Politikern beliebte Prozentzahl.) Die offensichtliche Methode, die Zahl über dem Strich kleiner zu machen, muß wohl kaum noch vertieft werden (so werden gerne Personen in ABM-Maßnahmen einfach nicht mitgezählt, obwohl diese ja auch noch eine feste Anstellung suchen).

      Diesen Bruch kann man aber noch auf eine zweite Weise kleiner machen: Man vergrößert einfach die Bezugsgröße, d.h. die Zahl unter dem Strich, in dem man z.B. nicht nur durch die abhängig Beschäftigten teilt, sondern großzügig noch andere Personen mit hinzurechnet, wie z.B. Unternehmer, Soldaten, ABM-Kräfte, ... (Ich bitte den doppelten Hattrick mit den ABM-Kräften zu verzeihen.)
       

      ... geht auch mal bei Profis daneben

      Durchaus erheiternd wird es, wenn ein Professor für Wirtschafts- und Sozialstatistik ein Buch über solche Machenschaften veröffentlicht ... und dann selber so einen Klops reißt. Da schreibt doch Walter Krämer als profunder Kenner der Materie ein Buch zum Thema "So lügt man mit Statistik".

      In diesem Buch erklärt er zunächst, dass bei der Bahn mit 0,9 Verkehrstoten pro 1 Milliarde Passagierkilometern zu rechnen ist und das dieser Wert beim Flugzeug nur 0,3 beträgt. Statt es hierbei zu belassen überlegt er nun aber, warum uns beim Betreten eines Flugzeuges der Angstschweiß ausbricht, beim Betreten eines Zugabteils jedoch nicht. Er erklärt dem geneigten Leser, daß es für ihn (W.K.) wichtiger ist, was in den nächsten 10 Minuten oder der nächsten Stunde passiert. Und schon sieht die Statistik wie folgt aus: Bahn 0,07 Verkehrstote pro 1 Million Passagierstunden, dagegen das Flugzeug mit 0,24.

      Unerwähnt bleibt zunächst hierbei, welche Bedeutung diese beiden gegensätzlich scheinenden Statistiken haben:
       

      • Die erste sagt nämlich aus, daß ich eine Reise über eine vorgegebene Distanz am sichersten mit dem Flugzeug absolviere. Wenn ich also von Frankfurt nach Rom möchte, ist das Flugzeug das Verkehrsmittel der Wahl.
      • Die zweite Statistik sagt dagegen aus, daß ich eine Reise über eine vorgegeben Reisezeit am sichersten mit der Bahn absolviere. Wenn ich also von Frankfurt aus 2 Stunden südlich reisen möchte, dann ist die Bahn sicherer.
      Natürlich sind beide Aussagen richtig. Und jemand, der sich über diese beiden unterschiedlichen Aussagen im klaren ist (also z.B. jemand der meine Gedanken zu diesem Thema hier gelesen hat) kann sie auch richtig einschätzen. Ich behaupte jedoch, daß
      • vielen Leuten diese Bedeutungen nicht klar sind  und daß
      • die Aussage über die vorgegebene Reisedauer für die überwältigende Mehrheit der Leute ziemlich heftig am Thema vorbeischrammt.
      Auch wenn ich unterstelle, daß einem Fachmann ein solcher Fehler nur zu 'Testzwecken' unterläuft, bleibt dennoch das traurige Ergebnis: Ohne diese Quelle zu kennen wissen viele Leute, daß es da eine Statistik gibt, die beweist, daß fliegen in Wirklichkeit gar nicht so sicher ist.

      Zurück zum Themenverzeichnis, zu meiner Denkecke oder zu meiner Homepage.



      Die Beweiskraft von Statistiken

      Geschichten vom Storch

      Ein weiteres Kapitel, in dem die arme Statistik gerne mißbraucht wird, ist das unrühmliche Kapitel der Beweise. Irgendwie scheint es ganz plausibel zu sein, daß beliebige Zahlenreihen, die sich ähnlich sehen, sich auch gleich gegenseitig beweisen. Klassisches Beispiel: In einem Dorf, dessen Name hier jetzt verschwiegen werden soll, hat sich über einen längeren Zeitraum die Population der Störche ähnlich entwickelt, wie die Geburtenrate der (menschlichen) Dorfbewohner.

      Wenn es so wäre, daß ähnliche Entwicklungen von Zahlenreihen automatisch etwas miteinander zu tun haben müssen, dann wäre also bewiesen, daß in diesem Dorf die Kinder vom Storch gebracht werden. (Oder ist damit nur bewiesen, daß die Storchenkinder von den Babies gebracht werden ???)
       

      Kriminalstatistik

      Auch wenn das vorangegangene Beispiel, aufgrund seiner Lächerlichkeit, sofort durchschaut werden kann, so ist dies leider nicht immer der Fall. Etwas ernster ist beispielsweise die Aussage, daß Ausländer krimineller sind als Deutsche. Wenn eine solche Aussage dann in einem politischen Umfeld getätigt wird und damit suggeriert werden soll, daß Menschen deswegen krimineller sind, weil sie keine Deutschen sind, sollte eigentlich mal wieder ein Punkt erreicht sein, an dem es Zeit wird die Hintergründe zu beleuchten.

      Gelegentlich sieht man Statistiken die belegen, daß pro 1000 Einwohner/Nationalität von Ausländern mehr Straftaten begangen werden als von Deutschen. Dies ist jedoch eine recht pauschale und vereinfachende Aussage. Sie berücksichtigt nämlich beispielsweise nicht die demographische Struktur der verglichenen Gruppen. Etwas deutlicher: Wenn bei den Deutschen der Anteil der 70 bis 80-jährigen Frauen höher ist als bei den Ausländern, letztere dafür in der Altergruppe der 20 bis 30-jährigen Männer stärker vertreten ist, so ist das Ergebnis, 'daß die Ausländer krimineller sind' nicht sehr verwunderlich. Der Anteil von 'bösen Buben' ist bei den 20 bis 30-jährigen nunmal -nationalitätsübergreifend- höher als bei den 70 bis 80-jährigen. Und das dürfte für alle Nationalitäten gelten.

      Doch auch wenn dieser Alterseffekt eliminiert wird, lauert eine weitere Gefahr: Man vergleicht Äpfel mit Birnen. Auf der Liste, der von den Ausländern begangenen Untaten stehen auch solche, die von der deutschen Vergleichsgruppe entweder gar nicht begangen werden können (ausländerspezifische Delikte) oder solche, die zwar auch von Deutschen begangen werden, aber nicht in der deutschen Statistik auftauchen ("Touristenkriminalität"). Darüber hinaus wird in einer solchen Zählung nicht die Schwere der Tat berücksichtigt. Bestimmte Personenkreise, wie beispielsweise Asylbewerber, begehen typischerweise meist sogenannte Bagatellkriminalität.

      Tatsache ist jedenfalls, daß bei einer differenzierten Auswertung der Kriminalstatistik die ausländische Wohnbevölkerung (also die Ausländer, die in Deutschland leben) sich gesetzestreuer zeigt als die deutsche Bevölkerung.
       

      Apropos Asylbewerber: Auch wenn es sich noch nicht bis zu allen Medien-Schaffenden rumgesprochen hat, so sind Asylbewerber keine Asylanten. Und bei Personengruppen wie Spätaussiedlern oder Jüdischen Emigranten (sogenannte "Kontingentflüchtlinge") ist dieser Begriff sogar noch weiter daneben. Aber ich glaube, jetzt schweife ich ab.
       

      Sonstige Abhängigkeiten

      Neben den bisher beschriebenen Phänomenen, gibt es noch eine große Gruppe von Pseudo-Abhängigkeiten. Die beobachteten Ereignisse haben zwar etwas miteinander zu tun, die behauptete Kausalität ist jedoch grottenfalsch. Beispiele hierfür:
       

      • Menschen mit Schuhgröße 30 (und kleiner) haben eine höhere Lebenserwartung -> Menschen mit kleinen Füßen leben länger. (Natürlich haben Kinder noch etwas länger zu leben.)
      • Informatiker leben länger. (Bevor sich jemand Informatiker nenen kann, muß er bereits eine Ausbildung durchlaufen haben. Die Säuglingssterblichkeit oder der plötzliche Kindstot betrifft nur den Durchschnitt aller Menschen, nicht jedoch den der Informatiker. Oder Billardspieler, Beamte, Bundeskanzler, ...)
      ... to be continued

      Zurück zum Themenverzeichnis, zu meiner Denkecke oder zu meiner Homepage.



      Kuriositäten

      Die Regenwahrscheinlichkeit

      Bei den oben erwähnten "beliebten Fehlerquellen" geht es darum, daß objektiv aussehende Statistiken, häufig alles andere als wertneutral sind und daß mit derart gefärbten Aussagen alles mögliche bewiesen oder widerlegt werden kann (und wird).

      Jetzt muß ich aber auch noch zu ein paar völlig belanglosen Bereichen meinen Senf dazugeben:

      Hier in Frankfurt haben wir einen Radiosender, der anläßlich eines jeden Wetterberichtes die hessischen Ohren mit einem Satz zurieselt, wie "die Regenwahrscheinlichkeit beträgt bis heute abend 50%". Leider habe ich nicht die geringste Ahnung was das heißen soll, bzw. was das für mich bedeutet.

      Soll das heißen, daß

      • mit einer 50%igen Wahrscheinlichkeit bis heute abend irgendwo in Hessen mit mindestens einem kurzen Regen zu rechnen ist,   oder daß
      • 50% des hessischen Landes bis heute abend mit mindestens einem kurzen Regen überzogen wird,   oder daß
      • halb Hessen durchgehend bis heute abend gewässert wird,    oder vieleicht auch daß
      • ganz Hessen die Hälfte der Zeit bis heute abend einen Regenschirm braucht ?
      Daraus ergeben sich dann natürlich weitere, mich quälende, Fragen:
      • Ist eine 50%ige Regenwahrscheinlichkeit bis heute abend schlechter als eine ebensolche bis Morgen (weil es ja vielleicht garnicht mehr heute regnet, sondern erst, mit eben dieser Wahrscheinlichkeit, morgen) ?
      • Und wenn es heute nicht geregnet hat, hat es das dann deshalb nicht getan, weil die günstigere Hälfte der 50% gegriffen hat (das hieße dann, das es morgen nicht mehr regnet), oder hat es deshalb nicht geregnet, weil es erst morgen mit dieser Wahrscheinlichkeit regnen wird ?
      • Oder ist die erwähnte Regenwahrscheinlichkeit besser wenn sie nur bis heute abend befristet ist ?  Mit welcher Wahrscheinlichkeit gibt es dann für morgen eine niedrigere Regenwahrscheinlichkeit ?
      Ach ja, Fragen über Fragen, die ich kleines Dummerchen nicht verstehe.
       

      Aus den Medien

      Fernsehen (genaueres leider unbekannt):
      Wie stark die Lebenserwartung gestiegen ist, erkennt man daran, daß die Menschen heute locker 80, 90 gar 100 Jahre alt werden, dagegen erreichten um 1900 jedes fünfte Kind noch nicht einmal das 1.Lebensjahr.


       

      Zurück zum Themenverzeichnis, zu meiner Denkecke oder zu meiner Homepage.