Auswahl der Encarta-Redaktion
Gute Bücher zum Thema "Statistik", ausgewählt von den Encarta-Redakteuren.
Verwandte Elemente
Suche in Encarta
In Encarta suchen nach Statistik

Windows Live® Suchergebnisse

Alle Suchergebnisse anzeigen:
Windows Live® Suchergebnisse

Statistik

Enzyklopädieartikel
Multimedia
KreisdiagrammKreisdiagramm
Artikelgliederung
1

Einleitung

Statistik, Zweig der Mathematik, der sich mit der Sammlung, Zusammenstellung und Analyse von Zahlenmaterial – den statistischen Daten – für wissenschaftliche, soziale, politische und wirtschaftliche Zwecke beschäftigt. Zu seinem Themengebiet gehört u. a. auch die mathematische Untersuchung von so genannten Zufallsgrößen. Die Statistik arbeitet mit großen Datenmengen ohne Berücksichtigung ihrer inhaltlichen Bedeutung.

2

Geschichte

Einfache Formen der Statistik gab es schon auf frühen Stufen der Zivilisation. Die Babylonier benutzten 3000 v. Chr. kleine Tontafeln für tabellarische Aufstellungen von landwirtschaftlichen Erträgen und von getauschten oder verkauften Waren. Die Ägypter stellten Bevölkerungszahlen und Daten des materiellen Reichtums ihres Landes auf, bevor sie damit begannen, die Pyramiden zu bauen. Die biblischen Bücher Numeri und 1. Buch der Chronik enthalten statistische Angaben: Ersteres berichtet von zwei Volkszählungen der Israeliten, und letzteres beschreibt den Reichtum verschiedener jüdischer Geschlechter. Ähnliche Zahlenaufstellungen gab es auch 2000 v. Chr. in China. Das antike Griechenland führte als Grundlage der Steuererhebung bereits seit 594 v. Chr. Volkszählungen durch.

Das Römische Reich sammelte umfangreiches Datenmaterial über die Bevölkerung, die Fläche und das Vermögen der von ihm beherrschten Gebiete. Während des Mittelalters wurden in Europa nur wenige Volkszählungen durchgeführt. Die karolingischen Könige Pippin III. und Karl der Große ordneten Übersichten über die Besitztümer der Kirche an: Pippin 758 und Karl der Große 762. Nach der normannischen Eroberung Englands 1066 ordnete König Wilhelm der Eroberer eine Volkszählung an; die Daten dieser 1086 durchgeführten Volkszählung wurden im Domesday Book aufgezeichnet. Die Registrierung von Todesfällen und Geburten wurde in England im frühen 16. Jahrhundert begonnen, und 1662 wurde die erste statistische Studie, Observations on the London Bills of Mortality (Beobachtungen zu Londons Sterblichkeitsraten) geschrieben. Eine ähnliche Sterblichkeitsstudie, 1691 in Breslau geschrieben, wurde von dem englischen Astronomen Edmond Halley als Grundlage für die älteste Sterblichkeitstabelle verwendet. Im 19. Jahrhundert erlebte die Statistik mit der zunehmenden Anwendung mathematischer Methoden in den Naturwissenschaften einen Aufschwung.

Gegenwärtig ist die Statistik ein verlässliches Instrument, um wirtschaftliche, politische, soziale, psychologische, medizinische, biologische und physikalische Daten genau zu beschreiben; zudem dient sie als Werkzeug, um solche Daten miteinander in Beziehung zu setzen und auszuwerten. Die Arbeit des Statistikers beschränkt sich nicht mehr auf das Sammeln und Auflisten von Daten, sondern sie dient der Interpretation der Information. Die Entwicklung der Wahrscheinlichkeitsrechnung erweiterte das Spektrum der statistischen Anwendungen. Viele Werte können durch Wahrscheinlichkeitsverteilungen näherungsweise bestimmt werden, und die Ergebnisse können zur Analyse statistischer Daten verwendet werden.

Um ein physikalisches, biologisches oder soziales Gesetz aufzustellen, kann der Statistiker mit einem Datensatz beginnen und ihn allmählich im Hinblick auf seine Erfahrung abändern. So wurde z. B. in frühen Studien über das Bevölkerungswachstum die zukünftige Veränderung der Größe der Bevölkerung dadurch vorausgesagt, dass man die Mehrzahl der Geburten gegenüber den Todesfällen in einer beliebigen Zeitspanne berechnete. Die Bevölkerungsstatistiker erkannten bald, dass der Betrag dieser Zahl letztendlich von der Anzahl der Geburten abhängt, unabhängig von der Anzahl der Todesfälle, so dass sie begannen, das künftige Bevölkerungswachstum auf der Grundlage der jährlichen Geburtenzahl pro 1 000 Personen zu berechnen. Als die auf dieser Methode basierenden Vorhersagen ungenaue Ergebnisse erbrachten, erkannten die Statistiker, dass in das Bevölkerungswachstum weitere Faktoren hineinspielen. Da die Anzahl der möglichen Geburten eher von der Anzahl der Frauen als von derjenigen der Gesamtbevölkerung abhängt und weil Frauen nur während eines bestimmten Lebensabschnitts Kinder bekommen können, nimmt man nun die Anzahl der Lebendgeburten pro 1 000 Frauen im gebärfähigen Alter als Datenbasis, um die zukünftige Größe der Bevölkerung zu berechnen. Der Voraussagewert dieser Datenbasis kann durch die Kombination mit anderen Daten über den Prozentsatz der Frauen, die kinderlos bleiben, weiter erhöht werden. Die Mehrzahl der Geburten gegenüber den Todesfällen ist deshalb nur als Hinweis auf das grobe Bevölkerungswachstum über eine bestimmte Zeitspanne in der Vergangenheit von Bedeutung; die Anzahl der Geburten pro 1 000 Personen ist nur als Ausdruck des Wachstumsverhältnisses während einer ähnlichen Zeitspanne bedeutsam; schließlich hat die Anzahl der Lebendgeburten pro 1 000 Frauen im gebärfähigen Alter Bedeutung für die Vorhersage der zukünftigen Größe der Bevölkerung.

3

Tabellierung und Darstellung von Daten

Die gesammelten Daten müssen angemessen geordnet, tabelliert und dargestellt werden, um eine klare Analyse und aussagekräftige Interpretation zu ermöglichen. Um beispielsweise die Verteilung der bei einer Prüfung erzielten Punkte in einer Klasse von 30 Schülern zu untersuchen und zu interpretieren, werden die Punkte zunächst in aufsteigender Folge angeordnet: 30, 35, 43, 52, 61, 65, 65, 65, 68, 70, 72, 72, 73, 75, 75, 76, 77, 78, 78, 80, 83, 85, 88, 88, 90, 91, 96, 97, 100, 100. Diese Folge zeigt auf einen Blick, dass das Maximum 100, das Minimum 30 und die Spannweite oder Differenz zwischen Maximum und Minimum 70 beträgt.

In der Verteilungsfunktion, wie sie in Abbildung 1 dargestellt ist, werden die Punktzahlen auf der waagerechten Achse aufgetragen und auf der senkrechten Achse die Zahl der Schüler als Summenzahl und in Prozent. Jeder eingetragene Punkt zeigt nun die Zahl der Schüler an, die eine bestimmte Punktzahl oder weniger erhalten haben. Der Punkt A etwa entspricht der zweiten 72; an der senkrechten Achse ist ablesbar, dass zwölf Schüler oder 40 Prozent der Schüler 72 Punkte oder weniger erreicht haben.

Wertet man die Punkte aus, die von zehn Klassen zu je 30 Schülern in je vier Prüfungen erzielt wurden, das sind insgesamt 1 200 Zahlen, so ist die Datenmenge zu groß, um wie in Abbildung 1 zweckmäßig dargestellt zu werden. Der Statistiker teilt daher die Daten in Gruppen oder Klassen ein. Beispielsweise könnten die 1 200 Zahlen auf zehn Intervalle verteilt werden, so wie in Spalte (a) der nebenstehenden Tabelle der Häufigkeitsverteilung. Die Anzahl der Punkte in einem Intervall, Klassenhäufigkeit genannt, ist in Spalte (c) eingetragen. Die Zahlen, die die Breite des Intervalls bestimmen, heißen die Grenzen des Intervalls. Es ist praktisch, die Intervallgrenzen so zu wählen, dass sie sich alle gleichen und die Intervallmittelpunkte einfache Zahlen sind. Die Punktezahl 87 findet sich im Intervall von 80 bis 90. Ein Grenzpunkt wie 90 kann durch alle Gruppen hindurch einheitlich entweder den unteren oder den oberen Intervallen zugeteilt werden. Die relative Häufigkeit, Spalte (d), ist das Verhältnis der Häufigkeit eines Intervalls zur Gesamtzahl. Die Summenhäufigkeit, Spalte (e), stellt die Anzahl der Schüler dar, die eine Punktezahl erzielt haben, die kleiner oder gleich dem Wertebereich des Intervalls ist. So erhält man die Anzahl der Schüler, die höchstens 30 Punkte haben, durch Addition der Zahlen in Spalte (c) für die ersten drei Intervalle, deren Summe 53 beträgt. Die relative Summenhäufigkeit, Spalte (f), ist das Verhältnis der Summenhäufigkeit zur Gesamtpunktezahl.

Die Daten dieser Tabelle der Häufigkeitsverteilung können nun graphisch in einem Histogramm der Verteilung wie in Abbildung 2 veranschaulicht werden oder wie in Abbildung 3 in einer Verteilungsfunktion oder Summenhäufigkeitsverteilung. Das Histogramm besteht aus einer Reihe von Säulen oder Balken, deren Grundseiten gleich den Intervallbreiten und deren Höhen und Flächeninhalte proportional zu den Häufigkeiten sind. Das Polygon in Abbildung 3 ist durch Verbinden der Intervallmitte eines Summenhäufigkeitshistogramms durch gerade Linien entstanden.

4

Mittelwerte

Eine einfach zu berechnende und oft gebrauchte statistische Größe ist der Mittelwert.

Es seien x1, x2, ..., xn die Zahlen einer statistischen Erhebung. Das so genannte arithmetische Mittel  ist gleich der Summe der Werte dividiert durch n:

Mit dem Symbol Σ für Sigma wird die Summe aller Werte bezeichnet.

Median- und Modalwert sind zwei weitere Mittelwerte. Sind die x-Werte numerisch angeordnet und n ungerade, so ist der Medianwert der Wert, der in der Reihe in der Mitte steht. Ist n gerade, so ist er das arithmetische Mittel der mittleren beiden x. Der Modalwert ist dasjenige x, das am häufigsten vorkommt. Kommen zwei oder mehr verschiedene x gleich häufig vor, doch keines öfter, so kann man sagen, dass die Menge der x keinen Modalwert besitze oder dass sie bimodal mit Modalwerten an den beiden häufigsten x sei oder trimodal mit Modalwerten an den drei häufigsten x.

Zurück
|
Nächste
In diesem Artikel suchen
Druckerfreundliche Version der Seite
Versenden




© 2008 Microsoft