Statistisches Modell
Ein statistisches Modell, manchmal auch statistischer Raum genannt, ist ein Begriff aus der mathematischen Statistik, dem Teilbereich der Statistik, der sich der Methoden der Stochastik und Wahrscheinlichkeitstheorie bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchen Mengen von Werten soll eine Wahrscheinlichkeit zugeordnet werden und welche Wahrscheinlichkeitsmaße sind möglich beziehungsweise sollen in Betracht gezogen werden?
Definition
Ein statistisches Modell
ist ein Tripel
bestehend aus
- einer Grundmenge
, die alle möglichen Ergebnisse des Experiments enthält,
- einer σ-Algebra
auf der Grundmenge
und
- einer Menge
von Wahrscheinlichkeitsmaßen auf
Oftmals ist es handlicher, die Menge von Wahrscheinlichkeitsmaßen als Familie
(mit beliebiger Indexmenge) zu notieren, um auf ausgewiesene Elemente leichter
zugreifen zu können. Die Menge von Wahrscheinlichkeitsmaßen wird dann auch mit
notiert. Dies bedeutet nicht zwangsläufig, dass es sich um ein parametrisches
Modell handelt.
Alternative Definitionen
Es existieren mehrere alternative Definitionen eines statistischen Modells, die sich in ihrer Detailliertheit unterscheiden.
Einerseits findet sich die Beschreibung eines statistischen Modells als eine
Zufallsvariable ,
die Werte in dem Messraum
annimmt entsprechend den Verteilungen aus
.
Der zugrunde liegende Wahrscheinlichkeitsraum der Zufallsvariable wird nicht
näher präzisiert, da er für die Verteilungen nicht relevant ist. Diese
Beschreibung macht im Gegensatz zur obigen Beschreibung klarer, dass die
Stichproben, also die Elemente aus
,
als Realisation einer Zufallsvariable mit unbekannter Verteilung zu sehen sind.
Die Menge
heißt dann auch Stichprobenraum.
Andererseits findet sich auch die Beschreibung eines statistischen Modells
lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen .
Der entsprechende Grundraum ergibt sich dann implizit aus den definierten
Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die
kanonische Wahl (Potenzmenge im diskreten Fall, Borelsche
σ-Algebra sonst).
Klassifikation statistischer Modelle
Parametrische und nichtparametrische Modelle
Lässt sich die Menge von Wahrscheinlichkeitsmaßen über eine Parametermenge, auch Parameterraum genannt, beschreiben, ist also
für eine Parametermenge ,
so spricht man von einem parametrischen Modell, ansonsten von einem
nichtparametrischen Modell. Ist
,
so spricht man von einem einparametrigen Modell.
Diskrete Modelle
Ist
endlich oder abzählbar
unendlich und ist
die Potenzmenge, so spricht man
von einem diskreten Modell. Die Wahrscheinlichkeitsmaße lassen sich dann
durch Wahrscheinlichkeitsfunktionen
beschreiben.
Stetige Modelle
Ist
eine Borel-Menge
des
und ist
die Einschränkung der Borelschen
σ-Algebra auf diese Menge, also
und besitzt jedes der Wahrscheinlichkeitsmaße in
eine Wahrscheinlichkeitsdichte,
so spricht man von einem stetigen Modell.
Standardmodelle
Handelt es sich um ein stetiges Modell oder um ein diskretes Modell, so spricht man von einem Standardmodell. Bei Standardmodellen existiert also insbesondere eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsfunktion. Manche Autoren nennen diese Modelle auch reguläre Modelle.
Reguläre Modelle
Reguläre statistische Modelle sind einparametrige Standardmodelle, bei denen noch Anforderungen an die Existenz von Ableitungen der Dichtefunktion gestellt werden. Sie werden zur Formulierung der Cramér-Rao-Ungleichung benötigt.
Lokations- und Skalenmodelle
Statistische Modelle, deren Verteilungsklasse eine Lokationsklasse ist, also durch Verschiebung einer einzigen Wahrscheinlichkeitsverteilung entstehen, werden Lokationsmodelle genannt, ebenso werden statistische Modelle mit Skalenfamilien Skalenmodell genannt.
Produktmodelle
Produktmodelle entstehen, wenn man das mehrmalige Produkt eines statistisches Modell mit sich selbst bildet. Sie formalisieren die Vorstellung, dass man einen Versuch mehrmals hintereinander ausführt und die Ergebnisse der Einzelversuche sich nicht Gegenseitig beeinflussen. Viele der gängigen Modelle wie das Normalverteilungsmodell sind Produktmodelle.
Beispiele
Ein Beispiel für ein statistisches Modell ist der Grundraum
versehen mit der σ-Algebra
und als Menge der Wahrscheinlichkeitsmaße die Menge
aller Binomialverteilungen
mit Parametern 100 und .
Dieses statistische Modell könnte man beispielsweise wählen, wenn man eine Münze
100 mal wirft und die Anzahl der Erfolge zählt. Diese ist binomialverteilt, aber
zu einem unbekannten Parameter, da nicht klar ist, ob die Münze gefälscht ist
oder nicht. Es handelt sich bei diesem Modell um ein einparametriges Modell, da
ist. Außerdem ist es ein diskretes Modell, da die Grundmenge endlich ist und die
σ-Algebra durch die Potenzmenge definiert wird. Damit ist es auch automatisch
ein Standardmodell. Die Menge von Wahrscheinlichkeitsmaßen
,
ergibt hingegen ein nichtparametrisches Modell.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 25.03. 2021