Schiefe (Statistik)
Die Schiefe (englischer Fachausdruck: Skewness bzw. Skew) ist eine statistische Kennzahl die die Art und Stärke der Asymmetrie einer Wahrscheinlichkeitsverteilung beschreibt. Sie zeigt an, ob und wie stark die Verteilung nach rechts (positive Schiefe) oder nach links (negative Schiefe) geneigt ist. Jede nicht >symmetrische Verteilung heißt schief.
Definition
![]() |
![]() |
Die Schiefe
einer Zufallsvariablen
ist das zentrale
Moment 3. Ordnung µ3(X) (falls das Moment 3. Ordnung
existiert), normiert auf die Standardabweichung
:
.
mit dem Erwartungswert
.
Mit den Kumulanten
ergibt sich die Darstellung
.
Die Schiefe kann jeden reellen Wert annehmen.
- Bei negativer Schiefe,
, spricht man von einer linksschiefen oder rechtssteilen Verteilung; sie fällt in typischen Fällen auf der linken Seite flacher ab als auf der rechten.
- Bei positiver Schiefe,
, spricht man von einer rechtsschiefen oder linkssteilen Verteilung; sie fällt typischerweise umgekehrt auf der rechten Seite flacher ab als auf der linken.
Typische Vertreter rechtsschiefer Verteilungen sind die
Bernoulli-Verteilung
für ,
die Exponentialverteilung
und die Pareto-Verteilung
für
.
Die Schiefe ist invariant unter linearer Transformation mit :
Für die Summe unabhängiger normierter Zufallsgrößen
gilt:
,
d.h. die Schiefe der Summe unabhängiger identisch verteiler Zufallsgrößen ist
die ursprüngliche Schiefe, dividiert durch .
Empirische Schiefe
Zur Berechnung der Schiefe einer empirischen Häufigkeitsverteilung wird die folgende Formel benutzt:
Damit die Schiefe unabhängig von der Maßeinheit der Variablen ist, werden die
Messwerte mit Hilfe des arithmetischen Mittelwertes
und der Standardabweichung
der Beobachtungswerte
standardisiert. Durch die Standardisierung gilt
und
.
Schätzung der Schiefe einer Grundgesamtheit
Zur Schätzung der unbekannten Schiefe
einer Grundgesamtheit mittels Stichprobendaten
(
der Stichprobenumfang) müssen der Erwartungswert und die Varianz aus der
Stichprobe geschätzt werden, d.h. die theoretischen durch die empirischen
Momente ersetzt werden:
mit
der Stichprobenmittelwert und
die Stichprobenstandardabweichung. Dieser Schätzer ist jedoch nicht erwartungstreu im
Gegensatz zu
.
Weitere Schiefemaße
Lage von Mittelwert und Median
Auf Karl Pearson geht die Definition
mit dem Erwartungswert
µ, dem Median
und der Standardabweichung
σ zurück. Der Wertebereich
von S ist das Intervall [-1,1]. Für symmetrische Verteilungen ist S = 0.
Rechtsschiefe Verteilungen besitzen häufig ein positives S, es gibt jedoch
Ausnahmen von dieser Faustregel.
Wenn die Standardabweichung divergiert, kann die Pearsonsche Definition
verallgemeinert werden, indem ein Verteilung rechtsschief bezeichnet wird, wenn
der Median kleiner als der Erwartungswert ist. In diesem Sinn ist die
Pareto-Verteilung für beliebigen Parameter
rechtsschief.
Quantilskoeffizient der Schiefe
Der Quantilskoeffizient der Schiefe beschreibt die normierte Differenz
zwischen der Entfernung des
und des
-Quantils
zum Median. Er wird also wie folgt berechnet:
,
Dabei kann der Quantilskoeffizient Werte zwischen -1 und 1 annehmen. Der Quantilskoeffizient existiert für beliebige Verteilungen, auch wenn Erwartungswert oder die Standardabweichung nicht definiert sein sollten.
Eine symmetrische Verteilung besitzt den Quantilskoeffizienten 0; eine
rechtsschiefe (linksschiefe) Verteilung besitzt in der Regel einen positiven
(negativen) Quantilskoeffizienten. Für
ergibt sich der Quartilskoeffizient. Die Pareto-Verteilung besitzt für beliebige
Parameter
positive Quantilskoeffizienten.
Deutung

Ist ,
so ist die Verteilung rechtsschief, ist
,
ist die Verteilung linksschief. Bei rechtsschiefen Verteilungen sind
Werte, die kleiner sind als der Mittelwert, häufiger zu beobachten, so dass sich
der Gipfel (Modus)
links vom Mittelwert befindet; der rechte Teil des Graphs ist flacher als der
linke. Gilt
,
so ist die Verteilung auf beiden Seiten ausgeglichen. Bei symmetrischen
Verteilungen ist immer
.
Umgekehrt müssen Verteilungen mit
nicht symmetrisch sein.
Als Daumenregeln kann man also festhalten:
- rechtsschief:
- symmetrisch:
- linksschief:
Die Schiefe ist ein Maß für die Asymmetrie einer Wahrscheinlichkeitsverteilung. Da die Gaußsche Normalverteilung symmetrisch ist, d.h. eine Schiefe von null besitzt, ist die Schiefe eine mögliche Maßzahl, um eine Verteilung mit der Normalverteilung zu vergleichen.
Interpretation der Schiefe
Rechtsschiefe Verteilungen findet man z.B. häufig beim Pro-Kopf-Einkommen. Hier gibt es einige wenige Personen mit extrem hohem Einkommen und sehr viele Personen mit eher niedrigem Einkommen. Durch die 3. Potenz erhalten die wenigen sehr extremen Werte ein hohes Gewicht und es entsteht ein Schiefemaß mit positivem Vorzeichen. Es gibt verschiedene Formeln, um die Schiefe zu berechnen. Die gängigen Statistikpakete wie SPSS, SYSTAT, Stata etc. nutzen besonders im Falle einer kleinen Fallzahl von obiger, momentbasierter Berechnungsvorschrift abweichende Formeln.
Siehe auch



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 08.09. 2022