Kategoriale Variable

In der Statistik bezeichnet man als kategoriale Variablen folgende Arten von Variablen:

Kategorische Variablen in der Regressionsanalyse

Da kategorische Variablen qualitative Aussagen über Daten tätigen und keine quantativen, müssen sie zuerst in quantitative Daten umgewandelt werden, damit man sie in der Regressionsanalyse verwenden kann. Dies geschieht durch eine geeignete Kodierung. Üblicherweise verwendet man eine der drei Kodierungen: Dummykodierung, Effektkodierung und Kontrastkodierung.

Beispiel: Die nominalskalierte Variable G enthält Informationen zum höchsten akademischen Grad einer Person (Kein, Bachelor, Master, Doktorgrad).

Dummykodierung

Eine Dummykodierung wird dann genützt, wenn man von einer Kontrollgruppe (auch Basislinie) ausgeht. Dafür werden drei binäre Variable {\displaystyle A1,A2,A3} eingeführt. Da die meisten Menschen über keinen akademischen Abschluss verfügen, macht es Sinn, diese als Kontrollgruppe zu verwenden. Man erhält somit folgende Kodierung:

Akademischer Grad A1 A2 A3
Kein 0 0 0
Bachelor 1 0 0
Master 0 1 0
Doktorgrad 0 0 1

Effektkodierung

In der Effektkodierung hat man keine Kontrollgruppe wie in der Dummykodierung. Es werden drei binäre Variable {\displaystyle A1,A2,A3} eingeführt. Die Gruppe ohne akademischen Abschluss wird mit -1 (statt {\displaystyle 0} wie in der Dummykodierung) kodiert:

Akademischer Grad A1 A2 A3
Kein −1 −1 −1
Bachelor 1 0 0
Master 0 1 0
Doktorgrad 0 0 1

Siehe auch

Literatur

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 08.04. 2021