Ein häufiges Problem in der Marktforschung sind fehlende Werte bei einzelnen Datensätzen dar sowie die daraus resultierenden unvollständigen Datenmatrizen. Fehlenden Werte entstehen z.B. wenn Versuchspersonen Fragen übersehen oder diese bewusst nicht beantworten. Die Ursachen hierfür können vielfältig sein, so können z.B. die Versuchspersonen Fragen übersehen, die Auskunft aus verschiedenen Gründen verweigern, Probleme bei der Datenaufbereitung entstehen etc.
Sofern Daten fehlen, stellt sich die Frage nach den dahinterliegenden Ausfallmechanismen. Hierbei ist vor allem bedeutsam, ob die Daten zufällig fehlen oder ein Systematik dafür verantwortlich ist:
-
Systematisch fehlende Daten: z.B. nur Personen mit geringem Einkommen verweigern die Aussage -> dies kann evtl. zu erheblichen Ergebnisverzerrungen führen
-
Unsystematisch fehlende Daten: Ursache liegt in Einflussfaktoren auf die Untersuchungssituation, z.B. Unaufmerksamkeit der Auskunftspersonen.Hierbei lassen sich zwei Unterkategorien unterscheiden:
-
Fehlen ist unabhängig von den fehlenden Daten selbst, aber evtl. gibt es Zusammenhänge mit anderen Merkmalen.
-
Fehlen ist komplett unabhängig und es existieren keinerlei Beziehungen und Zusammenhänge die fehlenden Daten betreffend.
-
Sofern fehlende Daten auftreten, lassen sich Strukturanalysen durchführen. Es ist z.B. möglich nach Zusammenhängen zwischen den fehlenden Werten in der unvollständigen Datenmatrix zu suchen. Hierbei kommen prinzipiell mehrere explorative und induktive Verfahren infrage (Korrelationsmaße, insb. Phi-Koeffizient; χ2-Anpassungstest; t-Tests; Faktorenanalysen etc.).
Einen weiteren wichtigen Punkt stellt die praktische Behandlung fehlender Daten dar. Hierbei kommen prinzipiell drei Verfahrenstechniken in Frage:
- Eliminierungsverfahren: fehlenden Werte werden entweder objektweise komplett (complete-case-analysis) oder verfahrensspezifisch, d.h. sofern für die aktuell angestrebte Untersuchung fehlende Werte vorhanden sind (available-case-analysis) ausgeschlossen -> Informationsverlust; nur möglich, wenn komplett zufällig fehlend
- Imputationsverfahren: Ersetzung der fehlenden Daten durch Schätzwerte, wie Lageparameter, Zufallszahlen etc.
- Sonstige Verfahren: z.B. Verwendung spezieller statistischer Verfahren, welche fehlende Daten implizit berücksichtigen.








