Marktforschung-Online.eu

Informationen zu Markforschung und Datenanalyse

  • Full Screen
  • Wide Screen
  • Narrow Screen
  • Increase font size
  • Default font size
  • Decrease font size
 

Suchen

Faktorenanalysen - Einführung in die Faktorenanalyse

E-Mail Drucken PDF

Bei der Faktorenanalyse werden Daten entweder verdichtet (explorative Faktorenanalyse) oder eine vermutete Verdichtung wird überprüft (konfirmatorische Faktorenanalyse). Das Verfahren dient dazu, viele einzelne Merkmale möglichst informationsverlustfrei zu möglichst wenigen Faktoren zusammenzufassen. Zum Beispiel könnten aus 100 verschiedenen Merkmalen eines Autos, fünf Faktoren ermittelt werden, welche annähernd die gleichen Informationen erhalten. Ein banales Beispiel wäre z.B. die Extraktion des Faktors Verbrauch aus den drei Merkmalen l/100km auf Landstraßen/im Stadtverkehr/im Drittelmix.

Die Faktorenanalyse ist ein Verfahren der Repräsentation. Das Ziel besteht darin, die Struktur des Zusammenhangs zwischen mehreren Variablen zu untersuchen. Aus den beobachteten Beziehungen zwischen allen Merkmalen werden hypothetische Größen (sogenannte Faktoren) extrahiert, welche die beobachteten Zusammenhänge beschreiben. Hierzu werden mittels verschiedener Extraktionsmethoden (z.B. Hauptkomponentenanalyse) einige wenige Faktoren extrahiert, die eine größere Menge von Variablen mit möglichst wenig Informationsverlust zusammenfassen (-> Datenreduktion).

Man kann je nach Zielsetzung zwischen einer

  1. explorativen Faktorenanalyse und einer
  2. konfirmatorischen Faktorenanalyse

unterscheiden. Während bei einer konfirmatorischen Faktorenanalyse eine Struktur überprüft wird (z.B. Überprüfung einer Skala), handelt es sich bei der explorativen Faktorenanalyse um ein strukturaufdeckendes Verfahren.

Voraussetzungen der Faktorenanalyse:

  1. Alle Variablen sind mindestens intervallskaliert
  2. Vorwissen über den Inhalt der beteiligten Merkmale notwendig
  3. Die sich ergebenden Faktoren müssen sich hinsichtlich ihrer Ladungen hinreichend voneinander abgrenzen lassen

Vorgehensweise bei einer Faktorenanalyse:

  1. Wahl der Extraktionsmethode
  2. Faktorenextraktion (z.B. Hauptkomponentenanalyse, ML-Schätzung)
  3. Festlegung der Anzahl der extrahierten Faktoren (z.B. Kaiserkriterium, Ellbow-Kriterium)
  4. gegebenenfalls Rotation der sich ergebenden Faktorladungen zur Erleichterung der Interpretation
  5. Inhaltliche Auswertung

Hauptmethoden zur Festlegung der Anzahl der extrahierten Faktoren:

  1. Kaiserkriterium: Alle Faktoren mit Eigenwerten (hoher Eigenwert=hoher Anteil der Varianz wird durch diesen Faktor erklärt) größer 1 werden extrahiert
  2. Ellbow-Kriterium: Darstellung der Eigenwerte nach abfallendem Eigenwert in einem Scree-Plot. Im Allgemeinen ergibt sich in der Grafik ein "Knickstelle". Die nachfolgenden Faktoren erklären nur noch einen geringen Teil der Gesamtvarianz

Wesentliche Begriffe:

  • Faktor: Latente Variable, welche im Rahmen der Faktorenanalyse erzeugt wird. Zugleich eine Dimension im sich ergebenden Faktorraum.
  • Faktorladung: Die Korrelation einer Ausgangsvariable mit einem der sich ergebenden Faktoren. Eine Faktorladung von 0 bedeutet, dass die beiden Variablen stochastisch unabhängig voneinander sind, ansonsten bestehen je nach Faktorladung positive oder negative Korrelationen.
  • Eigenwert: Durch einen Faktor erklärte Gesamtvarianz der gesamten Ausgangsdaten. Wenn ein Faktor einen relativ zu den anderen Faktoren hohen Eigenwert aufweist, dann erklärt der Faktor einen hohen Teil der Ausgangsdaten.
  • Kommunalität: Die Summe der quadrierten Faktorladungen einer Variablen. Die Kommunalität gibt an, wie gut eine einzelne Ausgangsvariable durch alle Faktoren erklärt wird. Daher wird ein Merkmal mit geringer Kommunalität insgesamt schlecht abgebildet. Eine geringe Kommunalität kann darauf hindeuten, dass dieses Merkmal inhaltlich wenig mit den anderen Merkmalen zusammenhängt.

Anwendungsbeispiel:

Die Pizzeria Cagliari aus Hamburg möchte überprüfen, wie die Kunden die ihre Pizza beurteilen. Vorab überlegt sich Manni Marktforscher, dass wohl die Knusprigkeit des Bodens, der Anteil an frischem Gemüse, der Kaloriengehalt, die Üppigkeit des Käsebelags und die allgemeine Qualität der Zutaten relevant sein sollten. Manni vermutet, dass sich die Daten verdichten lassen auf einige latente Variablen, welche sich hinter den erhobenen Merkmalen verstecken. Hierzu führt er im Anschluss an die Datensammlung eine explorative Faktorenanalyse durch. Er entscheidet sich für eine Hauptkomponentenanalyse. Als er die Eigenwerte der sich ergebenden Faktoren betrachtet, erkennt er sofort, dass zwei Faktoren einen Eigenwert größer als eins aufweisen und auch im Scree-Plot sieht er sofort den Knick bei dem zweiten Faktor. Er entscheidet sich dazu, zwei Faktoren zu extrahieren. Da die Faktorladungen schwer zu interpretieren sind, führt Manni Marktforscher anschließend noch ein Faktor-Rotation durch. Nach der Rotation zeigt sich, dass auf dem ersten Faktor vor allem die Merkmale Knusprigkeit, Qualität der Zutaten und auf dem zweiten Faktor die Merkmale Gemüseanteil und Kaloriengehalt (mit negativer Faktorladung) laden. Das Merkmal Üppigkeit des Käsebelags lädt positiv auf dem ersten Faktor und negativ auf dem Zweiten. Manni überlegt, was die jeweils auf dem Faktor ladenden Merkmale repräsentieren könnten. Er kommt zu dem Schluss, dass es sich bei dem ersten Faktor wahrscheinlich um den Geschmackseindruck und bei dem Zweiten um den Gesundheitsaspekt handelt. Der Kaloriengehalt und die Üppigkeit des Käsebelags weisen eine negative Faktorladung auf, weil sie negativ mit dem Gesundheitsaspekt korrelieren. Die Faktorladungen des Käsebelags erklären sich durch den positiven Effekt auf den Geschmack und den negativen auf die Gesundheit. Die Kommunalitäten sind alle sehr hoch und der durch die beiden Faktoren korrelieren nur leicht miteinander, insgesamt erklären die Faktoren noch einen sehr hohen Anteil der ursprünglichen Varianz. Manni Marktforscher entschließt sich dazu die Daten zu verdichten und den sich ergebenden 2-dimensionalen Faktorraum und die Positionen der einzelnen Pizzen zu betrachten, denn nun kann er die einzelnen Pizzen grafisch im 2-dimensionalen Faktorraum darstellen...

Weiterführende Literatur zur Faktorenanalyse:

You are here: Start