Die Varianzanalyse ist ein klassisches uni- oder auch multivariates Verfahren, mit dem Mittelwerte verglichen werden können. Hierzu werden über sogenannte Faktoren Gruppen gebildet, welche auf Mittelwertunterschiede untersucht werden. Mit diesem Verfahren kann z.B. getestet werden, ob verschiedene Personengruppen wie Männer und Frauen (Faktor Geschlecht), alte und junge Personen (Faktor Alter) oder Kombinationen junge Männer (Faktor Geschlecht X Alter) eine Werbeaussage signifikant unterschiedlich hinsichtlich vorab erhobener Kriterien (z.B. der Informationsgehalt, Glaubwürdigkeit der Aussage, Gesamt-Appeal) beurteilen.
Das Ziel der Varianzanalyse (ANOVA: Analysis of Variance) besteht darin Gesetzmäßigkeiten in den Daten aufzudecken, indem die Varianz untersucht wird. Es handelt sich daher um ein mustererkennendes statistisches Verfahren. Die Varianzanalyse untersucht die Erwartungswerte zwischen verschiedenen Gruppen. Die Varianz wird hierbei zerlegt in die Innergruppen- und Zwischengruppenvarianz. Anschließend wird überprüft, ob die Varianz zwischen den Gruppen größer ist, als die Varianz in den Gruppen. Alternativ zur direkten Varianzzerlegung kann eine Varianzanalyse auch auf Basis des allgemeinen linearen Modells der Regressionsanalyse durchgeführt werden.
In diesem kurzen Video wird gut erklärt, was das Grundprinzip der Varianz-Analyse ist:
Bei einer Varianzanalyse wird untersucht, welche der folgenden beiden Hypothesen "zutrifft":
Nullhypothese: Alle Mittelwerte sind in den Gruppen identisch
Alternativhypothese: Mindestens ein Mittelwert ist unterschiedlich
Dies bedeutet, dass bei einer Varianzanalyse wird lediglich überprüft wird, ob generell signifikante Mittelwert-Unterschiede vorliegen. Im Anschluss muss deshalb noch ermittelt werden, um welche signifikanten Mittelwert-Unterschiede es sich im Einzelnen handelt. Um dies herauszufinden, werden die einzelnen Mittelwerte im Anschluss an die Varianzanalyse zusätzlich noch mit Post-hoc-Tests auf Unterschiede getestet.
Allgemeine Voraussetzungen der Varianzanalyse:
- Die abhängige Variable muss hierbei metrisches Datenniveau aufweisen, während es sich bei der oder den unabhängigen Variablen, welche auch als Faktor bezeichnet werden, um nominalskalierte Variablen handelt. Die unterschiedlichen Kategorien werden als Faktorstufen bezeichnet.
- Normalverteilung und Varianzhomogenität: Die Stichprobenvariablen müssen normalverteilt sein, bei gleichen Varianzen.
Arten von Varianzanalysen:
Die unterschiedlichen Verfahren können danach unterschieden werden, wie viele abhängige Variablen und verschiedene Faktoren varianzanalytisch untersucht werden.
- Ein Faktor und eine abhängige V.: Einfaktorielle univariate Varianzanalyse
- Mehrere Faktoren und eine abhängige V.: Mehrfaktorielle univariate Varianzanalyse
- Ein Faktor und mehrere abhängige V.: Einfaktorielle multivariate Varianzanlyse
- Mehrere Faktoren und mehrere abhängige V.: Mehrfaktorielle multivariate Varianzanalyse
Anwendungsbeispiel:
Die Pizzeria Cagliari aus Hamburg plant eine Werbekampagne mit Postwurfsendungen. Manni Marktforscher kommen sofort drei Werbebotschaften in den Sinn. Da er sich nicht so recht entscheiden kann, entschließt er sich dazu einen Werbemittel-Pretest zu machen. Als abhängige Zielvariable erhebt er die einfach die erfragte subjektive Bestellwahrscheinlichkeit in seiner Pizzeria im Anschluss an die Präsentation seiner jeweiligen Testanzeige. Den zu testenden Faktor in der Varianzanalyse stellt die jeweils verwendete Werbebotschaft dar, mit den Faktorstufen A,B,C für die verschiedenen Werbeaussagen. Er befragt für jede Werbeanzeige jeweils einige Personen. Manni Marktforscher denkt, dass für seine Zwecke 40 Personen je Experimentalgruppe, also insgesamt 120 Personen als Stichprobe ausreichend scheinen. Anschließend führt er eine einfaktorielle univariate Varianzanalyse durch, um zu überprüfen, ob die Mittelwerte für die Bestellwahrscheinlichkeit zwischen den Faktorstufen unterscheiden. Ergibt die Varianzanalyse einen signifikanten F-Wert, so muss die Nullhypothese (dass alle Mittelwerte gleich sind) verworfen werden. Mannis Anova ergibt einen signifikanten F-Wert, was darauf hindeutet, dass Mittelwertunterschiede zwischen den Faktorstufen vorhanden sind. Also führt er einen Post-Hoc-Mittelwertvergleich durch, um zu überprüfen, welche Werbeanzeigen sich hinsichtlich ihrer Wirkung auf die Bestellwahrscheinlichkeit unterscheiden. Er wählt in seiner SPSS-Software einfach mal den Scheffè-Test und dieser zeigt signifikante Mittelwertunterschiede zwischen den Werbeaussagen A und B und A und C. Als er die Mittelwerte anschaut, erkennt Manni Marktforscher, dass die Werbeaussage A höhere Kaufwahrscheinlichkeiten in der Stichprobe erreicht, während die Werbeaussagen B und C keinen signifikanten Wirkungsunterschied in der Stichprobe aufweisen. Er entscheidet sich für diese Werbeaussage und ist froh darüber, dass der Mittelwertunterschied in der passenden Richtung lag, denn ansonsten hätte er ja immer noch zwei Werbebotschaften übrig...
Haupteffekte und Wechselwirkungen:
Bei mehrfaktoriellen Varianzanalysen können zusätzlich zu den Haupteffekten die Wechselwirkungen (Interaktionen) zwischen mehreren Faktoren untersucht werden. Die Gruppen, welche die Wechselwirkung repräsentieren, ergeben sich durch die Kombination der Faktorstufen der beteiligten Faktoren.
Beispiel: Bei einer zweifaktoriellen Varianzanalyse werden die Faktoren Geschlecht und Werbeaussage (A/B) untersucht. Es ergeben sich daher zwei Haupteffekte. Hierbei handelt es sich um die Mittelwerte in den jeweils zwei untersuchten Gruppen. Bei der Wechselwirkung werden die Mittelwerte der sich ergebenden vier Gruppen untersucht. Im oben genannten Beispiel wäre es z.B. möglich, dass die Geschlechter unterschiedliche Werbebotschaften vorziehen, was eine signifikante Wechselwirkung zur Folge haben könnte.
Kovarianzanalysen:
Eine Kovariate ist eine metrische unabhängige Variable, welche vermutlich ebenfalls einen Einfluss auf die im Rahmen der Varianzanalyse untersuchte abhängige Variable hat. Wird diese in das varianz-analystische Modell aufgenommen, so spricht man von einer Kovarianzanalyse. Bei diesem Verfahren wird die abhängige Variable vorab statistisch um den Einfluss der Kovariate bereinigt.
Beispiel: Es wird die Wirkung eines blutdrucksenkenden Mittels getestet. Die beiden Faktorstufen sind die Gruppen mit und ohne Einnahme des Medikaments. Abhängige Variable ist der „Blutdruck nach 2 Wochen“. In diesem Fall ist es denkbar, dass der resultierende Blutdruck durch die Kovariate „Ausgangsniveau des Blutdrucks“ beeinflusst wird. Um dies überprüfen und berücksichtigen zu können wird diese Variable ebenfalls erhoben und im Rahmen einer Kovarianzanalyse in das Modell einbezogen.








