Bestimmtheitsmaß • Berechnung und Interpretation (2024)

Video anzeigen

Hier geht's zum Video „Regressionsanalyse“Hier geht's zum Video „Abhängige und unabhängige Variable“Hier geht's zum Video „Varianz“

In diesem Artikel erfährst du alles Wichtige zum Bestimmtheitsmaß R². Wir erklären dir, was das Bestimmtheitsmaß ist, wie du es berechnest und was du bei der Interpretation beachten musst.

Du möchtest das Thema noch schneller abhaken? Dann sieh dir unser Video an und lerne dort ganz entspannt alles, was du wissen musst!

Inhaltsübersicht

Bestimmtheitsmaß R² einfach erklärt

im Videozur Stelle im Video springen

(00:19)

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (1)(auch: Determinationskoeffizient, R squared) ist eine Kennzahl der Regressionsanalyse. Sie gibt dir Auskunft darüber, wie gut du die abhängige Variable mit den betrachteten unabhängigen Variablen vorhersagen kannst. In der Fachsprache sagt man, es gibt an, welchen Anteil der Varianz der abhängigen Variable durch die unabhängige(n) Variable(n) „aufgeklärt“ wird. Das Bestimmtheitsmaß kann Werte zwischen 0 und 1 annehmen. Prinzipiell stehen dabei höhere Werte für eine bessere Vorhersage der abhängigen Variable.

Wie hoch es sein soll, hängt dabei allerdings von den betrachteten Variablen und dem untersuchten Thema ab. Tendenziell überschätzt das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (2) zudem leicht den Anteil der aufgeklärten Varianz. Deshalb verwendet man das adjustierte Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (3), wenn man Aussagen aus einer Stichprobe auf die Grundgesamtheit übertragen möchte.

Bestimmtheitsmaß Herleitung

im Videozur Stelle im Video springen

(00:58)

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (4) zeigt den Anteil der aufgeklärten Varianz an der Gesamtvarianz der abhängigen Variable (AV).

Bestimmtheitsmaß • Berechnung und Interpretation (5)

Um diese Statistik zu verstehen, müssen wir uns also nochmal die Bedeutung der Varianz ins Gedächtnis rufen: Grob gesagt beschreibt die Varianz, wie stark sich die Messwerte in einer Stichprobe unterscheiden. Eine kleine Varianz sagt aus, dass sich die Messwerte alle sehr ähneln. Eine große Varianz heißt hingegen, dass die Werte sehr unterschiedlich sind und weit verstreut liegen.

Stell dir nun vor, du betrachtest in einer Untersuchung die erreichte Punktzahl in einer Matheprüfung. Vermutlich werden nicht alle Personen in der Prüfung die gleiche Punktzahl erreicht haben. Stattdessen werden einige werden besser, und andere schlechter abgeschnitten haben. Es gibt also Varianz in der erreichten Punktzahl.

Nun kann es verschiedene Gründe geben, warum Personen in der Prüfung mehr oder weniger Punkte erreicht haben. Beispielsweise könnte das Ausmaß der Vorbereitung einen Einfluss auf das Prüfungsergebnis haben. Ebenfalls könnte die Intelligenz oder das Vorwissen einer Person die Leistung beeinflussen. Und schließlich könnten Personen abgeschrieben, schlecht geschlafen oder vor der Prüfung sehr viel Kaffee getrunken haben, was ihre zusätzliche Punktzahl beeinflusst. All diese Gründe können dazu führen, dass Personen unterschiedliche Punktzahlen in der Prüfung erreichen.

In einerRegressionsanalyse wählst du nun einzelne dieser möglichen Gründe als unabhängige Variablen aus. Von diesen Variablen vermutest du, dass sie einen besonders starken Einfluss auf die abhängige Variable „Punkte in der Matheprüfung“ haben könnten.

Dein Ziel ist es, mit Hilfe der unabhängigen Variablen möglichst gut zu erklären, warum sich die Punktzahlen verschiedener Personen in der Prüfung unterscheiden. In der Fachsprache sagt man, du möchtest möglichst viel Varianz der abhängigen Variable durch die unabhängige Variable „aufklären“. Du untersuchst also zum Beispiel, wie viel der Unterschiedlichkeit der erreichten Punktzahlen dadurch erklärt werden kann, dass Menschen unterschiedlich intelligent sind.

Bestimmtheitsmaß Berechnung

im Videozur Stelle im Video springen

(03:27)

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (6) ist nun eine Kennzahl, die dir genau das verrät. Es gibt an, welcher Anteil der Varianz der Punktzahl (also der abhängigen Variablen) durch die Intelligenz (die unabhängige Variable) erklärt werden kann.

Um es zu berechnen, kannst du diese Formel verwenden:

Bestimmtheitsmaß: Formel 1

Bestimmtheitsmaß • Berechnung und Interpretation (7)

Bestimmtheitsmaß • Berechnung und Interpretation (8) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (9) – Aufgeklärte Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (10) – Totale Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (11) – Vorhergesagter Wert der Person Bestimmtheitsmaß • Berechnung und Interpretation (12) auf der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (13) – Mittelwert der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (14) – Beobachteter Wert von Person Bestimmtheitsmaß • Berechnung und Interpretation (15) auf der abhängigen Variable

Du teilst also die aufgeklärte Varianz durch die gesamte Varianz der abhängigen Variable. Damit erhältst du, welcher Anteil an der Gesamtvarianz durch die unabhängigen Variablen aufgeklärt werden konnte.

Alternativ kannst du Bestimmtheitsmaß • Berechnung und Interpretation (16) auch über die nicht aufgeklärte Varianz berechnen:

Bestimmtheitsmaß: Formel 2

Bestimmtheitsmaß • Berechnung und Interpretation (17)

Bestimmtheitsmaß • Berechnung und Interpretation (18) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (19) – Nicht aufgeklärte Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (20) – Totale Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (21) – Vorhergesagter Wert der Person Bestimmtheitsmaß • Berechnung und Interpretation (22) auf der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (23) – Mittelwert der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (24) – Beobachteter Wert von Person Bestimmtheitsmaß • Berechnung und Interpretation (25) auf der abhängigen Variable

Bei diesem Rechenweg ziehst du den Anteil der Varianz, der nicht aufgeklärt wurde, von 1 ab. Da sich die Anteile von aufgeklärter und nicht aufgeklärter Varianz zu 1 ergänzen, erhältst du auch über diesen Weg das Ergebnis für Bestimmtheitsmaß • Berechnung und Interpretation (26).

Beide Formeln liefern also das gleiche Ergebnis. Welchen Weg du zur Berechnung wählst, hängt meist einfach davon ab, welche Angaben du in der Aufgabe gegeben hast. Bei der einfachen linearen Regression kannst du das Bestimmtheitsmaß sogar noch einfacher berechnen: Hier erhältst du es, in dem du einfach den Korrelationskoeffizienten Bestimmtheitsmaß • Berechnung und Interpretation (27) quadrierst.

Um das Konzept des Bestimmtheitsmaß möglichst einfach zu verdeutlichen, haben wir in diesem Beitrag ein Beispiel gewählt, das einen kausalen Zusammenhang zwischen unabhängiger und abhängiger Variable nahe legt („Eine Person ist besser in der Prüfung, weil sie intelligenter ist“). Bitte beachte aber, dass du im Zuge einer Regressionsanalyse nicht einfach von einer Korrelation auf Kausalität schließen darfst! Ob das möglich ist, hängt immer von deinem gewählten Untersuchungsdesign (z.B. Experiment) ab.

Bestimmtheitsmaß Interpretation

Da das Bestimmtheitsmaß einen Anteil von etwas ausdrückt, kann es Werte zwischen 0 und 1 annehmen. Größere Werte stehen hierbei für mehr aufgeklärte Varianz und somit für eine bessere Vorhersage der abhängigen Variable.

Zwar spricht ein hohes Bestimmtheitsmaß für einen starken Zusammenhang zwischen unabhängiger und abhängiger Variable, das bedeutet jedoch im Umkehrschluss nicht, dass gar kein Zusammenhang besteht, wenn Bestimmtheitsmaß • Berechnung und Interpretation (28) nahe oder gleich 0 ist. Das liegt daran, dass Bestimmtheitsmaß • Berechnung und Interpretation (29) nur geeignet ist, um lineare Zusammenhänge abzubilden. Stehen deine Variablen also zum Beispiel in einem quadratischen oder exponentiellen Verhältnis zueinander, wird Bestimmtheitsmaß • Berechnung und Interpretation (30) quasi 0 sein, obwohl die Variablen systematisch zusammenhängen. Um solche Fälle zu erkennen, hilft es sich Diagramme deiner Daten anzusehen.

Generell kannst du das Bestimmtheitsmaß aber so interpretieren: Nehmen wir an, du erhältst ein Bestimmtheitsmaß von Bestimmtheitsmaß • Berechnung und Interpretation (31). Das bedeutet, dass 30 % der Varianz der abhängigen Variablen durch die unabhängige(n) Variable(n) aufgeklärt werden konnten. 70 % der Unterschiedlichkeit der Messwerte geht hingegen auf Einflüsse zurück, die wir in unserer Untersuchung nicht betrachtet haben. Diese Varianz aufgrund von unbekannten Einflüssen bezeichnen wir pauschal als „Fehler-„ oder als „Residualvarianz“.

Wie hoch das Bestimmtheitsmaß mindestens sein soll, lässt sich nicht pauschal festlegen. Das hängt von verschiedenen Faktoren ab, beispielsweise in welchem Forschungsfeld du deine Untersuchung durchführst und wie viele unabhängige Variablen du gleichzeitig betrachtest. Wenn du dir unsicher bist, wie hoch Bestimmtheitsmaß • Berechnung und Interpretation (32) in einem konkreten Fall sein sollte, dann schlage am besten in anderen Untersuchungen zu deinem Thema nach.

Adjustiertes Bestimmtheitsmaß

Nun weißt du bereits, wie man das Bestimmtheitsmaß in einer Stichprobe berechnet und interpretiert. Allerdings fällt das Bestimmtheitsmaß durch zufällige Fehler in Stichproben meistens etwas zu hoch aus. Wie stark diese Überschätzung ist, ist dabei von der Stichprobengröße und der Anzahl der betrachteten Variablen abhängig. Das ist vor allem ein Problem, wenn du Ergebnisse aus der Stichprobe auf die Grundgesamtheit übertragen möchtest. Deshalb gibt es eine Formel, mit der du die Überschätzung von Bestimmtheitsmaß • Berechnung und Interpretation (33) korrigieren kannst. Die korrigierte Version des Bestimmtheitsmaßes wird adjustiertes Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (34) oder auch „adjusted squared multiple R“ genannt.
Du berechnest es so:

Adjustiertes Bestimmtheitsmaß: Formel

Bestimmtheitsmaß • Berechnung und Interpretation (35)

Bestimmtheitsmaß • Berechnung und Interpretation (36) – Adjustiertes Bestimmtheitsmaß
Bestimmtheitsmaß • Berechnung und Interpretation (37) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (38) – Stichprobengröße
Bestimmtheitsmaß • Berechnung und Interpretation (39) – Anzahl der unabhängigen Variablen

Residuen

im Videozum Video springen

Ein weiteres Wichtiges Thema der Regressionsanalyse sind die Residuen. Was Residuen sind und wie du sie berechnest, erfährst du in unserem Video dazu. Schau es dir unbedingt an damit du die Regressionsanalyse für deine nächste Prüfung verstehst!

zur Videoseite: Bestimmtheitsmaß

Beliebte Inhalte aus dem BereichInduktive Statistik

  • ResiduenDauer:02:22
  • Lineare RegressionDauer:04:20
  • Logistische RegressionDauer:04:19

zur Videoseite: Bestimmtheitsmaß

Weitere Inhalte:Induktive Statistik

Regressionsanalyse

RegressionDauer:05:19
RegressionsanalyseDauer:04:14
RegressionskoeffizientDauer:03:37
BestimmtheitsmaßDauer:04:28
ResiduenDauer:02:22
Lineare RegressionDauer:04:20
Logistische RegressionDauer:04:19
Multiple RegressionDauer:03:41
MultikollinearitätDauer:04:50
HeteroskedastizitätDauer:04:12
Bestimmtheitsmaß • Berechnung und Interpretation (2024)

FAQs

Wie interpretiert man das Bestimmtheitsmaß? ›

Konkret ist das Bestimmtheitsmaß ein Index für die Qualität der Vorhersage der linearen Regression. Das Bestimmtheitsmaß liegt zwischen 0 und 1. Je näher es an 1 liegt, desto besser stimmt die lineare Regression mit den erhobenen Daten überein.

Was bedeutet ein hohes Bestimmtheitsmaß? ›

Ein hohes Bestimmtheitsmaß gebe an, dass die geschätzte Regressionslinie überall eine gute Approximation an die Daten darstellt; die pinken Daten legen auch hier etwas anderes nahe.

Was sagt der Determinationskoeffizient aus? ›

(auch: Determinationskoeffizient, R squared) ist eine Kennzahl der Regressionsanalyse . Sie gibt dir Auskunft darüber, wie gut du die abhängige Variable mit den betrachteten unabhängigen Variablen vorhersagen kannst.

Was ist ein gutes r2? ›

Ein R-Quadrat-Wert von 0,7 – 0,9 verdeutlicht eine hohe Korrelation zwischen den Daten, ein Wert von 0,4 – 0,699 zeigt ein mittelmäßiges Verhältnis und ein Wert unter 0,3 wird als unerhebliche Korrelation erachtet.

Ist das Bestimmtheitsmaß der Korrelationskoeffizient? ›

Das Quadrat des Korrelationskoeffizienten r² nennt man Bestimmtheitsmaß (= Determinationskoeffizient). Es gibt in erster Näherung an, wie viel % der Varianz durch die untersuchte Beziehung erklärt werden. Beispiel: Bei r = 0,3 bzw. 0,8 werden 9% bzw.

Was ist ein guter r Wert Statistik? ›

Multipler Korrelationskoeffizient (R)

Der Korrelationskoeffizient kann Werte zwischen -1 und +1 annehmen, wobei ein Wert von +1 einen perfekten positiven Zusammenhang zwischen beiden Variablen beschreibt, während eine Korrelation von −1 einen perfekten negativen (inversen) Zusammenhang (Antikorrelation) beschreibt.

Kann das Bestimmtheitsmaß negativ sein? ›

Es besteht aus dem Wert des einfachen R², welcher mit einem "Strafterm" belegt wird. Daher nimmt das korrigierte R² in der Regel einen geringeren Wert als das einfache R² an und kann in manchen Fällen sogar negativ werden. Die "Strafe" steigt mit der Anzahl der unabhängigen Variablen.

Wann ist R2 signifikant? ›

Ist R² = 1, so liegen alle Beobachtungen genau auf der Regressionsgeraden. Zwischen X und Y besteht dann ein perfekter linearer Zusammenhang. Je kleiner R² ist, desto geringer ist der lineare Zusammenhang. Ein R² = 0 bedeutet, dass zwischen X und Y kein linearer Zusammenhang vorliegt.

Wann ist eine Regression gut? ›

Besitzt eine Regression ein R² nahe 1, bedeutet dies, dass die unabhängigen Variablen gut geeignet sind, die abhängige Variable vorherzusagen. Das Modell besitzt eine gute Anpassungsgüte ("good model fit").

Was bedeutet R2 bei Regression? ›

Was ist das R-Quadrat? Das R-Quadrat ist ein statistisches Maß dafür, wie dicht die Daten an der angepassten Regressionslinie liegen. Es wird auch als Determinationskoeffizient oder – bei der multiplen Regression – als multipler Determinationskoeffizient bezeichnet. Das R-Quadrat nimmt immer Werte von 0 bis 100 % an.

Was misst R2? ›

R2 misst, wie gut ein Regressionsmodell zu den tatsächlichen Daten passt. Mit anderen Worten, es ist eine Kennzahl für die Gesamtgenauigkeit des Modells. R im Quadrat ist auch bekannt als Bestimmtheitskoeffizient. In IBM® Cognos Analyticswird R2 zum Messen der Genauigkeit eines CHAID-Regressionsbaums verwendet.

Ist R2 gleich d? ›

Übrigens: Der Durchmesser d ist genau doppelt so lang, wie der Radius r (d = 2 · r).

Was sagt der R 2 Wert aus? ›

Das R² lässt sich leicht interpretieren als der Anteil der Varianz der abhängigen Variablen (erklärte Variable), der durch die unabhängigen Variablen (erklärende Variablen) erklärt werden kann. Das dahinterliegende Konzept ist die Varianzzerlegung (s. Teil 3: Die Varianzzerlegung).

Was sagt das korrigierte R Quadrat aus? ›

Das korrigierte R2 ist eine korrigierte Genauigkeitskennzahl (Modellgenauigkeit) für lineare Modelle. Es gibt den Prozentsatz der Varianz im Zielfeld an, die durch die Eingabe(n) erklärt wird.

References

Top Articles
Latest Posts
Article information

Author: Dr. Pierre Goyette

Last Updated:

Views: 6296

Rating: 5 / 5 (70 voted)

Reviews: 93% of readers found this page helpful

Author information

Name: Dr. Pierre Goyette

Birthday: 1998-01-29

Address: Apt. 611 3357 Yong Plain, West Audra, IL 70053

Phone: +5819954278378

Job: Construction Director

Hobby: Embroidery, Creative writing, Shopping, Driving, Stand-up comedy, Coffee roasting, Scrapbooking

Introduction: My name is Dr. Pierre Goyette, I am a enchanting, powerful, jolly, rich, graceful, colorful, zany person who loves writing and wants to share my knowledge and understanding with you.