Beschreibung des numerischen Verbesserung in Analysis ToolPak ANOVA-Tools in Excel

SPRACHE AUSWÄHLEN SPRACHE AUSWÄHLEN
Artikel-ID: 829215 - Produkte anzeigen, auf die sich dieser Artikel bezieht
Alles erweitern | Alles schließen

Auf dieser Seite

Zusammenfassung

Dieser Artikel beschreibt die numerische Verbesserungen in jedem der drei Analysis ToolPak ANOVA-Tools. Dieser Artikel beschreibt auch ungenaue Ergebnisse in Microsoft Excel 2002 und früheren Versionen von Excel in extremen Situationen.

Weitere Informationen

Viele Funktionen, die Berechnung der Summe der Abweichungen im Quadrat von einem Mittelwert erfordern. Genau dazu, Microsoft Office Excel 2003 oder höher Versionen von Excel verwenden eine zweistufige-Prozedur, die den Mittelwert beim ersten Durchgang findet und berechnet dann die quadrierten Abweichungen vom Mittelwert beim zweiten Durchgang.

In genauer Arithmetik tritt das gleiche Ergebnis in früheren Versionen von Excel, mit denen die "Rechenformel". Mit dieser Formel wird so genannt, da es weit verbreitet war, als Statistiker Rechner anstelle von Computern verwendet. Die Rechenformel frühere Versionen von Excel Summe der Quadrate der Beobachtungen und subtrahiert dann von dieser Summe die folgende Menge:
((sum of observations)^2) / number of observations
Diese Berechnung erfolgt in einem einzelnen Durchlauf durch die Daten.

In arithmetischen endlichen Genauigkeit unterliegt die Rechenformel Rundungsfehler Fehler in extremen Fällen. Excel 2002 und früheren Versionen von Excel verwenden Sie die Rechenformel für die meisten Funktionen, die eine Summe der Abweichungen im Quadrat von einem Mittelwert (z. B. Varianz, STABW, Steigung und PEARSON) erfordern. Diese Versionen von Excel verwenden jedoch auch das mehr numerisch stabile zweistufige Verfahren für KORREL und KOVAR SUMQUADABW-Funktionen.

Experten Statistikberechnungen wird empfohlen, dass Sie nicht die Rechenformel verwenden. Die Rechenformel wird als "nicht wie" in Texten zu Statistikberechnungen dargestellt. Alle drei der Analysis ToolPak (ATP) ANOVA-Tools machen weit verbreitete Nutzung von die Rechenformel oder eine entsprechende Einschritt-Ansatz jedoch in Excel 2002 und früheren Versionen von Excel.

Excel 2003 oder höher Excel-Versionen verwenden das zweistufige Verfahren für alle drei ANOVA ATP-Modelle. Dieser Artikel behandelt folgenden computational Verbesserungen in der ATP drei ANOVA-Modelle:
  • Einfaktorielle Varianzanalyse
  • Zwei Zweifaktorielle Varianzanalyse mit Messwiederholung
  • Zwei Zweifaktorielle Varianzanalyse ohne Messwiederholung
Dieser Artikel beschreibt diese Modelle später.

Da Excel das zweistufige Verfahren immer mit SUMQUADABW verwendet hat, nutzt dieser Artikel häufig es verbesserten Verfahren beschreiben. Diese überarbeiteten Verfahren entweder effektiv SUMQUADABW aufrufen oder Code, dessen Funktionalität SUMQUADABW Funktion identisch ist.

Für jede ANOVA-Tools ATP-Ausgabe enthält eine zusammenfassende Tabelle mit Werten von Anzahl, Summe, Durchschnitt und die Varianz und eine ANOVA-Tabelle, die verschiedene Quadratsummen und Werte der SS, df, hat MS, F und P-Wert. Ergebnisse in der Tabelle werden berechnet durch Aufrufen von Excel-Funktionen, Anzahl, Summe, Durchschnitt und VAR. Diese vier Funktionen unterliegt nur VAR Rundungsfehler Fehler.

Excel 2002 und früheren Versionen von Excel implementieren mit der Rechenformel VAR. Der folgende Artikel über Varianz beschreibt die Verbesserungen, die in aufgetreten ist Excel 2003 und in später Versionen von Excel. In diesem Artikel können Sie experimentieren mit numerischen Daten sehen, wenn Fehler Rundungsfehler in früheren Versionen von Excel auftreten können.

Weitere Informationen über VAR klicken Sie auf die folgende Artikelnummer, um den Artikel der Microsoft Knowledge Base anzuzeigen:
826112 Statistik-Funktionen Excel: VAR


In diesem Artikel die drei ANOVA-Modelle erläutert, Schwerpunkt es ANOVA-Output-Tabellen. In jedem Fall sind die Zusammenfassungstabellen gut konzipierte in Excel 2003 und in später Versionen von Excel. In Excel 2002 und früheren Versionen von Excel treten Probleme in der Spalte für die Abweichung, wenn Daten extreme Werte verfügen.

Jedoch enthält der Artikel Zusammenfassungstabellen in den Abschnitten Modell, da diese Tabellen für einen Vergleich hilfreich beim Überprüfen der geänderten Beispiele im Anhang sind.

Modell 1: Einfaktorielle Varianzanalyse

Ein einfaches Beispiel mit Daten ist wie folgt.
Tabelle minimierenTabelle vergrößern
GRUNDMODELL ANOVA-1:
123
244
365
486
57
68
Anova: Einfaktorielle Varianzanalyse
ZUSAMMENFASSUNG
GruppenAnzahlSummeDurchschnittVarianz
Spalte 16213.53.5
Spalte 242056.666667
Spalte 36335.53.5
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Zwischen Gruppen12,7526,3751.5068180.2578973.805567
Innerhalb von Gruppen55134.230769
Gesamt67.7515
Excel 2002 und früheren Versionen von Excel verwenden den folgenden Pseudocode, um die Summen der Quadrate zu berechnen:
GrandSum = 0;
GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0; 
GrandMeanSqrd = 0; 
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
   GrandSum = GrandSum + sum of observations in s-th sample;
   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +
      (sum of observations in s-th sample^2)/size of s-th sample;
   GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs ? GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd ? GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs ? GrandSampleMeanSqrd;
Dieser Ansatz ist im Wesentlichen die Rechenformel. Dieser Ansatz die Summen der Quadrate der Beobachtungen berechnet und subtrahiert dann eine Menge, wie Varianz die Summe der Quadrate der Beobachtungen berechnet und dann subtrahiert Summe der Beobachtungen^ 2 /Größe der Stichprobe. Ähnliche Pseudocode für das Modell 2 und 3-Modell wurde ausgelassen.

Auch für Modell 2 und 3-Modell Quadratsummen berechnet werden, und wird eine Menge von der Summe der Quadrate in die Rechenformel subtrahiert. Leider vorschlagen Basisstatistiken Texte wie die weiter oben in diesem Artikel gezeigt wird häufig Ansätze für die ANOVA.

Excel 2003 oder höher Excel-Versionen verwenden einen anderen Ansatz, um die verschiedenen Einträge in der Spalte SS ANOVA-Tabelle zu berechnen. Zur Veranschaulichung vorausgesetzt, dass die numerischen Daten in dem früheren Beispiel mit fehlenden Daten in den Zellen B6 und B7 in Zellen A2:C7 angezeigt werden.
  • Insgesamt SS ist einfach SUMQUADABW auf alle Daten, solche asDEVSQ(A2:C7) angewendet werden. SUMQUADABW funktioniert ordnungsgemäß, obwohl die Daten nicht vorhanden ist.
  • Zwischen Gruppen SS ist Total SS abzüglich der Summe der DEVSQapplied für die einzelnen Spalten, wie z. B. DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • In Gruppen-SS ist Total SS minus zwischen GroupsSS.
Wenn Sie Einträge in der Spalte "SS" der ANOVA-Tabelle korrekt berechnet werden, die Genauigkeit der anderen Einträge in der Tabelle folgen.

Modell 2: Zwei Zweifaktorielle Varianzanalyse mit Messwiederholung

Ein einfaches Beispiel mit Daten ist wie folgt.
Tabelle minimierenTabelle vergrößern
AN-OVUM 2 BASISMODELLGruppe 1Gruppe 2Gruppe 3
Test 1123
244
365
Test 2486
5107
6128
Anova: Zweifaktorielle Varianzanalyse mit Replikation
ZUSAMMENFASSUNGGruppe 1Gruppe 2Gruppe 3Gesamt
Test 1
Anzahl3339
Summe6121230
Durchschnitt2443,333333 zurück
Varianz1412.5
Test 2
Anzahl3339
Summe15302166
Durchschnitt51077.333333
Varianz1416,25
Gesamt
Anzahl666
Summe214233
Durchschnitt3.575.5
Varianz3.5143.5
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Beispiel72172366.22E-054.747221
Spalten37218.59,250.0037093.88529
Interaktion924.52,250.1479733.88529
Innerhalb von24122
Gesamt14217
Erneut aus, wenn Einträge in der Spalte SS richtig berechnet sind, folgt die Richtigkeit aller Einträge in der ANOVA-Teil der Ausgabe.

Hier ist das Rechenverfahren für Excel 2003 und für später Versionen von Excel. Dieses Verfahren wird SUMQUADABW berechnet die verschiedenen Einträge in der Spalte SS ANOVA-Tabelle. Zur Veranschaulichung angenommen, dass die numerischen Daten in Zellen B2:D7 angezeigt werden.
  • Insgesamt SS ist einfach SUMQUADABW auf alle Daten, solche asDEVSQ(B2:D7) angewendet werden.
  • Beispiel-SS ist Total SS abzüglich der Summe der SUMQUADABW Beispiel Toeach, wie DEVSQ(B2:D4) + DEVSQ(B5:D7) angewendet.
  • Spalten-SS ist Total SS abzüglich der Summe der SUMQUADABW Toeach Spalte, z. B. DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7) angewendet.
  • In SS ist die Summe der SUMQUADABW angewendet auf jedes Paar Testversion Orgroup wie DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) +DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • Interaktion SS ist Total SS minus Beispiel SS MinusColumns SS minus in SS gleich.

Modell 3: Zwei Zweifaktorielle Varianzanalyse ohne Messwiederholung

Ein einfaches Beispiel mit Daten ist wie folgt.
Tabelle minimierenTabelle vergrößern
GRUNDLEGENDE 3 ANOVA-MODELL:NIEDRIG MITTELMEER HALLO
SCHLECHTE123
244
365
MITTE-KLASSE486
5107
6128
REICH71410
8126
9102
Anova: Zweifaktorielle Varianzanalyse ohne Messwiederholung
ZUSAMMENFASSUNGAnzahlSummeDurchschnittVarianz
SCHLECHTE3621
3103,333333 zurück1,333333
3144.6666672.333333
MITTE-KLASSE31864
3227.3333336.333333
3268.6666679.333333
REICH33110.3333312.33333
3268.6666679.333333
321719
NIEDRIG 94557.5
MITTELMEER 9788.66666716
HALLO9515.6666676,25
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Zeilen176.6667822.083335.760870.0014762.591094
Spalten68.66667234.333338.9565220.0024553.633716
Fehler61.33333163.833333
Gesamt306.666726
Wenn die Werte in der Spalte SS richtig berechnet sind, folgt die Richtigkeit aller Werte in der ANOVA-Tabelle.

Excel 2003 oder höher Versionen von Excel verwenden Sie das folgende Rechenverfahren. Die Prozedur verwendet SUMQUADABW zur Berechnung der Werte in der Spalte SS ANOVA-Tabelle. Zu Illustrationszwecken wird, dass der Bereich der Zellen, die in dem früheren Beispiel gezeigt D10 ist angenommen. Daher werden die numerischen Daten in Zellen B2:D10 angezeigt.
  • Insgesamt SS ist einfach SUMQUADABW auf alle Daten, solche asDEVSQ(B2:D10) angewendet werden.
  • Zeilen-SS ist Total SS abzüglich der Summe der SUMQUADABW angewendet, Eachrow, wie DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + +DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • Spalten-SS ist Total SS abzüglich der Summe der SUMQUADABW Toeach Spalte, z. B. DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10) angewendet.
  • Fehler SS ist Total SS minus SS minus ColumnsSS Zeilen.

Ergebnisse in Excel 2002 und früheren Versionen von Excel

In extremen Fällen, in denen gibt es viele signifikante Ziffern in den Daten aber auch eine kleine Abweichung die Rechenformel zu ungenauen Ergebnissen führt. Die Anlage, die weiter unten in diesem Artikel sind Beispiele für Rundungsfehler Probleme in extremen Situationen.

Ergebnisse in Excel 2003 und in später Versionen von Excel

Excel 2003 oder höher Versionen von Excel verwenden Sie eine Prozedur, die zwei Durchgänge durch die Daten durchführt. Beim ersten Durchgang Excel 2003 oder höher Versionen von Excel berechnet die Summe und die Anzahl der Datenwerte. Von diesen kann Excel den Stichprobe-Mittelwert (Durchschnitt) berechnen.

Beim zweiten Durchgang Excel das Quadrat der Differenz zwischen jeder Datenpunkt und der Stichprobe-Mittelwert berechnet und summiert dann dieser quadrierten Differenzen. Folglich müssen die Ergebnisse in Excel 2003 und in später Versionen von Excel sind numerisch stabiler.

Schlussfolgerungen

Eine zweistufige Vorgehensweise verbessert die numerische Leistung in allen drei ATP ANOVA-Tools in Excel 2003 und in später Versionen von Excel im Vergleich zu früheren Versionen von Excel. Die Ergebnisse, die Sie mithilfe von erhalten. Excel 2003 oder höher Versionen von Excel sind nie weniger genau als die Ergebnisse, die mit früheren Versionen von Excel zu erhalten.

In die meisten praktischen Fällen jedoch besteht kein Unterschied zwischen diesen Ergebnissen. Dies ist, da die Daten keine in der Regel die Art von ungewöhnlichem Verhalten aufweisen, die den folgenden Anhang veranschaulicht. Numerische Instabilität ist am wahrscheinlichsten in früheren Versionen von Excel auftreten, wenn Daten viele signifikante Ziffern mit relativ wenig Unterschiede zwischen den einzelnen Datenwerte enthält.

Wenn Sie eine frühere Version von Excel verwenden und wenn Sie sehen möchten, ob Excel 2003 oder eine später Excel-Version bietet Ihnen verschiedene ANOVA-Ergebnisse, vergleichen Sie die Ergebnisse, die Sie erhalten, wenn Sie in der früheren Version von Excel mit den Ergebnissen der ANOVA-Tools, die Sie erhalten verwenden, wenn Sie mithilfe die Verfahren, die SUMQUADABW verwenden.

Hinweis Die Verfahren, mit denen SUMQUADABW wurden weiter oben in diesem Artikel für die ANOVA-Tabelle beschrieben, die mit einzelnen Tools ist.

Um sicherzustellen, dass Abweichungen in der Zusammenfassungstabelle für jeden Bereich richtig sind, verwenden Sie SUMMIEREN)Bereich) / (ANZAHL ()Bereich) ? 1).

Anhang: Numerische Beispiele für die Leistung von Excel 2002 und früheren Versionen von Excel

Für jedes einfache Beispiel von Modellen, 1, 2 und 3 dargestellt in diesem Artikel zuvor die ATP-Tool-Ausgabe. Dies beinhaltete der Zusammenfassung und ANOVA-Tabelle. Daten wurde in jedem Beispiel erstellen Sie ein Beispiel für "betonten" geändert. Dies geschieht durch Hinzufügen von 10 ^ 8, um jeden Datenwert. Hinzufügen einer konstantes wie z. B. 10 ^ 8, um jeden Datenwert Varianz in der Zusammenfassungstabelle hat keinen Einfluss auf (aber Mittelwert und Summe auf offensichtliche Weise beeinflussen wird). Es sollte auch einen Eintrag in die ANOVA-Tabelle nicht beeinträchtigen.

Wenn Sie Abweichungen in den Übersichtstabellen und SS in die ANOVA-Tabellen vergleichen, werden Sie feststellen, dass alle diese falsch in allen drei der folgenden betonten Modelle mit Ausnahme eines Postens im Modell 3 berechnet werden, auf die mit gezeigt wird "<>".

In den betonten Fällen stimmen die ANOVA-Ergebnisse, die Sie erhalten, indem Sie Excel 2003 und höheren Versionen von Excel mit den vorherigen Ergebnissen in einfachen Fällen (wie erwartet).

ANOVA 1 betont Modell umfangreicher Datenmengen

Tabelle minimierenTabelle vergrößern
100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: Einfaktorielle Varianzanalyse
ZUSAMMENFASSUNG
GruppenAnzahlSummeDurchschnittVarianz
Spalte 166000000211E + 084.8
Spalte 244000000201E + 088
Spalte 366000000331E + 081.6
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Zwischen Gruppen020013.805567
Innerhalb von Gruppen64134.923077
Gesamt6415

An-OVUM 2 betont Modell umfangreicher Datenmengen

Tabelle minimierenTabelle vergrößern
Gruppe 1Gruppe 2Gruppe 3
Test 1100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
Test 2100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: Zweifaktorielle Varianzanalyse mit Replikation
ZUSAMMENFASSUNGGruppe 1Gruppe 2Gruppe 3Gesamt
Test 1
Anzahl3339
Summe3000000063000000123000000129E + 08
Durchschnitt1000000021000000041000000041E + 08
Varianz0404
Test 2
Anzahl3339
Summe3000000153000000303000000219E + 08
Durchschnitt1000000051000000101000000071E + 08
Varianz0406
Gesamt
Anzahl666
Summe600000021600000042600000033
Durchschnitt100000004100000007100000005.5
Varianz4.814.41.6
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Beispiel64164240.0003674.747221
Spalten3221660,0156253.88529
Interaktion3221660,0156253.88529
Innerhalb von32122.666666667
Gesamt12817

ANOVA 3 betont Modell umfangreicher Datenmengen

Tabelle minimierenTabelle vergrößern
NIEDRIG MITTELMEER HALLO
SCHLECHTE100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
MITTE-KLASSE100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
REICH100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: Zweifaktorielle Varianzanalyse ohne Messwiederholung
ZUSAMMENFASSUNGAnzahlSummeDurchschnittVarianz
Zeile 133000000061000000020
Zeile 233000000101000000032
Zeile 333000000141000000052
Zeile 433000000181000000064<>
Zeile 533000000221000000076
Zeile 6330000002610000000910
Zeile 7330000003110000001012
Zeile 8330000002610000000910
Zeile 9330000002110000000718
Spalte 199000000451000000058
Spalte 2990000007810000000914
Spalte 399000000511000000064
ANOVA
Quelle der VarianteSSdfMSFP-WertCrit F
Zeilen12881620.1132812.591094
Spalten3221620.1677723.633716
Fehler128168
Gesamt28826

Eigenschaften

Artikel-ID: 829215 - Geändert am: Samstag, 23. November 2013 - Version: 3.0
Die Informationen in diesem Artikel beziehen sich auf:
  • Microsoft Office Excel 2007
Keywords: 
kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo kbmt KB829215 KbMtde
Maschinell übersetzter Artikel
Wichtig: Dieser Artikel wurde maschinell übersetzt und wird dann möglicherweise mithilfe des Community Translation Framework (CTF) von Mitgliedern unserer Microsoft Community nachbearbeitet. Weitere Informationen zu CTF finden Sie unter http://support.microsoft.com/gp/machine-translation-corrections/de.
Den englischen Originalartikel können Sie über folgenden Link abrufen: 829215
Microsoft stellt Ihnen die in der Knowledge Base angebotenen Artikel und Informationen als Service-Leistung zur Verfügung. Microsoft übernimmt keinerlei Gewährleistung dafür, dass die angebotenen Artikel und Informationen auch in Ihrer Einsatzumgebung die erwünschten Ergebnisse erzielen. Die Entscheidung darüber, ob und in welcher Form Sie die angebotenen Artikel und Informationen nutzen, liegt daher allein bei Ihnen. Mit Ausnahme der gesetzlichen Haftung für Vorsatz ist jede Haftung von Microsoft im Zusammenhang mit Ihrer Nutzung dieser Artikel oder Informationen ausgeschlossen.

Ihr Feedback an uns

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com