Popis numerického vylepšení analýzy analytické nástroje ANOVA nástroje v aplikaci Excel

Překlady článku Překlady článku
ID článku: 829215 - Produkty, které se vztahují k tomuto článku.
Rozbalit všechny záložky | Minimalizovat všechny záložky

Na této stránce

Souhrn

Tento článek popisuje numerických vylepšení v každém tři nástroje analýzy analytické nástroje ANOVA. Tento článek také uvádí nepřesné výsledky v aplikaci Microsoft Excel 2002 a v dřívějších verzích aplikace Excel v extrémních situacích.

Další informace

Mnoho funkcí vyžaduje výpočet součtu čtverců odchylek u středních hodnot. Jak to přesně, Microsoft Office Aplikace Excel 2003 a novější verze aplikace Excel pomocí dvou propust postup, který zjistí průměr na prvním průchodu a pak vypočítá druhou mocninu odchylky, o průměru na druhém průchodu.

V přesné aritmetický, stejné výsledek dochází v dřívějších verzích aplikace Excel, které použít vzorec Kalkulačka"." Tento vzorec tak názvem, protože byla široce používají při statistiků kalkulačky namísto počítačů. Pomocí vzorce Kalkulačka a starších verzích aplikace Excel součet čtverečky pozorování a poté odečte od tohoto součtu následujících množství:
((sum of observations)^2) / number of observations
Tento výpočet dochází v jediném přes data.

V Aritmetické omezené přesnosti vzorce Kalkulačka podléhá vznikajícím chyby v extrémních případech. Aplikace Excel 2002 a dřívějších verzích aplikace Excel použít vzorec pro výpočet Většina funkcí, které vyžadují (jako například součet kvadratických odchylek o střední VAR.výběr, SMODCH.výběr, SLOPE a PEARSON). Ale tyto verze aplikace Excel použít také Další postup zahrnut numericky robustnější Dvojfázové CORREL, COVAR a DEVSQ funkce.

Odborníci v počítačové statistické doporučujeme používat Vzorec pro výpočet. Kalkulačka vzorce je zobrazen jako "jak nelze provést" v textech o statistické computing. Bohužel všechny tři analýzy Analytické nástroje (ATP) nástroje ANOVA široce využívat Kalkulačka vzorec nebo ekvivalent jednoho průchodu přístupu v aplikaci Excel 2002 a v dřívějších verzích aplikace Excel.

Aplikace Excel 2003 a novějšíverze aplikace Excel použít dvouprůchodové postup pro všechny tři modely analytických nástrojích ANOVA. V tomto článku Tento článek popisuje následující vylepšení výpočetní analytický nástroj ANOVA modely:
  • Jeden faktor
  • Dva faktory s opakováním
  • Dva faktory bez opakování
Tento článek popisuje tyto modely později.

Protože Aplikace Excel vždy použít dvouprůchodové postup s DEVSQ, vytvoří v tomto článku Časté používání na zlepšené postupy. Tyto revidované postupy účinně DEVSQ volání nebo použití kódu, jejichž funkčnost je stejně jako funkce DEVSQ společnosti.

Pro jednotlivé nástroje ANOVA ATP Výstup obsahuje souhrnné tabulky s hodnotami Count, součet, průměr, a Rozptyl a analýzu variance, který má různých součtů čtverců a hodnoty SS, DF, MS, F a P-hodnota. Výsledky v souhrnné tabulce vypočten voláním Funkce aplikace Excel COUNT, SUM, průměr a VAR. Z těchto čtyř funkcí pouze VAR podléhá vznikajícím chyby.

Aplikace Excel 2002 a dřívějších verzích aplikace Excel implementovat VAR pomocí programu Kalkulačka vzorec. Článek o funkci VAR.Výběr popisuje vylepšení k nimž došlo v Aplikace Excel 2003 a v později verze aplikace Excel. Tento článek také umožňuje experimentovat s číselných dat Pokud jsou dříve hrozí v chybám vznikajícím verze aplikace Excel.

Další informace o funkci VAR.Výběr získáte klepnutím na následující číslo článku databáze Microsoft Knowledge Base:
826112Statistické funkce aplikace Excel: VAR


Jako Tento článek pojednává o modely ANOVA je zaměřen na výstupní tabulky ANOVA. V každém případě souhrn jsou tabulky, které jsou v pořádku v Aplikace Excel 2003 a v později verze aplikace Excel. V aplikaci Excel 2002 a v dřívějších verzích aplikace Excel, problémy ve sloupci odchylka dojít po extrémní hodnoty data.

Ale to článek obsahuje souhrnné tabulky v oddílech modelu, jsou tyto tabulky užitečné pro porovnání při revizi upravené příklady v Dodatek.

Model 1: Jeden faktor

Jednoduchý příklad dat je následující.
Zmenšit tuto tabulkuRozšířit tuto tabulku
BASIC ANOVA 1 MODEL:
123
244
365
486
57
68
Anova: jeden Faktor
SOUHRN
SkupinyPočetSoučetPrůměrOdchylka
Sloupec 16213.53.5
Sloupec 242056.666667
Sloupec 36335.53.5
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Mezi Skupiny12.7526.3751.5068180.2578973.805567
V rámci Skupiny55134.230769
Celkem67.7515
Aplikace Excel 2002 a dřívějších verzích aplikace Excel, použijte následující pseudocode na Výpočet součtů čtverců:
GrandSum = 0;
GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0; 
GrandMeanSqrd = 0; 
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
   GrandSum = GrandSum + sum of observations in s-th sample;
   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +
      (sum of observations in s-th sample^2)/size of s-th sample;
   GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs – GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd – GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs – GrandSampleMeanSqrd;
Tento přístup je v podstatě vzorec Kalkulačka. Tento přístup se vypočítá částek čtverečky pozorování a potom odečte množství, stejně jako VAR vypočítá součet druhých mocnin pozorování a poté odečte Součet pozorování^ 2 avzorek velikost. Byl podobný pseudocode pro model 2 a model 3 vynechat.

Opět pro model 2 a model 3, součtů čtverců vypočten a množství se odečte od součtu čtverců, například ve vzorci Kalkulačka. Bohužel znění základních statistik často navrhuje přístupů pro ANOVA například ten, který je uveden výše v tomto článku.

Aplikace Excel 2003 a novější verze aplikace Excel pomocí jiné metody pro výpočet různých položek ve sloupci SS Variance. Pro ilustraci, tento článek předpokládá, že číselná data v předchozí příklad se zobrazí v buňkách A2:C7 s chybějící data do buňky B6 a B7.
  • Celkové SS je právě DEVSQ u všech dat, jako například DEVSQ(A2:C7). DEVSQ funguje správně, přestože chybí data.
  • Mezi skupinami SS je celkem SS, mínus součet DEVSQ u každého sloupce, například DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • V rámci skupiny SS je celkem SS minus mezi skupinami SS.
Pokud se počítají položek ve sloupci tabulky ANOVA SS správně postupujte podle přesnosti ostatní položky v tabulce.

Model 2: Dva faktory s opakováním

Jednoduchý příklad dat je následující.
Zmenšit tuto tabulkuRozšířit tuto tabulku
ANOVA 2 ZÁKLADNÍ MODELSkupina 1skupiny 2Skupina 3
zkušební verze 1123
244
365
zkušební verze 2486
5107
6128
Anova: Dva faktory s opakováním Replikace
SOUHRNSkupina 1Skupina 2skupiny 3Celkem
zkušební verze 1
Počet3339
Součet6121230
Průměr2443.333333
Odchylka1412.5
zkušební verze 2
Počet3339
Součet15302166
Průměr51077.333333
Odchylka1416,25
Celkem
Počet666
Součet214233
Průměr3.575.5
Odchylka3.5143.5
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Vzorek72172366.22E-054.747221
Sloupce37218.59.250.0037093.88529
Interakce924.52,250.1479733.88529
V rámci24122
Celkem14217
Znovu, pokud se položky ve sloupci SS počítají správně, přesnost všechny ostatní položky v části výstup ANOVA takto.

Zde je výpočetní procedura pro Aplikace Excel 2003 a pro později verze aplikace Excel. Tento postup se používá DEVSQ pro výpočet různých položek ve sloupci tabulky ANOVA SS. Pro ilustrace, tento příklad předpokládá, že číselná data se zobrazí v buňkách B2:D7.
  • Celkové SS je právě DEVSQ u všech dat, jako například DEVSQ(B2:D7).
  • SS vzorku je celkem SS, mínus součet u DEVSQ Každý vzorek, například DEVSQ(B2:D4) + DEVSQ(B5:D7).
  • Sloupce SS je celkem SS, mínus součet u DEVSQ jednotlivé sloupce, například DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7).
  • V rámci SS je součtem DEVSQ u každé zkušební nebo Skupina pár, jako je například DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • Interakce SS se rovná celkové SS minus vzorku SS minus SS minus sloupce uvnitř SS.

Model 3: Dva faktory bez opakování

Jednoduchý příklad dat je následující.
Zmenšit tuto tabulkuRozšířit tuto tabulku
ANOVA 3 ZÁKLADNÍ MODEL:NÍZKÁ MED HI
ŠPATNÁ123
244
365
MID TŘÍDA486
5107
6128
VE FORMÁTU RTF71410
8126
9102
Anova: Dva faktory bez Replikace
SOUHRNPočetSoučetPrůměrOdchylka
ŠPATNÁ3621
3103.3333331,333333
3144.6666672.333333
MID TŘÍDA31864
3227.3333336.333333
3268.6666679.333333
VE FORMÁTU RTF33110.3333312.33333
3268.6666679.333333
321719
NÍZKÁ 94557.5
MED 9788.66666716
HI9515.6666676,25
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Řádky176.6667822.083335.760870.0014762.591094
Sloupce68.66667234.333338.9565220.0024553.633716
Chyba61.33333163.833333
Celkem306.666726
Pokud jsou hodnoty ve sloupci SS správně, vypočítá Řídí přesnost všechny ostatní hodnoty v tabulce ANOVA.

Aplikace Excel 2003 a novější verze aplikace Excel pomocí následujícího postupu výpočetní. Postup používá DEVSQ k Výpočet hodnot ve sloupci tabulky ANOVA SS. Pro ilustraci, Tento příklad předpokládá, že je oblast buněk, které jsou uvedeny v předchozím příkladu buňky a1: D10. Proto číselná data se zobrazí v buňkách B2:D10.
  • Celkové SS je právě DEVSQ u všech dat, jako například DEVSQ(B2:D10).
  • Řádky SS je celkem SS, mínus součet DEVSQ použita pro každou řádku, například DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • Sloupce SS je celkem SS, mínus součet u DEVSQ jednotlivé sloupce, například DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10).
  • Chyba SS je celkem SS minus řádky SS minus sloupce SS.

Výsledky v aplikaci Excel 2002 a v dřívějších verzích aplikace Excel

V extrémních případech jsou-li počet platných číslic v data, ale také malé odchylky, Kalkulačka vzorec vede nepřesné výsledky. Dodatek, který dále v tomto článku jsou uvedeny příklady problémům vznikajícím v takových situacích krajní.

Výsledky Aplikace Excel 2003 a v později verze aplikace Excel

Aplikace Excel 2003 a novější verze aplikace Excel použít postup umožňující dvěma prochází data. Na první fáze Aplikace Excel 2003 a novější verze aplikace Excel vypočítat součet a počet dat hodnoty. Z těchto aplikace Excel lze vypočítat střední hodnoty výběru (průměr).

Druhý průchod, aplikace Excel vypočte druhou mocninu rozdílu mezi každý datový bod a střední hodnoty výběru a pak součet těchto kvadratických odchylek. V důsledku výsledky v Aplikace Excel 2003 a v později verze aplikace Excel jsou stabilnější číselně.

Závěry

Zlepšuje přístup Dvojfázové numerický výkon ve všech třech Analytické nástroje ANOVA v Aplikace Excel 2003 a v později verze aplikace Excel ve srovnání s předchozími verzemi aplikace Excel. Výsledky, které můžete získat pomocí Aplikace Excel 2003 a novější nejsou nikdy méně přesné než výsledky, které můžete získat pomocí starší verze aplikace Excel verze aplikace Excel.

Ve většině praktických případů však není žádný rozdíl mezi tyto výsledky. Důvodem je, že data nesmí vykazovat obvykle druh neobvyklé chování, Následující dodatku znázorňuje. Číselný nestability je pravděpodobnější v dřívější verze aplikace Excel data obsahuje vysoký počet významných číslice s relativně malou změnu mezi hodnotami dat.

Pokud jste Použití starší verze aplikace Excel, a pokud chcete zjistit zda Aplikace Excel 2003 nebo později verze aplikace Excel umožňuje jiné výsledky ANOVA, porovnat výsledky, které jste získali při použití nástroje ANOVA ve vašem dřívější verze aplikace Excel s výsledky, které jste získali při použití postupů, které používají DEVSQ.

Poznámka: Byly postupy, které používají DEVSQ popsané výše v tomto článku pro tabulku ANOVA, spojené s jednotlivými nástroje.

Ověřte správnost odchylky v souhrnné tabulce pro každou oblast použití DEVSQ (rozsah) / ((POČETrozsah) – 1).

Dodatek: Numerické příklady výkon aplikace Excel 2002 a dřívějších verzích aplikace Excel

Pro každý základní příklad z modelů 1, 2 a 3 tohoto článku dříve předložené analytický nástroj výstup. To je součástí tabulky Shrnutí a ANOVA. Data byla upravena v každé například vytvořit "stressed" příklad. To provádí přidáním 10 ^ 8 každé hodnotě. Přidání konstanta například 10 ^ 8 Každá hodnota dat neovlivní odchylka v souhrnné tabulce (ale ovlivní Průměr a SUMA v samozřejmý). To by také neměla ovlivnit všechny položky v Variance.

Pokud porovnáte odchylky v souhrnných tabulek a SS v tabulky ANOVA, zjistíte, že všechny tyto nesprávně vypočten ve všech třech následujících zdůraznila modely s výjimkou jedné položky v modelu 3 která je propojená s"<>".

Ve všech stressed případech ANOVA výsledky, které můžete získat pomocí aplikace Excel 2003 a vyšších verzích aplikace Excel souhlasí s předchozí výsledky základních případů (jako by měli).

ANOVA 1 zdůraznila model s velké datové hodnoty

Zmenšit tuto tabulkuRozšířit tuto tabulku
100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: jeden Faktor
SOUHRN
SkupinyPočetSoučetPrůměrOdchylka
Sloupec 166000000211E + 084.8
Sloupec 244000000201E + 088
Sloupec 366000000331E + 081.6
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Mezi Skupiny020013.805567
V rámci Skupiny64134.923077
Celkem6415

ANOVA 2 zdůraznila model s velké datové hodnoty

Zmenšit tuto tabulkuRozšířit tuto tabulku
Skupina 1Skupina 2skupiny 3
zkušební verze 1100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
zkušební verze 2100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: Dva faktory s opakováním Replikace
SOUHRNSkupina 1Skupina 2skupiny 3Celkem
zkušební verze 1
Počet3339
Součet3000000063000000123000000129E + 08
Průměr1000000021000000041000000041E + 08
Odchylka0404
zkušební verze 2
Počet3339
Součet3000000153000000303000000219E + 08
Průměr1000000051000000101000000071E + 08
Odchylka0406
Celkem
Počet666
Součet600000021600000042600000033
Průměr100000004100000007100000005.5
Odchylka4.814.41.6
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Vzorek64164240.0003674.747221
Sloupce3221660.0156253.88529
Interakce3221660.0156253.88529
V rámci32122.666666667
Celkem12817

ANOVA 3 zdůraznila model s velké datové hodnoty

Zmenšit tuto tabulkuRozšířit tuto tabulku
NÍZKÁ MED HI
ŠPATNÁ100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
MID TŘÍDA100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
VE FORMÁTU RTF100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: Dva faktory bez Replikace
SOUHRNPočetSoučetPrůměrOdchylka
Řádek 133000000061000000020
Řádek 233000000101000000032
Řádek 333000000141000000052
Řádek 433000000181000000064<>
Řádek 533000000221000000076
Řádek 6330000002610000000910
Řádek 7330000003110000001012
Řádek 8330000002610000000910
Řádek 9330000002110000000718
Sloupec 199000000451000000058
Sloupec 2990000007810000000914
Sloupec 399000000511000000064
ANOVA
Zdroj VariantySSDFMSFHodnota PF crit
Řádky12881620.1132812.591094
Sloupce3221620.1677723.633716
Chyba128168
Celkem28826

Vlastnosti

ID článku: 829215 - Poslední aktualizace: 20. května 2011 - Revize: 4.0
Informace v tomto článku jsou určeny pro produkt:
Klíčová slova: 
kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo kbmt KB829215 KbMtcs
Strojově přeložený článek
Důležité: Tento článek byl přeložen pomocí software společnosti Microsoft na strojový překlad, ne profesionálním překladatelem. Společnost Microsoft nabízí jak články přeložené překladatelem, tak články přeložené pomocí software na strojový překlad, takže všechny články ve Znalostní databázi (Knowledge Base) jsou dostupné v češtině. Překlad pomocí software na strojový překlad ale není bohužel vždy dokonalý. Obsahuje chyby ve skloňování slov, skladbě vět, nebo gramatice, podobně jako když cizinci dělají chyby při mluvení v češtině. Společnost Microsoft není právně zodpovědná za nepřesnosti, chyby nebo škody vzniklé chybami v překladu, nebo při použití nepřesně přeložených instrukcí v článku zákazníkem. Společnost Microsoft aktualizuje software na strojový překlad, aby byl počet chyb omezen na minimum.
Projděte si také anglickou verzi článku:829215

Dejte nám zpětnou vazbu

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com