Statistické funkce aplikace Excel: PEARSON

Souhrn

Tento článek popisuje funkce PEARSON v aplikaci Microsoft Excel. Tento článek popisuje způsob použití funkce. Kromě toho tento článek porovnává výsledky PEARSON v aplikaci Microsoft Office Excel 2003 a vyšších verzích aplikace Excel s výsledky PEARSON v dřívějších verzích aplikace Excel.

Další informace

PEARSON (pole1, pole2) Vrátí Pearsonův produkt momentový korelační koeficient mezi dvěma maticemi dat..

Syntaxe

PEARSON(array1, array2)
Argumenty pole1 a pole2, musí být čísla, názvy, maticové konstanty nebo odkazy obsahující čísla.

Nejobvyklejším použitím PEARSON zahrnuje dva rozsahy buněk obsahujících data, například PEARSON (a1: A100, B1:B100).

Příklad použití

Pro ilustraci funkce PEARSON, postupujte takto:
  1. Vytvořte prázdný list aplikace Excel a potom zkopírujte následující tabulku.
    13 + 10 = ^ $D$ 2Napájení 10 chcete-li přidat data
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2starší než Excel 2003
    Při D2 = 7.5
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    Při D2 = 8
    #DIV/0!
    0.713772
  2. Vyberte buňku A1 v listu aplikace Excel a potom vložit položky tak, aby tabulka vyplní A1:D13 buněk v listu.
  3. Klepněte na tlačítko Možnosti vložení a potom klepněte na tlačítko Přizpůsobit formátování cíli. Stále vybrán vložený rozsah použijte jeden z následujících postupů odpovídající verzi aplikace Excel, kterou používáte:
    • V aplikaci Microsoft Office Excel 2007 klepněte na kartu Domů , klepněte na tlačítko Formát ve skupině buňky a potom klepněte na tlačítko Přizpůsobit šířku sloupců.
    • V aplikaci Microsoft Office Excel 2003 v nabídce Formát přejděte na příkaz sloupec a klepněte na příkaz Přizpůsobit.
    Poznámka: Chcete formátovat buňky B1:B6 jako číslo s 0 desetinných míst.
Buňky a1: a6 a B1:B6 obsahují dva datové pole, která jsou v tomto příkladu použita k volání funkce funkce CORREL a PEARSON v buňkách A8 a A9. PEARSON a funkce CORREL výpočtu korelačního koeficientu Pearson moment produktu a jejich výsledky se musí dohodnout.

Ve verzích aplikace Excel dřívější než Excel 2003 může projevit PEARSON chyby zaokrouhlení. Bylo vylepšeno chování PEARSON v aplikaci Excel 2003 a vyšších verzích aplikace Excel. Funkce CORREL vždy byl implementován s lepší postup, který nyní slouží v aplikaci Excel 2003 a vyšších verzích aplikace Excel. Proto pokud používáte verzi aplikace Excel dřívější než Excel 2003 PEARSON, společnost Microsoft doporučuje místo toho použijte funkce CORREL.

Ve verzích aplikace Excel, které jsou starší než Excel 2003 můžete použít list v tomto článku pokus spustit a zjistit, pokud dojde k chybám zaokrouhlení. Pokud přidáte do každé z pozorování ve B1:B6 konstanta, by neměla být dotčena PEARSON a funkce CORREL CHYBOVOU hodnotu. Pokud zvýšíte hodnotu v D2, větší konstantu je přidán do B1:B6. Pokud D2 je nižší než 7, existuje žádné chyby zaokrouhlení, které se objeví v prvních šest desetinných míst z PEARSON. Nyní přejděte hodnotu D2 7,25, 7.5, 7,75 a pak 8. D6:D13 buňky listu zobrazit hodnoty PEARSON a funkce CORREL při D2 = 7.5 a při D2 = 8, respektive.

Funkce CORREL je stále přesnější, ale chyby zaokrouhlení v PEARSON staly tak závažné, že dojde k dělení 0 při D2 = 8.

Dřívější verze aplikace Excel vykazovat nesprávné odpovědi v těchto případech, protože účinky chyby zaokrouhlení jsou mnohem důkladnější s výpočetní vzorec, který používá tyto verze. Případech v tomto experimentu, přesto lze pohlížet jako na extreme.

V aplikaci Excel 2003 a vyšších verzích aplikace Excel měli byste vidět žádné změny v hodnotách PEARSON, pokud se pokusíte experimentu. D6:D13 buněk však zobrazit stejné chyby zaokrouhlení získat v dřívějších verzích aplikace Excel.

Výsledky v dřívějších verzích aplikace Excel

Pokud zadáte název pole dva datové značkou a Y's, starší verze aplikace Excel pomocí jednoho průchodu přes data vypočítat součet čtverců značkou, součet čtverců Y's, součet značkou, součet Y's, součet XY's a počet počet pozorování každého pole. Tato množství jsou pak sloučeny do výpočetní vzorec v souboru nápovědy v dřívějších verzích aplikace Excel.

Výsledky v aplikaci Excel 2003 a vyšších verzích aplikace Excel

Postup, který se používá v aplikaci Excel 2003 a vyšších verzích aplikace Excel používá dvouprůchodové procesu data. První, částek značkou a vypočtené hodnoty Y a počet počet pozorování každého pole. Z těchto prostředků (průměr) X a Y pozorování mohou být vypočteny. Na druhém průchodu, druhá mocnina rozdílu mezi každou X a X průměr je nalezen; těchto kvadratických odchylek se sčítají. Druhá mocnina rozdílu mezi každou Y a střední hodnoty Y je nalezen; těchto kvadratických odchylek se sčítají. Navíc produkty (X – střední hodnota) * (Y-Y střední) jsou nalezeny pro každou dvojici datových bodů a jsou sečteny. Vzorec pro výpočet PEARSONOVA společně tyto tři částky. Žádná z těchto tří částek jsou ovlivněny přidáním konstanta každou hodnotu v matici Y (nebo pole X), protože stejnou hodnotu je přidán do střední hodnota Y (nebo střední hodnoty X). V příkladech číselné i s vysokou napájení 10 v buňce D12 tyto tři částky nejsou ovlivněny a výsledky druhé fáze jsou nezávislé položka v buňce D2. Proto výsledky v aplikaci Excel 2003 a vyšších verzích aplikace Excel jsou stabilnější číselně.

Závěry

Přístup Dvojfázové zaručuje lepší numerický výkon PEARSON v aplikaci Excel 2003 a vyšších verzích aplikace Excel než jednofázové přístup, který je používán v dřívějších verzích aplikace Excel. Výsledky, které můžete získat v aplikaci Excel 2003 a novějších verzích nikdy bude méně přesné, než výsledky, které jste získali v dřívějších verzích aplikace Excel.

Funkce CORREL má stejné funkce a vždy byl implementován s přístupem, který se používá pro PEARSON v aplikaci Excel 2003 a vyšších verzích aplikace Excel. Funkce CORREL je tedy vhodnější pro starší verze aplikace Excel.

V nejvíce praktické příklady však nejste pravděpodobně Všimněte si rozdílu mezi výsledky v aplikaci Excel 2003 a vyšších verzích aplikace Excel a výsledky v dřívějších verzích aplikace Excel. Typické dat je nepravděpodobné, že vykazují druh neobvyklé chování, které ukazuje tento experiment. Pravděpodobně se zobrazí v dřívějších verzích aplikace Excel data obsahuje vysoký počet platných číslic a relativně malým množstvím variant mezi hodnoty dat je číselný nestabilitu.

Postup, který vyhledá součet čtverců odchylek o střední hodnoty výběru pomocí hledání střední hodnoty výběru, computing každou odchylku ve čtverci a potom sečtením kvadratických odchylek je přesnější než alternativní postup. (Alternativní postup je často označovány jako "kalkulačky vzorec", protože je vhodný pro použití kalkulačky na malý počet datových bodů.) Alternativní postup se skládá z následujících kroků:
  1. Najděte součet čtverců všechny připomínky, velikost vzorku a součet všech pozorování.
  2. Vypočítat součet druhých mocnin všech pozorování minus ((součet všech pozorování) ^ 2) / ukázka velikost).
Existuje mnoho dalších funkcí, které byly vylepšeny v aplikaci Excel 2003 a vyšších verzích aplikace Excel. Tyto funkce jsou lepší, protože novější verze aplikace Excel nahradit postup jednofázové Dvojfázové postup, který vyhledá střední hodnoty výběru na prvním průchodu a pak vypočte součet čtverců odchylek o vzorku znamená v druhé fázi.

Krátký seznam těchto funkcí obsahuje následující funkce:
  • VAR
  • FUNKCE VAR
  • SMĚRODATNÁ ODCHYLKA
  • FUNKCE SMODCH
  • FUNKCE DVAR
  • DVAR
  • FUNKCE DSTDEV
  • DSTDEVP
  • PROGNÓZA
  • SKLON
  • PRŮSEČÍK S OSOU Y
  • PEARSON
  • RSQ
  • VRÁTÍ FUNKCE STEYX
Byla provedena podobné vylepšení v každé tři nástroje analýzy Variance v analytické nástroje.
Vlastnosti

ID článku: 828129 - Poslední kontrola: 16. 1. 2017 - Revize: 1

Váš názor