Statistiska funktioner i Excel: PEARSON

Artikelöversättning Artikelöversättning
Artikel-id: 828129 - Visa produkter som artikeln gäller.
Visa alla | Dölj alla

På den här sidan

Sammanfattning

I denna artikel beskrivs PEARSON-funktionen i Microsoft Excel. I artikeln beskrivs hur funktionen används, och resultat från PEARSON i Excel 2003 jämförs med resultat från tidigare versioner av Excel.

Mer Information

Med funktionen PEARSON(matris1, matris2) returneras korrelationskoefficienten mellan två datamatriser.

Syntax:

PEARSON(matris1, matris2)
Argumenten, matris1 och matris2, måste vara numeriska värden, namn, matriskonstanter eller referenser som innehåller numeriska värden.

PEARSON används vanligtvis med två cellområden som innehåller data, t ex PEARSON(A1:A100, B1:B100).

Exempel på användning

Gör så här för att visa ett exempel på användning av PEARSON-funktionen:
  1. Skapa ett tomt kalkylblad i Excel och kopiera följande tabell till kalkylbladet.
    Dölj tabellenVisa tabellen
    1= 3 + 10^$D$2Tiopotens att lägga till i data
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2I tidigare versioner än Excel 2003
    när D2 = 7.5
    =PEARSON(A1:A6,B1:B6)0.702038
    =KORREL(A1:A6,B1:B6)0.713772
    när D2 = 8
    #DIV/0!
    0.713772

  2. Markera cell A1 i det tomma kalkylbladet och klicka sedan på Klistra inRedigera-menyn så att posterna i tabellen fyller cellerna A1:D13.
  3. Klicka på knappen Inklistringsalternativ och sedan på Matcha målformatering. Se till att det inklistrade området är markerat och och peka på KolumnFormat-menyn, och klicka sedan på Passa markering.

    Obs! Det kan vara lämpligt att formatera cellerna B1:B6 som Tal med noll decimaler.
Cellerna A1:A6 och B1:B6 innehåller de två datamatriser som används i detta exempel för att anropa funktionerna PEARSON och KORREL i cellerna A8 och A9. Med både PEARSON och KORREL beräknas korrelationskoefficienten och resultaten bör vara samstämmiga.

I tidigare versioner än Excel 2003 kan det uppstå avrundningsfel när PEARSON används. PEARSON-funktionen har förbättrats i Excel 2003, men den förbättrade proceduren har även tidigare används i KORREL. Microsoft rekommenderar därför att du använder KORREL i stället för PEARSON i tidigare versioner än Excel 2003.

Du kan använda kalkylbladet i denna artikel i en tidigare version av Excel för att granska avrundningsfel. Om du lägger till en konstant i var och en av observationerna i B1:B6, bör inte värdet av PEARSON eller KORREL påverkas. Om du ökar värdet i D2 läggs en större konstant till i B1:B6. Om D2 är mindre än 7 uppstår inga avrundningsfel i de sex första decimalerna i PEARSON. Ändra D2-värdet till 7,25, 7,5, 7,75 och sedan 8. I cellerna D6:D13 visas värden för PEARSON och KORREL när D2 = 7,5 och när D2 = 8.

KORREL är korrekt men avrundningsfelen i PEARSON blir så allvarliga att division med noll uppstår när D2 = 8.

I tidigare versioner av Excel blir resultatet felaktigt på grund av avrundningsfel i beräkningsformeln som används i dessa versioner. De fall som visas i detta experimet kan dock betraktas som extrema.

Om du utför samma experiment i Excel 2003 ändras inte värden för PEARSON. Samma avrundningsfel visas dock i cellerna D6:D13 som i tidigare Excel-versioner.

Resultat i tidigare versioner av Excel

Om du ger de två datamatriserna namnen X och Y, används en enkel beräkning i tidigare versioner av Excel för beräkning av kvadraten på X, kvadraten på Y, summan av X, summan av Y, summan av XY och antalet observationer i varje matris. Dessa mängder kombineras sedan i beräkningsformeln i hjälpfilen i tidigare versioner av Excel.

Resultat i Excel 2003

I Excel 2003 beräknas data två gånger. Först beräknas summan av X och Y, och antalet observationer i varje matris. Utifrån dessa mängder beräknas medelvärden för X- och Y-observationer. Sedan beräknas kvadraten på skillnaden mellan varje X och X-medelvärdet och dessa värden summeras. Kvadraten på skillnaden mellan varje Y och Y-medelvärdet beräknas och dessa värden summeras. Dessutom beräknas produkterna (X ? X-medelvärde) * (Y ? Y-medelvärde) för varje datapunktpar och dessa värden summeras. De tre summorna kombineras i formeln för PEARSON. Ingen av summorna påverkas om en konstant läggs till i varje värde i Y-matrisen (eller X-matrisen), eftersom samma värde läggs till i Y-medelvärdet (eller X-medelvärdet). I de numeriska exemplen påverkas inte ens de tre summorna med en stor tiopotens i cell D12 och resultaten från andra beräkningen är oberoende av posten i cell D2. Det innebär att resultaten i Excel 2003 är mer numeriskt stabila.

Slutsatser

Dubbel beräkning ger bättre numeriska prestanda i PEARSON i Excel 2003 än den enkla beräkningen i tidigare versioner av programmet. Resultat i Excel 2003 blir aldrig mindre noggranna än resultaten i tidigare versioner. KORREL har samma funktioner och har alltid använt dubbel beräkning som för PEARSON i Excel 2003. Det innebär att KORREL är lämpligare att använda i tidigare versioner av Excel.

I de flesta fall kommer du dock inte att märka någon skillnad mellan resultaten från Excel 2003 och tidigare versioner. Det är inte troligt att problemet som illustreras i exemplet uppstår med vanliga data. Det är mer sannolikt att numerisk instabilitet uppstår i tidigare versioner av Excel när data innehåller både ett stort antal signifikanta siffror och relativt lite variation mellan datavärden.

Med proceduren som används för att beräkna summan av kvadraten på avvikelser för ett sampelmedelvärde genom att
  1. hitta sampelmedelvärdet
  2. beräkna kvadraten på avvikelserna
  3. och sedan summera dessa värden
är mer precis än den alternativa proceduren. (Den alternativa proceduren kallas ofta för miniräknarformeln, eftersom den passar för bruk på miniräknare med ett litet antal datapunkter.) Den alternativa proceduren är:
  1. Hitta kvadratsumman för alla observationer, sampelstorleken och summan av alla observationer.
  2. Beräkna kvadratsumman för alla observationer minus ((summan av alla observationer)^2)/sampelstorlek).
Många andra funktioner i Excel 2003 har förbättrats med införandet av dubbel beräkning där sampelvärdet identifieras först och summan av kvadratavvikelserna sedan beräknas.

I korthet är dessa funktioner VARIANS, VARIANSP, STDAV, STDAVP, DVARIANS, DVARIANSP, DSTDAV, DSTDAVP, PREDIKTION, LUTNING, SKÄRNINGSPUNKT, PEARSON, RKV, och STDFELYX. Liknande förbättringar har gjorts i vart och ett av de tre verktygen för variansanalys i Analysis ToolPak.

Gör så här om du vill veta mer om PEARSON: Klicka på Hjälp om Microsoft ExcelHjälp-menyn, skriv pearson i rutan Sök efter i hjälpfönstret och visa avsnittet genom att klicka på Starta sökning.

Egenskaper

Artikel-id: 828129 - Senaste granskning: den 22 mars 2006 - Revision: 1.4
Informationen i denna artikel gäller:
  • Microsoft Office Excel 2003
Nyckelord: 
kbinfo KB828129

Ge feedback

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com