Statistiske funksjoner i Excel: PEARSON

Artikkeloversettelser Artikkeloversettelser
Artikkel-ID: 828129 - Vis produkter som denne artikkelen gjelder for.
Vis alt | Skjul alt

På denne siden

Sammendrag

Denne artikkelen omhandler PEARSON-funksjonen i Microsoft Excel. Denne artikkelen beskriver hvordan du bruker funksjonen. I tillegg sammenligner denne artikkelen resultater fra PEARSON i Microsoft Office Excel 2003 og senere versjoner av Excel med resultatene av PEARSON i tidligere versjoner av Excel.

Mer informasjon

Funksjonen PEARSON (matrise1, matrise2) returnerer produktmomentkorrelasjonskoeffisienten mellom to datamatriser.

Syntaks

PEARSON(matrise1, matrise2)
Argumentene, matrise1 og matrise2, må være enten tall, navn, matrisekonstanter eller referanser som inneholder tall.

Ved bruk av PEARSON-funksjonen er det vanligvis to celleområder som inneholder dataene, for eksempel PEARSON(A1:A100, B1:B100).

Eksempelbruk

Følg denne fremgangsmåten for å lære mer om hvordan PEARSON-funksjonen fungerer:
  1. Opprett et tomt Excel-regneark, og kopier deretter denne tabellen:
    Skjul denne tabellenVis denne tabellen
    1=3+10^$D$210. potens som legges til data
    2=4+10^$D$20
    3=2+10^$D$2
    4=5+10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2før Excel 2003
    når D2 = 7,5
    =PEARSON(A1:A6;B1:B6)0.702038
    =CORREL(A1:A6;B1:B6)0.713772
    når D2 = 8
    #DIV/0!
    0.713772
  2. Stå i celle A1 i det tomme Excel-regnearket, og lim deretter inn oppføringene slik at tabellen fyller celle A1:D13 i regnearket.
  3. Klikk knappen Alternativer for innliming, og klikk deretter Bruk målformatering. Behold merkingen av det innlimte området, og bruk en av følgende fremgangsmåter som passer den versjonen av Excel du kjører:
    • I Microsoft Office Excel 2007 klikker du kategorien Hjem, klikker Format i Celler-gruppen og deretter Beste tilpassing av kolonnebredde.
    • I Microsoft Office Excel 2003 velger du KolonneFormat-menyen, og klikker deretter Beste tilpassing.
    Obs!  Det kan lønne seg å formatere cellene B1:B6 som Tall med 0 desimaler.
Cellene A1:A6 og B1:B6 inneholder de to datamatrisene som i dette eksemplet brukes til å kalle PEARSON- og CORREL-funksjonen i celle A8 og A9. Både PEARSON og CORREL beregner produktmomentkorrelasjonskoeffisienten Pearson, og resultatene av de to funksjonene skal samsvare.

I tidligere Excel-versjoner enn Excel 2003 kan det forekomme avrundingsfeil ved bruk av PEARSON. PEARSON-funksjonen er forbedret i Excel 2003 og i senere versjoner av Excel. CORREL har alltid vært implementert med den forbedrede prosedyren som nå brukes i Excel 2003 og i senere versjoner av Excel. Hvis du bruker PEARSON i en tidligere Excel-versjon enn Excel 2003, anbefaler Microsoft derfor at du heller bruker CORREL.

I tidligere versjoner enn Excel 2003 kan du bruke regnearket i denne artikkelen som en test for å finne ut når avrundingsfeil oppstår. Hvis du legger til en konstant i hver av observasjonene i B1:B6, skal det ikke ha noen innvirkning på verdien av PEARSON eller CORREL. Hvis du øker verdien i D2, blir det lagt til en større konstant i B1:B6. Hvis D2 er mindre enn 7, er det ingen avrundingsfeil i de seks første desimalene i PEARSON. Endre verdien i D2 til 7,25, deretter til 7,5 og 7,75, og til slutt til 8. Cellene D6:D13 i regnearket viser verdiene for PEARSON og CORREL når D2 = 7,5 og D2 = 8.

CORREL er fortsatt nøyaktig, men avrundingsfeilene i PEARSON har blitt så alvorlige at divisjon med 0 skjer når D2 = 8.

Tidligere versjoner av Excel gir gale svar i disse tilfellene fordi effektene av avrundingsfeil er større med beregningsformelen som brukes i disse versjonene. Tilfellene i dette eksperimentet må imidlertid anses som ekstreme.

I Excel 2003 og i senere versjoner av Excel skal du ikke kunne se endringer i PEARSON-verdiene hvis du prøver eksperimentet. Cellene D6:D13 viser imidlertid de samme avrundingsfeilene som du får i tidligere versjoner av Excel.

Resultater i tidligere versjoner av Excel

La oss kalle de to datamatrisene X og Y. Tidligere versjoner av Excel behandler dataene i én omgang for å beregne summen av kvadrater i X, summen av kvadrater i Y, summen av X, summen av Y, summen av XY, og summen av antall observasjoner i hver matrise. Disse summene blir deretter slått sammen i beregningsformelen i hjelpefilen i tidligere versjoner av Excel.

Resultater i Excel 2003 og i senere versjoner av Excel

I Excel 2003 og senere versjoner av Excel blir dataene behandlet i to omganger. Først beregnes summene av X og Y og summen av antall observasjoner i hver matrise. Utifra disse beregnes gjennomsnittet av X- og Y-observasjoner. Deretter, i andre omgang, blir den kvadrerte differansen mellom hver X og X-gjennomsnittet funnet. Disse kvadrerte differansene blir summert. Den kvadrerte differansen mellom hver Y og Y-gjennomsnittet blir funnet. Disse kvadrerte differansene blir summert. I tillegg blir produktet (X ? X-gjennomsnitt) * (Y ? Y-gjennomsnitt) funnet for hvert par med datapunkt, og deretter summert. Disse tre summene blir slått sammen i formelen for PEARSON. Ingen av disse tre summene påvirkes når du legger til en konstant i hver verdi i Y-matrisen (eller X-matrisen), fordi den samme verdien blir lagt til Y-gjennomsnittet (eller X-gjennomsnittet). I de numeriske eksemplene ? selv med en høy 10. potens i celle D12 ? blir ikke disse tre summene påvirket, og resultatene av den andre omgangen er uavhengige av oppføringen i celle D2. Resultatene i Excel 2003 og i senere versjoner av Excel er derfor mer stabile, numerisk sett.

Konklusjoner

Behandling i to omganger garanterer bedre numerisk ytelse av PEARSON i Excel 2003 og i senere versjoner av Excel enn behandlingen i én omgang som er brukt i tidligere versjoner av Excel. Resultatene du får i Excel 2003 og i senere versjoner av Excel, vil aldri bli mindre nøyaktige enn resultater du fikk i tidligere versjoner av Excel.

CORREL har samme funksjonalitet, og har alltid blitt implementert med tilnærmingen som brukes for PEARSON i Excel 2003 og for senere versjoner av Excel. CORREL er derfor et bedre valg i tidligere versjoner av Excel.

I de fleste praktiske eksempler vil du imidlertid ikke merke noen forskjell mellom resultater i Excel 2003 og i senere versjoner av Excel og resultatene i tidligere versjoner av Excel. De atypiske resultatene fra dette eksperimentet vil sannsynligvis ikke forekomme i vanlige data. Numerisk ustabilitet kan først og fremst forekomme i tidligere versjoner av Excel når data inneholder et stort antall betydelige sifre og det er relativt liten variasjon mellom dataverdiene.

Prosedyren som finner summen av kvadrerte avvik for et utvalgsgjennomsnitt ved å finne utvalgsgjennomsnittet, ved å beregne hvert kvadrerte avvik, og deretter summere de kvadrerte avvikene, er mer nøyaktig enn den alternative prosedyren. (Den alternative prosedyren refereres ofte til som kalkulatorformelen, fordi den passer til bruk med en kalkulator på et lite antall datapunkt.) Den alternative prosedyren består av følgende trinn:
  1. Finn summen av kvadrater av alle observasjoner, utvalgsstørrelsen og summen av alle observasjoner.
  2. Beregn summen av kvadrater av alle observasjoner minus ((summen av alle observasjoner)^2)/utvalgsstørrelsen).
Det er mange andre funksjoner som er forbedret i Excel 2003 og i senere versjoner av Excel. Disse funksjonene er forbedret fordi senere versjoner av Excel erstatter prosedyren for behandling i én omgang er erstattet med prosedyren for behandling i to omganger, der utvalgsgjennomsnittet blir funnet i første omgang og summen av kvadrerte avvik blir beregnet i andre omgang.

En kort liste over slike funksjoner omfatter følgende funksjoner:
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • PROGNOSE
  • STIGNINGSTALL
  • SKJÆRINGSPUNKT
  • PEARSON
  • RSQ
  • STEYX
Det ble utført tilsvarende forbedringer i hvert av de tre verktøyene for avviksanalysering i Analysis ToolPak.

Egenskaper

Artikkel-ID: 828129 - Forrige gjennomgang: 21. februar 2007 - Gjennomgang: 2.0
Informasjonen i denne artikkelen gjelder:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
Nøkkelord: 
kbinfo kbformula kbexpertisebeginner KB828129

Gi tilbakemelding

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com