Sammendrag

Denne artikkelen beskriver KONFIDENS-funksjonen i Microsoft Office Excel 2003 og Microsoft Office Excel 2007, illustrerer hvordan funksjonen brukes, og sammenligner resultatene av funksjonen for Excel 2003 og Excel 2007 med resultatene av KONFIDENS i tidligere versjoner av Excel.Betydningen av et konfidensintervall feiltolkes ofte, og vi prøver å gi en forklaring av gyldige og ugyldige setninger som kan gjøres etter at du har bestemt en KONFIDENSverdi fra dataene.

Mer informasjon

KONFIDENS(alfa, sigma, n)-funksjonen returnerer en verdi som du kan bruke til å konstruere et konfidensintervall for en populasjonsverdi. Konfidensintervallet er et verdiområde som er sentrert rundt et kjent utvalgsgjennomsnittet. Observasjoner i utvalget antas å komme fra en normal fordeling med kjent standardavvik, sigma og antall observasjoner i utvalget er n.

Syntaks

CONFIDENCE(alpha,sigma,n)

Parametere: Alfa er en sannsynlighet og 0 < alfa < 1. Sigma er et positivt tall, og n er et positivt heltall som tilsvarer utvalgsstørrelsen.Alfa er vanligvis en liten sannsynlighet, for eksempel 0,05.

Eksempel på bruk

Anta at intelligens kvotient (IQ) score følger en normal fordeling med standardavvik 15. Du tester IQ-er for et utvalg på 50 elever på den lokale skolen og får et utvalg på 105. Du vil beregne et konfidensintervall på 95 % for gjennomsnittet for populasjonen. Et konfidensintervall på 95 % eller 0,95 tilsvarer alfa = 1 – 0,95 = 0,05.Hvis du vil illustrere KONFIDENS-funksjonen, oppretter du et tomt Excel-regneark, kopierer tabellen nedenfor og merker celle A1 i det tomme Excel-regnearket. Klikk på Lim innRediger-menyen.

Obs!: Klikk Lim inn i Utklippstavle-gruppen i kategorien Hjem i Excel 2007.

Oppføringene i tabellen nedenfor fyller cellene A1:B7 i regnearket.

Alpha

0,05

Stdav

15

n

50

eksempelverdi

105

=KONFIDENS(B1;B2;B3)

=NORMSINV(1 - B1/2)*B2/SQRT(B3)

Når du har limt inn denne tabellen i det nye Excel-regnearket, klikker du Knappen Alternativer for innliming og deretter Tilordne målformatering.

Mens det innlimte området fremdeles er merket, peker du på KolonneFormat-menyen, og deretter klikker du Beste tilpassing av merket område.

Obs!: I Excel 2007, der det innlimte celleområdet er merket, klikker du Formater i Celler-gruppenFanen Hjem, og deretter klikker du Beste tilpassing av kolonnebredde.

Celle A6 viser verdien av KONFIDENS. Celle A7 viser samme verdi fordi et kall til KONFIDENS(alfa, sigma, n) returnerer resultatet av databehandling:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Ingen endringer ble gjort direkte i KONFIDENS, men NORMSINV ble forbedret i Microsoft Excel 2002, og deretter ble det gjort flere forbedringer mellom Excel 2002 og Excel 2007. KONFIDENS kan derfor returnere ulike (og forbedrede) resultater i disse senere versjonene av Excel, fordi KONFIDENS er avhengig av NORMSINV.Dette betyr ikke at du bør miste tilliten til KONFIDENS for tidligere versjoner av Excel. Unøyaktigheter i NORMSINV skjedde vanligvis for verdier av argumentet svært nær 0 eller svært nær 1. I praksis er alfa vanligvis satt til 0,05, 0,01 eller kanskje 0,001. Verdier av alfa må være mye mindre enn det, for eksempel 0,0000001, før avrundingsfeil i NORMSINV sannsynligvis blir lagt merke til.

Obs!: Se artikkelen om NORMSINV for en diskusjon om beregningsforskjeller i NORMSINV.

Hvis du vil ha mer informasjon, klikker du følgende artikkelnummer for å vise artikkelen i Microsoft Knowledge Base:

826772 Statistiske funksjoner i Excel: NORMSINV

Tolkning av resultatene av KONFIDENS

Excel-hjelpefilen for CONFIDENCE er omskrevet for Excel 2003 og Excel 2007, fordi alle tidligere versjoner av Hjelpe-filen ga villedende råd om hvordan du tolker resultater. I eksemplet står det «Anta at vi ser at i vårt utvalg av 50 pendlere er gjennomsnittlig reiselengde på jobb 30 minutter med et standardavvik for populasjonen på 2,5. Vi kan være 95 prosent sikre på at befolkningsgjennomsnittet er i intervallet 30 +/- 0,692951" der 0,692951 er verdien returnert av KONFIDENS(0,05, 2,5, 50).I samme eksempel står konklusjonen: «Den gjennomsnittlige reiselengden til arbeid er lik 30 ± 0,692951 minutter eller 29,3 til 30,7 minutter.» Formodentlig er dette også en setning om populasjonsgjennomsnittet som faller innenfor intervallet [30 – 0,692951, 30 + 0,692951] med sannsynlighet 0,95.Før du utfører eksperimentet som ga dataene for dette eksemplet, kan en klassisk statistiker (i motsetning til en bayesisk statistiker) ikke gi noen uttalelse om sannsynlighetsfordelingen av gjennomsnittet for populasjonen. I stedet håndterer en klassisk statistiker hypotesetesting.En klassisk statistiker vil for eksempel kanskje gjennomføre en tosidig hypotesetest som er basert på antakelsen av en normal fordeling med kjent standardavvik (for eksempel 2,5), en bestemt forhåndsvalgt verdi av gjennomsnittet for populasjonen, μ0 og et forhåndsvalgt signifikansnivå (for eksempel 0,05). Testens resultat vil være basert på verdien av det observerte utvalgsgjennomsnittet (for eksempel 30), og nullhypotesen som gjennomsnittet for populasjonen er μ0, vil bli avvist på et signifikansnivå 0,05 hvis det observerte utvalgsgjennomsnittet var for langt fra μ0 i begge retninger. Hvis nullhypotesen blir avvist, er tolkningen at et utvalg betyr at langt eller lenger fra μ0 tilfeldigvis ville skje mindre enn 5% av tiden under antakelsen om at μ0 er den sanne populasjonsgjennomsnittet. Etter å ha utført denne testen, kan en klassisk statistiker fortsatt ikke gi noen uttalelse om sannsynlighetsfordelingen av populasjonen.En bayesisk statistiker, derimot, ville starte med en antatt sannsynlighetsfordeling for befolkningsgjennomsnittet (kalt en priorifordeling), ville samle eksperimentelle bevis på samme måte som den klassiske statistikeren, og ville bruke dette beviset til å revidere henne eller hans sannsynlighetsfordeling for befolkningsgjennomsnittet og dermed få en posteriori fordeling. Excel inneholder ingen statistiske funksjoner som vil hjelpe en bayesisk statistiker i dette arbeidet. Statistiske funksjoner i Excel er beregnet på klassiske statistikere.Konfidensintervaller er relatert til hypotesetester. Gitt eksperimentelle bevis, et konfidensintervall gjør en konsis uttalelse om verdiene i den hypotetiske befolkningen bety μ0 som ville gi aksept av null hypotesen at populasjonen gjennomsnittet er μ0 og verdiene av μ0 som ville gi avvisning av null hypotesen at befolkningen mener er μ0. En klassisk statistiker kan ikke komme med noen uttalelse om sjansen for at befolkningen mener faller i et bestemt intervall, fordi hun eller han aldri gjør en priori antagelser om denne sannsynlighetsfordelingen og slike antagelser ville være nødvendig hvis man skulle bruke eksperimentelle bevis for å revidere dem.Utforsk forholdet mellom hypotesetester og konfidensintervaller ved å bruke eksemplet i begynnelsen av denne delen. Med forholdet mellom KONFIDENS og NORMSINV angitt i den siste delen, har du:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Fordi utvalgsgjennomsnittet er 30, er konfidensintervallet 30 +/- 0,692951.

Vurder nå en tosidig hypotesetest med signifikansnivå 0,05 som beskrevet tidligere som forutsetter en normal fordeling med standardavvik 2,5, en utvalgsstørrelse på 50 og et bestemt hypotetisk gjennomsnitt for populasjonen, μ0. Hvis dette er gjennomsnittet for den sanne populasjonen, kommer utvalgsgjennomsnittet fra en normal fordeling med populasjonsgjennomsnittet μ0 og standardavvik, 2,5/SQRT(50). Denne fordelingen er symmetrisk om μ0, og du vil forkaste nullhypotesen hvis ABS(utvalgsgjennomsnittet - μ0) > en avkuttet verdi. Cutoff-verdien ville være slik at hvis μ0 var gjennomsnittet for den sanne populasjonen, ville en verdi av utvalgsgjennomsnittet - μ0 høyere enn denne avskjæringen eller en verdi på μ0 – utvalgsgjennomsnittet høyere enn denne avskjæringen ville hver skje med sannsynlighet 0,05/2. Denne cutoff-verdien er

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Avvis derfor nullhypotesen (populasjonsgjennomsnittet = μ0) hvis en av følgende setninger er sann:

eksempelverdi - μ0 > 0. 692951 0 – utvalgsgjennomsnittet > 0. 692951

Fordi eksempelgjennomsnittet = 30 i eksemplet vårt, blir disse to setningene følgende uttrykk:

30 - μ0 > 0. 692951 μ0–30 > 0. 692951

Omskriving av dem slik at bare μ0 vises til venstre gir følgende uttalelser:

μ0 < 30-0. 692951 μ0 > 30 + 0. 692951

Dette er nøyaktig verdiene for μ0 som ikke er i konfidensintervallet [30 –0,692951, 30 + 0,692951]. Konfidensintervallet [30 –0,692951, 30 + 0,692951] inneholder derfor verdiene for μ0 der nullhypotesen som gjennomsnittet for populasjonen er μ0 ikke ville bli avvist, gitt utvalgsbeviset. For verdiene av μ0 utenfor dette intervallet vil nullhypotesen om at gjennomsnittet for populasjonen er μ0 bli avvist gitt utvalgsbeviset.

Konklusjoner

Unøyaktigheter i tidligere versjoner av Excel forekommer vanligvis for ekstremt små eller svært store verdier av p i NORMSINV(p). KONFIDENS evalueres ved å kalle NORMSINV(p), så nøyaktigheten til NORMSINV er en potensiell bekymring for brukere av TILLIT. Verdier av p som brukes i praksis er imidlertid ikke sannsynligvis ekstreme nok til å forårsake betydelige avrundingsfeil i NORMSINV, og ytelsen til KONFIDENS bør ikke være et problem for brukere av noen versjon av Excel.Mesteparten av denne artikkelen har fokusert på å tolke resultatene av KONFIDENS. Med andre ord har vi spurt: "Hva er betydningen av et konfidensintervall?" Konfidensintervaller misforstås ofte. Excel-hjelpefiler i alle versjoner av Excel som er eldre enn Excel 2003, har dessverre bidratt til denne misforståelsen. Hjelpefilen for Excel 2003 er forbedret.

Trenger du mer hjelp?

Vil du ha flere alternativer?

Utforsk abonnementsfordeler, bla gjennom opplæringskurs, finn ut hvordan du sikrer enheten og mer.

Fellesskap hjelper deg med å stille og svare på spørsmål, gi tilbakemelding og høre fra eksperter med stor kunnskap.