Sažetak
U ovom se članku opisuje funkcija CONFIDENCE u programu Microsoft Office Excel 2003 i u programu Microsoft Office Excel 2007, ilustrira način na koji se funkcija koristi i uspoređuje rezultate funkcije za Excel 2003 i za Excel 2007 s rezultatima funkcije CONFIDENCE u starijim verzijama Excel.
Značenje intervala pouzdanosti često se pogrešno protumačiti, a mi iz podataka želimo navesti objašnjenje valjanih i nevaljanih izjava koje se mogu dati nakon utvrđivanja vrijednosti CONFIDENCE.
Dodatne informacije
Funkcija CONFIDENCE(alfa, sigma, n) vraća vrijednost koju možete koristiti za izgradnju intervala pouzdanosti za srednja vrijednost populacije. Interval pouzdanosti raspon je vrijednosti centriranjem na poznatoj sredini uzorka. Pretpostavlja se da opažanja u uzorku dolaze iz normalne razdiobe s poznatom standardnom devijacijom, sigmom, a broj opažanja u uzorku je n.
Sintaksa
CONFIDENCE(alpha,sigma,n)
Parametri: Alfa je vjerojatnost i 0 < alfa < 1. Sigma je pozitivan broj, a n je pozitivan cijeli broj koji odgovara veličini uzorka.
Alfa je obično mala vjerojatnost, npr. 0,05.
Primjer korištenja
Pretpostavimo da rezultati kvocijent inteligencije (IQ) prate normalnu raspodjelu sa standardnom devijacijom 15. Testi ste IQ-ove za uzorak od 50 učenika u lokalnoj školi i dobivate srednju vrijednost uzorka od 105. Želite izračunati interval pouzdanosti od 95 % za srednja vrijednost populacije. Interval pouzdanosti od 95% ili 0,95 odgovara alfa = 1 – 0,95 = 0,05.
Da biste prikazali funkciju CONFIDENCE, stvorite prazan radni Excel, kopirajte sljedeću tablicu, a zatim odaberite ćeliju A1 na praznom Excel radnom listu. Na izborniku Uređivanje kliknite Zalijepi.
Napomena: U Excel 2007 kliknite Zalijepi u grupi Međuspremnik na kartici Polazno.
Unosi u tablici u nastavku ispunjavaju ćelije A1:B7 na radnom listu.
alfa |
0,05 |
stdev |
15 |
n |
50 |
srednja vrijednost uzorka |
105 |
=CONFIDENCE(B1;B2;B3) |
|
=NORMSINV(1 - B1/2)*B2/SQRT(B3) |
Kada zalijepite tablicu na novi radni Excel, kliknite gumb Mogućnosti lijepljenja, a zatim Uskladi odredišno oblikovanje.
Ako je i dalje odabran zalijepiti raspon, pokažite na Stupac na izborniku Oblikovanje, a zatim kliknite Samoprilagodi odabir.
Napomena: U Excel 2007 s odabranim zalijepitim rasponom ćelija kliknite Oblikovanje u grupi Ćelije na kartici Polazno, a zatim Samoprilagodi širinu stupca.
Ćelija A6 prikazuje vrijednost POUZDANOSTI. Ćelija A7 prikazuje istu vrijednost jer poziv na CONFIDENCE(alfa, sigma, n) vraća rezultat izračuna:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
U programu Microsoft Excel 2002 nije izvršeno izravno povjerenje, no NORMSINV je poboljšan, Excel 2002 i Excel 2007. Stoga CONFIDENCE može vratiti različite (i poboljšane) rezultate u ovim kasnijim verzijama programa Excel, jer SE CONFIDENCE oslanja na NORMSINV.
To ne znači da biste trebali izgubiti povjerenje u pouzdanost za starije verzije Excel. Netočnosti u normi NORMSINV obično su se dogodile za vrijednosti argumenta vrlo blizu 0 ili vrlo blizu 1. U praksi je alfa općenito postavljen na 0,05, 0,01 ili možda 0,001. Vrijednosti alfa moraju biti mnogo manje od toga, primjerice 0,0000001, prije nego što se zaokruže pogreške u normi NORMSINV vjerojatno zamijete.
Napomena: Pogledajte članak o normi NORMSINV za raspravu o računalnim razlikama u normi NORMSINV.
Dodatne informacije potražite u članku iz Microsoftove baze znanja pod sljedećim brojem:
826772 Excel statističke funkcije: NORMSINV
Tumačenje rezultata pouzdanosti
Datoteka Excel pomoći za CONFIDENCE prepisana je za Excel 2003 i za Excel 2007 jer su sve starije verzije datoteke pomoći dale pogrešne savjete o tumačenju rezultata. U primjeru se navodi: "Pretpostavimo da u uzorku od 50 osoba na poslu prosječna duljina putovanja na posao iznosi 30 minuta uz standardnu devijaciju populacije od 2,5. Možemo biti 95 posto sigurni da je srednja vrijednost populacije u intervalu 30 +/- 0,692951", pri kojem je 0,692951 vrijednost koju vraća CONFIDENCE(0,05, 2,5, 50).
U istom je primjeru u zaključku pročitano : "prosječna duljina putovanja na posao iznosi 30 ± 0,692951 minuta ili od 29,3 do 30,7 minuta". To je vjerojatno i izjava o prosječnoj populaciji koja se nalazi u intervalu [30 – 0,692951, 30 + 0,692951] s vjerojatnosti 0,95.
Prije provođenja eksperimenta koji je dala podatke za ovaj primjer, klasični statističar (za razliku od bayesijskog statističara) ne može dati izjavu o distribuciji vjerojatnosti za srednja vrijednost populacije. Umjesto toga, klasični statističar bavi se testiranjem hipoteze.
Primjerice, klasični statističar može provesti dvostrani test hipoteze koji se temelji na pretpostavki normalne razdiobe s poznatom standardnom devijacijom (npr. 2,5), određenoj unaprijed odabranoj vrijednosti vrijednosti populacije, μ0 i unaprijed odabranoj razini značajnosti (npr. 0,05). Rezultat testa temeljio bi se na vrijednosti opažene srednja vrijednosti uzorka (na primjer 30), a nulta pretpostavka da je srednja vrijednost populacije μ0 bila bi odbijena na razini značajnosti 0,05 ako je opažena srednja vrijednost uzorka bila predaleko od μ0 u oba smjera. Ako se odbije hipoteza null, tumačenje je da uzorak znači da je daleko ili dalje od μ0 slučajno manje od 5 % vremena pod pretpostavkom da je μ0 srednja vrijednost prave populacije. Nakon provođenja ovog testa klasični statističar i dalje ne može dati izjavu o distribuciji vjerojatnosti za srednja vrijednost populacije.
Bayesian statistician, s druge strane, će početi s pretpostavljenom distribucijom vjerojatnosti za populacijsku srednja vrijednost (pod nazivom a priori distribucija), prikupiti eksperimentalne dokaza na isti način kao i klasični statističar, a koristit će se taj dokaz da biste revidirali njezinu ili njegovu distribuciju vjerojatnosti za srednja populacija i time dobili a posteriornu distribuciju. Excel ne pruža statističke funkcije koje bi pomogle bayesian statistician u ovom nastojanju. Excel statističke funkcije namijenjene su klasičnim statističarima.
Intervali pouzdanosti povezani su s testovima hipoteze. S obzirom na eksperimentalni dokaz, interval pouzdanosti daje sažetu izjavu o vrijednostima hipotetizirane populacije srednja vrijednost μ0 koja bi dala prihvaćanje nulte hipoteze da je srednja vrijednost populacije μ0 i vrijednosti μ0 koje bi urodili odbacivanjem null pretpostavke da je srednja vrijednost populacije μ0. Klasični statističar ne može dati nikakve izjave o vjerojatnosti da srednja vrijednost populacije pada u bilo kojem određenom intervalu jer ona ili on nikad ne daje priori pretpostavke o toj distribuciji vjerojatnosti i takve bi pretpostavke bile potrebne da se koriste eksperimentalni dokazi da bi ih se revidirale.
Istražite odnos između testova hipoteze i intervala pouzdanosti pomoću primjera na početku ovog odjeljka. Odnos između CONFIDENCE i NORMSINV naveden u zadnjem odjeljku sadrži sljedeće:
CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
Budući da je srednja vrijednost uzorka 30, interval pouzdanosti je 30 +/- 0,692951.
Sada razmislite o dvostranom testu hipoteze s razinom značajnosti 0,05 kao što je opisano ranije, koje pretpostavlja normalnu raspodjelu sa standardnom devijacijom 2,5, veličinom uzorka od 50 i specifičnom hipotetiziranom srednja vrijednost populacije, μ0. Ako je to srednja vrijednost prave populacije, srednja vrijednost uzorka doći će iz normalne razdiobe s μ0 i standardnom devijacijom, 2,5/SQRT(50). Ta je raspodjela simetrična oko μ0 i želite odbaciti hipotezu null ako JE ABS(srednja vrijednost uzorka - μ0) > vrijednost za izrez. Vrijednost za izrezanje bila bi takva da ako je μ0 srednja vrijednost prave populacije, vrijednost srednja vrijednost uzorka – μ0 veća od tog izreza ili vrijednost μ0 – srednja vrijednost uzorka veća od te vrijednosti, svaki bi se od njih dogodio s vjerojatnošću 0,05/2. Ta je vrijednost izrezana
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
Stoga odbacite hipotezu null (srednja vrijednost populacije = μ0) ako je istinita jedna od sljedećih izjava:
srednja vrijednost uzorka – μ0 > 0. 692951
0 – srednja vrijednost uzorka > 0. 692951
Budući da je srednja vrijednost uzorka = 30 u našem primjeru, te dvije izjave postaju sljedeće izjave:
30 – μ0 > 0. 692951
μ0 – 30 > 0. 692951
Prepisujući ih tako da se na lijevoj strani prikazuje samo μ0 daje sljedeće izjave:
μ0 < 30 – 0. 692951
μ0 > 30 + 0. 692951
To su točno vrijednosti μ0 koje nisu u intervalu pouzdanosti [30 – 0,692951, 30 + 0,692951]. Stoga interval pouzdanosti [30 – 0,692951, 30 + 0,692951] sadrži vrijednosti μ0 u kojima nulta hipoteza da srednja vrijednost populacije μ0 ne bi bila odbijena, s obzirom na dokaz o uzorku. Za vrijednosti μ0 izvan tog intervala, nulta pretpostavka da je srednja vrijednost populacije μ0 bit će odbijena s obzirom na uzorak dokaza.
Zakljuci
Netočnosti u starijim verzijama Excel obično se pojavljuju za iznimno male ili iznimno velike vrijednosti p u normi NORMSINV(p). CONFIDENCE se procjenjuje pozivajući NORMSINV(p), pa je točnost normi NORMSINV potencijalna briga za korisnike pouzdanosti. No vrijednosti p koje se koriste u praksi vjerojatno neće biti dovoljno ekstremne da uzrokuju značajne zaokružne pogreške u normi NORMSINV, a performanse confidencea ne bi trebale biti problem za korisnike bilo koje verzije Excel.
Većina ovog članka usredotočila se na tumačenje rezultata pouzdanosti. Drugim riječima, upitali smo: "Koje je značenje intervala pouzdanosti?" Intervali pouzdanosti često se pogrešno razumiju. Nažalost, Excel pomoći u svim verzijama programa Excel koje su starije od Excel 2003 pridonijele su tom nesporazumu. Poboljšana Excel pomoći za 2003.