Rezime
Ovaj članak opisuje funkciju CONFIDENCE u programu Microsoft Office Excel 2003 i programu Microsoft Office Excel 2007, ilustruje kako se funkcija koristi i poredi rezultate funkcije za Excel 2003 i Excel 2007 sa rezultatima funkcije CONFIDENCE u starijim verzijama programa Excel.
Značenje intervala pouzdanosti često se pogrešno tumači i nastojimo da pružimo objašnjenje važećih i nevažećih izraza koje se može dati kada utvrdite vrednost CONFIDENCE iz podataka.Više informacija
Funkcija CONFIDENCE(alfa, sigma, n) vraća vrednost koju možete da koristite da biste konstruisali interval pouzdanosti za srednju vrednost populacije. Interval pouzdanosti je opseg vrednosti koje su centriirane na poznatoj srednjoj vrednosti uzorka. Pretpostavlja se da posmatranja u uzorku dolaze iz normalne raspodele sa poznatom standardnom devijacijom, sigmom, a broj opservacija u uzorku je n.
Sintaksa
CONFIDENCE(alpha,sigma,n)
Parametri: Alfa je verovatnoća i 0 < alfa < 1. Sigma je pozitivan broj, a n je pozitivan ceo broj koji odgovara veličini uzorka.
Obično je alfa mala verovatnoća, na primer 0,05.Primer korišćenja
Pretpostavimo da količnik inteligencije (IQ) prati normalnu raspodelu sa standardnom devijacijom 15. Testirate IQ-ove za uzorak od 50 studenata u lokalnoj školi i dobijate uzorak srednje vrednosti od 105. Želite da računate interval pouzdanosti od 95% za srednju vrednost populacije. Interval pouzdanosti od 95% ili 0,95 odgovara alfa = 1 – 0,95 = 0,05.
Da biste ilustroli funkciju CONFIDENCE, kreirajte prazan Excel radni list, kopirajte sledeću tabelu, a zatim izaberite ćeliju A1 u praznom Excel radnom listu. U meniju Uređivanje izaberite stavku Nalepi.Napomena: U programu Excel 2007 izaberite stavku Nalepi u grupi Ostava na kartici Početak.
Stavke u dolenavedenoj tabeli popunjavaju ćelije A1:B7 u radnom listu.
Alfa |
0,05 |
Stdev |
15 |
n |
50 |
sredina uzorka |
105 |
=CONFIDENCE(B1,B2,B3) |
|
=NORMSINV(1 - B1/2)*B2/SQRT(B3) |
Kada nalepite ovu tabelu u novi Excel radni list, kliknite na dugme Opcije lepljenja, a zatim izaberite stavku Uskladi sa odredišnim oblikovanjem.
Dok je nalepljeni opseg još uvek izabran, u meniju "Oblikovanje" postavite pokazivač na stavku "Kolona", a zatim izaberite stavku "Automatski uklopi izbor".
Napomena: U programu Excel 2007, sa izabranim nalepljenim opsegom ćelija, kliknite na dugme Oblikuj u grupi Ćelije na kartici Početak, a zatim izaberite stavku Automatski uklopi širinu kolone.
Ćelija A6 prikazuje vrednost CONFIDENCE. Ćelija A7 prikazuje istu vrednost zato što poziv funkciji CONFIDENCE(alfa, sigma, n) daje rezultat izračunavanja:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
Nije izvršena nijedna promena direktno u funkciji CONFIDENCE, ali je NORMSINV poboljšan u programu Microsoft Excel 2002, a zatim je napravljeno više poboljšanja između programa Excel 2002 i Excel 2007. Stoga funkcija CONFIDENCE može dati različite (i poboljšane) rezultate u ovim novijim verzijama programa Excel, jer se CONFIDENCE oslanja na NORMSINV.
To ne znači da bi trebalo da izgubite poverenje u pouzdanost za starije verzije programa Excel. Greške u funkciji NORMSINV obično su se javljale za vrednosti argumenta koje su veoma blizu 0 ili veoma blizu broja 1. U praksi, alfa je obično podešena na 0,05, 0,01 ili možda 0,001. Vrednosti alfa moraju biti mnogo manje od toga, na primer 0,0000001, pre nego što se primete greške prilikom zaokruživanja u funkciji NORMSINV.Napomena: Pogledajte članak o funkciji NORMSINV da biste videli diskusiju o razlikama u proučavanja u funkciji NORMSINV.
Za više informacija kliknite na sledeći broj članka da biste videli članak u Microsoft bazi znanja:
826772 Excel statističke funkcije: NORMSINV
Interpretacija rezultata funkcije CONFIDENCE
Excel datoteka pomoći za CONFIDENCE je ponovo napisana za Excel 2003 i Excel 2007 zato što su sve starije verzije datoteke pomoći dale pogrešan savet o tumačenju rezultata. Primer navodi: "Recimo da u našem uzorku od 50 putnika prosečna dužina putovanja na posao iznosi 30 minuta, a standardna devijacija populacije od 2,5. Možemo biti 95 procenata uvereni da je srednja vrednost populacije u intervalu od 30 +/- 0,692951" gde je 0,692951 vrednost koju vraća funkcija CONFIDENCE(0,05, 2,5, 50).
Na isti primer, zaključak prikazuje"Prosečna dužina putovanja iznosi 30 ± 0,692951 minuta ili od 29,3 do 30,7 minuta". Ovo je verovatno i izjava o opadanju populacije u intervalu [30 – 0,692951, 30 + 0,692951] sa verovatnoća 0,95. Pre nego što izvedete eksperiment koji je dao podatke za ovaj primer, klasični statistički (za razliku od bajske statističke) ne može da daje izjavu o raspodeli verovatnoće srednje vrednosti populacije. Klasiиni statistiиar se bavi hipotetiиnim testiranjem. Na primer, klasični statistički podatak može da izvrši dvostrani test hipoteze koji je zasnovan na pretpostavci normalne raspodele sa poznatom standardnom devijacijom (kao što je 2,5), određenom unapred izabranom vrednošću srednje vrednosti populacije, μ0 i unapred izabranim nivoom značaja (kao što je 0,05). Rezultat testa će biti zasnovan na vrednosti posmatrane sredine uzorka (na primer 30) i bez vrednosti hipoteze da je sredina populacije μ0 biće odbijena na nivou značaja 0,05 ako je opservirana sredina uzorka bila daleko od μ0 u oba smera. Ako se hipoteza bez vrednosti odbaci, tumačenje je da uzorak znači da bi se daleko ili dalje od μ0 javilo slučajno manje od 5% vremena pod pretpostavnom pozicijom da μ0 predstavlja pravu srednju vrednost populacije. Nakon izvoda ovog testa, klasični statističkinja i dalje ne može da daje bilo kakve izjave o raspodeli verovatnoće srednje vrednosti populacije. Sa druge strane, bajeska statistička ekipa bi počinjala pretpostavljenim raspodelom verovatnoće za srednju vrednost populacije (pod imenom prioritetna raspodela), prikupila bi eksperimentalne dokaze na isti način kao klasični statistički i koristila bi ovaj dokaz da koriguje raspodelu verovatnoće za srednju vrednost populacije i tako dobije posteorijsku raspodelu. Excel ne pruža statističke funkcije koje bi pomogle baješskom statističkom timu u ovom poduhvatu. Statističke funkcije programa Excel namenjene su klasičnim statističarima. Intervali pouzdanosti su povezani sa Hipotetičkim testovima. S dijagnostičkim dokazima, interval pouzdanosti daje sažetu izjavu o vrednostima hipotetičke sredine populacije koja daje prihvatljivu hipotezu "nulte" u kojoj je sredina populacije μ0 i vrednosti μ0 koje bi dale odbacivanje prazne hipoteze koju sredina populacije predstavlja μ0. Klasični statističar ne može da daje bilo kakve izjave o šansama da srednja vrednost populacije spada u bilo koji određeni interval, jer ona ili on nikada ne daje prioritete u vezi sa tom raspodelom verovatnoće i takve pretpostavke bi bile neophodne ako bi se koristili eksperimentalni dokazi za njihovu korigaciju. Istražite odnos između hipotetičkih testova i intervala pouzdanosti koristeći primer na početku ovog odeljka. Sa relacijama između funkcija CONFIDENCE i NORMSINV navedenim u poslednjem odeljku, imate:CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
Pošto je sredina uzorka 30, interval pouzdanosti je 30 +/- 0,692951.
Sada razmotrite dvostrani hipotetički test sa nivoom značaja 0,05 kao što je opisano ranije, koji pretpostavlja normalnu raspodelu sa standardnom devijacijom 2,5, veličinu uzorka od 50 i određenu hipotetičku srednju vrednost populacije, μ0. Ako je ovo tačna srednja vrednost populacije, onda će sredina uzorka biti iz normalne raspodele sa sredinom populacije μ0 i standardnom devijacijom, 2,5/SQRT(50). Ova raspodela je simetrična oko μ0 i trebalo bi da odbacite null hipotezu ako ABS(sredina uzorka - μ0) > nekom rezlokacionom vrednošću. Vrednost za rezanje bi bila takva da je μ0 tačna sredina populacije, vrednost prosek uzorka – μ0 veća od ovog stepena isecanje ili vrednost μ0 – srednja vrednost uzorka veća od ovog rezanja bi se javila sa verovatnoćama 0,05/2. Ova vrednost za isecanje je
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
Zato odbacite praznu hipotezu (sredina populacije = μ0) ako je jedan od sledećih izraza tačan:
sredina uzorka - μ0 > 0.
692951 0 – srednja vrednost uzorka > 0. 692951Budući da je sredina uzorka = 30 u našem primeru, ove dve izjave postaju sledeće izjave:
30 - μ0 > 0.
692951 μ0 – 30 > 0. 692951Prepisivanje teksta tako da se na levoj strani pojavljuje samo μ0 daje sledeće izjave:
μ0 < 30 - 0.
692951 μ0 > 30 + 0. 692951Ovo su upravo vrednosti μ0 koje nisu u intervalu pouzdanosti [30 – 0,692951, 30 + 0,692951]. Stoga interval pouzdanosti [30 – 0,692951, 30 + 0,692951] sadrži vrednosti μ0 kod kojih srednja vrednost populacije nije μ0, ako se zada uzorak dokaza. Za vrednosti μ0 izvan ovog intervala, prazna hipoteza da je sredina populacije μ0 biće odbijena ako se dobije uzorak dokaza.
Zakljuиke
Greške u starijim verzijama programa Excel obično se javljaju za izuzetno male ili izuzetno velike vrednosti p u funkciji NORMSINV(p). Funkcija CONFIDENCE se procenjuje pozivanjem funkcije NORMSINV(p), tako da je tačnost funkcije NORMSINV potencijalna briga za korisnike funkcije CONFIDENCE. Međutim, vrednosti p koje se koriste u praksi verovatno neće biti dovoljno ekstremne da dovode do značajnih grešaka prilikom zaokruživanja u funkciji NORMSINV, a performanse funkcije CONFIDENCE ne bi trebalo da budu zabrinjavajuće za korisnike bilo koje verzije programa Excel.
Veći deo ovog članka se fokusirao na tumačenje rezultata funkcije CONFIDENCE. Drugim rečima, postavili smo pitanje "Šta je značenje intervala pouzdanosti?" Intervali pouzdanosti često se pogrešno razumeju. Nažalost, excel datoteke pomoći u svim verzijama programa Excel starijim od verzije Excel 2003 doprinele su ovom nesporazumu. Datoteka pomoći za Excel 2003 je poboljšana.