Descrierea funcțiilor statistice CONFIDENCE din Excel

Rezumat

Acest articol descrie funcția CONFIDENCE din Microsoft Office Excel 2003 și Microsoft Office Excel 2007, ilustrează modul de utilizare a funcției și compară rezultatele funcției pentru Excel 2003 și Excel 2007 cu rezultatele funcției CONFIDENCE din versiunile anterioare de Excel.

Semnificația intervalului de încredere este adesea interpretată greșit și încercăm să oferim o explicație pentru afirmațiile valide și nevalide care pot fi făcute după ce determinați o valoare de ÎNCREDERE din datele dvs.

Mai multe informații

Funcția CONFIDENCE(alfa, sigma, n) returnează o valoare pe care o puteți utiliza pentru a construi un interval de încredere pentru o medie a populației. Intervalul de încredere este un interval de valori centrate pe o medie cunoscută a eșantionului. Se presupune că observațiile din eșantion provin dintr-o distribuție normală cu abatere standard cunoscută, sigma, iar numărul de observații din eșantion este n.

Sintaxă

CONFIDENCE(alpha,sigma,n)

Parametri: alfa este o probabilitate și 0 < alfa < 1. Sigma este un număr pozitiv, iar n este un întreg pozitiv care corespunde dimensiunii eșantionului.

De obicei, alfa este o probabilitate mică, cum ar fi 0,05.

Exemplu de utilizare

Să presupunem că scorurile coeficientului de inteligență (IQ) urmează o distribuție normală cu abaterea standard 15. Testezi IQ-ul pentru un eșantion de 50 de elevi din școala ta locală și obții o medie a eșantionului de 105. Doriți să calculați un interval de încredere de 95% pentru media populației. Un interval de încredere de 95% sau 0,95 corespunde alfa = 1 – 0,95 = 0,05.

Pentru a ilustra funcția CONFIDENCE, creați o foaie de lucru Excel necompletată, copiați următorul tabel și apoi selectați celula A1 din foaia de lucru Excel necompletată. În meniul Editare, faceți clic pe Lipire.

Notă

În Excel 2007, faceți clic pe Lipire în grupul Clipboard de pe fila Pornire .

Intrările din tabelul de mai jos completează celulele A1:B7 din foaia de lucru.

alfa 0,05
stdev 15
n 50
Media eșantionului 105
=CONFIDENCE(B1;B2;B3)
=NORMSINV(1 - B1/2)*B2/SQRT(B3)

După ce lipiți acest tabel în noua foaie de lucru Excel, faceți clic pe butonul Opțiuni lipire , apoi faceți clic pe Potrivire formatare destinație.

Cu zona lipită încă selectată, indicați spre Coloană în meniul Formatare , apoi faceți clic pe Potrivire automată selecție.

Notă

În Excel 2007, cu zona de celule lipită selectată, faceți clic pe Format în grupul Celule de pe fila Pornire , apoi faceți clic pe Potrivire automată lățime coloane.

Celula A6 afișează valoarea CONFIDENCE. Celula A7 afișează aceeași valoare, deoarece un apel la CONFIDENCE(alfa, sigma, n) returnează rezultatul calculului:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Nu au fost efectuate modificări direct la CONFIDENCE, dar NORMSINV a fost îmbunătățit în Microsoft Excel 2002, apoi au fost aduse îmbunătățiri suplimentare între Excel 2002 și Excel 2007. Prin urmare, CONFIDENCE poate returna rezultate diferite (și îmbunătățite) în aceste versiuni mai recente de Excel, deoarece CONFIDENCE se bazează pe NORMSINV.

Acest lucru nu înseamnă că ar trebui să vă pierdeți încrederea în ÎNCREDERE pentru versiunile anterioare de Excel. Inexactitățile din NORMSINV au apărut în general pentru valori ale argumentului său foarte apropiate de 0 sau foarte apropiate de 1. În practică, alfa este setat în general la 0,05, 0,01 sau poate 0,001. Valorile alfa trebuie să fie mult mai mici decât atât, de exemplu, 0,0000001, înainte să fie observate erorile de rotunjire din NORMSINV.

Notă

Vedeți articolul despre NORMSINV pentru o discuție despre diferențele computaționale din NORMSINV.

Pentru mai multe informații, faceți clic pe următorul număr de articol pentru a-l vedea în Baza de cunoștințe Microsoft:

826772 Funcții statistice Excel: NORMSINV

Interpretarea rezultatelor CONFIDENCE

Fișierul de ajutor Excel pentru CONFIDENCE a fost rescris pentru Excel 2003 și Excel 2007, deoarece toate versiunile anterioare ale fișierului Ajutor dădeau sfaturi înșelătoare cu privire la interpretarea rezultatelor. Exemplul afirmă: "Să presupunem că observăm că, în eșantionul nostru de 50 de navetiști, durata medie a călătoriei la serviciu este de 30 de minute cu o abatere standard a populației de 2,5. Putem fi siguri în proporție de 95% că media populației se află în intervalul 30 +/- 0,692951", unde 0,692951 este valoarea returnată de CONFIDENCE(0,05; 2,5; 50).

Pentru același exemplu, concluzia spune: "durata medie a călătoriei la serviciu este egală cu 30 ± 0,692951 minute sau 29,3 până la 30,7 minute". Probabil, aceasta este, de asemenea, o afirmație despre media populației care se încadrează în interval [30 – 0,692951, 30 + 0,692951] cu probabilitate 0,95.

Înainte de a efectua experimentul care a dat datele pentru acest exemplu, un statistician clasic (spre deosebire de un statistician bayesian) nu poate face nicio afirmație despre distribuția de probabilitate a mediei populației. În schimb, un statistician clasic se ocupă de testarea ipoteticelor.

De exemplu, un statistician clasic poate dori să efectueze un test ipotetic bilateral care se bazează pe presupunerea unei distribuții normale cu abatere standard cunoscută (cum ar fi 2,5), o anumită valoare preselectată a mediei populației, μ0 și un nivel de semnificație preselectat (cum ar fi 0,05). Rezultatul testului s-ar baza pe valoarea mediei observate a eșantionului (de exemplu, 30), iar ipoteza nulă că media populației este μ0 ar fi respinsă la un nivel de semnificație 0,05 dacă media observată a eșantionului ar fi prea departe de μ0 în oricare direcție. Dacă ipoteza nulă este respinsă, interpretarea este că o medie a eșantionului care este departe sau mai departe de μ0 ar apărea din întâmplare mai puțin de 5% din timp, presupunând că μ0 este adevărata medie a populației. După efectuarea acestui test, un statistician clasic încă nu poate face nicio afirmație despre distribuția de probabilitate a mediei populației.

Un statistician bayesian, pe de altă parte, ar începe cu o distribuție de probabilitate presupusă pentru media populației (numită distribuție a priori), ar aduna dovezi experimentale în același mod ca statisticianul clasic și ar folosi aceste dovezi pentru a-și revizui distribuția de probabilitate pentru media populației și astfel a obține o distribuție a posteriori. Excel nu oferă funcții statistice care ar ajuta un statistician bayesian în acest efort. Toate funcțiile statistice Excel sunt destinate statisticienilor clasici.

Intervalele de încredere sunt asociate testelor ipotetice. Având în vedere dovezile experimentale, un interval de încredere face o afirmație concisă despre valorile mediei ipotetice a populației μ0 care ar da acceptarea ipotezei nule că media populației este μ0 și a valorilor μ0 care ar produce respingerea ipotezei nule că media populației este μ0. Un statistician clasic nu poate face nicio afirmație despre șansa ca media populației să scadă într-un anumit interval, deoarece el sau el nu face niciodată presupuneri a priori despre această distribuție a probabilității și astfel de ipoteze ar fi necesare dacă s-ar folosi dovezi experimentale pentru a le revizui.

Explorați relația dintre testele ipotetice și intervalele de încredere utilizând exemplul de la începutul acestei secțiuni. Având în vedere relația dintre CONFIDENCE și NORMSINV menționată în secțiunea anterioară, aveți:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Deoarece media eșantionului este 30, intervalul de încredere este 30 +/- 0,692951.

Acum să luăm în considerare un test ipotetic cu două fețe cu nivelul de semnificație 0,05, așa cum este descris mai devreme, care presupune o distribuție normală cu abatere standard 2,5, o dimensiune a eșantionului de 50 și o medie ipotetică specifică a populației, μ0. Dacă aceasta este media adevărată a populației, atunci media eșantionului va proveni dintr-o distribuție normală cu media populației μ0 și abatere standard, 2,5/SQRT(50). Această repartiție este simetrică față de μ0 și ați dori să respingeți ipoteza nulă dacă ABS(media eșantionului - μ0) > o valoare de limitare. Valoarea limită ar fi astfel încât, dacă μ0 ar fi media adevărată a populației, o valoare a mediei eșantionului - μ0 mai mare decât această limită sau o valoare a μ0 - media eșantionului mai mare decât această limită ar apărea fiecare cu probabilitate 0,05/2. Această valoare limită este

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Așadar, respingeți ipoteza nulă (media populației = μ0) dacă una dintre următoarele afirmații este adevărată:

Media eșantionului - μ0 > 0. 692951
0 – media > eșantionului 0. 692951

Deoarece media eșantionului = 30 în exemplul nostru, aceste două afirmații devin următoarele afirmații:

30 - μ0 > 0. 692951
μ0 – 30 > 0. 692951

Rescriindu-le astfel încât doar μ0 să apară în stânga se produc următoarele afirmații:

μ0 < 30 - 0. 692951
μ0 > 30 + 0. 692951

Acestea sunt exact valorile lui μ0 care nu se află în intervalul de încredere [30 – 0,692951, 30 + 0,692951]. Prin urmare, intervalul de încredere [30 – 0,692951, 30 + 0,692951] conține acele valori ale μ0 unde ipoteza nulă conform căreia media populației este μ0 nu ar fi respinsă, având în vedere dovezile eșantionului. Pentru valori de μ0 în afara acestui interval, ipoteza nulă conform căreia media populației este μ0 ar fi respinsă, date fiind dovezile eșantionului.

Concluzii

Inexactitățile din versiunile anterioare de Excel apar în general pentru valori extrem de mici sau extrem de mari ale lui p în NORMSINV(p). CONFIDENCE este evaluată prin apelarea NORMSINV(p), astfel încât acuratețea NORMSINV este o preocupare potențială pentru utilizatorii de CONFIDENCE. Cu toate acestea, valorile lui p utilizate în practică nu vor fi probabil suficient de extreme pentru a provoca erori de rotunjire semnificative în NORMSINV, iar performanța CONFIDENCE nu ar trebui să fie o preocupare pentru utilizatorii oricărei versiuni de Excel.

Cea mai mare parte a acestui articol s-a concentrat pe interpretarea rezultatelor CONFIDENCE. Cu alte cuvinte, am întrebat: "Care este semnificația unui interval de încredere?" Intervalele de încredere sunt adesea înțelese greșit. Din păcate, fișierele Ajutor Excel din toate versiunile de Excel care sunt mai vechi decât Excel 2003 au contribuit la această neînțelegere. Fișierul Ajutor Excel 2003 a fost îmbunătățit.