Programos "Excel" statistinių funkcijų CONFIDENCE aprašas

Taikoma
„Excel 2024“ Excel 2021 Excel 2019 Excel 2016

Suvestinė

Šiame straipsnyje aprašoma "Microsoft Office Excel 2003" ir "Microsoft Office Excel 2007" funkcija CONFIDENCE, parodyta, kaip naudojama ši funkcija, ir palyginami "Excel 2003" ir "Excel 2007" funkcijos rezultatai su ankstesnių "Excel" versijų funkcijos CONFIDENCE rezultatais.

Patikimumo intervalo reikšmė dažnai klaidingai interpretuojama, todėl mes bandome paaiškinti galiojančius ir netinkamus teiginius, kuriuos galima pateikti nustačius CONFIDENCE reikšmę pagal savo duomenis.

Daugiau informacijos

Funkcija CONFIDENCE(alfa, sigma, n) grąžina reikšmę, kurią galite naudoti aibės vidurkio pasikliautinajam intervalui sudaryti. Patikimumo intervalas yra reikšmių, kurių centre yra žinomas empirinis vidurkis, diapazonas. Laikoma, kad imties stebėjimai yra gauti iš normalaus skirstinio su žinomu standartiniu nuokrypiu, sigma, o stebinių imtyje skaičius yra n.

Sintaksė

CONFIDENCE(alpha,sigma,n)

Parametrai: Alfa yra tikimybė, o 0 < alfa < 1. Sigma yra teigiamas skaičius, o n yra teigiamas sveikasis skaičius, atitinkantis imties dydį.

Paprastai alfa yra maža tikimybė, pavyzdžiui, 0,05.

Naudojimo pavyzdys

Tarkime, kad intelekto koeficiento (IQ) balai atitinka normalų skirstinį su standartiniu nuokrypiu 15. Išbandote IQ 50 mokinių imtyje savo vietinėje mokykloje ir gaunate imties vidurkį 105. Norite apskaičiuoti aibės vidurkio 95 % pasikliautinąjį intervalą. 95 % arba 0,95 patikimumo intervalas atitinka alfa = 1 – 0,95 = 0,05.

Norėdami iliustruoti funkciją CONFIDENCE, sukurkite tuščią "Excel" darbalapį, nukopijuokite toliau pateiktą lentelę ir tuščiame "Excel" darbalapyje pažymėkite langelį A1. Meniu Redaguoti spustelėkite Įklijuoti.

Pastaba

Programoje "Excel 2007" skirtuko Pagrindinis grupėje Mainų sritis spustelėkite Įklijuoti.

Toliau pateiktos lentelės įrašai užpildo darbalapio langelius A1:B7.

alfa 0,05
stdev 15
n 50
Imties vidurkis 105
=CONFIDENCE(B1;B2;B3)
=NORMSINV(1 - B1/2)*B2/SQRT(B3)

Po to, kai įklijuosite lentelę į naująjį "Excel" darbalapį, spustelėkite mygtuką Įklijavimo parinktys , tada spustelėkite Atsižvelgti į paskirties vietos formatavimą.

Pažymėję įklijuotą diapazoną, meniu Formatavimas nukreipkite žymiklį į Stulpelis, tada spustelėkite Automatiškai talpinti pažymėtą sritį.

Pastaba

Programoje "Excel 2007" pasirinkę įklijuotą langelių diapazoną, skirtuko Pagrindinis grupėje Langeliai spustelėkite Formatavimas, tada spustelėkite Automatiškai talpinti pagal stulpelio plotį.

Langelyje A6 rodoma reikšmė CONFIDENCE. Langelis A7 rodo tą pačią reikšmę, nes iškvietimas CONFIDENCE(alfa, sigma, n) grąžina skaičiavimo rezultatą:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Tiesiogiai CONFIDENCE nebuvo keista, tačiau NORMSINV buvo patobulinta Microsoft Excel 2002, vėliau patobulinta Excel 2002 ir Excel 2007. Todėl funkcija CONFIDENCE šiose vėlesnėse Excel versijose gali pateikti kitokius (ir patobulintus) rezultatus, nes CONFIDENCE priklauso nuo NORMSINV.

Tai nereiškia, kad galite prarasti pasitikėjimą ankstesnių "Excel" versijų CONFIDENCE. Paprastai netikslumų NORMSINV pasitaikydavo dėl argumento reikšmių, kurios buvo labai artimos 0 arba labai artimos 1. Praktiškai alfa paprastai nustatoma kaip 0,05, 0,01, o gal 0,001. Alfa reikšmės turi būti daug mažesnės, pvz., 0.0000001, kad NORMSINV būtų pastebimos apvalinimo klaidos.

Pastaba

Žr. straipsnį apie NORMSINV dėl NORMSINV skaičiavimo skirtumų aptarimo.

Norėdami gauti papildomos informacijos, spustelėkite toliau nurodytą straipsnio numerį ir peržiūrėkite "Microsoft" žinių bazės straipsnį:

826772 "Excel" statistinės funkcijos: NORMSINV

CONFIDENCE rezultatų aiškinimas

"Excel" žinyno failas siekiant CONFIDENCE buvo perrašytas "Excel 2003" ir "Excel 2007", nes visose ankstesnėse žinyno failo versijose buvo pateikiami klaidinantys patarimai, kaip interpretuoti rezultatus. Pavyzdyje teigiama: "Tarkime, kad pastebime, kad mūsų imtyje, kurioje yra 50 keleivių, vidutinė kelionės į darbą trukmė yra 30 minučių, o gyventojų standartinis nuokrypis yra 2,5. Galime būti 95 procentais tikri, kad aibės vidurkis yra intervale 30 +/- 0,692951", kur 0,692951 yra reikšmė, grąžinta funkcijos CONFIDENCE(0,05; 2,5, 50).

To paties pavyzdžio išvadoje rašoma: "vidutinė kelionės į darbą trukmė yra 30 ± 0,692951 minutės, arba 29,3 – 30,7 minutės". Manoma, kad tai taip pat yra teiginys apie gyventojų vidurkį, patenkantį į intervalą [30 – 0,692951, 30 + 0,692951] su tikimybe 0,95.

Prieš atlikdamas eksperimentą, kuris davė duomenis šiam pavyzdžiui, klasikinis statistikas (priešingai nei Bajeso statistikas) negali pasakyti apie aibės vidurkio tikimybės pasiskirstymą. Vietoj to, klasikinis statistikas užsiima hipotezės tikrinimu.

Pavyzdžiui, klasikinis statistikas gali norėti atlikti dvipusį hipotezės testą, pagrįstą normaliojo skirstinio su žinomu standartiniu nuokrypiu (pvz., 2,5), tam tikra iš anksto parinkta aibės vidurkio reikšme μ0 ir iš anksto pasirinktu reikšmingumo lygiu (pvz., 0,05). Bandymo rezultatas būtų pagrįstas stebimo imties vidurkio verte (pvz., 30), o nulinė hipotezė, kad populiacijos vidurkis yra μ0, būtų atmesta 0,05 reikšmingumo lygiu, jei stebimas imties vidurkis būtų per toli nuo μ0 bet kuria kryptimi. Jei nulinė hipotezė atmetama, aiškinama, kad imties vidurkis, kuris toli ar toliau nuo μ0 atsitiktinai atsirastų mažiau nei 5% laiko, darant prielaidą, kad μ0 yra tikrasis aibės vidurkis. Atlikęs šį testą, klasikinis statistikas vis dar negali pasakyti apie aibės vidurkio tikimybės pasiskirstymą.

Kita vertus, Bajeso statistikas pradėtų nuo tariamo populiacijos vidurkio tikimybės skirstinio (pavadinto a priori skirstiniu), rinktų eksperimentinius įrodymus taip pat, kaip klasikinis statistikas, ir panaudotų šiuos įrodymus, kad peržiūrėtų savo tikimybių skirstinį aibės vidurkiui ir tokiu būdu gautų a posteriori skirstinį. Programa "Excel" nepateikia statistinių funkcijų, kurios padėtų Bajeso statistikui atlikti šį darbą. Visos programos "Excel" statistinės funkcijos skirtos klasikiniams statistikams.

Patikimumo intervalai susiję su hipotezės testais. Atsižvelgiant į eksperimentinius įrodymus, pasikliautinasis intervalas glaustai teigia apie hipotetinio aibės vidurkio μ0 vertes, kurios leistų priimti nulinę hipotezę, kad aibės vidurkis yra μ0, ir μ0 vertes, kurios atmestų nulinę hipotezę, kad aibės vidurkis yra μ0. Klasikinis statistikas negali teigti apie tikimybę, kad populiacijos vidurkis nukris tam tikru intervalu, nes jis niekada nedaro a priori prielaidų apie šį tikimybių pasiskirstymą ir tokios prielaidos būtų reikalingos, jei būtų naudojami eksperimentiniai įrodymai joms peržiūrėti.

Išnagrinėkite ryšį tarp hipotezės testų ir pasikliautinųjų intervalų naudodami šio skyriaus pradžioje pateiktą pavyzdį. Paskutiniame skyriuje nurodytas ryšys tarp CONFIDENCE ir NORMSINV, jūs turite:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Kadangi empirinio vidurkio reikšmė yra 30, pasikliovimo intervalas yra 30 +/- 0,692951.

Dabar apsvarstykite dvipusį hipotezės testą, kurio reikšmingumo lygis yra 0,05, kaip aprašyta anksčiau, kuris daro prielaidą, kad normalus skirstinys yra su standartiniu nuokrypiu 2,5, imties dydis yra 50 ir konkretus hipotetinis aibės vidurkis μ0. Jei tai yra tikrasis aibės vidurkis, imties vidurkis gaunamas iš normalaus skirstinio su aibės vidurkiu μ0 ir standartiniu nuokrypiu 2,5/SQRT(50). Šis skirstinys yra simetriškas maždaug μ0, todėl norėtumėte atmesti nulinę hipotezę, jei ABS (imties vidurkis - μ0) > yra kažkokia ribinė vertė. Ribinė vertė būtų tokia, kad jei μ0 būtų tikrasis aibės vidurkis, imties vidurkio vertė – μ0 didesnė už šią ribinę ribą arba μ0 – didesnė už šią ribinę vertę, atsirastų su 0,05/2 tikimybe. Ši galutinė vertė yra

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Taigi atmeskite nulinę hipotezę (gyventojų skaičiaus vidurkis = μ0), jei vienas iš šių teiginių yra teisingas:

mėginio vidurkis - μ0 > 0. 692951
0 – imties vidurkis > 0. 692951

Kadangi mūsų pavyzdyje pavyzdžio vidurkis = 30, šie du sakiniai tampa šiais teiginiais:

30 - μ0 > 0. 692951
μ0 – 30 > 0. 692951

Perrašius juos taip, kad kairėje atsirastų tik μ0, gaunami šie teiginiai:

μ0 < 30 - 0. 692951
μ0 > 30 + 0. 692951

Tai yra tiksliai μ0 vertės, kurios nėra pasikliautinajame intervale [30 – 0,692951, 30 + 0,692951]. Todėl pasikliautinajame intervale [30 – 0,692951, 30 + 0,692951] yra tos μ0 vertės, kai nulinė hipotezė, kad aibės vidurkis yra μ0, nebūtų atmesta, atsižvelgiant į imties įrodymus. Jei μ0 vertės yra už šio intervalo ribų, nulinė hipotezė, kad aibės vidurkis yra μ0, būtų atmesta, atsižvelgiant į imties įrodymus.

Išvados

Netikslumų ankstesnėse Excel versijose dažniausiai pasitaiko taikant labai mažoms arba labai didelėms p reikšmėms NORMSINV(p). CONFIDENCE yra vertinamas iškvietus NORMSINV(p), todėl NORMSINV tikslumas gali kelti susirūpinimą CONFIDENCE vartotojams. Tačiau praktikoje naudojamos p reikšmės greičiausiai nebus pakankamai ekstremalios, kad sukeltų reikšmingų apvalinimo klaidų NORMSINV, ir CONFIDENCE efektyvumas neturėtų kelti rūpesčių nė vienos Excel versijos vartotojams.

Didžioji šio straipsnio dalis buvo skirta CONFIDENCE rezultatų interpretavimui. Kitaip tariant, mes paklausėme: "Ką reiškia pasikliautinasis intervalas?" Patikimumo intervalai dažnai neteisingai suprantami. Deja, prie šio nesusipratimo kilo "Excel" žinyno failai visose ankstesnėse nei "Excel 2003" versijose. Patobulintas "Excel 2003" žinyno failas.