Popis statistických funkcí CONFIDENCE v Excelu

Platí pro
Excel 2024 Excel 2021 Excel 2019 Excel 2016

Shrnutí

Tento článek popisuje funkci CONFIDENCE v systém Microsoft Office Excelu 2003 a systém Microsoft Office Excelu 2007, ilustruje způsob použití této funkce a porovnává výsledky funkce pro Excel 2003 a Excel 2007 s výsledky funkce CONFIDENCE v dřívějších verzích Excelu.

Význam intervalu spolehlivosti je často mylně interpretován, a proto se snažíme poskytnout vysvětlení platných a neplatných tvrzení, která můžete provést poté, co z dat určíte hodnotu CONFIDENCE.

Další informace

Funkce CONFIDENCE(alfa, sigma, n) vrátí hodnotu, kterou můžete použít k vytvoření intervalu spolehlivosti pro střední hodnotu základního souboru. Interval spolehlivosti je oblast hodnot, které jsou soustředěny na známou střední hodnotu výběru. Předpokládá se, že pozorování ve vzorku pocházejí z normálního rozdělení se známou směrodatnou odchylkou, sigma a počtem pozorování ve vzorku je n.

Syntaxe

CONFIDENCE(alpha,sigma,n)

Parametry: Alfa je pravděpodobnost a 0 < alfa < 1. Sigma je kladné číslo a n je celé kladné číslo, které odpovídá velikosti vzorku.

Alfa má obvykle malou pravděpodobnost, například 0,05.

Příklad použití

Předpokládejme, že skóre inteligenčního kvocientu (IQ) má normální rozdělení se směrodatnou odchylkou 15. Testujete IQ na vzorku 50 studentů ve vaší místní škole a získáte průměr vzorku 105. Chcete vypočítat 95% interval spolehlivosti pro střední hodnotu základního souboru. Interval spolehlivosti 95 % neboli 0,95 odpovídá alfa = 1 – 0,95 = 0,05.

Pro ilustraci funkce CONFIDENCE vytvořte prázdný excelový list, zkopírujte následující tabulku a potom v prázdném excelovém listu vyberte buňku A1. V nabídce Úpravy klikněte na Vložit.

Poznámka

V Excelu 2007 klikněte ve skupině Schránka na kartě Domů na tlačítko Vložit.

Položky z následující tabulky vyplní buňky A1:B7 ve vašem listu.

alfa 0,05
Funkce SMODCH.VÝBĚR 15
n 50
Střední hodnota vzorku 105
=CONFIDENCE(B1,B2,B3)
=NORMSINV(1 - B1/2)*B2/ODMOCNINA(B3)

Po vložení této tabulky do nového listu Excelu klikněte na tlačítko Možnosti vložení a potom klikněte na Přizpůsobit formátování cíli.

Nechte vkládanou oblast vybranou, přejděte na příkaz Sloupec v nabídce Formát a klepněte na příkaz Přizpůsobit výběru.

Poznámka

Když máte v Excelu 2007 vybranou oblast vložených buněk, klikněte ve skupině Buňky na kartě Domů na Formát a potom klikněte na Přizpůsobit šířku sloupců.

Buňka A6 ukazuje hodnotu funkce CONFIDENCE. Buňka A7 zobrazuje stejnou hodnotu, protože volání CONFIDENCE(alfa, sigma, n) vrátí výsledek počítání:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

V CONFIDENCE nebyly provedeny žádné přímé změny, ale funkce NORMSINV byla vylepšena v Microsoft Excelu 2002 a poté došlo k dalším vylepšením mezi Excelem 2002 a Excelem 2007. Funkce CONFIDENCE proto může v těchto novějších verzích Excelu vracet odlišné (a vylepšené) výsledky, protože funkce CONFIDENCE spoléhá na funkci NORMSINV.

To neznamená, že byste měli důvěřovat funkci CONFIDENCE u dřívějších verzí Excelu. Nepřesnosti funkce NORMSINV se obecně vyskytovaly u hodnot argumentu velmi blízko 0 nebo 1. V praxi je alfa obecně nastavená na 0,05, 0,01 nebo možná 0,001. Hodnoty alfa musí být mnohem menší, například 0,0000001, aby se chyby zaokrouhlení v NORMSINV pravděpodobně zaznamenaly.

Poznámka

Viz článek o funkci NORMSINV pro diskuzi o výpočetních rozdílech v NORMSINV.

Další informace naleznete v následujícím článku znalostní báze znalostní báze Microsoft Knowledge Base:

826772 statistických funkcí Excelu: NORMSINV

Interpretace výsledků CONFIDENCE

Soubor nápovědy Excelu pro CONFIDENCE byl přepsán pro Excel 2003 a Excel 2007, protože všechny předchozí verze souboru nápovědy poskytovaly zavádějící rady ohledně interpretace výsledků. Příklad uvádí: "Předpokládejme, že v našem vzorku 50 dojíždějících je průměrná délka cesty do práce 30 minut se směrodatnou odchylkou obyvatelstva 2,5. Můžeme si být na 95 % jistí, že střední hodnota základního souboru je v intervalu 30 +/- 0,692951", kde 0,692951 je hodnota vrácená funkcí CONFIDENCE(0,05; 2,5; 50).

Ve stejném příkladu závěr zní: "Průměrná délka cesty do práce se rovná 30 ± 0,692951 minut, neboli 29,3 až 30,7 minuty." Pravděpodobně se jedná také o tvrzení o střední hodnotě základního souboru spadající do intervalu [30 – 0,692951, 30 + 0,692951] s pravděpodobností 0,95.

Před provedením experimentu, který přinesl data pro tento příklad, nemůže klasický statistik (na rozdíl od bayesovského statistika) učinit žádné prohlášení o rozdělení pravděpodobnosti střední hodnoty základního souboru. Místo toho se klasický statistik zabývá testováním hypotéz.

Klasický statistik může například chtít provést test oboustranné hypotézy, který je založen na předpokladu normálního rozdělení se známou směrodatnou odchylkou (například 2,5), konkrétní předem zvolenou střední hodnotou základního souboru μ0 a předem zvolenou hladinou významnosti (například 0,05). Výsledek testu by byl založen na hodnotě pozorované střední hodnoty vzorku (například 30) a nulová hypotéza, že střední hodnota souboru je μ0, by byla zamítnuta na hladině významnosti 0,05, pokud by pozorovaná střední hodnota vzorku byla příliš daleko od μ0 v obou směrech. Pokud je nulová hypotéza zamítnuta, interpretace je taková, že vzorek, který je daleko nebo dále od μ0, by se náhodou vyskytl v méně než 5 % případů za předpokladu, že μ0 je skutečný průměr populace. Po provedení tohoto testu klasický statistik stále nemůže učinit žádné prohlášení o rozdělení pravděpodobnosti průměru populace.

Bayesovský statistik by na druhé straně začal s předpokládaným rozdělením pravděpodobnosti pro střední hodnotu populace (nazývaným apriorní rozdělení), shromáždil by experimentální důkazy stejným způsobem jako klasický statistik a použil by tyto důkazy k revizi svého rozdělení pravděpodobnosti pro střední hodnotu populace, a tím by získal aposteriorní rozdělení. Aplikace Excel neobsahuje žádné statistické funkce, které by bayesovským statistikům v tomto úsilí pomohly. Všechny statistické funkce Excelu jsou určené pro klasické statistiky.

Intervaly spolehlivosti souvisejí s testy hypotéz. Na základě experimentálních důkazů interval spolehlivosti činí stručné prohlášení o hodnotách hypotetické střední hodnoty populace μ0, které by vedlo k přijetí nulové hypotézy, že střední hodnota populace je μ0, a k hodnotám μ0, které by vedly k odmítnutí nulové hypotézy, že střední hodnota populace je μ0. Klasický statistik nemůže učinit žádné prohlášení o šanci, že střední hodnota populace spadá do nějakého specifického intervalu, protože on nebo on nikdy nevytváří apriorní předpoklady o tomto rozdělení pravděpodobnosti a takové předpoklady by byly vyžadovány, pokud bychom použili experimentální důkazy k jejich revizi.

Prozkoumejte vztah mezi testy hypotéz a intervaly spolehlivosti pomocí příkladu na začátku této části. Se vztahem mezi funkcemi CONFIDENCE a NORMSINV uvedenými v poslední části jste:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Protože střední hodnota výběru je 30, interval spolehlivosti je 30 +/- 0,692951.

Nyní uvažujme výše popsaný test oboustranné hypotézy s hladinou významnosti 0,05, který předpokládá normální rozdělení se směrodatnou odchylkou 2,5, velikostí vzorku 50 a specifickou hypotetickou střední hodnotou základního souboru μ0. Pokud se jedná o skutečnou střední hodnotu základního souboru, pak střední hodnota výběru bude pocházet z normálního rozdělení se střední hodnotou souboru μ0 a směrodatnou odchylkou 2,5/ODMOCNINA(50). Toto rozdělení je symetrické kolem μ0 a měli byste chtít odmítnout nulovou hypotézu, pokud ABS(střední hodnota vzorku - μ0) > nějakou mezní hodnotu. Mezní hodnota by byla taková, že pokud by μ0 byla skutečnou střední hodnotou základního souboru, hodnota střední hodnoty vzorku - μ0 vyšší než tato mezní hodnota nebo hodnota μ0 - střední hodnota vzorku vyšší než tato mezní hodnota by nastala s pravděpodobností 0,05/2. Tato hraniční hodnota je

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Zamítněte tedy nulovou hypotézu (střední hodnota populace = μ0), pokud je pravdivé jedno z následujících tvrzení:

Střední hodnota vzorku - μ0 > 0. 692951
0 – průměr > vzorku 0. 692951

Protože střední hodnota výběru = v našem příkladu = 30, z těchto dvou tvrzení se stanou následující tvrzení:

30 - μ0 > 0. 692951
μ0 – 30 > 0. 692951

Přepíšete-li je tak, aby se vlevo zobrazoval pouze μ0, dostaneme následující tvrzení:

μ0 < 30 - 0. 692951
μ0 > 30 + 0. 692951

Jedná se přesně o hodnoty μ0, které nejsou v intervalu spolehlivosti [30 – 0,692951, 30 + 0,692951]. Interval spolehlivosti [30 – 0,692951, 30 + 0,692951] proto obsahuje ty hodnoty μ0, kde nulová hypotéza, že střední hodnota základního souboru je μ0, by vzhledem k důkazům vzorku nebyla zamítnuta. Pro hodnoty μ0 mimo tento interval by byla na základě důkazů odmítnuta nulová hypotéza, že střední hodnota základního souboru je μ0.

Závěry

Nepřesnosti v dřívějších verzích Excelu se obvykle vyskytují u velmi malých nebo extrémně vysokých hodnot p ve funkci NORMSINV(p). Funkce CONFIDENCE se vyhodnocuje voláním funkce NORMSINV(p), takže přesnost funkce NORMSINV je pro uživatele funkce CONFIDENCE potenciálním problémem. Hodnoty p, které se používají v praxi, ale pravděpodobně nebudou tak extrémní, aby způsobily významné chyby zaokrouhlení ve funkci NORMSINV, a výkon funkce CONFIDENCE by neměl být pro uživatele žádné verze aplikace Excel problémem.

Většina tohoto článku se zaměřila na interpretaci výsledků CONFIDENCE. Jinými slovy, položili jsme si otázku: "Jaký je význam intervalu spolehlivosti?" Intervaly spolehlivosti jsou často špatně chápány. Bohužel k tomuto nedorozumění přispěly soubory nápovědy Excelu ve všech verzích Excelu starších než Excel 2003. Byl vylepšen i soubor nápovědy k Excelu 2003.