Shrnutí

Tento článek popisuje funkci CONFIDENCE v Microsoft Office Excel 2003 a Microsoft Office Excel 2007, znázorňuje způsob použití funkce a porovnává výsledky funkce pro Excel 2003 a Excel 2007 s výsledky funkce CONFIDENCE v dřívějších verzích Excel.

Význam intervalu spolehlivosti se často chybně interpretuje a snažíme se poskytnout vysvětlení platných a neplatných příkazů, které je možné udělat po určení hodnoty CONFIDENCE z dat.

Další informace

Funkce CONFIDENCE(alfa, sigma, n) vrátí hodnotu, kterou můžete použít k vytvoření intervalu spolehlivosti pro střední hodnotu základního souboru. Interval spolehlivosti je oblast hodnot, které jsou na střed známé střední hodnoty vzorku. Předpokládá se, že pozorování ve vzorku pocházejí z normálního rozdělení se známou směrodatnou odchylkou, sigmou a počtem pozorování ve vzorku je n.

Syntaxe

CONFIDENCE(alpha,sigma,n)

Parametry: Alfa je pravděpodobnost a 0 < alfa < 1. Sigma je kladné číslo a n je kladné celé číslo, které odpovídá velikosti vzorku.

Alfa je obvykle malá pravděpodobnost, například 0,05.

Příklad použití

Předpokládejme, že skóre IQ (Intelligence Quotient) sleduje normální rozdělení se směrodatnou odchylkou 15. Testujte časté otázky pro vzorek 50 studentů ve vaší místní škole a získáte ukázkový průměr 105. Chcete vypočítat interval spolehlivosti 95 % pro střední hodnotu základního souboru. Interval spolehlivosti 95 % nebo 0,95 odpovídá alfa = 1 – 0,95 = 0,05.

Pokud chcete ilustrovat funkci CONFIDENCE, vytvořte prázdnou Excel listu, zkopírujte následující tabulku a pak vyberte buňku A1 v prázdném Excel listu. V nabídce Úpravy klikněte na Vložit.

Poznámka: V Excel 2007 klikněte na kartěDomů na Vložit ve skupině Schránka.

Položky v tabulce dole vyplňují buňky A1:B7 v listu.

alfa

0,05

smodch.

15

n

50

středník vzorku

105

=CONFIDENCE(B1;B2;B3)

=NORMSINV(1 - B1/2)*B2/SQRT(B3)

Po vložení této tabulky do nového listu Excel na tlačítko Možnosti vložení a potom klikněte na Přizpůsobit cílové formátování.

Pokud je vybraná oblast vložení, přejděte v nabídce Formát na Sloupec a potom klikněte na Přizpůsobit výběr.

Poznámka: V Excel 2007 s vybranou vložeou oblast buněk klikněte na Formát ve skupině Buňky na kartě Domů a potom klikněte na Přizpůsobit šířku sloupce.

Buňka A6 zobrazuje hodnotu CONFIDENCE. Buňka A7 zobrazuje stejnou hodnotu, protože volání funkce CONFIDENCE(alfa, sigma, n) vrátí výsledek výpočtu:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

V aplikaci MICROSOFT EXCEL 2002 nebyly provedeny žádné změny přímo v aplikaci CONFIDENCE, ale v roce Microsoft Excel 2002 jsme vylepšili normu NORMSINV a mezi Excel 2002 a Excel 2007 byla provedena další vylepšení. Funkce CONFIDENCE proto může vrátit různé (a vylepšené) výsledky v těchto novějších Excel, protože funkce CONFIDENCE se spoléhá na normu NORMSINV.

To neznamená, že byste měli ztratit důvěru v důvěru ve starší verze Excel. Nepřesnosti v normě NORMSINV se obvykle vyskytly u hodnot jejího argumentu velmi blízko k 0 nebo velmi blízko 1. V praxi je alfa obecně nastavená na 0,05, 0,01 nebo možná 0,001. Hodnoty alfa musí být mnohem menší než hodnoty, například 0,0000001, aby se chyby zaokrouhlení v normsinv mohly zobrazit.

Poznámka: Informace o rozdílech výpočtů v normě NORMSINV najdete v článku NORMSINV.

Další informace najdete v následujícím článku znalostní báze Microsoft Knowledge Base:

826772 Excel statistické funkce: NORMSINV

Interpretace výsledků aplikace CONFIDENCE

Soubor nápovědy Excel confidence byl přepsán pro Excel 2003 a Excel 2007, protože všechny starší verze souboru nápovědy poskytly zavádějící rady k interpretaci výsledků. Příklad uvádí: "Předpokládejme, že ve vzorku 50 dojíždějící osob je průměrná délka cesty do práce 30 minut se směrodatnou odchylkou základního souboru 2,5. Můžeme si být 95 procent jistí, že střední hodnota základního souboru je v intervalu 30 +/- 0,692951", kde 0,692951 je hodnota vrácená společností CONFIDENCE(0,05; 2,5; 50).

Ve stejném příkladu se v závěru říká: "Průměrná délka cesty do práce se rovná 30 ± 0,692951 minut nebo 29,3 až 30,7 minut". Pravděpodobně jde také o prohlášení o středním počtu obyvatel spadajícím do intervalu [30 – 0,692951; 30 + 0,692951] s pravděpodobností 0,95.

Před provedením experimentu, který v tomto příkladu vynesl data, nemůže klasický statistik (na rozdíl od bayesovského statistického statistiky) o rozdělení pravděpodobnosti střední hodnoty základního souboru nic říct. Místo toho se klasický statistik zabývá testováním hypotéz.

Klasická statistika může například chtít provést oboustranný hypotetický test založený na předpokladu normálního rozdělení se známou směrodatnou odchylkou (například 2,5), konkrétní předem vybranou hodnotou střední hodnoty základního souboru, μ0 a předem vybranou úrovní významnosti (například 0,05). Výsledek testu by byl založený na hodnotě pozorované střední hodnoty vzorku (například 30) a na nulové hypotéze, že střední hodnota základního souboru je μ0, by byla odmítnuta na úrovni významnosti 0,05, pokud by pozorovaný průměr vzorku byl příliš daleko od μ0 v obou směrech. Pokud je hypotéza null odmítnuta, interpretace je v tom, že výběrový soubor znamená, že by se od μ0 mohla objevit náhodná hodnota menší než 5 % času pod předpokladem, že μ0 je skutečný střední hodnota základního souboru. Po provedení tohoto testu klasický statistik stále nemůže vyvodovat žádné prohlášení o rozdělení pravděpodobnosti střední hodnoty základního souboru.

Bayesian statistician by na druhou stranu začal s předpokládanou pravděpodobnostní distribucí pro střední hodnotu základního souboru (pojmenovanou a priori rozdělení), shromáždil experimentální důkazy stejným způsobem jako klasický statisticik a pomocí tohoto důkazu přehodnotil její rozdělení pravděpodobnosti pro střední hodnotu populace a získalo tak posteriori rozdělení. Excel žádné statistické funkce, které by pomohly bayesovskému statistickému statistikovi v tomto úsilí. Excel statistické funkce jsou určené pro klasické statistiky.

Intervaly spolehlivosti souvisejí s hypotézou. Vzhledem k experimentálním důkazům vytvoří interval spolehlivosti stručné prohlášení o hodnotách hypotetizovaného základního souboru střední hodnoty μ0, která by vynesla přijetí nulové hypotézy, že střední hodnota základního souboru je μ0, a hodnoty μ0, které by vynesly odmítnutí nulové hypotézy, že střední hodnota základního souboru je μ0. Klasická statistika nemůže učinit žádné prohlášení o pravděpodobnosti, že střední hodnota souboru spadá do určitého intervalu, protože nikdy nevyjádřuje předchozí předpoklady o rozdělení pravděpodobnosti a takové předpoklady by bylo nutné, pokud by někdo k jejich revizi musel použít experimentální důkazy.

Prozkoumejte vztah mezi testy hypotéz a intervaly spolehlivosti pomocí příkladu na začátku této části. S vztahem mezi funkcemi CONFIDENCE a NORMSINV v poslední části máte:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Vzhledem k tomu, že průměr vzorku je 30, je interval spolehlivosti 30 +/- 0,692951.

Teď zvažte oboustranný test hypotézy s úrovní významnosti 0,05, jak je popsáno výše, která předpokládá normální rozdělení se směrodatnou odchylkou 2,5, velikostí vzorku 50 a specifickým hypotetizovaným středním podílem základního souboru, μ0. Pokud se jedná o skutečný střední soubor, bude střední hodnota vzorku pocátá z normálního rozdělení se střední hodnotou souboru μ0 a směrodatnou odchylkou, 2,5/SQRT(50). Toto rozdělení je symetrické asi μ0 a chcete odmítnout nulovou hypotézu, pokud abs(střední hodnota vzorku - μ0) > hodnoty výřezu. Hodnota cutoff by byla taková, že pokud by μ0 byla skutečnou střední hodnotou základního souboru, došlo by ke střední hodnotě vzorku – μ0 vyšší než tento výřez nebo hodnota μ0 – střední hodnota vzorku vyšší, než je tato hodnota, s pravděpodobností 0,05/2. Tato hodnota výřezu je

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Odmítne tedy hypotézu null (střední hodnota základního souboru = μ0), pokud platí jeden z následujících příkazů:

středník vzorku – μ0 > 0. 692951
0 – střední > 0. 692951

Vzhledem k tomu, že střední hodnota vzorku = 30 v našem příkladu, stanou se z těchto dvou příkazů následující příkazy:

30 – μ0 > 0. 692951
μ0 – 30 > 0. 692951

Přepisování je tak, aby se na levé straně vyneslo jenom μ0, následující příkazy:

μ0 < 30 – 0. 692951
μ0 > 30 + 0. 692951

Jedná se přesně o hodnoty μ0, které nejsou v intervalu spolehlivosti [30 – 0,692951, 30 + 0,692951]. Interval spolehlivosti [30 – 0,692951; 30 + 0,692951] proto obsahuje hodnoty μ0, pokud by se vzhledem k důkazu vzorku neodmítla nulová hypotéza, že střední hodnota základního souboru je μ0. U hodnot μ0 mimo tento interval by se vzhledem k důkazu vzorku odmítla nulová hypotéza, že střední hodnota základního souboru je μ0.

Závěry

Nepřesnosti v dřívějších verzích Excel obvykle vyskytují u extrémně malých nebo extrémně velkých hodnot p v normě NORMSINV(p). Funkce CONFIDENCE se vyhodnocuje voláním funkce NORMSINV(p), takže přesnost funkce NORMSINV je potenciálním problémem pro uživatele funkce CONFIDENCE. Hodnoty p, které se používají v praxi, ale pravděpodobně nebudou dost extrémní, aby způsoboval významné chyby zaokrouhlení v normsinv a výkon funkce CONFIDENCE by neměl být pro uživatele žádné verze Excel.

Většina tohoto článku se zaměřuje na interpretaci výsledků aplikace CONFIDENCE. Jinými slovy, zeptali jsme se: "Jaký je význam intervalu spolehlivosti?" Intervaly spolehlivosti jsou často nepochopené. K tomuto nedorozumění Excel přispěly soubory nápovědy ve všech verzích Excel starší než Excel 2003. Vylepšili Excel nápovědu k 2003.

Potřebujete další pomoc?

Rozšiřte své znalosti a dovednosti
Projít školení
Získejte nové funkce jako první
Připojit se systém Microsoft Office insiderům

Byly tyto informace užitečné?

Jak jste spokojeni s kvalitou jazyka?
Co ovlivnilo váš názor?

Děkujeme vám za zpětnou vazbu.

×