Applies ToExcel 2024 Excel 2021 Excel 2019 Excel 2016 Office за бизнеса

Резюме

Тази статия описва функцията CONFIDENCE в Microsoft Office Excel 2003 и в Microsoft Office Excel 2007 илюстрира как се използва функцията и сравнява резултатите от функцията за Excel 2003 и за Excel 2007 с резултатите от CONFIDENCE в по-стари версии на Excel.Значението на доверителния интервал често се интерпретира погрешно и се опитваме да предоставим обяснение на валидни и невалидни декларации, които могат да бъдат направени, след като определите стойност CONFIDENCE от вашите данни.

Повече информация

Функцията CONFIDENCE(алфа; сигма; n) връща стойност, която можете да използвате за изграждане на доверителен интервал за средната стойност на генералната съвкупност. Доверителният интервал е диапазон от стойности, които са центрирани в известна средна стойност на извадка. Предполага се, че наблюденията в извадката идват от нормално разпределение с известно стандартно отклонение, сигма, а броят на наблюденията в извадката е n.

Синтаксис

CONFIDENCE(alpha,sigma,n)

Параметри: алфа е вероятност, а 0 < алфа < 1. "сигма" е положително число, а n е положително цяло число, което съответства на размера на извадката.Обикновено алфа е малка вероятност, например 0,05.

Пример за използване

Да предположим, че точките на интелигентното цитиране (IQ) следват нормално разпределение със стандартно отклонение 15. Тествате IQ за извадка от 50 ученици във вашето местно училище и получавате средна стойност от 105. Искате да изчислите 95% доверителен интервал за средната стойност на генералната съвкупност. Доверителният интервал от 95% или 0,95 съответства на алфа = 1 – 0,95 = 0,05.За да илюстрирате функцията CONFIDENCE, създайте празен работен лист на Excel, копирайте таблицата по-долу и след това изберете клетка A1 в празния работен лист на Excel. В менюто Редактиране щракнете върху Постави.

Забележка: В Excel 2007 щракнете върху Постави в групата Клипборд на раздела Начало.

Записите в таблицата по-долу попълват клетки A1:B7 в работния лист.

Алфа

0,05

стандартно отклонение

15

м

50

средна стойност на извадка

105

=CONFIDENCE(B1;B2;B3)

=NORMSINV(1 – B1/2)*B2/SQRT(B3)

След като поставите тази таблица в новия работен лист на Excel, щракнете върху бутона Опции за поставяне и след това щракнете върху Съгласуване с форматирането на местоназначението.

Докато поставяният диапазон все още е избран, посочете Колона в менюто Формат и след това щракнете върху Автопобиране на селекцията.

Забележка: В Excel 2007, с избран поставен диапазон от клетки, щракнете върху Формат в групата Клетки на раздела Начало и след това щракнете върху Автопобиране на ширината на колона.

Клетка A6 показва стойността на CONFIDENCE. Клетка A7 показва същата стойност, защото извикване на CONFIDENCE(алфа, сигма, n) връща резултата от изчислението:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Не са направени промени директно в CONFIDENCE, но NORMSINV е подобрен в Microsoft Excel 2002 и след това са направени повече подобрения между Excel 2002 и Excel 2007. Следователно CONFIDENCE може да върне различни (и подобрени) резултати в тези по-нови версии на Excel, защото CONFIDENCE разчита на NORMSINV.Това не означава, че трябва да загубите доверие в CONFIDENCE за по-стари версии на Excel. Неточностите в NORMSINV обикновено се появяват за стойности на аргумента много близо до 0 или много близо до 1. На практика алфа обикновено е зададено на 0,05, 0,01 или може би 0,001. Стойностите на алфа трябва да са много по-малки от тези, например 0,0000001, преди да е вероятно да се закръглят грешките в NORMSINV.

Забележка: Вижте статията относно NORMSINV за обсъждане на изчислителни разлики в NORMSINV.

За повече информация щракнете върху следния номер на статия в базата знания на Microsoft:

826772 Статистически функции на Excel: NORMSINV

Тълкуване на резултатите от CONFIDENCE

Помощният файл на Excel за CONFIDENCE е презаписан за Excel 2003 и за Excel 2007, защото всички по-стари версии на помощния файл дадоха подвеждащи съвети за интерпретиране на резултатите. Примерът гласи: "Да предположим, че в нашата извадка от 50 души, които пътуват до работа, средната продължителност на пътуването до работа е 30 минути със стандартно отклонение на генералната съвкупност от 2,5. Можем да сме 95 процента уверени, че средната стойност на генералната съвкупност е в интервала 30 +/-0,692951", където 0,692951 е стойността, върната от CONFIDENCE(0,05, 2,5, 50).За същия пример изводът гласи "средната продължителност на пътуването до работа е равна на 30 ± 0,692951 минути или от 29,3 до 30,7 минути". Предполага се, че това е също изявление за средната стойност на генералната съвкупност, попадащи в интервала [30 – 0,692951, 30 + 0,692951] с вероятност 0,95.Преди да проведе експеримента, до който са добити данните за този пример, класически статистик (за разлика от байесийски статистик) не може да направи никакво изявление за вероятностното разпределение на средната стойност на генералната съвкупност. Вместо това класическият статистик се занимава с проверката на хипотези.Например класически статистик може да иска да проведе двустранен тест за хипотези, който се базира на предположението за нормално разпределение с известно стандартно отклонение (например 2,5), конкретна предварително избрана стойност на средната стойност на генералната съвкупност, μ0 и предварително избрано ниво на значимост (например 0,05). Резултатът от теста ще се базира на стойността на наблюдаваната средна стойност (например 30) и нулева хипотеза, че средната стойност на генералната съвкупност е μ0 ще бъде отхвърлена при ниво на значимост 0,05, ако наблюдаваната средна стойност на извадката е твърде далеч от μ0 в която и да е посока. Ако се отхвърли нулевата хипотеза, тълкуването е, че извадка означава, че далеч или по-далеч от μ0 би възникнала случайно по-малко от 5 % от времето, за което се предполага, че μ0 е действителната средна стойност на генералната съвкупност. След провеждането на този тест класически статистик все още не може да направи никаква декларация за вероятностното разпределение на средната стойност на генералната съвкупност.Белезийският статистик, от друга страна, започва с предполагаемото вероятностно разпределение за средната стойност на генералната съвкупност (наречено приори разпределение), ще събере експериментални доказателства по същия начин като класическия статистик и ще използва тези доказателства, за да преразгледа своето или неговото вероятностно разпределение за средната стойност на генералната съвкупност и по този начин да получи постериориално разпределение. Excel не предоставя статистически функции, които биха помогнали на байесийски статистик в това начинание. Всички статистически функции на Excel са предназначени за класически статисисти.Доверителните интервали са свързани с тестовете за хипотези. Като се има предвид експерименталното доказателство, доверителният интервал прави кратък отчет за стойностите на средната μ0 на генералната съвкупност с предполагаема хипотеза, която би произнесла нулевата хипотеза, че средната стойност на генералната съвкупност е μ0, и стойностите на μ0, които биха донесли отхвърляне на нулевата хипотеза, че средната стойност на генералната съвкупност е μ0. Класическият статистик не може да направи изявление за шанса средната стойност на генералната съвкупност да попадне в конкретен интервал, защото тя или той никога не прави предишни предположения за това вероятностно разпределение и такива предположения биха били необходими, ако се използва експериментално доказателство за преразглеждането им.Проучете връзката между тестовете на хипотези и доверителните интервали, като използвате примера в началото на този раздел. При релацията между CONFIDENCE и NORMSINV, посочена в последния раздел, имате:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Тъй като средната стойност на извадката е 30, доверителният интервал е 30 +/-0,692951.

Сега помислете за двустранен тест за хипотези със ниво на значимост 0,05, както е описано по-горе, което предполага нормално разпределение със стандартно отклонение 2,5, размер на извадката 50 и специфична средна генерална съвкупност с хипотеза, μ0. Ако това е действителната средна стойност на генералната съвкупност, средната стойност на извадката ще идва от нормално разпределение със средна стойност на генералната съвкупност μ0 и стандартно отклонение, 2,5/SQRT(50). Това разпределение е симетрично за μ0 и бихте искали да отхвърлите нулеобразната хипотеза, ако ABS(средната стойност на извадката – μ0) > някаква отрязана стойност. Отрязаната стойност би била такава, че ако μ0 е истинската средна стойност на генералната съвкупност, стойност на средната стойност - μ0 по-висока от тази отрязана стойност или стойност μ0 – средната стойност, по-висока от тази, ще възникне всяка с вероятност 0,05/2. Тази отрязана стойност е

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Така че отхвърлете нулевата хипотеза (средната стойност на генералната съвкупност = μ0), ако една от следните твърдения е вярна:

средната стойност на извадката – μ0 > 0. 692951 0 – средната стойност на извадката > 0. 692951

Тъй като средната стойност на извадката = 30 в нашия пример, тези две твърдения стават следните твърдения:

30 – μ0 > 0. 692951 μ0 – 30 > 0. 692951

Презаписването им, така че само μ0 да се появява вляво, дава следните твърдения:

μ0 < 30 – 0. 692951 μ0 > 30 + 0. 692951

Това са точно стойностите на μ0, които не са в доверителния интервал [30 – 0,692951, 30 + 0,692951]. Следователно доверителният интервал [30 – 0,692951, 30 + 0,692951] съдържа тези стойности на μ0, при които не би се отхвърлила нулевата хипотеза, че средната стойност на генералната съвкупност е μ0, като се имат предвид доказателствата от извадката. За стойности на μ0 извън този интервал би била отхвърлена нулеовата хипотеза, че средната стойност на генералната съвкупност е μ0 с оглед на данните от извадката.

Заключения

Неточностите в по-старите версии на Excel обикновено се появяват за изключително малки или изключително големи стойности на p в NORMSINV(p). CONFIDENCE се оценява чрез извикване на NORMSINV(p), така че точността на NORMSINV е потенциална грижа за потребителите на CONFIDENCE. Въпреки това стойностите на p, които се използват на практика, не е вероятно да са достатъчно крайни, за да причинят значителни грешки от закръгляване в NORMSINV, а ефективността на CONFIDENCE не трябва да бъде въпрос за потребителите на никоя версия на Excel.По-голямата част от тази статия се фокусира върху интерпретиране на резултатите от CONFIDENCE. С други думи, попитахме: "Какво е значението на доверителния интервал?" Доверителните интервали често се разбират неправилно. За съжаление, помощните файлове на Excel във всички версии на Excel, които са по-стари от Excel 2003, допринесоха за това недоразумение. Помощният файл на Excel 2003 е подобрен.

Нуждаете ли се от още помощ?

Искате ли още опции?

Разгледайте ползите от абонамента, прегледайте курсовете за обучение, научете как да защитите устройството си и още.

Общностите ви помагат да задавате и отговаряте на въпроси, да давате обратна връзка и да получавате информация от експерти с богати знания.