摘要
本文將說明 Microsoft Office Excel 2003 和 Microsoft Office Excel 2007 中的 CONFIDENCE 函數,說明如何使用該函數,並比較 Excel 2003 和 Excel 2007 函數的結果與舊版 Excel 中 CONFIDENCE 的結果。
信賴區間的意義經常會被錯誤解譯,而我們嘗試提供在您從數據中判斷 CONFIDENCE 值之後可提供有效和無效陳述的說明。更多資訊
CONFIDENCE (alpha、sigma、n) 函數會傳回您可以用來建構母體平均值信賴區間的值。 信賴區間是以已知樣本平均值為中心的值範圍。 假設樣本中的觀察來自於已知標準偏差、sigma 的常態分配,而樣本中的觀察數則為 n。
語法
CONFIDENCE(alpha,sigma,n)
參數:Alpha 為機率,0 < alpha < 1。 Sigma 是正數,而 n 是對應到樣本大小的正整數。
一般說來,alpha 的機率很小,例如0.05。使用方式範例
假設智慧商數 (IQ) 分數遵循標準偏差 15 的常態分配。 您在本機學校測試範例 50 個學生的 IQ,並取得平均值為 105 的樣本。 您想要計算母體平均值的 95% 信賴區間。 95% 或 0.95 信賴區間對應至 alpha = 1 – 0.95 = 0.05。
若要說明 CONFIDENCE 函數,請建立空白 Excel 工作表,複製下表,然後選取空白 Excel 工作表中的單元格 A1。 在 [編輯] 功能表上,按一下 [貼上]。附註: 在 Excel 2007 中,按兩下 [常用] 索引標籤上 [剪貼簿] 群組中的 [貼上]。
下表中的專案會填滿工作表中的儲存格 A1:B7。
阿爾 法 |
0.05 |
stdev |
15 |
n |
50 |
樣本平均數 |
105 |
=CONFIDENCE (B1,B2,B3) |
|
=NORMSINV (1 - B1/2) *B2/SQRT (B3) |
將此表格貼到新的 Excel 工作表後,按兩下 [貼上選項] 按鈕,然後按兩下 [符合目的格式設定]。
當貼上的範圍仍然選取時,指向 [格式] 功能表上的 [欄],然後按兩下 [自動調整選取範圍]。
附註: 在 Excel 2007 中,選取貼上的儲存格範圍后,按兩下 [常用] 索引標籤上 [單元格] 群組中的 [格式],然後按兩下 [自動調整欄寬]。
單元格 A6 會顯示 CONFIDENCE 的值。 單元格 A7 會顯示相同的值,因為呼叫 CONFIDENCE (alpha、sigma、n) 會傳回運算的結果:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
未直接對 CONFIDENCE 進行任何變更,但 Microsoft Excel 2002 已改善 NORMSINV,並在 Excel 2002 和 Excel 2007 之間做了更多改進。 因此,CONFIDENCE 可能會在這些更新版本的 Excel 中傳回不同的 (和改良) 結果,因為 CONFIDENCE 仰賴 NORMSINV。
這並不表示您應該對舊版 Excel 的 CONFIDENCE 失去信賴。 NORMSINV 中的不準確之處通常是其自變數的值非常接近 0 或非常接近 1。 實際上,alpha 通常會設為0.05、0.01或0.001。 ALpha 值必須小於 0.0000001,NORMSINV 中的舍去錯誤才可能受到注意。附註: 請參閱 NORMSINV 上的文章,以瞭解 NORMSINV 中的運算差異。
如需詳細資訊,請按一下下面的文章編號,檢視「Microsoft 知識庫」中的文章:
826772 Excel 統計函數:NORMSINV
CONFIDENCE 結果的解譯
已為 Excel 2003 和 Excel 2007 重新寫入 CONFIDENCE 的 Excel 說明檔案,因為所有舊版的說明檔案都針對解讀結果提供誤導性建議。 範例指出:「假設我們觀察到,在50位通勤者的樣本中,出差的平均工時長度為30分鐘,而母體標準偏差為2.5。 95% 的人可確信母體平均值是在間隔 30 +/- 0.692951“,其中 0.692951 是 CONFIDENCE (0.05、2.5、50) 傳回的值。
在同一個範例中,總結會讀出「出差的平均長度等於 30 ± 0.692951 分鐘,或 29.3 到 30.7 分鐘」。 不過,這也是關於母體平均值落在機率 0.95 間隔內的語句 [30 – 0.692951,30 + 0.692951]。 進行此範例數據的實驗之前,古典統計學 (,而非巴耶西亞統計) 無法說明母體平均值的機率分配。 相反地,古典統計學家會處理假設檢閱。 例如,古典統計學家可能會想要根據標準偏差 (的常態分配假設進行雙面假設檢定,例如 2.5) 、母體平均值的特定預先選取值 μ0,以及預先選取的重要層級 (,例如 0.05) 。 如果觀察到的樣本平均值與任一方向的 μ0 太遠,則檢定的結果會根據觀察到的樣本平均值 (例如 30) ,而母體平均值為 μ0 的 Null 假設會以顯著水準 0.05 遭到拒絕。 如果 Null 假設遭到拒絕,解譯是,在假設 μ0 為真正的母體平均值的情況下,極少於 5% 的時間會發生與 μ0 遠或更進一步的樣本平均值。 進行這項測試之後,古典統計學家仍無法對母體平均值的機率分配做出任何陳述。 另一方面,Bayesian 統計員會從名為 priori 分配) 之母體平均值 (的假設機率分配開始,以與古典統計學相同的方式收集實驗性證據,並使用此證據來修改母體平均值的機率分配,並藉此取得後端分配。 Excel 不提供任何統計函數,可協助巴耶西亞統計人員參與這項工作。 Excel 的統計函數全都適用於古典統計學。 信賴區間與假設檢定相關。 根據實驗性證據,信賴區間會針對假設母體平均值 μ0 的值進行簡潔的陳述,以便接受母體平均值為 μ0 的 Null 假設,以及 μ0 的值,以產生對母體平均值為 μ0 之 Null 假設的拒絕。 古典統計學家無法針對母體平均值落在任何特定間隔內的機率做出任何陳述,因為母體平均值從未對此機率分配做出過先前的假設,若要使用實驗性證據來修改,則必須有此類假設。 使用本節開頭的範例,探索假設檢定與信賴區間之間的關聯。 使用上一節所述 CONFIDENCE 與 NORMSINV 之間的關聯,您有:CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
由於樣本平均值為 30,因此信賴區間為 30 +/- 0.692951。
現在請考慮使用顯著水準 0.05 的雙面假設檢定,如先前所述,假設常態分配為標準偏差 2.5、樣本大小為 50 以及特定的假設母體平均值 μ0。 如果這是真正的母體平均值,則樣本平均值會來自具有母體平均值 μ0 且標準偏差為 2.5/SQRT (50) 常態分配。 此分配是關於 μ0 的對稱分配,如果 ABS (樣本平均數 - μ0) > 一些截止值,您會想要拒絕 Null 假設。 如果 μ0 是真正的母體平均值,樣本平均值 - 比這個截止點高 μ0,或是值 μ0 – 比此截止點更高的樣本平均值就會發生機率 0.05/2。 此截止值為
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
因此,如果下列其中一個語句為 True,則拒絕母體平均值 (null 假設 = μ0) :
樣本平均數 - μ0 > 0。
692951 0 – 樣本平均 > 0。 692951在我們的範例中,由於範例平均數 = 30,這兩個語句會變成下列語句:
30 - μ0 > 0。
692951 μ0 – 30 > 0。 692951將它們重寫,使左側只會顯示 μ0,併產生下列語句:
μ0 < 30 - 0.
692951 μ0 > 30 + 0。 692951這些值與 μ0 的值完全不在信賴區間 [30 – 0.692951、30 + 0.692951]。 因此,根據範例證據,信賴區間 [30 – 0.692951、30 + 0.692951] 包含 μ0 的那些值,其中將不會拒絕母體平均值為 μ0 的 Null 假設。 對於此區間以外 μ0 的值,若是母體平均值為 μ0 的 Null 假設,則會以樣本證據拒絕。
結論
舊版 Excel 中的不準確之處通常是在 NORMSINV (p) 中發生極小或極大型的 p 值。 CONFIDENCE 是透過呼叫 NORMSINV (p) 來評估,因此 NORMSINV 的正確性是 CONFIDENCE 使用者可能考慮的問題。 不過,實際上使用的 p 值極不可能在 NORMSINV 中造成嚴重的捨位錯誤,而任何 Excel 版本的使用者不應擔心 CONFIDENCE 的效能。
本文大部分的內容都著重於解譯 CONFIDENCE 的結果。 換句話說,我們問了「信賴區間的意義是什麼?」 信賴區間經常被誤判。 很抱歉,Excel 2003 之前所有 Excel 版本的 Excel 說明檔案都曾參與此作業。 已改善 Excel 2003 說明檔案。