Excel 統計函數:PEARSON

文章翻譯 文章翻譯
文章編號: 828129 - 檢視此文章適用的產品。
全部展開 | 全部摺疊

在此頁中

結論

本文將告訴您 Microsoft Excel 中的 PEARSON 函數,以及如何使用此函數,然後比較 Microsoft Office Excel 2003 和更新版本中 PEARSON 的結果與舊版 Excel 中 PEARSON 的結果。

其他相關資訊

PEARSON(array1, array2) 函數會傳回兩個資料陣列之間的皮耳森積差相關係數。

語法

PEARSON(array1, array2)
引數 array1 和 array2 必須是數字、名稱、陣列常數或含有數字的參考。

PEARSON 最常見的用法是包含兩個含有資料的儲存格範圍,例如 PEARSON(A1:A100, B1:B100)。

使用範例

如果要說明 PEARSON 函數,請依照下列步驟執行:
  1. 建立空白的 Excel 工作表,然後複製下表。
    摺疊此表格展開此表格
    1= 3 + 10^$D$2在資料中加入 10 的次方
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2Excel 2003 之前的版本
    當 D2 = 7.5
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    當 D2 = 8
    #DIV/0!
    0.713772
  2. 在您的空白 Excel 工作表中選取儲存格 A1,然後貼上這些項目,將表格填入您工作表中的儲存格 A1:D13。
  3. 按一下 [貼上選項] 按鈕,然後按一下 [符合目的格式設定]。在仍選取貼上範圍時,依據您所執行的 Excel 版本,使用下列其中一項適合的程序:
    • 在 Microsoft Office Excel 2007 中,依序按一下 [常用] 索引標籤、[儲存格] 群組中的 [格式] 以及 [自動調整欄寬]
    • 在 Microsoft Office Excel 2003 中,指向 [格式] 功能表上的 [欄],然後按一下 [最適欄寬]
    注意 您可能會想要將儲存格 B1:B6 格式化為具有 0 個小數位數的數字
儲存格 A1:A6 和 B1:B6 包含兩個資料陣列,在本例中是用於在儲存格 A8 和 A9 中呼叫 PEARSON 和 CORREL 函數。PEARSON 和 CORREL 都會計算皮耳森積差相關係數,且它們的結果應相符。

在早於 Excel 2003 的 Excel 版本中,PEARSON 可能會出現無條件捨去的錯誤。PEARSON 的問題在 Excel 2003 和更新版本中已經改良。CORREL 則一直使用現在用於 Excel 2003 和更新版本中的改良程序來實作。因此,如果您將 PEARSON 用於比 Excel 2003 更早的 Excel 版本中,Microsoft 建議您改用 CORREL。

在早於 Excel 2003 的 Excel 版本中,您可以使用本文中的工作表來進行實驗,並找出何時會發生無條件捨去的錯誤。如果您在 B1:B6 中的每個觀察值中加入常數,PEARSON 或 CORREL 的值應該都不會受到影響。如果您增加 D2 中的值,則 B1:B6 中會加入較大的常數。如果 D2 小於 7,在 PEARSON 的前六位小數中就不會出現無條件捨去的錯誤。現在請將 D2 的值變更為 7.25、7.5、7.75 接著是 8。工作表的儲存格 D6:D13 會分別顯示當 D2 = 7.5 和 D2 = 8 時,PEARSON 和 CORREL 的值。

CORREL 仍然很準確,但是 PEARSON 中無條件捨去的錯誤已變得很嚴重,當 D2 = 8 時會發生除以 0 的情況。

舊版 Excel 在這些情況中會出現不正確的答案,因為這些版本所使用的計算公式會讓無條件捨去錯誤的影響更大。這個實驗中的情況仍然可以視為是極端的情況。

在 Excel 2003 和更新版本中,如果您嘗試這個實驗,應該會看到 PEARSON 的值沒有改變。然而,儲存格 D6:D13 會顯示和您在舊版 Excel 中所得到的相同無條件捨去錯誤。

舊版 Excel 中的結果

如果您將兩個資料陣列命名為 X's 和 Y's,舊版 Excel 會使用一段式資料處理來計算 X's 的平方和、Y's 的平方和、X's 的和、Y's 的和、XY's 的和,以及各陣列中的觀察值數目。接下來,在舊版 Excel 中,這些數量會合併到「說明」檔案中的計算公式中。

Excel 2003 和更新版本中的結果

Excel 2003 和更新版本中所使用的程序是使用二段式資料處理程序。首先會計算 X's 與 Y's 的和以及各陣列中的觀察值數目,如此就可以從中計算出 X 和 Y 觀察值的平均數。然後在第二階段中,便會得出每個 X 和 X 平均數之間的差平方,然後再加總這些差平方。接著,得出每個 Y 和 Y 平均數之間的差平方後,再加總這些差平方。此外,會得出每一對資料點的乘積 (X – X 平均數) * (Y – Y 平均數) 並加總,這三個總和會合併到 PEARSON 的公式中。在 Y 陣列 (或 X 陣列) 的每個值中加入常數並不會影響到這三個總和,因為在 Y 平均數 (或 X 平均數) 中也加入了相同的值。在數值範例中,即使在儲存格 D12 中的值包含高達 10 次方,這三個總和仍不會受到影響,而且第二階段的結果與儲存格 D2 中的項目無關。因此,Excel 2003 和更新版本中的結果在數值方面更加穩定。

結論

二段式方法可以保證在 Excel 2003 和更新版本中的 PEARSON 的數值效能優於舊版 Excel 中所使用的一段式方法。Excel 2003 和更新版本中取得的結果絕對比舊版中取得的結果更精確。

CORREL 具有相同的功能,而且一定是以用於 Excel 2003 和更新版本中 PEARSON 的方法來實作。因此對於舊版 Excel,CORREL 是較佳的選擇。

然而,在大部分的實際例子中,您不太可能注意到 Excel 2003 和更新版本中的結果以及舊版 Excel 中的結果的差別,因為一般資料不太可能出現本實驗中所示範的不尋常行為。當資料包含大量的有效位數,而資料值之間幾乎沒有變異時,最有可能在舊版 Excel 中發生數值不穩定的情況。

利用找出樣本平均數、計算每個差平方、然後加總差平方的方法找出有關樣本平均數之差異平方和的程序,比替代程序更精確(替代程序經常被稱為「計算機公式」,因為它適合在資料點數量較小時使用計算機進行計算)。替代程序包含下列步驟:
  1. 找出所有觀察值的平方和、樣本大小以及所有觀察值的總和。
  2. 計算所有觀察值的平方和減去 ((所有觀察值的和)^2)/樣本大小)。
Excel 2003 和更新版本中已改良許多其他函數。這些函數的改良是因為新版 Excel 使用二段式程序來取代一段式程序,二段式程序在第一階段會找出樣本平均數,然後在第二階段計算相關的差平方和。

此類函數的簡短清單包括下列函數:
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • FORECAST
  • SLOPE
  • INTERCEPT
  • PEARSON
  • RSQ
  • STEYX
Analysis ToolPak 中的三種「變異數分析」工具都分別經過類似的改良。

屬性

文章編號: 828129 - 上次校閱: 2007年3月14日 - 版次: 2.0
這篇文章中的資訊適用於:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
關鍵字:?
kbformula kbexpertisebeginner kbinfo KB828129
Microsoft及(或)其供應商不就任何在本伺服器上發表的文字資料及其相關圖表資訊的恰當性作任何承諾。所有文字資料及其相關圖表均以「現狀」供應,不負任何擔保責任。Microsoft及(或)其供應商謹此聲明,不負任何對與此資訊有關之擔保責任,包括關於適售性、適用於某一特定用途、權利或不侵權的明示或默示擔保責任。Microsoft及(或)其供應商無論如何不對因或與使用本伺服器上資訊或與資訊的實行有關而引起的契約、過失或其他侵權行為之訴訟中的特別的、間接的、衍生性的損害或任何因使用而喪失所導致的之損害、資料或利潤負任何責任。

提供意見

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com