Excel の統計関数 PEARSON

文書翻訳 文書翻訳
文書番号: 828129 - 対象製品
すべて展開する | すべて折りたたむ

目次

概要

この資料では、Microsoft Excel の PEARSON 関数について説明します。この関数の使用方法を説明し、Microsoft Office Excel 2003 以降のバージョンの Excel での PEARSON の計算結果と、以前のバージョンの Excel での PEARSON の計算結果とを比較します。

詳細

PEARSON(array1, array2) 関数は、2 組のデータ配列間のピアソン積率相関係数を返します。

構文

PEARSON(array1, array2)
引数 array1 および array2 は、数値、名前、配列定数、または数値が格納された参照、のいずれかである必要があります。

PEARSON の最も一般的な使用方法では、PEARSON(A1:A100, B1:B100) のように、データを格納した 2 組のセル範囲を指定します。

使用例

PEARSON 関数を使用するには、次の手順を実行します。
  1. 空の Excel ワークシートを作成し、以下の表をコピーします。
    元に戻す全体を表示する
    1 = 3 + 10^$D$2 データに追加する 10 の指数
    2 =4 + 10^$D$2 0
    3 =2 + 10^$D$2
    4 =5 + 10^$D$2
    5 =4+10^$D$2
    6 =7+10^$D$2 Excel 2003 より前のバージョンの場合
    D2 = 7.5 の場合
    =PEARSON(A1:A6,B1:B6) 0.702038
    =CORREL(A1:A6,B1:B6) 0.713772
    D2 = 8 の場合
    #DIV/0!
    0.713772
  2. 空の Excel ワークシートでセル A1 をクリックし、コピーした内容を貼り付けます。表の各項目がワークシートのセル A1:D13 に入力されます。
  3. [貼り付けのオプション] ボタンをクリックし、[貼り付け先の書式に合わせる] をクリックします。貼り付けた範囲を選択したまま、実行している Excel のバージョンに応じて、以下の手順のいずれかを実行します。
    • Microsoft Office Excel 2007 では、[ホーム] タブをクリックし、[セル] の [書式] をクリックし、[列の幅の自動調整] をクリックします。
    • Microsoft Office Excel 2003 では、[書式] メニューの [列] をポイントし、[選択範囲に合わせる] をクリックします。
    : セル B1:B6 の書式を、小数点以下の桁数 0 の "数値" 形式に設定することもできます。
セル A1:A6 および B1:B6 には、2 組のデータ配列が格納されています。この例で、セル A8 および A9 から PEARSON 関数と CORREL 関数を呼び出すときにこれらのデータ配列を使用します。PEARSON と CORREL の両方でピアソン積率相関係数が計算され、それらの計算結果は本来、一致します。

Excel 2003 より前のバージョンの Excel では、PEARSON で丸め誤差の問題が発生する可能性があります。この PEARSON の動作は、Excel 2003 以降のバージョンの Excel では変更されています。CORREL は、これまでも常に、現在 Excel 2003 で使用されているのと同じ手法で実装されていました。したがって、Excel 2003 より前のバージョンの Excel で PEARSON を使用している場合は、代わりに CORREL を使用することをお勧めします。

Excel 2003 より前のバージョンの Excel では、この資料のワークシートを使用してテストを行い、丸め誤差の問題が発生することを確認できます。B1:B6 に表示される値に定数を追加しても、PEARSON および CORREL の値には影響がないのが正常な動作です。D2 の値を大きくすると、B1:B6 にはより大きな定数が追加されます。D2 の値が 7 未満の場合、PEARSON の値の小数点以下 6 桁で発生する丸め誤差の問題は発生しません。次に、D2 の値を 7.25、7.5、7.75、8 に変更します。ワークシートのセル範囲 D6:D13 には、D2 = 7.5 の場合と D2 = 8 の場合の PEARSON と CORREL の値がそれぞれ表示されます。

CORREL の値は常に正確ですが、PEARSON では丸め誤差の問題の影響が大きくなり、D2 = 8 の場合には 0 による除算が発生します。

以前のバージョンの Excel では、このような場合に誤った解が返されます。これは、これらのバージョンで使用されている計算式では、丸め誤差の問題の影響がより大きくなるからです。ただし、このテストの条件は極端な例と見なすことができます。

Excel 2003 以降のバージョンの Excel では、テストを行っても PEARSON の値には変化は見られません。ただし、セル D6:D13 では、以前のバージョンの Excel と同様の丸め誤差の問題が発生します。

以前のバージョンの Excel の計算結果

2 組のデータ配列を X's および Y's と呼ぶことにします。以前のバージョンの Excel では、X's の平方和、Y's の平方和、X's の合計、Y's の合計、XY's の合計、および各配列内の値の数を計算するためのデータ処理に 1 段階の計算方式を使用しています。この計算が行われた後、これらの値が、以前のバージョンの Excel ヘルプ ファイルに記載されている計算式に代入されます。

Excel 2003 以降のバージョンの Excel の計算結果

Excel 2003 以降のバージョンの Excel で使用されている手順では、データを 2 段階の計算方式で処理する手法を採用しています。第 1 段階で、X's および Y's の合計と、各配列の値の個数が計算されます。これらの値から、X および Y の標本の平均値が計算されます。次に、第 2 段階で、X の各値と X の平均値の平方差が求められ、これらの平方差が合計されます。Y の各値と Y の平均値の平方差が求められ、これらの平方差が合計されます。さらに、各データ要素のペアごとに (X ? X の平均値) * (Y ? Y の平均値) の積が求められ、合計されます。これら 3 つの合計値が PEARSON の数式に代入されます。これらの 3 つの合計値は、Y 配列 (または X 配列) の各値に定数を追加しても、それと同じ値が Y の平均値 (または X の平均値) に追加されるため、いずれも影響を受けません。数値の例では、セル D12 の 10 の指数が大きくなっても、これら 3 つの合計値は影響を受けず、第 2 段階の計算結果はセル D2 の内容からは独立しています。したがって、Excel 2003 以降のバージョンの Excel の計算結果では、より安定した数値が得られます。

まとめ

Excel 2003 以降のバージョンの Excel で使用されている 2 段階の計算方式では、以前のバージョンの Excel での 1 段階の計算方式よりも、PEARSON の数値計算で優れたパフォーマンスが保証されます。Excel 2003 以降のバージョンの Excel の計算結果が以前のバージョンの計算結果よりも不正確になることはありません。

CORREL は同じ機能を持ち、Excel 2003 以降のバージョンの Excel の PEARSON で使用されているものと同じ方式がこれまでも実装されていました。このため、以前のバージョンの Excel では、CORREL を使用することをお勧めします。

ただし、実際のほとんどの例では、Excel 2003 以降のバージョンの Excel の計算結果と以前のバージョンの Excel の計算結果の間の相違に気付く可能性は高くありません。通常のデータでは、このテストで説明した正常でない動作が発生する可能性はほとんどありません。以前のバージョンの Excel で数値に不安定さが最も発生しやすくなるのは、有効桁数の非常に大きな値がデータに含まれており、かつ、各データの値の間の変動が相対的に小さい場合です。

標本の平均値を計算し、各偏差の平方を計算し、偏差の平方の合計を計算することによって、標本の平均値に対する偏差の平方和を求める手順は、もう 1 つの代替手順よりも正確です (この代替手順はよく "電卓の数式" と呼ばれます。それはこの方式が、少数のデータ要素を扱う電卓で使用するのに適しているからです)。この代替手順は、次のようになっています。
  1. すべての標本の平方和、標本の数、およびすべての標本の合計を求めます。
  2. すべての標本の平方和から ((すべての標本の合計)^2)/標本の数) を引いた値を計算します。
Excel 2003 以降のバージョンの Excel では、これ以外にも強化された多くの関数があります。これらの関数は、Excel 2003 以降のバージョンの Excel で、1 段階の計算方式が、第 1 段階で標本の平均値を求め、第 2 段階でその値に対する偏差の平方和を計算する 2 段階の計算方式に置き換えられたことにより、機能が強化されています。

このような関数を、以下の一覧に示します。
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • FORECAST
  • SLOPE
  • INTERCEPT
  • PEARSON
  • RSQ
  • STEYX
同様の機能強化は、Analysis ToolPak の 3 つの分散分析ツールでも行われています。

プロパティ

文書番号: 828129 - 最終更新日: 2007年4月23日 - リビジョン: 2.0
この資料は以下の製品について記述したものです。
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
キーワード:?
kbformula kbexpertisebeginner kbinfo KB828129
"Microsoft Knowledge Baseに含まれている情報は、いかなる保証もない現状ベースで提供されるものです。Microsoft Corporation及びその関連会社は、市場性および特定の目的への適合性を含めて、明示的にも黙示的にも、一切の保証をいたしません。さらに、Microsoft Corporation及びその関連会社は、本文書に含まれている情報の使用及び使用結果につき、正確性、真実性等、いかなる表明・保証も行ないません。Microsoft Corporation、その関連会社及びこれらの権限ある代理人による口頭または書面による一切の情報提供またはアドバイスは、保証を意味するものではなく、かつ上記免責条項の範囲を狭めるものではありません。Microsoft Corporation、その関連会社 及びこれらの者の供給者は、直接的、間接的、偶発的、結果的損害、逸失利益、懲罰的損害、または特別損害を含む全ての損害に対して、状況のいかんを問わず一切責任を負いません。(Microsoft Corporation、その関連会社 またはこれらの者の供給者がかかる損害の発生可能性を了知している場合を含みます。) 結果的損害または偶発的損害に対する責任の免除または制限を認めていない地域においては、上記制限が適用されない場合があります。なお、本文書においては、文書の体裁上の都合により製品名の表記において商標登録表示、その他の商標表示を省略している場合がありますので、予めご了解ください。"

フィードバック

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com