Help and Support

文書番号: 828124 - 最終更新日: 2008年2月6日 - リビジョン: 2.0

Excel の統計関数 CONFIDENCE について

目次

すべて展開する | すべて折りたたむ

概要

この資料では、Microsoft Office Excel 2003 および Microsoft Office Excel 2007 の CONFIDENCE 関数について説明します。この関数の使用方法を説明し、Excel 2003 および Excel 2007 の CONFIDENCE 関数の計算結果と Excel 2003 より前のバージョンの Excel の CONFIDENCE 関数の計算結果を比較します。

信頼区間の意味は誤解されることが多いため、ここでは、データから CONFIDENCE の値を算出した結果、判断できることおよび判断できないことについて説明します。

詳細

CONFIDENCE(α, σ, n) 関数は、母集団の平均に対する信頼区間を返します。信頼区間とは、既知の標本平均を中心としたその両側の範囲です。標本の観測値は既知の標準偏差σの正規分布に従うことが想定されており、標本の観測数は n です。

構文

CONFIDENCE(α,σ,n)
パラメータ : αは確率で、0 < α < 1 となる値です。σは正の数です。n は標本数に相当する正の整数です。

通常、αは 0.05 などの低い確率です。

使用例

知能指数 (IQ) の値が標準偏差 15 の正規分布に従うものとします。地元の学校の学生 50 人を標本として IQ をテストしたところ、標本平均は 105 でした。このとき、母集団の平均の 95% 信頼区間を計算します。95% (0.95) 信頼区間は、α = 1 ? 0.95 = 0.05 に相当します。

CONFIDENCE 関数の動作を確認するには、空の Excel ワークシートを作成します。次の表をコピーし、空の Excel ワークシートのセル A1 をクリックします。[編集] メニューの [貼り付け] をクリックします。

: Excel 2007 では、[ホーム] タブの [クリップボード] で [コピー] をクリックします。

下表の項目はワークシートのセル A1:B7 に挿入されます。
元に戻す全体を表示する
α 0.05
σ 15
n 50
標本平均 105
=CONFIDENCE(B1,B2,B3)
=NORMSINV(1 - B1/2)*B2/SQRT(B3)

この表を新しい Excel ワークシートに貼り付けたら、[貼り付けのオプション] ボタンをクリックし、[貼り付け先の書式に合わせる] をクリックします。

貼り付けた範囲が選択された状態のまま、[書式] メニューの [列] をポイントし、[選択範囲に合わせる] をクリックします。

: Excel 2007 では、貼り付けた範囲が選択された状態のまま、[ホーム] タブの [セル] で [書式] をクリックし、[列の幅の自動調整] をクリックします。

セル A6 に CONFIDENCE の値が表示されます。CONFIDENCE(α, σ, n) を呼び出すと以下の計算の結果が返されるため、セル A7 にはセル A6 と同じ値が表示されます。
NORMSINV(1 ? α/2) * σ / SQRT(n)
CONFIDENCE 関数自体には変更は加えられていませんが、NORMSINV は Microsoft Excel 2002 で変更が加えられ、Excel 2002 と Excel 2007 の間でさらに機能強化が行われました。CONFIDENCE では NORMSINV が使用されているため、これらの新しいバージョンの Excel では CONFIDENCE で返される結果が異なる場合があります (より適した結果が返されます)。

これは、以前のバージョンの Excel の CONFIDENCE は信頼できないという意味ではありません。NORMSINV で不正確な値が返されるのは一般に、引数の値が 0 に非常に近いか 1 に非常に近い場合です。実際には、αには通常 0.05、0.01、または 0.001 などが設定されます。NORMSINV で丸め誤差が認められるのは、αの値がこれらの値よりもはるかに小さい場合 (0.0000001 など) です。

: NORMSINV における計算の相違点については、NORMSINV に関する資料を参照してください。

関連情報を参照するには、以下の「サポート技術情報」 (Microsoft Knowledge Base) をクリックしてください。
826772? (http://support.microsoft.com/kb/826772/ ) Excel の統計関数 NORMSINV

CONFIDENCE の計算結果の解釈

Excel 2003 および Excel 2007 のヘルプ ファイルでは、CONFIDENCE に関する記述が書き直されています。これは、これ以前のすべてのバージョンの Excel ヘルプ ファイルには計算結果の解釈に関して誤解を招く内容が記載されていたためです。ヘルプ ファイルの使用例には、「郊外に住む会社員 50 人を標本として、通勤時間を調査したところ、片道の平均時間が 30 分で、母集団の標準偏差は 2.5 になりました。母集団の平均に対する信頼区間が次の数式 (30 ± 0.692951) で表されるとき、その信頼度は 95% になります。」と記載されています。ここで、0.692951 は CONFIDENCE(0.05, 2.5, 50) で返される値です。

この例の計算結果では、平均通勤時間は 30 ± 0.692951 分、つまり 29.3 〜 30.7 分となっています。これは、母集団の平均は 0.95 の確率で区間 [30 ? 0.692951, 30 + 0.692951] 内に入ることを表しているとも解釈されます。

ベイズ統計学とは異なり、古典統計学では、この使用例のデータを取得する実験を行う前に母集団の平均の確率分布について何らかの判断を行うことはできません。古典統計学で扱われるのは、仮説検定です。

たとえば、古典統計学では、既知の標準偏差 (2.5 など) を持つ正規分布、あらかじめ選択された特定の母集団の平均値 ?0、あらかじめ選択された有意水準 (0.05 など) という仮定に基づく両側仮説検定を行います。検定結果は観測された標本平均の値 (30 など) に基づいており、観測された標本平均が ?0 からいずれかの方向に非常に大きく離れている場合、「標本平均は ?0 である」という帰無仮説は有意水準 0.05 で棄却されます。「?0 は母集団の真の平均である」という仮定の下で帰無仮説が棄却される場合は、標本平均が ?0 から大きく離れている確率は 5% 未満であるという解釈になります。古典統計学では、この検定を実施した後でも母集団の平均の確率分布について何らかの判断をすることはできません。

一方、ベイズ統計学では、標本平均の確率分布の仮定 (事前分布と呼ばれます) を最初に行い、古典統計学と同じ方法で実験的証拠を収集して、この証拠を使用して母集団の平均の確率分布を変更することによって事後分布を求めます。Excel には、この作業でベイズ統計学の役に立つ統計関数は用意されていません。Excel の統計関数はすべて、古典統計学の手法を対象としています。

信頼区間は仮説検定に関係しています。信頼区間では、実験的証拠が与えられた場合に、「母集団の平均は ?0 である」という帰無仮説が採択される母集団の平均 ?0 の仮説値と、この帰無仮説が棄却される ?0 の値について簡潔に示すことができます。古典統計学ではこの確率分布に関する先験的仮定を行うことはなく、また実験的証拠を使用して仮説を修正するには先験的仮定が必要であるため、古典統計学では母集団の平均が特定の区間に入る確率について判断することはできません。

このセクションの冒頭にある使用例を使用して仮説検定と信頼区間の関係を探ってみます。前のセクションに記載されている CONFIDENCE と NORMSINV との関係を使用すると、以下のようになります。
CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 ? 0.05/2) * 2.5 / SQRT(50) = 0.692951
標本平均が 30 であるため、信頼区間は 30 ± 0.692951 となります。

標準偏差 2.5、標本数 50、および母集団の平均 ?0 の仮説値を持つ正規分布を仮定した、前述の有意水準 0.05 の両側仮説検定を考えてみます。?0 が母集団の真の平均である場合、標本平均は、母集団の平均が ?0 で標準偏差が 2.5/SQRT(50) の正規分布に従います。この分布は ?0 に関して対称であり、ABS(標本平均 ? ?0) > カットオフ値の場合に帰無仮説は棄却されます。カットオフ値は、?0 (標本平均 ? ?0) の値または (?0 ? 標本平均) の値がこのカットオフ値より大きくなる確率がそれぞれ 0.05/2 になるような値です。このカットオフ値は以下のようになります。
NORMSINV(1 ? 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
そのため、以下の式のいずれかが真の場合に帰無仮説 (母集団の平均 = ?0) が棄却されます。
標本平均 ? ?0 > 0. 692951
?0 ? 標本平均 > 0. 692951
使用例では標本平均 = 30 であるため、上記の 2 つの式は以下のようになります。
30 ? ?0 > 0. 692951
?0 ? 30 > 0. 692951
左辺が ?0 のみになるように書き直すと、以下のようになります。
?0 < 30 ? 0. 692951
?0 > 30 + 0. 692951
これらは、信頼区間 [30 ? 0.692951, 30 + 0.692951] に入らない ?0 の値です。したがって、信頼区間 [30 ? 0.692951, 30 + 0.692951] に ?0 の値が含まれている場合は、標本の証拠を前提にして「母集団の平均は ?0 である」という帰無仮説は棄却されません。?0 の値がこの区間に含まれていない場合は、標本の証拠を前提にして「母集団の平均は ?0 である」という帰無仮説は棄却されます。

まとめ

以前のバージョンの Excel で不正確な値が返されるのは一般に、NORMSINV(p) の p 値が非常に小さい場合または非常に大きい場合です。CONFIDENCE は NORMSINV(p) を呼び出して計算されるため、NORMSINV の精度は CONFIDENCE を使用する場合に問題となる可能性があります。ただし、実際に使用される p 値が、NORMSINV で有意な丸め誤差が生じるほど極端な値である可能性は低いため、どのバージョンの Excel を使用していても CONFIDENCE の計算精度が問題になることは通常ありません。

この資料の大部分は、CONFIDENCE の結果の解釈に重点を置いています。つまり、「信頼区間の意味とは何か」を明らかにしようとしています。信頼区間はよく誤解されます。残念ながら、Excel 2003 より前のすべてのバージョンの Excel のヘルプ ファイルは、この誤解の一因になっていました。そのため、Excel 2003 ではヘルプ ファイルの記述が変更されています。

この資料は以下の製品について記述したものです。
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
キーワード:?
kbinfo kbexpertisebeginner KB828124
"Microsoft Knowledge Baseに含まれている情報は、いかなる保証もない現状ベースで提供されるものです。Microsoft Corporation及びその関連会社は、市場性および特定の目的への適合性を含めて、明示的にも黙示的にも、一切の保証をいたしません。さらに、Microsoft Corporation及びその関連会社は、本文書に含まれている情報の使用及び使用結果につき、正確性、真実性等、いかなる表明・保証も行ないません。Microsoft Corporation、その関連会社及びこれらの権限ある代理人による口頭または書面による一切の情報提供またはアドバイスは、保証を意味するものではなく、かつ上記免責条項の範囲を狭めるものではありません。Microsoft Corporation、その関連会社 及びこれらの者の供給者は、直接的、間接的、偶発的、結果的損害、逸失利益、懲罰的損害、または特別損害を含む全ての損害に対して、状況のいかんを問わず一切責任を負いません。(Microsoft Corporation、その関連会社 またはこれらの者の供給者がかかる損害の発生可能性を了知している場合を含みます。) 結果的損害または偶発的損害に対する責任の免除または制限を認めていない地域においては、上記制限が適用されない場合があります。なお、本文書においては、文書の体裁上の都合により製品名の表記において商標登録表示、その他の商標表示を省略している場合がありますので、予めご了解ください。"

サポート技術情報の翻訳

 

Related Support Centers