Excel の CONFIDENCE 統計関数の説明

概要

この記事では、Microsoft Office Excel 2003 および Microsoft Office Excel 2007 の CONFIDENCE 関数について説明し、関数の使用方法を示し、Excel 2003 および Excel 2007 の関数の結果と以前のバージョンの Excel の CONFIDENCE の結果を比較します。

信頼区間の意味は、誤って解釈される場合が多く、データから CONFIDENCE 値を決定した後に作成できる有効なステートメントと無効なステートメントの説明を提供しています。

詳細情報

CONFIDENCE(α, σ, n) 関数は、母集団の平均に対する信頼区間の構築に使用できる値を返します。 信頼区間とは、既知のサンプル平均を中心にした値の範囲です。 サンプル内の観測値は、既知の標準偏差、σ、およびサンプル内の観測値の数が n の正規分布からの値であると見なされます。

構文

CONFIDENCE(alpha,sigma,n)

パラメーター: α は確率、0 は α < 1 <します。 σは正の数値で、n はサンプル サイズに対応する正の整数です。

通常、α は 0.05 などの小さい確率です。

使用例

インテリジェンス商 (IQ) スコアが標準偏差 15 の正規分布に従ったとします。 ローカル の学校で 50 人の学生のサンプルを対象に IQs をテストし、サンプル平均 105 を取得します。 母集団の平均に対して 95% の信頼区間を計算する場合。 95% または 0.95 信頼区間は、α = 1 – 0.95 = 0.05 に対応します。

CONFIDENCE 関数を説明するには、空白の Excel ワークシートを作成し、次の表をコピーして、空白の Excel ワークシートのセル A1 を選択します。 [編集] メニューの [貼り付け] をクリックします。

注: Excel 2007 では、[ホーム] タブの [クリップボード]グループの [貼り付け] をクリックします。

下の表のエントリは、ワークシートのセル A1:B7 に入力されています。

α

0.05

stdev

15

n

50

サンプル平均

105

=CONFIDENCE(B1,B2,B3)

=NORMSINV(1 - B1/2)*B2/SQRT(B3)

この表を新しい Excel ワークシートに貼り付けしたら、[貼り付けオプション] ボタンをクリックし、[貼り付け先の書式に合わせて設定]をクリックします

貼り付け範囲を選択した後、[書式] メニューの [列] をポイントし、[選択範囲の自動調整]をクリックします

注: Excel 2007 では、貼り付けされたセル範囲を選び、[ホーム] タブの[セル] グループで [書式] をクリックし、[列幅の自動調整] をクリックします

セル A6 には CONFIDENCE の値が表示されます。 CONFIDENCE(α, σ, n) の呼び出しは計算の結果を返すので、セル A7 には同じ値が表示されます。

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

CONFIDENCE に直接変更は加えはなされませんが、NORMSINV は Microsoft Excel 2002 で改善され、Excel 2002 と Excel 2007 の間でさらに改善されました。 そのため、CONFIDENCE は NORMSINV に依存するため、これらの新しいバージョンの Excel では異なる結果 (および改善された) 結果が返される可能性があります。

これは、以前のバージョンの Excel の CONFIDENCE に対する信頼を失う必要があるという意味ではありません。 NORMSINV 関数の誤りは、通常、引数が 0 に非常に近い値、または 1 に非常に近い値に対して発生します。 実際には、α は通常 0.05、0.01、または 0.001 に設定されます。 NORMSINV の丸め誤差が発生する可能性が高い場合、α の値は、0.0000001 など、それよりはるかに小さい値である必要があります。

注: NORMSINV の計算の違いについては、NORMSINV に関する記事を参照してください。

詳細については、次の記事番号をクリックして、Microsoft サポート技術情報の記事を表示します。

826772 Excel 統計関数: NORMSINV

CONFIDENCE の結果の解釈

CONFIDENCE の Excel ヘルプ ファイルは、Excel 2003 および Excel 2007 用に書き換えされました。ヘルプ ファイルのすべての以前のバージョンでは、結果の解釈について誤解を招くアドバイスが得られたためです。 例では、"50 人の通勤者のサンプルでは、通勤時間の平均は、母集団の標準偏差が 2.5 の 30 分である、という観測を行ったとします。 0.692951 は CONFIDENCE(0.05, 2.5, 50) によって返される値である 0.692951" の間隔で母集団の平均が 30 +/- 0.692951" であるという 95% の確信を持つ可能性があります。

同じ例では、結論は"作業する出張の平均の長さは 30 ± 0.692951 分、または 29.3 から 30.7 分です" と読み上げられます。 これは、確率 0.95 の区間 [30 – 0.692951, 30 + 0.692951] の間隔内に位置する母集団の平均に関する記述で、0.95 と見なされます。

この例のデータを生成した実験を行う前に、(ベイズ統計学者ではなく) クラシカル統計学者は、母集団の平均の確率分布に関する記述を行う必要はありません。 代わりに、クラッシック統計学者は仮説検定を扱います。

たとえば、クラッシック統計学者は、既知の標準偏差 (2.5 など)、母集団の平均 μ0 の特定の事前に選択された値、および事前に選択された基準レベル (0.05 など) を持つ正規分布の対比に基づく両面仮説検定を行う場合があります。 検定の結果は、観測されたサンプル平均の値 (例 30) と、観測されたサンプル平均がどちらかの方向の μ0 から離れすぎた場合、母集団の平均が μ0 であるという帰無仮説が基準レベル 0.05 で拒否されるという帰無仮説に基づいて行います。 帰無仮説が拒否された場合、μ0 が真の母集団の平均であるという仮説の下で、μ0 から遠いまたは遠い方の確率で時間の 5% 未満の確率で発生するサンプル平均が解釈されます。 この検定を実施した後でも、クラシカル統計学者は母集団の平均の確率分布に関する記述を一切行う必要はありません。

一方、バイレス統計学者は、母集団の平均 (事前分布) に対する確率分布を想定して開始し、クラシカル統計学者と同じ方法で試験的証拠を収集し、この証拠を使用して母集団平均の確率分布を修正し、その結果として後分分布を得る必要があります。 Excel には、この取り組みにおけるバイレス統計学者に役立つ統計関数はありません。 Excel の統計関数は、すべてクラシカル統計を対象とします。

信頼区間は仮説検定に関連しています。 信頼区間は、仮説の母集団平均 μ0 の値に関する簡潔な計算を行い、母集団の平均が μ0 という帰無仮説と、母集団の平均が μ0 という帰無仮説の拒否を生み出す μ0 の値を表します。 クラシカル統計学者は、母集団の平均が一定の間隔で含まれる可能性についていかなる記述も行えないので、この確率分布に関する事前の仮定を行う必要はありません。また、それらを修正するために試験的証拠を使用する場合は、そのような仮定が必要になる可能性があります。

このセクションの先頭にある例を使用して、仮説検定と信頼区間の関係を探します。 最後のセクションで説明した CONFIDENCE と NORMSINV の間の関係を使用すると、次の情報を使用できます。

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

サンプル平均は 30 なので、信頼区間は 30 +/- 0.692951 です。

ここで、標準偏差 2.5 の正規分布、50 のサンプル サイズ、特定の仮説の母集団平均 μ0 を仮定した、前に説明したように、有意水準 0.05 の両面仮説検定を検討してください。 これが真の母集団の平均である場合、母集団の平均 μ0 と標準偏差 2.5/SQRT(50) を持つ正規分布からサンプル平均が得されます。 この分布は μ0 について対称であり、ABS(サンプル平均 - μ0) が何らかのカットオフ値を返す場合に帰無仮説を>する必要があります。 カットオフ値は、μ0 が真の母集団の平均である場合、サンプル平均の値 (このカットオフより μ0 高い値、または μ0 の値) がそれぞれ 0.05/2 の確率で発生する可能性が高くなります。 このカットオフ値は、

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

したがって、次のいずれかの条件に当てはまる場合は、帰無仮説 (母集団の平均 = μ0) を返します。

サンプル平均 - μ0 > 0。 692951
0 – 0 の>平均を示します。 692951

この例のサンプル平均 = 30 なので、これら 2 つのステートメントは次のステートメントになります。

30 - μ0 > 0. 692951
μ0 – 30 > 0。 692951

左に μ0 だけが表示される形式で書き換える場合、次のステートメントが生成されます。

μ0 < 30 - 0。 692951
μ0 > 30 + 0。 692951

これらは、信頼区間 [30 – 0.692951, 30 + 0.692951] に含されていない μ0 の値です。 したがって、信頼区間 [30 – 0.692951, 30 + 0.692951] には μ0 の値が含まれます。この場合、母集団の平均が μ0 であるという帰無仮説は、サンプル証拠を指定すると拒否されません。 この区間を超える μ0 の値の場合、母集団の平均が μ0 であるという帰無仮説は、サンプルエビデンスによって拒否されます。

まとめ

以前のバージョンの Excel では、一般的に NORMSINV(p) の p の値が非常に小さいか非常に大きい場合、不正確になります。 CONFIDENCE は NORMSINV(p) を呼び出すことによって評価されます。したがって、NORMSINV の精度は CONFIDENCE のユーザーの潜在的な問題です。 ただし、実際に使用される p の値が NORMSINV で重大な丸めエラーを引き起こすほど極端な値になる可能性は低く、CONFIDENCE のパフォーマンスは Excel の任意のバージョンのユーザーにとって問題になるはずではありません。

この記事の大部分は、CONFIDENCE の結果の解釈に重点を置きました。 つまり、"信頼区間の意味は何ですか?" という質問をしています。 信頼区間は、よく誤解されます。 残念ながら、Excel 2003 より前のすべてのバージョンの Excel ヘルプ ファイルは、この誤解の一部です。 Excel 2003 ヘルプ ファイルが改善されました。

ヘルプを表示

Office のスキルを磨く
トレーニングの探索
新機能を最初に入手
Office Insider に参加する

この情報は役に立ちましたか?

フィードバックをお寄せいただき、ありがとうございます。Office サポートの担当者におつなぎいたします。

×