複雑な統計解析またはエンジニアリング分析を開発する必要がある場合は、Analysis ToolPak を使用して手順と時間を節約できます。 分析に必要なデータとパラメーターを指定すると、各ツールが統計用または工学用の適切なマクロ関数を使ってデータを分析し、計算結果を出力テーブルに表示します。 出力テーブルだけでなく、グラフを出力するツールもあります。
データ分析関数は、一度に 1 つのワークシートでのみ使用できます。 グループ化されたワークシートでデータ分析を実行すると、分析結果は 1 枚目のワークシートに表示され、残りのワークシートには空のテーブルが表示されます。 残りのワークシートでデータ分析を実行するには、ワークシートごとに分析ツールで再計算します。
分析ツールには、以降のセクションで説明するツールが含まれます。 これらのツールにアクセスするには、[データ] タブの [データ分析] を選択します。データ分析コマンドを使用できない場合は、Analysis ToolPak アドイン プログラムを読み込んでアクティブ化する必要があります。
分析ツールの読み込みとライセンス認証
Analysis ToolPak を読み込んでアクティブにするには:
Excel for Mac で、ファイル メニューの [ツール>Excel アドイン] に移動します。
Excel for Windows の場合:
- [ ファイル]、[ オプション] の順 に選択し、[アドイン] を選択します。
- [ 管理 ] ボックスで、[ Excel アドイン ] を選択し、[ 移動] を選択します。
[アドイン] ボックス で 、[ 分析ツール][パック ] チェック ボックスをオンにし、[ OK] を選択します。
- [有効なアドイン] ボックスの一覧に [分析ツール] が表示されない場合は、[参照] をクリックしてアドイン ファイルを見つけます。
- Analysis ToolPak が現在コンピューターにインストールされていないというメッセージが表示されたら、[ はい ] を選択してインストールします。
注
分析ツールで Visual Basic for Application (VBA) 関数を使用するには、分析ツールを読み込むときと同じ方法で "分析ツール - VBA" アドインを読み込みます。 [使用できるアドイン] ボックスの一覧の [分析ツール - VBA] チェック ボックスをオンにします。
分散分析
分散分析ツールを使用すると、さまざまな種類の分散分析を行うことができます。 使用するツールは、検定する母集団の要因数と標本数によって決まります。
分散分析: 一元配置
このツールは、複数の標本のデータについて分散の簡単な分析を行います。 この分析を行うと、すべての標本に関して基になる確率分布が同じではないという対立仮説に対して同じ確率分布からそれぞれの標本が得られるという仮説を検定することができます。 サンプルが 2 つしかない場合は、ワークシート関数 T.TEST を使用できます。 2つ以上のサンプルでは、 T.TESTの便利な一般化はなく、代わりに単一因子分散分析モデルを呼び出すことができます。
分散分析: 繰り返しのある二元配置
この分析ツールは、データを 2 つの異なる次元に従って分類できる場合に役立ちます。 たとえば植物の高さを計測する実験では、その植物に A、B、C など異なる肥料を与え、低温、高温などの異なる温度環境に置く場合があります。 {肥料、温度} の 6 種類の可能な組み合わせのそれぞれについて、植物の高さを同じ回数観察します。 この分散分析ツールを使うと、以下の検定を行うことができます。
- 異なる種類の肥料を与えた場合の植物の高さが、同じ母集団から得られた標本であると見なせるかどうか。 この分析では温度環境を無視します。
- 異なる温度環境に置いた場合の植物の高さが、同じ母集団から得られた標本であると見なせるかどうか。 この分析では肥料の種類を無視します。
箇条書き項目 1 での肥料の種類と箇条書き項目 2 での温度環境の違いによる影響を考慮に入れて、{肥料、温度} 値のすべての組み合わせを代表する 6 つの標本が同じ母集団から得られたものであると見なせるかどうかを検定します。 この場合の対立仮説は、肥料の種類単独または温度環境単独における違いに対して、{肥料、温度} の特定の組み合わせによる影響があるということです。
分散分析: 繰り返しのない二元配置
この分析ツールは、繰り返しのある二元配置の場合と同じように、データが 2 つの異なる次元で分類される場合に役立ちます。 ただしこのツールでは、1 つの組み合わせ (たとえば前の例では、{肥料、温度} の組み合わせの 1 つ) について、1 回の観察のみを行うと仮定します。
相関
CORREL および PEARSON ワークシート関数は両方とも、N 人の被験者のそれぞれについて各変数の測定値が観察されたときに、2 つの測定変数間の相関係数を計算します。 (対象に対する観察が欠落している場合、その対象は分析で無視されます)。相関分析ツールは、N 個の被験者ごとに 2 つ以上の測定変数がある場合に特に便利です。 これは、測定変数の可能な各ペアに適用される CORREL (または PEARSON) の値を示す出力テーブル、相関行列を提供します。
相関係数は、共分散と同様に、2 つの測定変数が "一緒に変化する" 程度の測定値です。共変性とは異なり、相関係数は、その値が 2 つの測定変数が表される単位に依存しないようにスケーリングされます。 (たとえば、2 つの測定変数が重みと高さの場合、重みがポンドからキロに変換された場合、相関係数の値は変更されません)。相関係数の値は、-1 から +1 までの範囲である必要があります。
相関分析ツールを使うと、測定変数の組み合わせそれぞれについて 2 つの測定変数が一緒に変化する傾向があるかどうかを調べることができます。一方の変数の大きな値がもう一方の変数の大きな値と関連する傾向があるか (正の相関)、一方の変数の小さな値がもう一方の変数の大きな値と関連する傾向があるか (負の相関)、両方の変数の値が関連しない傾向があるか (0 に近い相関) などを調べることができます。
共分散
一連の個人で N 個の異なる測定変数が観測されている場合、相関ツールと共分散ツールはどちらも同じ設定で使用できます。 相関ツールと共分散ツールはそれぞれ、測定変数の各ペア間の相関係数または共分散をそれぞれ示す出力テーブル、行列を提供します。 違いは、相関係数が -1 と +1 の間にあるようにスケーリングされることです。 対応する共分散はスケーリングされません。 相関係数と共分散はどちらも、2 つの変数が「一緒に変化する」程度の尺度です。
共変性ツールは、ワークシート関数 COVARIANCE の値を計算します 。 測定変数の各ペアの P。 (COVARIANCE を直接使用します。共変性ツールではなく P は、N=2 という 2 つの測定変数しかない場合に、妥当な代替手段です。行 i の共変性ツールの出力テーブルの対角線上のエントリ、列 i は、それ自体を持つ i 番目の測定変数の共分散です。 これは、ワークシート関数 VAR.P によって計算される、その変数の母集団分散にすぎません。
共分散分析ツールを使うと、測定変数の組み合わせそれぞれについて 2 つの測定変数が一緒に変化する傾向があるかどうかを調べることができます。一方の変数の大きな値がもう一方の変数の大きな値と関連する傾向があるか (正の共分散)、一方の変数の小さな値がもう一方の変数の大きな値と関連する傾向があるか (負の共分散)、両方の変数の値が関連しない傾向があるか (0 に近い共分散) などを調べることができます。
基本統計量
基本統計量分析ツールは、入力範囲のデータを対象に、一変量による基本統計量を調べ、対象となるデータの主要な傾向と変動に関する情報を出力します。
指数平滑
指数平滑化分析ツールは、前の期間の予測に基づいて、その前の予測の誤差を調整した値を予測します。 平滑化定数 a を使って計算します。この定数は、前回の予測値の誤差に対する予測値の反応の強さを決める値です。
注
平滑化定数に指定する値は 0.2 ~ 0.3 が適しています。 この範囲の値を使うと、現在の予測が前回の予測の 20 ~ 30% の誤差に調整されます。 定数に大きい値を指定すると、予測値の計算に必要な時間は短くなりますが、予測の誤差は大きくなります。 定数に小さい値を指定すると、予測値の計算に必要な時間が長くなります。
F 検定: 2 標本を使った分散の検定
F 検定: 2 標本を使った分散の検定分析ツールは、2 つの標本を使った F 検定を行って、2 つの母集団の分散を比較します。
たとえば、2 つのチームそれぞれの水泳大会でのタイムの標本について F 検定ツールを使用することができます。 このツールを使用すると、基となる分布で分散が等しくないという対立仮説に対して、分散が等しい分布からこれら 2 つの標本が得られるという帰無仮説に対する検定の結果を求めることができます。
このツールは F 統計 (または F 比率) の f 値を計算します。 f の値が 1 に近い場合は、基になる母集団の分散が等しいことを示します。 出力テーブルで、f < 1 "P(F <= f) one-tail" の場合、母集団の分散が等しい場合に f より小さい F 統計量の値を観測する確率が与えられます。"F Critical one-tail" は、選択した有意水準の α に対して 1 未満の臨界値を与えます。 f > 1 の場合、"P(F <= f) one-tail" は、母集団の分散が等しい場合に f より大きい F 統計量の値を観察する確率を与え、"F Critical one-tail" はアルファの場合に 1 より大きい臨界値を与えます。
フーリエ解析
フーリエ解析分析ツールは、データを変換する高速フーリエ変換 (FFT) を使って線形システムの解を求め、周期データを分析します。 この分析ツールは、変換したデータを元のデータに戻す逆変換もサポートしています。
ヒストグラム
ヒストグラム分析ツールは、対象となるデータおよびデータ区間のセル範囲の個別頻度および累積頻度を計算します。この分析ツールを使って、データ グループに含まれる特定の値の出現頻度を求めます。
たとえば、20 人の学生のクラスで、テストの点数をアルファベットでランク分けした分布を求めることができます。 このとき、ヒストグラム テーブルには、各ランクの境界値と、それぞれのランクに属する点数の頻度が表示されます。 最も出現頻度の高い点数がデータのモード (最頻値) です。
移動平均
移動平均分析ツールは、過去の一定期間の変数の平均値に基づき、将来の期間の値を予測します。 移動平均を使うと、過去のデータを平均するだけではわからない傾向についての情報が得られます。 売り上げや在庫などの傾向を予測するには、この分析ツールを使用します。 予測値は、次の数式を基に計算されます。
ここで
- N は、移動平均の計算に使う過去の観測値の個数です。
- Aj は、時刻 j の実際の値 です
- Fj は、時刻 j の予測値 です
乱数発生
乱数生成分析ツールは、いくつかの分布の 1 つから抽出された独立した乱数で範囲を埋めます。 確率分布を使用して、母集団内の対象を特徴付けることができます。 たとえば、正規分布を使用して個人の身長の母集団を特徴付けたり、2 つの可能な結果のベルヌーイ分布を使用してコイン トスの結果の母集団を特徴付けたりすることができます。
順位と百分位数
順位と百分位数分析ツールは、対象となるデータ グループに含まれる各値に対して、その順位と百分位を含む出力テーブルを作成します。 データの中での各値の相対的な位置を分析できます。 このツールでは、ワークシート関数 RANK を使用します。EQ と PERCENTRANK。INC. 関連付けられた値を考慮する場合は、RANK を使用します 。EQ 関数。これは、関連付けられた値を同じランクを持つものとして扱うか、RANK を使用 します。AVG 関数。関連付けられた値の平均ランクを返します。
回帰分析
回帰分析ツールは、「最小二乗」法を使用して線形回帰分析を実行し、一連の観測値に線を当てはめます。 単一の従属変数が 1 つ以上の独立変数の値によってどのように影響を受けるかを分析できます。 たとえば、年齢、身長、体重などの要因によってアスリートのパフォーマンスがどのように影響を受けるかを分析できます。 一連のパフォーマンス データに基づいて、パフォーマンス測定値のシェアをこれら 3 つの要素のそれぞれに割り当て、その結果を使用して、テストされていない新しいアスリートのパフォーマンスを予測できます。
回帰ツールでは、ワークシート関数 LINEST を使用します。
サンプリング
サンプリング分析ツールは、入力範囲のデータを母集団と見なし、母集団から標本を抽出します。 母集団の規模が大きすぎて統計処理やグラフ化が困難な場合は、母集団全体ではなく標本を対象に分析すると便利です。 また、入力データにある種の周期性が認められる場合は、周期の特定部分から一定数の標本を抽出することもできます。 たとえば、入力範囲に四半期ごとの売上高が入力されている場合、周期を 4 に設定すると、同じ四半期の売上高だけを出力テーブルに抽出できます。
t 検定
2 標本による t 検定分析ツールは、各標本の基になる母集団の平均の等しさを検定します。 母集団の分散が等しいという仮定、母集団の分散が等しくないという仮定、および 2 つの標本が同じ対象物についての処理の前と後の測定を表すという仮定、という 3 つの異なる仮定に 3 つのツールを使用します。
以下の 3 つのツールすべてにおいて、t 統計値 t が計算されて出力テーブルに "t Stat" として示されます。 データに応じてこの t という値は負の値にも正の値にもなります。 等しい基になる母集団の仮定では、t が 0 < 場合、"P(T <= t) one-tail" は t よりも負の t-Statistic の値が観測される確率を示します。 t >=0 の場合、"P(T <= t) one-tail" は t より正の t 統計量の値が観測される確率を示します。 "t 境界値 片側" で、"t 境界値 片側" より大きいか等しい t 統計の値が測定される確率が Alpha になるような区分値が求められます。
"P(T <= t) two-tail" は、t よりも絶対値が大きい t 統計量の値が観測される確率を示します。 "P 境界値 両側" で、絶対値が "P 境界値 両側" より大きい t 統計の値が測定される確率が Alpha になるような区分値が求められます。
t 検定: 一対の標本による平均の検定
1 つの標本グループをある実験の前後で 2 度検定する場合のように、2 つの観測値に自然な対の関係がある場合は、この形式の t 検定を使います。 この分析ツールとその数式は、一対の標本を使ったスチューデントの t 検定を行い、処理の前に行われた測定と処理の後に行われた測定が、母集団の平均値が等しい分布から行われたと見なせるかどうかを調べます。 この形式の t 検定では、2 つの母集団の分散が等しいことを前提としません。
注
この分析ツールを使って出力する結果には、次の数式で求められる、プールされた分散 (結果に関するデータの分散がプールされた量) が現れることもあります。
t 検定: 等分散を仮定した 2 標本による検定
この分析ツールは、2 標本のスチューデントの t 検定を実行します。 この t 検定フォームは、2 つのデータ セットが同じ分散の分布からのものであることを前提としています。 これは、等分散性 t 検定と呼ばれます。 この t 検定を使用して、2 つのサンプルが母集団の平均が等しい分布からのものである可能性が高いかどうかを判断できます。
t 検定: 分散が等しくないと仮定した 2 標本による検定
この分析ツールは、2 標本のスチューデントの t 検定を実行します。 この t 検定フォームは、2 つのデータ セットが不均等な分散を持つ分布からのものであることを前提としています。 これは、不均一分散 t 検定と呼ばれます。 前の等分散の場合と同様に、この t 検定を使用して 2 つのサンプルが母集団の平均が等しい分布からのものである可能性が高いかどうかを判断できます。 2 つのサンプルに異なる被験者がいる場合は、このテストを使用します。 次の例で説明するペア検定を使用します。これは、被験者のセットが 1 つで、2 つのサンプルが治療前後の各被験者の測定値を表す場合です。
統計定数 t を決めるには、次の数式を使います。
自由度 df を計算するには、次の数式を使用します。 通常は計算結果が整数ではないため、t テーブルからの境界値を求める際に、df の値が最も近い整数に四捨五入されます。 Excel ワークシート関数 T.TEST では、計算された df 値を丸めずに使用します。これは、 T.TEST の値を非整数 df で計算できるためです。 自由度を決定するためのこれらの異なるアプローチにより、 T.TEST とこの t-Test ツールの結果は、不等分散のケースで異なります。
z 検定
z 検定: 2 標本による平均の検定分析ツールは、既知の分散を使って、2 つの標本を対象に平均値の z 検定を行います。 この分析ツールを使って、片面または両面の対立仮説いずれかに対して 2 つの母集団の平均値の間に差がないという帰無仮設を検定します。 分散が不明な場合は、代わりにワークシート関数 Z.TEST を使用する必要があります。
z 検定分析ツールを使う場合は、出力を詳しく調べる必要があります。 "P(Z <= z) one-tail" は、実際には P(Z >= ABS(z)))であり、母集団平均間に差がない場合に観察された z 値と同じ方向にさらに 0 から z 値の確率を示します。 "P(Z <= z) two-tail" は、実際には P(Z >= ABS(z) または Z <= -ABS(z)) であり、母集団平均間に差がない場合、観測された z 値よりもいずれかの方向で 0 からさらに z 値が発生する確率です。 両側の結果は、片側のちょうど 2 倍の値になります。 z 検定分析ツールは、2 つの母集団の平均値の差が 0 以外の特定の値であるという仮説が帰無仮説となる場合に使用することもできます。 たとえば、z 検定を行うと、2 種類の車の性能の差異を検定できます。
補足説明
Excel Tech Community の専門家にいつでも依頼したり、コミュニティでサポートを受けたりすることができます。