使用分析工具库执行复杂数据分析

如果需要开发复杂的统计或工程分析，可以使用分析工具库来节省步骤和时间。为每项分析提供数据和参数，此工具将使用适当的统计或工程宏函数来计算并将结果显示在输出表格中。除了输出表格，某些工具还生成图表。

这些数据分析函数一次只能在一个工作表上使用。当您在分组的工作表上执行数据分析时，结果将显示在第一个工作表，而其余的工作表中则显示清空格式的表格。要对其余的工作表执行数据分析，请使用分析工具分别对每个工作表重新计算。

分析工具库包括下文所述的工具。若要访问这些工具，请在“ 数据 ”选项卡上选择“ 数据分析 ”。如果 Data Analysis 命令不可用，则需要加载并激活 Analysis ToolPak 加载项程序。

加载和激活分析工具库

若要加载并激活分析工具库，请执行以下操作：

在Excel for Mac，在文件菜单中，转到“工具”>“Excel 加载项”。

在 Excel for Windows 中：
1. 依次选择“文件”、“选项”和“加载项”。
2. 在 “管理 ”框中，选择“ Excel 加载项 ”，然后选择“ 转到”。
在“加载项”框中，选择“分析工具库检查”框，然后选择“确定”。
- 如果“可用加载宏”框中未列出“分析工具库”，请单击“浏览”以找到它。
- 如果系统提示计算机上当前未安装分析工具库，请选择“ 是 ”进行安装。

注意

若要包括用于分析工具库的 Visual Basic for Application (VBA) 函数，可以按加载分析工具库的相同方式加载“分析工具库 - VBA”加载宏。在“可用加载宏”框中，选中“分析工具库 - VBA”复选框。

方差分析

方差分析工具提供了不同类型的方差分析。您应根据要测试的样本总体中的因素数和样本数决定要使用的工具。

方差分析：单因素

此工具对两个或两个以上样本的数据方差执行简单的分析。此分析可提供一种假设检验，该假设的内容是：每个样本都取自相同基础概率分布，这与对所有样本来说基础概率分布都不相同的假设相反。如果只有两个示例，则可以使用工作表函数 T.TEST。对于两个以上的样本， T.TEST 没有方便的通用化，可以改为调用单因素方差模型。

方差分析：包含重复的双因素

此分析工具可用于分析按两个不同的维度归类的数据。例如，在测量植物高度的实验中，可能会对植物施加不同品牌的化肥（例如，A、B、C），也可能在不同温度（例如，低、高）中培养植物。对于 {化肥，温度} 的六种可能配对中的每一种，我们对植物高度取相同数量的观测值。使用此方差分析工具，我们可以测试：

施加不同品牌化肥的植物高度是否取自相同的基础样本总体。此分析将忽略温度。
不同温度级别中种植的植物高度是否取自相同的基础样本总体。此分析将忽略化肥品牌。

是否考虑到在第 1 步中发现的不同品牌化肥之间的差异以及第 2 步中不同温度之间差异的影响，代表所有 {化肥，温度} 值配对的 6 个样本取自相同的样本总体。另一种假设是仅基于化肥或温度来说，这些差异会对特定的 {化肥，温度} 值配对有影响。

方差分析工具的数据源区域设置

方差分析：无重复的双因素

此分析工具可用于分析按两个不同的维度归类的数据（如包含重复的双因素案例）。但是，对于此工具，假设每个配对只有一个观测值（例如，上面的示例中的每个 {化肥，温度} 配对）。

协方差

当您需要观测一组个体的 N 个不同测量变量时，相关系数和协方差工具都可用于相同的设置中。相关系数和协方差工具会各自提供一个输出表格，即一个矩阵，分别显示每对测量变量之间的相关系数和协方差。不同之处在于，相关系数可以调整，其值介于 -1 和 +1 之间（包括 -1 和 +1）。相应的协方差则无法调整。相关系数和协方差均为两个变量之间关联变化程度的指标。

协方差工具计算工作表函数 COVARIANCE 的值。 每对度量变量的 P。 (直接使用 COVARIANCE。当只有两个度量变量（即 N=2.) C 协方差工具输出表的第 i 行对角线上的条目，第 i 列是第 i 个度量变量本身的协方差值时，P 而不是协方差工具是一个合理的替代方法。这只是该变量的总体方差，由工作表函数 VAR.P 计算。

可以使用“协方差”工具来检验每对测量值变量，以便确定两个测量值变量是否趋向于同时变动，即，一个变量的较大值是否趋向于与另一个变量的较大值相关联（正相关）；或者一个变量的较小值是否趋向于与另一个变量的较大值相关联（负相关）；或者两个变量中的值趋向于互不关联（协方差近似于零）。

描述统计

“描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表，提供有关数据趋中性和易变性的信息。

指数平滑

“指数平滑”分析工具根据前期预测导出新预测值，并修正前期预测值的误差。此工具使用平滑常数 a，其大小决定了本次预测对前期预测误差的反馈程度。

注意

0.2 到 0.3 之间的值是合理的平滑常数。这些数值表明，由于前期预测值的误差，当前预测应调整 20% 到 30%。较大的常数可产生较快的响应，但将产生不稳定的结果。较小的常数将导致预测值长期的延迟。

F-检验双样本方差

“F-检验双样本方差”分析工具通过双样本 F-检验对两个样本总体的方差进行比较。

例如，您可对一次游泳比赛中两个队伍各自的时间样本使用 F-检验工具。该工具提供的检验结果，是以零假设为条件，即两个样本来自具有相同方差的分布，而不是以基础分布中方差不相等的备择假设为条件。

该工具计算 F-统计（或 F-比值）的 f 值。接近 1 的 f 值证明基础样本总体方差相等。在输出表中，如果 f < 1“P (F <= f) 单尾”给出在总体方差相等时观察到 F 统计值小于 f 的概率，而“F 关键单尾”为所选显著性级别提供小于 1 的临界值，则 Alpha。如果 f > 1，则“P (F <= f) 一尾”给出在总体方差相等时观察到 F 统计值大于 f 的概率，而“F 关键单尾”为 Alpha 提供大于 1 的临界值。

傅立叶分析

“傅立叶分析”分析工具可以解决线性系统问题，并通过使用快速傅立叶变换 (FFT) 方法转换数据来分析周期性数据。此工具也支持逆变换，对变换后的数据进行逆变换可返回原始数据。

“傅立叶分析”的数据源和输出区域

直方图

“直方图”分析工具可计算数据单元格区域和数据接收区间的单个和累积频率。此工具可用于统计数据集中某个数值出现的次数。

例如，在一个有 20 名学生的班里，可按字母评分的分类来确定成绩的分布情况。直方图表可给出字母评分的边界，以及在最低边界和当前边界之间分数出现的次数。出现频率最多的分数即为数据的众数。

提示

现可在 Excel 2016 中创建直方图或排列图。

移动平均

“移动平均”分析工具可以基于特定的过去几个时期中变量的平均值，设计预测期间的值。移动平均值提供了由所有历史数据的简单平均值所代表的趋势信息。使用此工具可以预测销售量、库存或其他趋势。每个预测值以下列计算公式为基础。

计算“移动平均”的公式

其中：

N 为进行移动平均包含的过去期间的个数
Aj 是时间 j 的实际值
Fj 是时间 j 的预测值

随机数发生器

“随机数发生器”分析工具可用几个分布中的一个产生的独立随机数字来填充某个区域。可以通过概率分布来表示样本总体中的主体特征。例如，可以使用正态分布来表示人体身高的总体特征，或者使用两项可能结果的伯努利分布来表示掷币实验结果的总体特征。

排位与百分比排位

“排位与百分比排位”分析工具可以产生一个数据表，在其中包含数据集中各个数值的顺序排位和百分比排位。该工具用来分析数据集中各数值间的相对位置关系。此工具使用工作表函数 RANK。EQ 和 PERCENTRANK。INC. 如果要考虑已绑定值，请使用 RANK。EQ 函数（将绑定值视为具有相同排名）或使用 RANK。AVG 函数，它返回已绑定值的平均排名。

回归

回归分析工具通过对一组观察值使用“最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或多个自变量影响的。例如，分析某个运动员的运动成绩与一系列统计因素的关系，如年龄、身高和体重等。根据一组成绩数据，您可确定这三个因素分别在运动成绩测量中所占的比重；然后使用该结果对尚未测量的运动员的成绩作出预测。

回归工具使用工作表函数 LINEST。

抽样

抽样分析工具以数据源区域为样本总体，并为此样本总体创建一个样本。当总体太大而不能进行处理或绘制时，可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的，还可创建一个样本，其中仅包含一个周期中特定时间段的数值。例如，如果数据源区域包含季度销售量数据，以四为周期性速率进行取样，将在输出区域生成与数据源区域中相同季度的数值。

t-检验

“双样本 t-检验”分析工具基于每个样本检验样本总体平均值的等同性。这三个工具分别使用不同的假设：样本总体方差相等；样本总体方差不相等；两个样本代表同一主体处理前后的观察值。

对于以下所有三个工具，t-统计值 t 在输出表中计算并显示为“t Stat”。数据决定了 t 是负值还是非负值。在基础总体平均值相等的假设下，如果 t < 0，则“P (T <= t) 一尾”给出观察到的 t 统计值比 t 更负的概率。如果 t >=0，则“P (T <= t) 单尾”给出观察到 t 统计值大于 t 正值的概率。 “t 单尾临界值”返回截止值，这样，t-统计的观察值将大于或等于“t 单尾临界值”的概率就为 Alpha。

“P (T <= t) 双尾”给出观察到的 t 统计值在绝对值中大于 t 的概率。 “P 双尾临界值”返回截止值，这样，t-统计的观测值绝对值大于“P 双尾临界值”的概率就为 Alpha。

t-检验：成对双样本平均值

当样本中存在自然配对的观察值时（例如，对一个样本组在实验前后进行了两次检验），可以使用此成对检验。此分析工具及其公式可以进行成对双样本学生的 t-检验，以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。此 t-检验窗体并未假设两个总体的方差是相等的。

注意

由此工具生成的结果中包含有合并方差，亦即数据相对于平均值的离散值的累积测量值，可以由下面的公式得到：

计算合并方差的公式

t-检验：双样本等方差假设

本分析工具可进行双样本学生 t-检验。此 t-检验窗体先假设两个数据集取自具有相同方差的分布。故也称作同方差 t-检验。可以使用此 t-检验来确定两个样本是否可能来自具有相同总体平均值的分布。

t-检验：双样本异方差假设

本分析工具可进行双样本学生 t-检验。此 t-检验窗体先假设两个数据集取自具有不同方差的分布。故也称作异方差 t-检验。如同上面的“等方差”情况，可以使用此 t-检验来确定两个样本是否可能来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时，可使用此检验。当具有唯一的一组对象以及代表每个对象在处理前后的测量值的两个样本时，则应使用下面所描述的成对检验。

用于确定统计值 t 的公式如下。

计算 t 值的公式

下列公式可用于计算自由度 df。因为计算结果一般不是整数，所以 df 的值被舍入为最接近的整数，以便从 t 表中获得临界值。 Excel 工作表函数 T.TEST 使用计算的 df 值而不舍入，因为可以使用非整数 df 计算 T.TEST 的值。由于这些用于确定自由度的不同方法， T.TEST 和此 t-Test 工具的结果在“不相等方差”事例中会有所不同。

估计自由度的公式

z-检验

“z-检验：双样本平均值”分析工具可对具有已知方差的双样本平均值进行 z-检验。此工具用于检验两个总体平均值之间不存在差异的零假设，而不是单方或双方的备择假设。如果差异未知，则应改用工作表函数 Z.TEST 。

当使用“z-检验”工具时，应该仔细理解输出。 “P (Z <= z) 单尾”实际上是 P (Z >= ABS (z) ) ，当总体平均值之间没有差异时，z 值的概率从 0 进一步向与观察到的 z 值相同。 “P (Z <= z) 双尾”实际上是 P (Z >= ABS (z) 或 Z <= -ABS (z) ) ，当总体平均值之间没有差异时，z 值在任一方向上从 0 进一步大于观察到的 z 值的概率。双尾结果只是单尾结果乘以 2。 z-检验工具还可用于当两个总体平均值之间的差异具有特定的非零值的零假设的情况。例如，可以使用此检验来确定两种汽车型号之间的性能差异情况。