Excel 统计函数:PEARSON

文章翻译 文章翻译
文章编号: 828129 - 查看本文应用于的产品
展开全部 | 关闭全部

本文内容

概要

本文介绍了 Microsoft Excel 中的 PEARSON 函数,并且讨论了如何使用此函数。此外,本文将 Microsoft Office Excel 2003 及更高版本的 Excel 中的 PEARSON 结果与更早版本的 Excel 中的 PEARSON 结果进行了比较。

更多信息

PEARSON(array1, array2) 函数返回两个数据数组之间的 Pearson 积矩法相关系数。

语法

PEARSON(array1, array2)
参数 array1 和 array2 必须是数字、名称、数组常量或包含数字的引用。

PEARSON 的最常见的用法包括两个包含数据的单元格区域,如 PEARSON(A1:A100, B1:B100)。

用法示例

为了说明 PEARSON 函数,请按照下列步骤操作:
  1. 创建一个空白 Excel 工作表,然后复制下表。
    收起该表格展开该表格
    1= 3 + 10^$D$2数据加上 10 的幂
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2Excel 2003 以前的版本
    当 D2 = 7.5 时
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    当 D2 = 8 时
    #DIV/0!
    0.713772
  2. 选中空白 Excel 工作表中的单元格 A1,然后粘贴各项,这样此表将填满工作表中的单元格 A1:D13。
  3. 单击“粘贴选项”按钮,然后单击“匹配目标格式”。在粘贴区域仍处于选中状态的情况下,根据所运行的 Excel 版本使用以下的相应过程:
    • 在 Microsoft Office Excel 2007 中,单击“开始”选项卡,单击“单元格”组中的“格式”,然后单击“自动调整列宽”。
    • 在 Microsoft Office Excel 2003 中,指向“格式”菜单上的“列”,然后单击“最适合的列宽”。
    注意:您可能希望将单元格 B1:B6 设置为“数字”格式,没有小数位。
单元格 A1:A6 和 B1:B6 包含本例中用于调用单元格 A8 和 A9 中的 PEARSON 和 CORREL 函数的两个数据数组。PEARSON 和 CORREL 都计算 Pearson 积矩法相关系数,它们的结果应该一致。

在早于 Excel 2003 的 Excel 版本中,PEARSON 可能会出现舍入错误。PEARSON 的行为在 Excel 2003 及更高版本的 Excel 中得到了改进。CORREL 总是通过 Excel 2003 及更高版本的 Excel 中现在使用的经改进的过程来实现。因此,如果您使用的是早于 Excel 2003 的 Excel 版本中的 PEARSON,Microsoft 建议您改为使用 CORREL。

在早于 Excel 2003 的 Excel 版本中,您可以使用本文中的工作表来做一个试验,已发现舍入错误。如果您将 B1:B6 中的每个观察值都加上一个常量,PEARSON 或 CORREL 的值应该不会受到影响。如果您增大 D2 中的值,则应向 B1:B6 加上一个更大的常量。如果 D2 小于 7,PEARSON 的前 6 位小数不会出现舍入错误。现在将 D2 的值更改为 7.25、7.5、7.75,然后更改为 8。工作表的单元格 D6:D13 显示 PEARSON 和 CORREL 分别在 D2 = 7.5 和 D2 = 8 时的值。

CORREL 仍是准确的,但 PEARSON 的舍入错误变得十分严重,当 D2 = 8 时,除数为 0。

在这些情况下,更早版本的 Excel 将显示不正确的答案,这是因为利用在这些版本中使用的计算公式,舍入误差的影响将更加深远。但是,此试验中的情况可被视为极端情况。

在 Excel 2003 及更高版本的 Excel 中,如果您尝试此试验,应该会发现 PEARSON 值没有更改。但是,单元格 D6:D13 显示了与在更早版本的 Excel 中得到的相同的舍入错误。

早期版本的 Excel 中的结果

如果将两个数据数组分别命名为 X's 和 Y's,更早版本的 Excel 对整个数据使用单步来计算 X's 的平方和、Y's 的平方和、X's 的和、Y's 的和、XY's 的和,以及每个数组中观察值的计数。然后这些量组合在更早版本的 Excel“帮助”文件中的计算公式中。

Excel 2003 及更高版本的 Excel 中的结果

在 Excel 2003 及更高版本的 Excel 中使用的过程对整个数据使用双步进程。首先,计算 X's 的和、Y's 的和以及每个数组中观察值的计数。利用这些结果,可以计算 X 和 Y 观察值的平均值。然后,在第二步中,得出每个 X 与 X 平均值的方差;求出这些方差的和。得出每个 Y 与 Y 平均值的方差;求出这些方差的和。另外,得出每对数据点的乘积 (X – X 平均值)*(Y – Y 平均值),并求出乘积之和。将这三个和组合在 PEARSON 的公式中。Y 数组(或 X 数组)中的每个值都加上一个常量不会对这三个和造成任何影响,因为 Y 平均值(或 X 平均值)也加上了相同的值。在数值示例中,即使在单元格 D12 中有 10 的高次幂,这三个和也不会受到影响,第二步的结果独立于单元格 D2 中的项。因此,Excel 2003 和更高版本的 Excel 中的结果在数值方面的稳定性更高。

结束语

Excel 2003 及更高版本的 Excel 中的双步方法比更早版本的 Excel 中使用的单步方法更能保证 PEARSON 的数值性能。在 Excel 2003 及更高版本的 Excel 中获得结果的精确度绝不会低于在更早版本的 Excel 中获得的结果。

CORREL 具有相同的功能,它总是通过在 Excel 2003 及更高版本的 Excel 中 PEARSON 使用的方法来实现。因此,在更早版本的 Excel 中,CORREL 是较好的选择。

但是,在大多数实际示例中,您可能不会注意到 Excel 2003 及更高版本的 Excel 中的结果与早期版本的 Excel 中的结果之间的区别。典型数据不可能展现出此试验说明的那种异常行为。在更早版本的 Excel 中,当数据包含非常多的有效数字并且数据值之间的差异相对较小时,最有可能显示出数值不稳定性。

通过得出样本平均值、计算每个方差、然后求出方差和来得出有关样本平均值的方差和,这一过程的精确度要高于替代过程。(替代过程常常被称为“计算器公式”,因为它适于少量数据点的计算器使用。)替代过程包含下列步骤:
  1. 找到所有观测数据的平方和、样本容量以及所有观测数据的和。
  2. 计算所有观测数据负偏差的平方和((所有观测数据的和)^2)/样本容量)。
在 Excel 2003 及更高版本的 Excel 中,还改进了许多其他的函数。改进这些函数的原因是,更高版本的 Excel 将单步过程替换为双步过程,后者在第一步中得出样本平均值,然后在第二步中计算关于样本平均值的方差和。

此类函数的简短列表包括以下函数:
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • FORECAST
  • SLOPE
  • INTERCEPT
  • PEARSON
  • RSQ
  • STEYX
在分析工具库中的三个方差分析工具的每个工具中都已进行了类似的改进。

属性

文章编号: 828129 - 最后修改: 2007年2月26日 - 修订: 2.0
这篇文章中的信息适用于:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
关键字:?
kbinfo kbformula kbexpertisebeginner KB828129
Microsoft和/或其各供应商对于为任何目的而在本服务器上发布的文件及有关图形所含信息的适用性,不作任何声明。 所有该等文件及有关图形均"依样"提供,而不带任何性质的保证。Microsoft和/或其各供应商特此声明,对所有与该等信息有关的保证和条件不负任何责任,该等保证和条件包括关于适销性、符合特定用途、所有权和非侵权的所有默示保证和条件。在任何情况下,在由于使用或运行本服务器上的信息所引起的或与该等使用或运行有关的诉讼中,Microsoft和/或其各供应商就因丧失使用、数据或利润所导致的任何特别的、间接的、衍生性的损害或任何因使用而丧失所导致的之损害、数据或利润不负任何责任。

提供反馈

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com