Select the product you need help with
Excel 统计函数:PEARSON文章编号: 828129 - 查看本文应用于的产品 本页概要本文介绍了 Microsoft Excel 中的 PEARSON 函数,并且讨论了如何使用此函数。此外,本文将 Microsoft Office Excel 2003 及更高版本的 Excel 中的 PEARSON 结果与更早版本的 Excel 中的 PEARSON 结果进行了比较。 更多信息PEARSON(array1, array2) 函数返回两个数据数组之间的 Pearson 积矩法相关系数。 语法PEARSON 的最常见的用法包括两个包含数据的单元格区域,如 PEARSON(A1:A100, B1:B100)。 用法示例为了说明 PEARSON 函数,请按照下列步骤操作:
在早于 Excel 2003 的 Excel 版本中,PEARSON 可能会出现舍入错误。PEARSON 的行为在 Excel 2003 及更高版本的 Excel 中得到了改进。CORREL 总是通过 Excel 2003 及更高版本的 Excel 中现在使用的经改进的过程来实现。因此,如果您使用的是早于 Excel 2003 的 Excel 版本中的 PEARSON,Microsoft 建议您改为使用 CORREL。 在早于 Excel 2003 的 Excel 版本中,您可以使用本文中的工作表来做一个试验,已发现舍入错误。如果您将 B1:B6 中的每个观察值都加上一个常量,PEARSON 或 CORREL 的值应该不会受到影响。如果您增大 D2 中的值,则应向 B1:B6 加上一个更大的常量。如果 D2 小于 7,PEARSON 的前 6 位小数不会出现舍入错误。现在将 D2 的值更改为 7.25、7.5、7.75,然后更改为 8。工作表的单元格 D6:D13 显示 PEARSON 和 CORREL 分别在 D2 = 7.5 和 D2 = 8 时的值。 CORREL 仍是准确的,但 PEARSON 的舍入错误变得十分严重,当 D2 = 8 时,除数为 0。 在这些情况下,更早版本的 Excel 将显示不正确的答案,这是因为利用在这些版本中使用的计算公式,舍入误差的影响将更加深远。但是,此试验中的情况可被视为极端情况。 在 Excel 2003 及更高版本的 Excel 中,如果您尝试此试验,应该会发现 PEARSON 值没有更改。但是,单元格 D6:D13 显示了与在更早版本的 Excel 中得到的相同的舍入错误。 早期版本的 Excel 中的结果如果将两个数据数组分别命名为 X's 和 Y's,更早版本的 Excel 对整个数据使用单步来计算 X's 的平方和、Y's 的平方和、X's 的和、Y's 的和、XY's 的和,以及每个数组中观察值的计数。然后这些量组合在更早版本的 Excel“帮助”文件中的计算公式中。Excel 2003 及更高版本的 Excel 中的结果在 Excel 2003 及更高版本的 Excel 中使用的过程对整个数据使用双步进程。首先,计算 X's 的和、Y's 的和以及每个数组中观察值的计数。利用这些结果,可以计算 X 和 Y 观察值的平均值。然后,在第二步中,得出每个 X 与 X 平均值的方差;求出这些方差的和。得出每个 Y 与 Y 平均值的方差;求出这些方差的和。另外,得出每对数据点的乘积 (X – X 平均值)*(Y – Y 平均值),并求出乘积之和。将这三个和组合在 PEARSON 的公式中。Y 数组(或 X 数组)中的每个值都加上一个常量不会对这三个和造成任何影响,因为 Y 平均值(或 X 平均值)也加上了相同的值。在数值示例中,即使在单元格 D12 中有 10 的高次幂,这三个和也不会受到影响,第二步的结果独立于单元格 D2 中的项。因此,Excel 2003 和更高版本的 Excel 中的结果在数值方面的稳定性更高。结束语Excel 2003 及更高版本的 Excel 中的双步方法比更早版本的 Excel 中使用的单步方法更能保证 PEARSON 的数值性能。在 Excel 2003 及更高版本的 Excel 中获得结果的精确度绝不会低于在更早版本的 Excel 中获得的结果。CORREL 具有相同的功能,它总是通过在 Excel 2003 及更高版本的 Excel 中 PEARSON 使用的方法来实现。因此,在更早版本的 Excel 中,CORREL 是较好的选择。 但是,在大多数实际示例中,您可能不会注意到 Excel 2003 及更高版本的 Excel 中的结果与早期版本的 Excel 中的结果之间的区别。典型数据不可能展现出此试验说明的那种异常行为。在更早版本的 Excel 中,当数据包含非常多的有效数字并且数据值之间的差异相对较小时,最有可能显示出数值不稳定性。 通过得出样本平均值、计算每个方差、然后求出方差和来得出有关样本平均值的方差和,这一过程的精确度要高于替代过程。(替代过程常常被称为“计算器公式”,因为它适于少量数据点的计算器使用。)替代过程包含下列步骤:
此类函数的简短列表包括以下函数:
属性文章编号: 828129 - 最后修改: 2007年2月26日 - 修订: 2.0
Microsoft和/或其各供应商对于为任何目的而在本服务器上发布的文件及有关图形所含信息的适用性,不作任何声明。 所有该等文件及有关图形均"依样"提供,而不带任何性质的保证。Microsoft和/或其各供应商特此声明,对所有与该等信息有关的保证和条件不负任何责任,该等保证和条件包括关于适销性、符合特定用途、所有权和非侵权的所有默示保证和条件。在任何情况下,在由于使用或运行本服务器上的信息所引起的或与该等使用或运行有关的诉讼中,Microsoft和/或其各供应商就因丧失使用、数据或利润所导致的任何特别的、间接的、衍生性的损害或任何因使用而丧失所导致的之损害、数据或利润不负任何责任。 | 文章翻译
|


回到顶端








