Funciones estadísticas de Excel: PEARSON

Seleccione idioma Seleccione idioma
Id. de artículo: 828129 - Ver los productos a los que se aplica este artículo
Expandir todo | Contraer todo

En esta página

Resumen

En este artículo se describe la función PEARSON de Microsoft Excel. En este artículo se describe cómo utilizar la función. Además, este artículo compara los resultados de PEARSON en Microsoft Office Excel 2003 y en versiones posteriores de Excel con los resultados de PEARSON en versiones anteriores de Excel.

Más información

La función PEARSON(matriz1, matriz2) devuelve el coeficiente de correlación producto-momento de Pearson entre dos matrices de datos.

Sintaxis

PEARSON(array1, array2)
Los argumentos, matriz1 y matriz2, deben ser números, nombres, constantes de matriz o referencias que contengan números.

El uso más frecuente de PEARSON incluye dos rangos de celdas que contienen los datos, como PEARSON(A1:A100, B1:B100).

Ejemplo de uso

Para ilustrar la función PEARSON, siga estos pasos:
  1. Cree una hoja de cálculo de Excel en blanco y copie la tabla siguiente.
    Contraer esta tablaAmpliar esta tabla
    1= 3 + 10^$D$2Potencia de 10 para sumar a los datos
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2antes de Excel 2003
    cuando D2 = 7,5
    =PEARSON(A1:A6,B1:B6)0.702038
    =COEF.DE.CORREL(A1:A6,B1:B6)0.713772
    cuando D2 = 8
    ¡#DIV/0!
    0.713772
  2. Seleccione la celda A1 de la hoja de cálculo de Excel en blanco y pegue las entradas de forma que la tabla rellene las celdas A1:D13 de la hoja de cálculo.
  3. Haga clic en el botón Opciones de pegado y, a continuación, haga clic en Coincidir con formato de destino. Con el rango pegado todavía seleccionado, utilice uno de los procedimientos siguientes según la versión de Excel que esté ejecutando:
    • En Microsoft Office Excel 2007, haga clic en la ficha Inicio, haga clic en Formato en el grupo Celdas y, a continuación, haga clic en Autoajustar ancho de columna.
    • En Microsoft Office Excel 2003, seleccione Columna en el menú Formato y, a continuación, haga clic en Autoajustar a la selección.
    Nota: puede dar formato a las celdas B1:B6 como Número con 0 posiciones decimales.
Las celdas A1:A6 y B1:B6 contienen las dos matrices de datos que se utilizan en este ejemplo para llamar a las funciones PEARSON y COEF.DE.CORREL en las celdas A8 y A9. Tanto PEARSON como COEF.DE.CORREL calculan el coeficiente de correlación producto-momento de Pearson y sus resultados deben coincidir.

En las versiones de Excel anteriores a Excel 2003, PEARSON puede presentar errores de redondeo. El comportamiento de PEARSON se ha mejorado en Excel 2003 y en las versiones posteriores de Excel. COEF.DE.CORREL siempre se ha implementado con el procedimiento mejorado que se utiliza ahora en Excel 2003 y en las versiones posteriores de Excel. Por tanto, si está utilizando PEARSON para una versión de Excel anterior a Excel 2003, Microsoft recomienda que utilice en su lugar COEF.DE.CORREL.

En las versiones de Excel anteriores a Excel 2003, puede utilizar la hoja de cálculo de este artículo para hacer un experimento y detectar cuándo se producen errores de redondeo. Si agrega una constante a cada una de las observaciones de B1:B6, el valor de PEARSON o de COEF.DE.CORREL no debe verse afectado. Si aumenta el valor de D2, se agregará una constante mayor a B1:B6. Si D2 es menor que 7, no hay ningún error de redondeo en las seis primeras posiciones decimales de PEARSON. Cambie ahora el valor de D2 a 7,25, 7,5, 7,75 y 8. Las celdas D6:D13 de la hoja de cálculo muestran los valores de PEARSON y de COEF.DE.CORREL cuando D2 = 7,5 y cuando D2 = 8, respectivamente.

COEF.DE.CORREL sigue siendo precisa, pero los errores de redondeo de PEARSON son tan graves que se produce una división por 0 cuando D2 = 8.

Las versiones anteriores de Excel presentan respuestas incorrectas en estos casos porque los efectos de los errores de redondeo son más profundos con la fórmula de cálculo utilizada por estas versiones. Los casos de este experimento pueden verse como un extremo.

En Excel 2003 y en versiones posteriores de Excel no debería ver ningún cambio en los valores de PEARSON si prueba el experimento. Sin embargo, las celdas D6:D13 muestran los mismos errores de redondeo que obtiene en las versiones anteriores de Excel.

Resultados en versiones anteriores de Excel

Si asigna a las dos matrices de datos los nombres X e Y, las versiones anteriores de Excel utilizan un único paso por los datos para calcular la suma de los cuadrados de X, la suma de los cuadrados de Y, la suma de X, la suma de Y, la suma de XY y el recuento del número de observaciones de cada matriz. Estas cantidades se combinan después en la fórmula de cálculo del archivo de Ayuda en las versiones anteriores de Excel.

Resultados en Excel 2003 y en versiones posteriores de Excel

El procedimiento utilizado en Excel 2003 y en las versiones posteriores de Excel utiliza un proceso de dos pasos por los datos. Primero se calculan las sumas de X e Y y el recuento del número de observaciones de cada matriz. A partir de esto se pueden calcular las medias (promedios) de las observaciones de X e Y. A continuación, en el segundo paso, se calcula la diferencia cuadrática entre cada X y la media de X; se suman estas diferencias cuadráticas. Se busca la diferencia cuadrática entre cada Y y la media de Y; se suman estas diferencias cuadráticas. Además, se buscan los productos (X ? media de X) * (Y ? media de Y) para cada par de puntos de datos y se suman. Estas tres sumas se combinan en la fórmula para PEARSON. Ninguna de estas tres sumas se ve afectada por agregar una constante a cada valor de la matriz Y (o la matriz X), ya que ese mismo valor se agrega a la media de Y (o a la media de X). En los ejemplos numéricos, incluso con una potencia elevada de 10 en la celda D12, estas tres sumas no se ven afectadas y los resultados del segundo paso son independientes de la entrada de la celda D2. Por tanto, los resultados en Excel 2003 y en versiones posteriores de Excel son más estables numéricamente.

Conclusiones

Un enfoque de dos pasos garantiza un mejor rendimiento numérico de PEARSON en Excel 2003 y en las versiones posteriores de Excel que el enfoque de un paso que se utiliza en las versiones anteriores de Excel. Los resultados que obtiene en Excel 2003 y en las versiones posteriores de Excel nunca serán menos precisos que los resultados que obtuvo en versiones anteriores de Excel.

COEF.DE.CORREL tiene la misma funcionalidad y siempre se ha implementado con el enfoque que se utiliza para PEARSON en Excel 2003 y en las versiones posteriores de Excel. Por tanto, COEF.DE.CORREL es una opción mejor para las versiones anteriores de Excel.

Sin embargo, en la mayoría de los ejemplos prácticos no es probable que observe ninguna diferencia entre los resultados en Excel 2003 y en versiones posteriores de Excel y los resultados en versiones anteriores de Excel. Es improbable que los datos típicos presenten el tipo de comportamiento no habitual que ilustra este experimento. La inestabilidad numérica es más probable que aparezca en versiones anteriores de Excel cuando los datos contienen un número alto de dígitos significativos y relativamente poca variación entre los valores de datos.

El procedimiento que busca la suma de desviaciones cuadráticas sobre una media de muestreo buscando la media de muestreo, calculando cada desviación cuadrática y sumando después las desviaciones cuadráticas es más preciso que el procedimiento alternativo. (El procedimiento alternativo se conoce con frecuencia como la "fórmula de la calculadora", porque es idóneo para su uso por una calculadora en un número pequeño de puntos de datos.) El procedimiento alternativo consta de los pasos siguientes:
  1. Buscar la suma de los cuadrados de todas las observaciones, el tamaño de muestreo y la suma de todas las observaciones.
  2. Calcular la suma de los cuadrados de todas las observaciones menos ((suma de todas las observaciones)^2/tamaño de muestreo).
Hay muchas otras funciones que se han mejorado en Excel 2003 y en las versiones posteriores de Excel. Estas funciones se han mejorado porque las versiones posteriores de Excel reemplazan el procedimiento de un paso con el procedimiento de dos pasos que busca la media de muestreo en el primer paso y, a continuación, calcula la suma de las desviaciones cuadráticas sobre la media de muestreo en el segundo paso.

Una breve lista de estas funciones incluye las siguientes:
  • VAR
  • VARP
  • DESVEST
  • DESVESTP
  • BDVAR
  • BDVARP
  • BDDESVEST
  • BDDESVESTP
  • PRONOSTICO
  • PENDIENTE
  • INTERSECCION.EJE
  • PEARSON
  • COEFICIENTE.R2
  • ERROR.TIPICO.XY
Se han realizado mejoras similares en las tres herramientas de Análisis de varianza en las Herramientas para análisis.

Propiedades

Id. de artículo: 828129 - Última revisión: jueves, 27 de diciembre de 2007 - Versión: 2.0
La información de este artículo se refiere a:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
Palabras clave: 
kbinfo kbformula kbexpertisebeginner KB828129

Enviar comentarios

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com