Puede obtener resultados incorrectos y etiquetas engañosas cuando se utiliza el complemento Herramientas de análisis prueba t en Excel

Resumen

Este artículo describe las herramientas de análisis prueba t denominada herramienta de las dos muestras emparejadas. Esta herramienta no ha cambiado para Microsoft Office Excel 2003 y versiones posteriores de Excel. Sin embargo, esta herramienta ofrece resultados con errores cuando hay datos que faltan. Además, si hay datos que faltan, o no hay etiquetas engañosas en la salida de la herramienta.

Microsoft Excel 2004 para obtener información de Macintosh

Las funciones estadísticas de Excel 2004 para Mac se actualizaron utilizando los mismos algoritmos empleados para actualizar las funciones estadísticas en Excel 2003 y en versiones posteriores de Excel. Cualquier información de este artículo que describe cómo funciona una función o cómo se ha modificado una función para Excel 2003 y versiones posteriores de Excel también se aplica a Excel 2004 para Mac.

Más información

Normalmente, se aplica la prueba t de dos muestras emparejadas (a veces denominada prueba pares emparejados t) una vez antes y después de las medidas en los mismos experimentos para un tratamiento. Por ejemplo, puede medir el peso de un sujeto antes y después de una dieta de 30 días.

Normalmente, deshacerse de datos en cualquier asunto cuya antes de medición o después falta de medición. Datos incompletos sobre un tema hacen inútil la información acerca de un tema. Por desgracia, esta herramienta de complemento Herramientas para análisis se comporta de forma distinta a la práctica habitual. En primer lugar, esta herramienta de complemento Herramientas para análisis cuenta el número de temas con antes de las medidas y el número de temas con después de las mediciones. Si estos totales son diferentes, recibirá un mensaje de error y no continuar con esta herramienta de complemento Herramientas para análisis. Por lo tanto, por ejemplo, si hay 49 temas que tienen antes y después de las mediciones y un fiftieth sujetos quién tiene sólo una medida antes, la herramienta de complemento Herramientas para análisis no realizar el análisis.

Si el número de temas que no se encuentran delante de los datos es igual al número de temas que faltan después de los datos y este número es positivo, la herramienta realiza un análisis inadecuado. Por ejemplo, supongamos que hay temas de 50. Falta una medida antes, sujeto A y B de asunto carece de una medida de After y los demás 48 sujetos no tienen que faltan datos. La herramienta cuenta 49 antes de las mediciones y 49 después de mediciones; la herramienta actúa como si se hubiera 49 sujetos sin datos que faltan. Esto infringe su intención de eliminar a cualquier asunto que falta un valor antes o una posterior. El número de asuntos en este ejemplo debe ser 48, 49 no. Por lo tanto, la herramienta utiliza un número incorrecto de grados de libertad. Además, dado que la herramienta descarta ni A de asunto después de medida ni del asunto B antes de medición, estas dos medidas se incluyen en los cálculos de las medias de las muestras que se utilizan en la estadística t. Por lo tanto, estos calculan medias de las muestras son inadecuadas.

En resumen, resulta inapropiado utilizar la herramienta cuando hay datos que faltan, porque la herramienta se procesa o calculará con fórmulas inadecuadas. El último caso se produce cuando el número de temas que le faltan antes de datos es igual al número de temas que le faltan después de los datos.

El ejemplo en la sección "Ejemplo de uso" de este artículo ilustra estos problemas y también señala las confusas etiquetas de salida de la herramienta. La sección "Solución" de este artículo sugiere una solución en casos donde no se puede comprobar la ausencia de datos que faltan antes de utilizar la herramienta.

Ejemplo de uso

Para ilustrar el problema de la falta de datos, cree una hoja de cálculo de Excel en blanco y, a continuación, copie la tabla siguiente. Seleccione la celda A1 en la hoja de cálculo de Excel en blanco y pegue las entradas de forma que la tabla rellene A1:I52 de celdas en la hoja de cálculo.
Experimento 1Experimento 2Experimento 3Experimento 3 modificado para quitar
antes deDespués deantes deDespués deantes deDespués detemas con datos que faltan
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
Comportamiento de prueba de 2 colas
=TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
Herramienta de ATP para el experimento 1:
t-Test: para medias de dos muestras emparejadas
Variable 1Variable 2
Media150144.090909090909
Variación1100914.090909090909
Observaciones1111
Correlación de Pearson0.952384533866487
Diferencia hipotética entre medias0
DF10
Estadístico t1.92092590483801
P (T < = t) una cola0.0418403929085198
t crítico de una cola1.81246110219722
P (T < = t) dos colas0.0836807858170396
t crítico de dos colas2.22813884242587
Herramienta de ATP para el experimento 2:
No se va a calcular por distinto número de puntos de
Herramienta de ATP para el experimento 3:
t-Test: para medias de dos muestras emparejadas
Variable 1Variable 2
Media151148.5
Variación1210778.055555555556
Observaciones1010
Correlación de Pearson0.936537537274845
Diferencia hipotética entre medias0
DF9
Estadístico t0.141327169509421
P (T < = t) una cola0.445362157564494
t crítico de una cola1.83311292255007
P (T < = t) dos colas0.890724315128988
t crítico de dos colas2.26215715817358
Después de la tabla se pega en la hoja de cálculo de Excel, haga clic en el botón Opciones de pegado y, a continuación, haga clic en Coincidir con formato de destino. Con el rango pegado todavía seleccionado, utilice uno de los procedimientos siguientes, según la versión de Excel que esté ejecutando:
  • En Microsoft Office Excel 2007, haga clic en la ficha Inicio , haga clic en formato , en el grupo de celdas y, a continuación, haga clic en Autoajustar ancho de columna.
  • En Excel 2003, elija columna en el menú formatoy, a continuación, haga clic en Autoajustar a la selección.
Puede utilizar la hoja de cálculo para comparar los resultados de la función de prueba de Excel con la herramienta de complemento Herramientas para análisis. Experimento 1 muestra datos completos sobre once asuntos. El valor de prueba en la celda A16 es la probabilidad de que la estadística t mayor que el valor observado, suponiendo una distribución t con diez grados de libertad. Este valor, 0.837, también se muestra en la salida de la herramienta en la celda B32. Debe leer la etiqueta de la celda A32 "P (T > = | t |) no de dos colas"," P (T < = t) dos colas ", pero la respuesta numérica es correcta porque no hay ningún dato perdido en el experimento 1. De igual forma, debe leer la etiqueta en la celda A30 "P (T > = | t |) no de una cola"," P (T < = t) una cola ". La hora límite "valor crítico t" es correctos. Se corresponden con el nivel de significancia predeterminado, 0,05, y utilizan el número adecuado de grados de libertad, 10.

Experimento 2 le falta un después de medición en un asunto y no hay otros datos que faltan. La herramienta se niega a calcular. Los valores de prueba en las celdas A16 y A17 son el mismo. En la celda A16, se utiliza el C3:D13 de rango de celda de datos; Esto incluye al último asunto, el único con los datos que faltan. En la celda A17, se utiliza el C3:D12 de rango de celda de datos; Esto corresponde a un experimento con los diez primeros asuntos y no hay datos que faltan. El hecho de que los resultados son los mismos indica que, cuando se llama a prueba en la celda A16, TTEST descarta adecuadamente el asunto con datos que faltan.

Experimento 3 le falta un antes de medición y falta un después de la medición en dos temas diferentes. Experimento 3 modificado muestra a los nueve temas restantes sin datos que faltan. Los resultados de la prueba de las celdas E16 y E17 son los mismos. En la celda E16, TTEST se llama en los datos del experimento 3 en las células E3:F13. En la celda E17, TTEST se llama en los datos del experimento 3 modificado en las células G3:H11. Los resultados son los mismos porque TTEST descarta adecuadamente los asuntos séptimo y undécimo en el experimento 3, los dos con datos que faltan. Si examina el resultado de la herramienta para el experimento 3, el número de antes y después de las observaciones de las celdas B44 y C44 es diez en cada caso. Es fácil comprobar que SUM(E3:E13) 1510 y SUM(F3:F13) 1485; como hay 10 observaciones en cada intervalo, las medias respectivas son 151 y 148.5, que se muestra en las celdas B42 y C42. Por lo tanto, la herramienta ha descartado a cualquier asuntos y ha incluido en su análisis la medida después del séptimo tema y la medida antes del undécimo tema. El número de grados de libertad en la celda B47 es inadecuado, porque debe haber nueve temas y ocho df. Esto hace que para las entradas incorrectas de valores límites de las celdas B50 y B52 (además de engañoso etiquetas para las entradas de las celdas A50 y A52).

Resultados en todas las versiones de Excel

Por desgracia, esta herramienta no fue corregida para Excel 2003 y versiones posteriores de Excel.

Solución recomendada para todas las versiones de Excel

Puede deshacerse de sujetos con datos que faltan antes de utilizar la herramienta. Sin embargo, no debería editar una hoja de cálculo de Excel en este modo. En los pasos siguientes se muestra un procedimiento para eliminar temas con datos que faltan. Para deshacerse de los sujetos con datos que faltan, siga estos pasos:
  1. Copiar los rangos de datos de dos a una nueva área de la hoja de cálculo.
  2. Analizar los datos hacia arriba desde la parte inferior comun de los dos rangos.
    1. Si la fila inferior contiene datos que faltan, desactive la fila inferior. Esto reduce el rango de datos. Vaya al paso 3.
    2. Identificar la fila r encima de la fila inferior, pero más cercana a la parte inferior con datos que faltan.
      1. Copiar todos los datos por debajo de la fila r.
      2. Seleccionar fila r y, a continuación, pegue los datos copiados en él.
      3. Desactive la fila inferior de datos (que ahora se duplicará la siguiente a la última fila de datos). Esto reduce el rango de datos.
  3. Repita el paso 2 hasta que no quedan datos que faltan.
Nota: Puede utilizar la herramienta si usted no puede garantizar que no falta ninguna observación.

Puede duplicar gran parte pero no todo de la herramienta de salida de sin transformar los datos. No puede encontrar los valores adecuados para Media, varianza y observaciones sin mucho esfuerzo. La herramienta busca valores inadecuados examinando el antes y después de los datos por separado. Df de la herramienta es el valor común de observaciones menos uno; por lo tanto, también resulta inadecuado si hay datos que faltan. No se puede encontrar t Stat sin mucho esfuerzo, ya que tiene que examinar antes y después de los datos al mismo tiempo.

Sin embargo, puede encontrar correlación de Pearson aplicando PEARSON o CORREL a los rangos de datos de dos. Ambas funciones Excel controlen correctamente datos que faltan. Además, puede encontrar las probabilidades de t de una cola y dos colas asociadas a los datos mediante una llamada a la función de prueba de Excel, que controla adecuadamente los datos que faltan. Para las probabilidades de una cola y de dos colas en el experimento 3, se puede llamar a TTEST (E3:E13, F3:F13, 1, 1) y TTEST (E3:E13, F3:F13, 2, 1) respectivamente. También puede comprobar que los resultados de estas funciones coinciden con los de la herramienta en el experimento 1, donde la herramienta se comporta correctamente porque no hay ningún dato perdido. Las llamadas correspondientes para el experimento 1 son TTEST (A3:A13, B3:B13, 1, 1) y TTEST (A3:A13, B3:B13, 2, 1) respectivamente.

Para los pantalones vaqueros críticos, debe establecer el número de grados de libertad. En los experimentos 1, 2 y 3, los números correctos de grados de libertad son ocho, nueve y diez respectivamente. Estos números son siempre uno menor que el número de asuntos útiles en los datos sin falta antes o después de las mediciones. Para el experimento 3, por ejemplo, podría introducir en la celda J3, = IF(OR(ISBLANK(E3), ISBLANK(F3)), 0, 1), a continuación, rellenar hacia abajo de esta fórmula en las celdas J4:J13 y buscar df escribiendo en la celda J14: =SUM(J3:J13): 1.

Después de establecer df, puede utilizar la función TINV de Excel. Con el nivel de significancia 0,05, las llamadas para 1, 2 y 3 los experimentos sería TINV (0.05, 10), TINV (0.05, 9) y TINV (0.05, 8) respectivamente. Estos devolvería los valores "t crítico de dos colas". Para obtener la "t crítico una cola valores", utilizaría las llamadas análogas con el nivel de significancia que se duplica, como TINV (0.10, 10), TINV (0.10, 9) y TINV (0.10, 8) respectivamente.

Conclusiones

No utilice la herramientas de análisis prueba t Paired Two Sample herramienta a menos que puede asegurarse de que no hay ningún punto de datos que faltan. Este artículo describe sugerencias para duplicar la mayor parte de la funcionalidad de la herramienta mediante las funciones de Excel, en lugar de las herramientas para análisis.

La herramienta también proporciona engañosa "P (T < = t)" etiquetas. Este artículo describe las interpretaciones correctas.
Propiedades

Id. de artículo: 829252 - Última revisión: 17 ene. 2017 - Revisión: 1

Comentarios