Resumen
En este artículo se describe la función INTERVALO.CONFIANZA en Microsoft Office Excel 2003 y en Microsoft Office Excel 2007, se muestra cómo se usa la función y se comparan los resultados de la función para Excel 2003 y Excel 2007 con los resultados de INTERVALO.CONFIANZA en versiones anteriores de Excel.
El significado de un intervalo de confianza se interpreta incorrectamente con frecuencia e intentamos proporcionar una explicación de las declaraciones válidas y no válidas que se pueden realizar después de que determine un valor INTERVALO.CONFIANZA a partir de sus datos.
Más información
La función INTERVALO.CONFIANZA(alfa, sigma, n) devuelve un valor que puede usar para crear un intervalo de confianza para la media de una población. El intervalo de confianza es un intervalo de valores centrados en la media de una muestra conocida. Se supone que las observaciones de la muestra proceden de una distribución normal con desviación estándar conocida, sigma, y el número de observaciones de la muestra es n.
Sintaxis
CONFIDENCE(alpha,sigma,n)
Parámetros: Alfa es una probabilidad y 0 < alfa < 1. Sigma es un número positivo y n es un número entero positivo que corresponde al tamaño de la muestra.
Normalmente, alfa es una probabilidad pequeña, como 0,05.
Ejemplo de uso
Suponga que las puntuaciones del cociente de inteligencia (IQ) siguen una distribución normal con la desviación estándar 15. Usted prueba los IQs para una muestra de 50 estudiantes de su escuela local y obtiene una media de muestra de 105. Desea calcular un intervalo de confianza del 95 % para la media de la población. Un intervalo de confianza del 95 % o 0,95 corresponde a alfa = 1 – 0,95 = 0,05.
Para ilustrar la función INTERVALO.CONFIANZA, cree una hoja de cálculo de Excel en blanco, copie la tabla siguiente y, a continuación, seleccione la celda A1 en la hoja de cálculo de Excel en blanco. En el menú Editar, haga clic en Pegar.
Nota: En Excel 2007, haga clic en Pegar en el grupo Portapapeles de la pestaña Inicio.
Las entradas de la tabla siguiente rellenan las celdas A1:B7 de la hoja de cálculo.
Alfa |
0,05 |
desvest |
15 |
n |
50 |
media de muestra |
105 |
=CONFIANZA(B1;B2;B3) |
|
=DISTR.NORM.ESTAND.INV(1 - B1/2)*B2/RAIZ(B3) |
Después de pegar esta tabla en la nueva hoja de cálculo de Excel, haga clic en el botón Opciones de pegado y, a continuación, haga clic en Coincidir con formato de destino.
Con el rango pegado seleccionado, seleccione Columna en el menú Formato y, a continuación, haga clic en Autoajustar selección.
Nota: En Excel 2007, con el rango de celdas pegado seleccionado, haga clic en Formato en el grupo Celdas de la pestaña Inicio y, a continuación, haga clic en Autoajustar ancho de columna.
La celda A6 muestra el valor de INTERVALO.CONFIANZA. La celda A7 muestra el mismo valor porque una llamada a INTERVALO.CONFIANZA(alfa, sigma, n) devuelve el resultado de la computación:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
No se realizaron cambios directamente en INTERVALO.CONFIANZA, pero NORM.ESTAND.INV se mejoró en Microsoft Excel 2002 y después se realizaron más mejoras entre Excel 2002 y Excel 2007. Por lo tanto, INTERVALO.CONFIANZA puede devolver resultados diferentes (y mejorados) en estas versiones posteriores de Excel, porque INTERVALO.CONFIANZA se basa en DISTR.NORM.ESTAND.INV.
Esto no significa que deba perder la confianza en CONFIDENCE en versiones anteriores de Excel. Las imprecisiones en DISTR.NORM.ESTAND.INV generalmente ocurrieron para valores de su argumento muy próximos a 0 o muy cercanos a 1. En la práctica, alfa se establece generalmente en 0,05, 0,01 o tal vez 0,001. Los valores de alfa tienen que ser mucho más pequeños que eso, por ejemplo 0,0000001, antes de que se noten los errores de redondeo en DISTR.NORM.ESTAND.INV.
Nota: Vea el artículo sobre DISTR.NORM.ESTAND.INV para obtener una explicación de las diferencias computacionales en DISTR.NORM.ESTAND.INV.
Para obtener más información, haga clic en el número de artículo siguiente para verlo en Microsoft Knowledge Base:
826772 Funciones estadísticas de Excel: DISTR.NORM.ESTAND.INV
Interpretación de los resultados de INTERVALO.CONFIANZA
El archivo de Ayuda de Excel para INTERVALO.CONFIANZA se ha reescrito para Excel 2003 y para Excel 2007 porque todas las versiones anteriores del archivo de Ayuda daban consejos engañosos sobre la interpretación de resultados. El ejemplo indica: "Supongamos que observamos que, en nuestra muestra de 50 viajeros, la duración media de los viajes al trabajo es de 30 minutos con una desviación estándar de la población de 2,5. Podemos estar 95 por ciento seguros de que la media de la población está en el intervalo 30 +/- 0,692951", donde 0,692951 es el valor devuelto por INTERVALO.CONFIANZA(0,05, 2,5, 50).
Para el mismo ejemplo, la conclusión lee, "la duración media de un viaje al trabajo es igual a 30 ± 0,692951 minutos o de 29,3 a 30,7 minutos". Presumiblemente, esta es también una declaración sobre la media de la población que se encuentra dentro del intervalo [30 – 0,692951, 30 + 0,692951] con probabilidad 0,95.
Antes de realizar el experimento que dio lugar a los datos de este ejemplo, un estadístico clásico (en lugar de un estadístico bayesiano) no puede hacer ninguna declaración sobre la distribución de probabilidad de la media de la población. En su lugar, un estadístico clásico se ocupa de las pruebas de hipótesis.
Por ejemplo, un estadístico clásico puede querer realizar una prueba de hipótesis a doble cara basada en la suposición de una distribución normal con desviación estándar conocida (como 2,5), un valor preseleccionado específico de la media de la población, μ0 y un nivel de significancia preseleccionada (como 0,05). El resultado de la prueba se basaría en el valor de la media observada de la muestra (por ejemplo 30) y la hipótesis nula de que la media de la población es μ0 se rechazaría en un nivel de significancia 0,05 si la media observada de la muestra estuviera demasiado lejos de μ0 en cualquier dirección. Si se rechaza la hipótesis nula, la interpretación es que una muestra significa que lejos o más lejos de μ0 se produciría por azar inferior al 5% del tiempo bajo la suposición de que μ0 es la media real de la población. Después de realizar esta prueba, un estadístico clásico aún no puede hacer ninguna declaración sobre la distribución de probabilidad de la media de la población.
Un estadístico bayesiano, por otro lado, comenzaría con una distribución de probabilidad asumida para la media de la población (denominada distribución a priori), recopilaría evidencia experimental de la misma manera que el estadístico clásico, y usaría esta evidencia para revisar su distribución de probabilidad para la media de la población y así obtener una distribución posterior. Excel no proporciona ninguna función estadística que ayude a un estadístico bayesiano en este esfuerzo. Las funciones estadísticas de Excel están destinadas a estadísticos clásicos.
Los intervalos de confianza están relacionados con las pruebas de hipótesis. Dada la evidencia experimental, un intervalo de confianza hace una declaración concisa sobre los valores de la hipótesis de media de población μ0 que produciría la aceptación de la hipótesis nula de que la media de la población es μ0 y los valores de μ0 que producirían el rechazo de la hipótesis nula de que la media de la población es μ0. Un estadístico clásico no puede hacer ninguna declaración sobre la posibilidad de que la media de la población se encuentre en un intervalo específico, porque ella o él nunca hace suposiciones a priori sobre esta distribución de probabilidad y tales suposiciones serían necesarias si se usara evidencia experimental para revisarlas.
Explore la relación entre pruebas de hipótesis e intervalos de confianza utilizando el ejemplo al principio de esta sección. Con la relación entre INTERVALO.CONFIANZA y DISTR.NORM.ESTAND.INV indicada en la última sección, tiene:
CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
Dado que la media de la muestra es 30, el intervalo de confianza es 30 +/- 0,692951.
Considere ahora una prueba de hipótesis a doble cara con el nivel de significancia 0,05 tal como se describió anteriormente y que supone una distribución normal con la desviación estándar 2,5, un tamaño de la muestra de 50 y una hipótesis específica de media de población, μ0. Si esta es la media real de la población, la media de la muestra procederá de una distribución normal con la media de la población μ0 y la desviación estándar, 2,5/RAIZ(50). Esta distribución es simétrica alrededor de μ0 y desea rechazar la hipótesis nula si ABS(media de la muestra - μ0) > algún valor de corte. El valor de corte sería tal que si μ0 fuera la media real de la población, un valor de la media de la muestra - μ0 superior a este corte o un valor de μ0 - media de la muestra mayor que este corte se produciría cada uno con una probabilidad de 0,05/2. Este valor de corte es
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
Por lo tanto, rechace la hipótesis nula (media de población = μ0) si se cumple una de las siguientes afirmaciones:
media de la muestra : μ0 > 0.
692951
0 – media de la muestra > 0. 692951
Como la media de ejemplo = 30 en nuestro ejemplo, estas dos instrucciones se convierten en las siguientes afirmaciones:
30 - μ0 > 0.
692951
μ0 – 30 > 0. 692951
Reescribirlas de modo que solo μ0 aparezca a la izquierda produce las siguientes afirmaciones:
μ0 < 30 - 0.
692951
μ0 > 30 + 0. 692951
Estos son exactamente los valores de μ0 que no están en el intervalo de confianza [30 – 0,692951, 30 + 0,692951]. Por lo tanto, el intervalo de confianza [30 – 0,692951, 30 + 0,692951] contiene esos valores de μ0 cuando no se rechazaría la hipótesis nula de que la media de la población es μ0, dada la evidencia de la muestra. Para valores de μ0 fuera de este intervalo, se rechazaría la hipótesis nula de que la media de la población sea μ0 dada la evidencia de la muestra.
Conclusiones
Las imprecisiones en versiones anteriores de Excel suelen producirse en valores extremadamente pequeños o extremadamente grandes de p en DISTR.NORM.ESTAND.INV(p). INTERVALO.CONFIANZA se evalúa llamando a DISTR.NORM.ESTAND.INV(p), por lo que la precisión de DISTR.NORM.ESTAND.INV es una preocupación potencial para los usuarios de INTERVALO.CONFIANZA. Sin embargo, los valores de p que se usan en la práctica no son lo suficientemente extremos para causar errores de redondeo significativos en DISTR.NORM.ESTAND.INV, y el rendimiento de INTERVALO.CONFIANZA no debe ser una preocupación para los usuarios de ninguna versión de Excel.
La mayor parte de este artículo se ha centrado en la interpretación de los resultados de INTERVALO.CONFIANZA. En otras palabras, hemos preguntado: "¿Cuál es el significado de un intervalo de confianza?" Los intervalos de confianza se malinterpretan con frecuencia. Lamentablemente, los archivos de ayuda de Excel en todas las versiones de Excel anteriores a Excel 2003 han contribuido a este malentendido. Se ha mejorado el archivo de ayuda de Excel 2003.