Descrição das funções estatísticas do TRUST no Excel

Resumo

Este artigo descreve a função CONFIDENCE no Microsoft Office Excel 2003 e no Microsoft Office Excel 2007, ilustra como a função é utilizada, e compara os resultados da função para Excel 2003 e para Excel 2007 com os resultados da CONFIANÇA em versões anteriores do Excel.

O significado de um intervalo de confiança é frequentemente mal interpretado, e tentamos fornecer uma explicação de declarações válidas e inválidas que podem ser feitas após determinar um valor DE CONFIANÇA a partir dos seus dados.

Mais Informações

A função CONFIANÇA (alfa, sigma, n) devolve um valor que pode usar para construir um intervalo de confiança para uma média populacional. O intervalo de confiança é uma gama de valores que estão centrados numa média de amostra conhecida. Presume-se que as observações na amostra provêm de uma distribuição normal com desvio padrão conhecido, sigma, e o número de observações na amostra é n.

Sintaxe

CONFIDENCE(alpha,sigma,n)

Parâmetros: Alpha é uma probabilidade e 0 < alfa < 1. Sigma é um número positivo, e n é um número inteiro positivo que corresponde ao tamanho da amostra.

Tipicamente, alfa é uma pequena probabilidade, como 0,05.

Exemplo de utilização

Assuma que as pontuações do quociente de inteligência (QI) seguem uma distribuição normal com desvio padrão 15. Você testa QI para uma amostra de 50 alunos na sua escola local e obtém uma média de amostra de 105. Quer calcular um intervalo de confiança de 95% para a média da população. Um intervalo de confiança de 95% ou 0,95 corresponde a alfa = 1 - 0,95 = 0,05.

Para ilustrar a função CONFIDENCE, crie uma folha de cálculo excel em branco, copie a tabela seguinte e, em seguida, selecione a célula A1 na sua folha de cálculo excel em branco. No menu Editar, clique em Colar.

Nota: No Excel 2007, clique em Pasta no grupo Desaparalho no separador Casa.

As entradas na tabela abaixo enchem as células A1:B7 na sua folha de cálculo.

alfa

0,05

stdev

15

m

50

amostra média

105

=CONFIANÇA (B1,B2,B3)

=NORMSINV(1 - B1/2)*B2/SQRT(B3)

Depois de colar esta tabela na sua nova folha de cálculo do Excel, clique no botão Pasta Opções e, em seguida, clique em Match Destination Formatting.

Com a gama colada ainda selecionada, aponte para a Coluna no menu Formato e, em seguida, clique na Seleção AutoFit.

Nota: No Excel 2007, com a gama colada de células selecionadas, clique em Formato no grupo De Células no separador Casa e, em seguida, clique na Largura da Coluna AutoFit.

A célula A6 mostra o valor da CONFIANÇA. A célula A7 mostra o mesmo valor porque uma chamada para CONFIDENCE (alpha, sigma, n) devolve o resultado da computação:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Não foram feitas alterações diretamente ao TRUST, mas a NORMSINV foi melhorada no Microsoft Excel 2002, e então foram feitas mais melhorias entre o Excel 2002 e o Excel 2007. Portanto, a CONFIANÇA pode devolver resultados diferentes (e melhorados) nestas versões posteriores do Excel, porque a CONFIANÇA depende da NORMSINV.

Isto não significa que deva perder a confiança em CONFIANÇA para versões anteriores do Excel. As imprecisões em NORMSINV ocorreram geralmente para valores do seu argumento muito próximos de 0 ou muito perto de 1. Na prática, alfa é geralmente definido para 0,05, 0,01, ou talvez 0,001. Os valores do alfa têm de ser muito menores do que isso, por exemplo 0.0000001, antes de serem notados erros de arredondar em NORMSINV.

Nota: Consulte o artigo sobre NORMSINV para uma discussão sobre diferenças computacionais em NORMSINV.

Para mais informações, clique no seguinte número de artigo para ver o artigo na Base de Conhecimento da Microsoft:

826772 Funções estatísticas do Excel: NORMSINV

Interpretação dos resultados da CONFIANÇA

O ficheiro Excel Help for CONFIDENCE foi reescrito para o Excel 2003 e para o Excel 2007 porque todas as versões anteriores do ficheiro Ajuda deram conselhos enganadores sobre a interpretação dos resultados. O exemplo afirma: "Suponhamos que, na nossa amostra de 50 passageiros, a duração média das viagens para o trabalho é de 30 minutos com um desvio padrão populacional de 2,5. Podemos estar 95 por cento confiantes de que a média populacional está no intervalo 30 +/- 0,692951" onde 0,692951 é o valor devolvido pela CONFIANÇA (0,05, 2,5, 50).

Para o mesmo exemplo, lê-se na conclusão, "a duração média das viagens para o trabalho equivale a 30 ± 0,692951 minutos, ou 29,3 a 30,7 minutos". Presumivelmente, esta é também uma afirmação sobre a média populacional que se enquadra dentro do intervalo [30 – 0,692951, 30 + 0,692951] com probabilidade de 0,95.

Antes de realizar a experiência que deu os dados para este exemplo, um estatístico clássico (em oposição a um estatístico bayesiano) não pode fazer nenhuma declaração sobre a distribuição de probabilidades da média da população. Em vez disso, um estatístico clássico lida com testes de hipóteses.

Por exemplo, um estatístico clássico pode querer realizar um teste de hipóteses de duas faces que se baseie na suposição de uma distribuição normal com desvio padrão conhecido (tais como 2.5), um valor particularmente pré-selecionado da média populacional, μ0, e um nível de significado pré-selecionado (tais como 0,05). O resultado do ensaio basear-se-ia no valor da média da amostra observada (por exemplo 30) e na hipótese nula de que a média da população é de μ0 seria rejeitada a um nível de 0,05 se a média da amostra observada estivesse demasiado longe de μ0 em ambas as direções. Se a hipótese de nulo for rejeitada, a interpretação é que uma amostra significa que, longe ou longe de μ0, ocorreria por acaso menos de 5% do tempo sob a suposição de que μ0 é a verdadeira média populacional. Depois de realizar este teste, um estatístico clássico ainda não consegue fazer qualquer declaração sobre a distribuição de probabilidades da média populacional.

Um estatístico bayesiano, por outro lado, começaria com uma suposta distribuição de probabilidade para a média populacional (nomeada uma distribuição a priori), reuniria provas experimentais da mesma forma que o estatístico clássico, e usaria esta evidência para revê-la ou a sua distribuição de probabilidade para a média populacional e, assim, obter uma distribuição posterior. O Excel não fornece funções estatísticas que ajudem um estatístico bayesiano neste esforço. As funções estatísticas do Excel são todas destinadas a estatísticos clássicos.

Os intervalos de confiança estão relacionados com os testes de hipóteses. Dada a evidência experimental, um intervalo de confiança faz uma declaração concisa sobre os valores da população hipotética significa μ0 que daria a aceitação da hipótese nupável de que a média da população é de μ0 e os valores de μ0 que resultariam na rejeição da hipótese nula que a população média é de μ0. Um estatístico clássico não pode fazer qualquer declaração sobre a possibilidade de a média da população cair em qualquer intervalo específico, porque ela ou ele nunca faz um pressuposto priori sobre esta distribuição de probabilidades e tais pressupostos seriam necessários se alguém usasse provas experimentais para revê-los.

Explore a relação entre testes de hipóteses e intervalos de confiança utilizando o exemplo no início desta secção. Com a relação entre a CONFIANÇA e a NORMSINV indicada na última secção, tem:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Como a média da amostra é de 30, o intervalo de confiança é de 30 +/- 0,692951.

Agora considere um teste de hipótese de duas face com o nível de significado 0.05, como descrito anteriormente, que pressupõe uma distribuição normal com desvio padrão 2.5, um tamanho de amostra de 50 e uma média de população de hipótese específica, μ0. Se esta é a verdadeira média populacional, então a média da amostra virá de uma distribuição normal com a média populacional de μ0 e desvio padrão, 2,5/SQRT(50). Esta distribuição é simétrica em cerca de μ0 e você gostaria de rejeitar a hipótese de nulo se o ABS (sample mean - μ0) > algum valor de corte. O valor de corte seria tal que, se μ0 fosse a verdadeira média populacional, um valor da média da amostra - μ0 superior a este corte ou um valor de μ0 - a amostra média superior a este corte ocorreria cada uma com probabilidade de 0,05/2. Este valor de corte é

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Assim, rejeitar a hipótese nulo (média populacional = μ0) se uma das seguintes declarações for verdadeira:

média da amostra - μ0 > 0. 692951
0 – amostra média > 0. 692951

Como a média da amostra = 30 no nosso exemplo, estas duas declarações tornam-se as seguintes declarações:

30 - μ0 > 0. 692951
μ0 - 30 > 0. 692951

Reescrevendo-as de modo a que apenas μ0 apareçam à esquerda produz as seguintes declarações:

μ0 < 30 - 0. 692951
μ0 > 30 +0. 692951

Estes são exatamente os valores de μ0 que não estão no intervalo de confiança [30 – 0,692951, 30 + 0,692951]. Por conseguinte, o intervalo de confiança [30 – 0,692951, 30 + 0,692951] contém os valores de μ0 em que a hipótese nula de que a população significa ser de μ0 não seria rejeitada, dado o elemento de prova da amostra. Para valores de μ0 fora deste intervalo, a hipótese nula de que a média da população é de μ0 seria rejeitada dada a prova da amostra.

Conclusões

As imprecisões em versões anteriores do Excel ocorrem geralmente para valores extremamente pequenos ou extremamente grandes de p em NORMSINV(p). A CONFIANÇA é avaliada chamando NORMSINV(p), pelo que a precisão da NORMSINV é uma potencial preocupação para os utilizadores de CONFIANÇA. No entanto, os valores de p que são utilizados na prática não são suscetíveis de ser suficientemente extremos para causar erros significativos de arredondar em NORMSINV, e o desempenho da CONFIANÇA não deve ser uma preocupação para os utilizadores de qualquer versão do Excel.

A maior parte deste artigo focou-se na interpretação dos resultados da CONFIANÇA. Por outras palavras, perguntámos: "Qual é o significado de um intervalo de confiança?" Intervalos de confiança são frequentemente mal compreendidos. Infelizmente, os ficheiros excel Help em todas as versões do Excel que são mais cedo do que o Excel 2003 contribuíram para este mal-entendido. O ficheiro de ajuda excel 2003 foi melhorado.

Precisa de mais ajuda?

Aumente os seus conhecimentos do Office
Explore as formações
Seja o primeiro a obter novas funcionalidades
Adira ao Office Insider

As informações foram úteis?

Obrigado pelo seu feedback! Parece que poderá ser benéfico reencaminhá-lo para um dos nossos agentes de suporte do Office.

×