Descrição do melhoramento numérico no Analysis ToolPak ANOVA ferramentas no Excel

Traduções de Artigos Traduções de Artigos
Artigo: 829215 - Ver produtos para os quais este artigo se aplica.
Expandir tudo | Reduzir tudo

Nesta página

Sumário

Este artigo descreve melhoramentos numéricos em cada uma das três ferramentas Analysis ToolPak ANOVA. Este artigo também ilustra resultados incorrectos no Microsoft Excel 2002 e em versões anteriores do Excel em casos extremos.

Mais Informação

Muitas funções requerem o cálculo da soma dos desvios quadrados sobre uma média. Para efectuar este procedimento com precisão, Microsoft Office Excel 2003 e versões posteriores do Excel utilizar um procedimento em dois passos que encontrar a média na primeira fase, e, em seguida, calcula desvios quadrados sobre a média na segunda fase.

Em aritmética precisa, o mesmo resultado ocorre em versões anteriores do Excel que utilizam " a fórmula da calculadora ". Esta fórmula por isso chama porque este foi a ser utilizado alargado quando statisticians utilizado calculadoras em vez de computadores. Com a fórmula da Calculadora, versões anteriores do Excel Soma os quadrados das observações, e seguida, subtrair deste total a quantidade que se segue:
((sum of observations)^2) / number of observations
Este cálculo ocorre numa única fase pelos dados.

Na precisão finito aritmético, a fórmula da calculadora está sujeita a erros roundoff em casos extremos. O Excel 2002 e versões anteriores do Excel utilizam a fórmula da Calculadora para a maior parte das funções que requerem uma soma dos desvios quadrados sobre uma média (como VAR, DESVPAD, DECLIVE, e PEARSON). No entanto, também estas versões do Excel utilizar o procedimento em dois passos numericamente mais robusto para as funções CORREL, COVAR, e calcular com o DESVQ.

Se a peritos da informática estatísticos recomendável que que não utilize a fórmula da Calculadora. A fórmula da calculadora é apresentada como " Como não fazê-lo " em textos sobre informática estatísticos. Infelizmente, três das ferramentas do Analysis ToolPak (ATP) ANOVA facilitam utilização alargada da fórmula da calculadora ou uma abordagem Single-passagens equivalente no Excel 2002 e em versões anteriores do Excel.

O Excel 2003 e versões posteriores do Excel utilizam o procedimento em dois passos para todos os modelos ANOVA ATP três. Este artigo aborda os seguintes melhoramentos computacional em três modelos ANOVA ATP ' s:
  • Factor único
  • De Duas factor duplo com replicação
  • De Duas factor duplo sem replicação
Este artigo descreve estes modelos mais tarde.

Uma vez que Excel sempre utilizou o procedimento em dois passos com DEVSQ, este artigo torna utilização frequente de-la para descrever os procedimentos melhorados. Estes procedimentos revistos de forma eficaz chamar DEVSQ ou utilizar código cuja funcionalidade é exactamente o mesmo que funcionalidade DEVSQ ' s.

MS-DOS, F e valor-P para cada ferramenta ANOVA, saída ATP contém uma tabela Resumo com valores de contagem, soma, média, e variação, e uma tabela ANOVA que tenha somas vários dos quadrados e valores de SS, df, MS-DOS, F e valor-P.. Resulta na tabela de resumo são calculadas pelo Chamar funções do Excel Contar, soma, média, e VAR. Uma destas funções quatro, apenas VAR está sujeita a erros roundoff.

O Excel 2002 e versões anteriores do Excel implementam VAR utilizando a fórmula da Calculadora. O seguinte artigo sobre VAR descreve os melhoramentos que ocorreram no Excel 2003 e em versões posteriores do Excel. Este artigo também permite fazer experiências com dados numéricos para ver quando erros roundoff têm mais probabilidades de ocorrer em versões anteriores do Excel.

Para mais informações sobre VAR, clique no número de artigo que se segue para visualizar o artigo na Microsoft Knowledge Base:
826112 Excel funções estatísticas: VAR


Como este artigo aborda os três modelos ANOVA,-lo foca ANOVA as tabelas de saída. Em cada caso, as tabelas de resumo são Well-behaved no Excel 2003 e em versões posteriores do Excel. No Excel 2002 e em versões anteriores do Excel, os problemas ocorrem na coluna desvio quando dados têm valores extremos.

No entanto, este artigo inclui as tabelas de resumo nas secções de modelo uma vez que estas tabelas são úteis para comparação quando proceder à revisão os exemplos modificados no apêndice a.

Factor único modelo 1:

Um exemplo simples com dados é a seguinte.
Reduzir esta tabelaExpandir esta tabela
Basic ANOVA 1 MODEL:
123
244
365
486
57
68
Anova: factor único
Resumo
GruposContagemSomaMédiaDesvio
A coluna 1 6213.53.5
A coluna 2 42056.666667
Coluna 3 6335.53.5
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Entre grupos 12.7526.3751.5068180.2578973.805567
Grupos dentro 55134.230769
Total67.7515
O Excel 2002 e versões anteriores do Excel utilizam o pseudocode que se segue para calcular as somas dos quadrados:
GrandSum = 0;
GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0; 
GrandMeanSqrd = 0; 
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
   GrandSum = GrandSum + sum of observations in s-th sample;
   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +
      (sum of observations in s-th sample^2)/size of s-th sample;
   GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs ? GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd ? GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs ? GrandSampleMeanSqrd;
Esta abordagem é, essencialmente, a fórmula da Calculadora. ^ Esta abordagem calcula somas dos quadrados das observações, e seguida, subtrai uma quantidade das mesmas, tal como VAR calcula a soma dos quadrados dos observações, e seguida, subtrai Soma de observações / exemplo Dimensionar 2 ^ 2 / exemplo Dimensionar .. Foi omitido pseudocode semelhante para o modelo 2 e 3 modelo.

Novamente, para modelo 2 e 3, modelo são calculadas somas dos quadrados e uma quantidade é subtraída a soma dos quadrados como na fórmula da Calculadora. Frequentemente infelizmente, textos de estatísticas básicas sugerir abordagens para ANOVA como, por exemplo, aquele que é mostrada anteriormente contidas neste artigo.

O Excel 2003 e versões posteriores do Excel utilizam uma abordagem diferente para calcular os movimentos vários na coluna da tabela ANOVA ss. Para ilustração, este artigo pressupõe que os dados numéricos no exemplo anteriores aparecem na A2:C7 células com dados em falta nas células B6 e B7.
  • SS total é calcular apenas com o DESVQ aplicada aos todos os dados, como, por exemplo, DEVSQ(A2:C7). Calcular com o DESVQ funciona correctamente mesmo que seja dados em falta.
  • Entre grupos ss é ss total menos a soma de calcular com o DESVQ aplicado a cada coluna, como, por exemplo, DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • SS grupos dentro é ss total menos ss entre grupos.
Se entradas na coluna da tabela ANOVA ss são calculadas correctamente, siga a exactidão de outras entradas na tabela.

Duas modelo 2: factor duplo com replicação

Um exemplo simples com dados é a seguinte.
Reduzir esta tabelaExpandir esta tabela
Basic ANOVA 2 MODELo grupo 1 Grupo 2 Grupo 3
Teste 1 123
244
365
2 de avaliação 486
5107
6128
Anova: factor duplo com replicação
Resumoo grupo 1Grupo 2 Grupo 3 Total
Teste 1
Contagem3339
Soma6121230
Média2443.333333
Desvio1412.5
2 de avaliação
Contagem3339
Soma15302166
Média51077.333333
Desvio1416.25
Total
Contagem666
Soma214233
Média3.575.5
Desvio3.5143.5
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Exemplo72172366.22E-054.747221
Colunas37218.59.250.0037093.88529
Interacção924.52.250.1479733.88529
Dentro24122
Total14217
Novamente, se entradas existentes na coluna ss são calculadas correctamente, a precisão do todas as outras entradas na parte da saída ANOVA segue.

Segue-se o procedimento informáticas para o Excel 2003 e para versões posteriores do Excel. Este procedimento utiliza para calcular os movimentos vários na coluna da tabela ANOVA ss calcular com o DESVQ. Para obter ilustração, este exemplo assume que os dados numéricos aparecem na B2:D7 células.
  • SS total é calcular apenas com o DESVQ aplicada aos todos os dados, como, por exemplo, DEVSQ(B2:D7).
  • SS exemplo é ss total menos a soma de calcular com o DESVQ aplicado a cada amostra, como, por exemplo, DEVSQ(B2:D4) + DEVSQ(B5:D7).
  • Colunas ss é ss total menos a soma de calcular com o DESVQ aplicado a cada coluna, como, por exemplo, DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7).
  • Dentro ss é a soma de calcular com o DESVQ aplicada a cada versão de avaliação ou par de grupo, como, por exemplo, DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • Interacção ss igual a ss total menos ss exemplo menos ss colunas menos ss dentro.

Duas modelo 3: factor duplo sem replicação

Um exemplo simples com dados é a seguinte.
Reduzir esta tabelaExpandir esta tabela
Basic ANOVA 3 MODEL:Low MED HI
POOR123
244
365
CLASS SEG.TEXTO 486
5107
6128
RICH71410
8126
9102
Anova: factor duplo sem replicação
ResumoContagemSomaMédiaDesvio
POOR3621
3103.3333331,333333
3144.6666672.333333
CLASS SEG.TEXTO 31864
3227.3333336.333333
326 de Março)8.6666679.333333
RICH33110.3333312.33333
326 de Março)8.6666679.333333
321719
Low 94557,5
MED 9788.66666716
HI9515.6666676.25
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Linhas176.6667822.083335.760870.0014762.591094
Colunas68.66667234.333338.9565220.0024553.633716
Erro61.33333163.833333
Total306.666726 de Março)
Se os valores na coluna ss são calculados correctamente, a exactidão de todos os outros valores na tabela ANOVA segue.

Excel 2003 e versões posteriores do Excel utilize o seguinte procedimento computacional. O processo usa para calcular os valores na coluna da tabela ANOVA ss calcular com o DESVQ. Para ilustração, este exemplo assume que o intervalo de células é mostrado no exemplo anterior é A1:D10 células. Assim, os dados numéricos aparecem na B2:D10 células.
  • SS total é calcular apenas com o DESVQ aplicada aos todos os dados, como, por exemplo, DEVSQ(B2:D10).
  • SS linhas é ss total menos a soma de calcular com o DESVQ aplicada a cada linha, como, por exemplo, DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B8:D8) + DEVSQ(B7:D7) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • Colunas ss é ss total menos a soma de calcular com o DESVQ aplicado a cada coluna, como, por exemplo, DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10).
  • Erro ss é ss total menos linhas ss menos ss colunas.

Resultados no Excel 2002 e em versões anteriores do Excel

Em casos extremos onde existem muitos algarismos significativos nos dados mas também um desvio pequeno, a fórmula da calculadora conduz a resultados incorrectos. O apêndice que aparece na posteriormente neste artigo fornece exemplos de problemas roundoff em tais situações extremos.

Resultados no Excel 2003 e em versões posteriores do Excel

Excel 2003 e versões posteriores do Excel utilizar um procedimento que faz dois passagens pelos dados. Na primeira fase, o Excel 2003 e versões posteriores do Excel calcular a soma e contagem de valores de dados. De opções, o Excel pode calcular a média da amostra (média).

Na segunda fase, o Excel calcula a diferença de quadrados entre cada ponto de dados e a média da amostra, e seguida, soma estas diferenças de quadrados. Como resultado, os resultados no Excel 2003 e em versões posteriores do Excel são mais estáveis numericamente.

Conclusions

Uma abordagem duas entrelaçado passagens melhora o desempenho numérico na todas as ferramentas ANOVA ATP três no Excel 2003 e no posteriores versões do Excel em comparação com versões anteriores do Excel. Os resultados que obtidos através da utilização de Excel 2003 e versões posteriores do Excel são nunca menos preciso do que os resultados que obtidos utilizando versões anteriores do Excel.

Em casos mais prática possível no entanto, existe qualquer diferença entre estes resultados. Isto deve-se ao facto dados normalmente não apresentar o tipo de comportamento anormal que ilustra o apêndice que se segue. Instabilidade numérica é mais provável que ocorrer em versões anteriores do Excel quando dados contém um número elevado de algarismos significativos com relativamente pouco variação entre valores de dados.

Se utilizar uma versão anterior do Excel, e se pretender ver se o Excel 2003 ou versão posterior do Excel fornece diferentes resultados ANOVA, comparar os resultados que obtidos quando utiliza as ferramentas ANOVA na versão anterior do Excel com os resultados que obtidos quando utiliza os procedimentos que utilizam DEVSQ.

NOTA os procedimentos que utilizam DEVSQ foram descritos anteriormente neste artigo para a tabela que está associado a cada uma das ferramentas ANOVA na.

Para verificar que variâncias desiguais estão correctos na tabela de resumo para cada intervalo, utilize DEVSQ ( intervalo ) / (COUNT ( intervalo ) û 1).

Numéricos exemplos do desempenho do Excel 2002 e versões anteriores do Excel apêndice:

Por cada exemplo básico de modelos 1, 2 e 3, anteriormente neste artigo apresentadas Saída da ferramenta ATP. Isto incluídas as tabelas de resumo e ANOVA. Dados foi modificados em cada exemplo para criar um exemplo " stressed ". Pode fazê-lo adicionando 10 ^ 8 para cada valor de dados. Adicionar uma constante como, por exemplo, 10 ^ 8 para cada valor de dados não vai afectar Desvio na tabela de resumo (mas irão afectar média e soma de formas óbvia). Deve vai também afectar qualquer entrada na tabela ANOVA.

Se comparar variâncias desiguais nas tabelas de resumo e ss nas tabelas ANOVA, irá notar que verifiquem-los de forma incorrecta são calculados em três dos seguintes modelos stressed excepto para uma entrada no modelo 3 que é apontar para com " <---".

Em todos os casos, stressed os resultados ANOVA que obtidos através da utilização de Excel 2003 e versões posteriores do Excel concordar com os resultados anteriores nos casos básicos (tal como estas devem).

1 ANOVA testados modelo com valores de dados de grandes dimensões

Reduzir esta tabelaExpandir esta tabela
100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: factor único
Resumo
GruposContagemSomaMédiaDesvio
A coluna 1 66000000211E + 084,8
A coluna 2 44000000201E + 088
Coluna 3 66000000331E + 081.6
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Entre grupos 020013.805567
Grupos dentro 64134.923077
Total6415

2 ANOVA testados modelo com valores de dados de grandes dimensões

Reduzir esta tabelaExpandir esta tabela
o grupo 1Grupo 2 Grupo 3
Teste 1 100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
2 de avaliação 100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: factor duplo com replicação
Resumoo grupo 1Grupo 2 Grupo 3 Total
Teste 1
Contagem3339
Soma3000000063000000123000000129E + 08
Média1000000021000000041000000041E + 08
Desvio0404
2 de avaliação
Contagem3339
Soma3000000153000000303000000219E + 08
Média1000000051000000101000000071E + 08
Desvio0406
Total
Contagem666
Soma600000021600000042600000033
Média100000004100000007100000005.5
Desvio4,814.41.6
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Exemplo64164240.0003674.747221
Colunas3221660.0156253.88529
Interacção3221660.0156253.88529
Dentro32122.666666667
Total12817

3 ANOVA testados modelo com valores de dados de grandes dimensões

Reduzir esta tabelaExpandir esta tabela
Low MED HI
POOR100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
CLASS SEG.TEXTO 100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
RICH100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: factor duplo sem replicação
ResumoContagemSomaMédiaDesvio
A linha 1 33000000061000000020
Linha 2 33000000101000000032
Linha 3 33000000141000000052
Linha 4 33000000181000000064<---
Linha 5 33000000221000000076
Linha 6 330000002610000000910
Linha 7 330000003110000001012
Linha 8 330000002610000000910
Linha 9 330000002110000000718
A coluna 1 99000000451000000058
A coluna 2 990000007810000000914
Coluna 3 99000000511000000064
ANOVA
Origem de variação SSdfMS-DOSFValor-P CRIT F
Linhas12881620.1132812.591094
Colunas3221620.1677723.633716
Erro128168
Total28826 de Março)

Propriedades

Artigo: 829215 - Última revisão: 10 de janeiro de 2007 - Revisão: 2.0
A informação contida neste artigo aplica-se a:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
Palavras-chave: 
kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo KB829215 KbMtpt kbmt
Tradução automática
IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine translation ou MT), não tendo sido portanto revisto ou traduzido por humanos. A Microsoft tem artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais. O objectivo é simples: oferecer em Português a totalidade dos artigos existentes na base de dados do suporte. Sabemos no entanto que a tradução automática não é sempre perfeita. Esta pode conter erros de vocabulário, sintaxe ou gramática? erros semelhantes aos que um estrangeiro realiza ao falar em Português. A Microsoft não é responsável por incoerências, erros ou estragos realizados na sequência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza actualizações frequentes ao software de tradução automática (MT). Pedíamos-lhe o favor de preencher o formulário existente no fundo desta página caso tenha encontrado erros neste artigo e tenha possibilidade de colaborar no processo de aperfeiçoamento desta ferramenta. Obrigado.
Clique aqui para ver a versão em Inglês deste artigo: 829215

Submeter comentários

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com