Descrição de melhoria numérica em Ferramentas de análise Anova ferramentas em Excel

Traduções deste artigo Traduções deste artigo
ID do artigo: 829215 - Exibir os produtos aos quais esse artigo se aplica.
Expandir tudo | Recolher tudo

Neste artigo

Sumário

Este artigo descreve melhorias numéricas em cada uma das três ferramentas de análise Anova ferramentas. Este artigo também ilustra resultados imprecisos no Microsoft Excel 2002 e nas versões anteriores do Excel em situações extremas.

Mais Informações

Muitas funções requerem o cálculo da soma dos desvios quadrados sobre um significar. Para fazer isso com precisão, Microsoft Office Excel 2003 e versões posteriores do Excel usam um dois-elevado ao quadrado desvios sobre a significar em transmitir o segundo procedimento transmitir que localiza o significar no, o primeiro transmitir e calcula.

Em aritmético preciso, o mesmo resultado ocorre em versões anteriores do Excel que usam " a fórmula Calculadora ". Essa fórmula é isso nomeado porque ela foi no amplo usa quando estatísticos usado calculadoras em vez de computadores. Com a fórmula Calculadora, versões anteriores do Excel soma os quadrados das observações, e clique subtraída desse total a seguinte quantidade:
((sum of observations)^2) / number of observations
Esse cálculo ocorre em um único transmitir os dados através de.

Em aritmético finito precisão, a fórmula calculadora é assunto para erros roundoff em casos extremos. Excel 2002 e versões anteriores do Excel usam a fórmula Calculadora para a maioria das funções que requerem uma soma dos desvios quadrados sobre um significar (such as Var, DESVPAD, INCLINAÇÃO, e PEARSON). No entanto, essas versões do Excel também usar os dois numericamente mais robusto - procedimento transmitir para as funções CORREL, COVAR, e DESVQ.

Especialistas em computação estatísticas recomendável que você não usar a fórmula Calculadora. A fórmula calculadora é apresentada como Não para fazê-lo " " em textos sobre computação estatísticas. Infelizmente, todos os três das ferramentas de análise ferramentas (ATP) anova fazer uso amplamente a fórmula Calculadora ou um equivalente de único - abordagem transmitir em Excel 2002 e em versões anteriores do Excel.

Excel 2003 e versões posteriores do Excel usam os dois - procedimento transmitir para todos os três modelos ATP ANOVA. Este artigo discute o seguinte computacional melhorias em três modelos anova do ATP:
  • Fator Único
  • Dois factor com replicação
  • Sem replicação factor dois
Este artigo aborda esses modelos mais tarde.

Porque Excel sempre tem usado os dois-procedimento transmitir com DESVQ, este artigo faz uso freqüente dele para descrever os procedimentos aprimorados. Esses revisado procedimentos ou efetivamente codificar DESVQ ou uso chamar cuja funcionalidade é exatamente o mesmo que a funcionalidade do DESVQ.

Para cada ferramenta anova, saída ATP contém uma tabela de resumo com valores de Contar, Soma, Média, e variação, e uma tabela anova que tenha vários soma de quadrados e valores de II, df, MS, F e P - valor. Resulta na tabela de resumo são calculadas por Excel funções Contar, Soma, Média, e VAR. chamado VAR somente dessas funções quatro, é assunto para erros roundoff.

Excel 2002 e versões anteriores de implementar Excel var usando a fórmula Calculadora. O seguinte artigo sobre var descreve os aperfeiçoamentos que ocorreram no Excel 2003 e em versões posteriores do Excel. Este artigo também permite fazer experiências com dados numéricos para ver quando roundoff erros são capazes de ocorrer em versões anteriores do Excel.

Para obter mais informações sobre Var, clique o seguinte artigo número para exibição do artigo no Microsoft Knowledge Base:
826112 Funções estatísticas Excel: var


Como este artigo aborda os modelos anova três, ele se concentra nas tabelas saída anova. Em cada maiúsculas e minúsculas, as tabelas de resumo são Well-behaved no Excel 2003 e em versões posteriores do Excel. No Excel 2002 e nas versões anteriores do Excel, ocorrer problemas na coluna variação quando dados tem valores extremos.

Entretanto, este artigo inclui as tabelas de resumo nas seções modelo porque essas tabelas são úteis para comparação ao revisar os exemplos modificados no apêndice.

Modelo 1: fator único

Um exemplo simples com dados é a seguinte.
Recolher esta tabelaExpandir esta tabela
Anova 1 BASIC principais:
123
244
365
486
57
68
Anova: Fator Único
Resumo
GruposContagemSomaMédiaVariância
Coluna 1 6213.53.5
A coluna 2 42056.666667
Coluna 3 6335.53.5
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Entre grupos 12.7526.3751.5068180.2578973.805567
Em grupos 55134.230769
Total67.7515
Pseudocódigo para calcular a soma dos quadrados Excel 2002 e versões anteriores do Excel usam o seguinte:
GrandSum = 0;
GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0; 
GrandMeanSqrd = 0; 
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
   GrandSum = GrandSum + sum of observations in s-th sample;
   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +
      (sum of observations in s-th sample^2)/size of s-th sample;
   GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs ? GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd ? GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs ? GrandSampleMeanSqrd;
Essa abordagem é essencialmente a fórmula Calculadora. tamanho exemplo ^ este abordagem calcula somas dos quadrados das observações, e seguida, subtrai uma quantidade por elas como VAR calcula a soma dos quadrados das observações, e seguida, subtrai soma de observações / 2 ^ / 2 tamanho exemplo .. Pseudocódigo semelhante para o modelo 2 e 3 modelo foi omitido.

Novamente, para modelo 2 e 3, modelo são calculadas somas dos quadrados e uma quantidade é subtraída da soma dos quadrados as in a fórmula Calculadora. Infelizmente, textos de estatísticas básicas freqüentes sugerir abordagens para anova, como aquele que é mostrado anteriormente neste artigo.

Excel 2003 e versões posteriores do Excel usam uma abordagem diferente para calcular o vários entradas na coluna da tabela anova II. Para ilustração, este artigo pressupõe que os dados numéricos no exemplo anterior são exibidas em A2:C7 células com dados ausentes nas células B6 e B7.
  • SS total é aplicado a todos os os dados, such as DEVSQ(A2:C7) DESVQ apenas. DESVQ funciona corretamente mesmo que esteja faltando dados.
  • Entre grupos ss é II total menos a soma de DESVQ aplicado a cada coluna, such as DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • Em grupos II é II total menos II entre grupos.
Se entradas na coluna da tabela anova SS são calculadas corretamente, a precisão das outras entradas na tabela a seguir.

Modelo 2: Fator Duplo com replicação

Um exemplo simples com dados é a seguinte.
Recolher esta tabelaExpandir esta tabela
Anova 2 BASIC principaisGRUPO 1 GRUPO 2 GRUPO 3
Avaliação 1 123
244
365
2 de avaliação 486
5107
6128
Anova: Fator Duplo com duplicação
ResumoGRUPO 1GRUPO 2 GRUPO 3 Total
Avaliação 1
Contagem3339
Soma6121230
Média2443.333333
Variância1412.5
2 de avaliação
Contagem3339
Soma15302166
Média51077.333333
Variância1416,25
Total
Contagem666
Soma214233
Média3.575.5
Variância3.5143.5
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Exemplo72172366.22E-20054.747221
Colunas37218.59.250.0037093.88529
Interação924.52.250.1479733.88529
Em24122
Total14217
Novamente, se entradas na coluna SS são calculadas corretamente, a precisão do todos segue as outras entradas na parte anova da saída.

Aqui está o computacional procedimento para Excel 2003 e para as versões posteriores do Excel. Este procedimento usa DESVQ para calcular o vários entradas na coluna da tabela anova II. Para ilustração, este exemplo pressupõe que os dados numéricos são exibidas em B2:D7 células.
  • SS total é aplicado a todos os os dados, such as DEVSQ(B2:D7) DESVQ apenas.
  • SS exemplo é II total menos a soma de DESVQ aplicado a cada exemplo, such as DEVSQ(B2:D4) + DEVSQ(B5:D7).
  • Colunas ss é II total menos a soma de DESVQ aplicado a cada coluna, such as DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7).
  • Em ss é a soma de DESVQ aplicada a cada tentativa ou par GRUPO, such as DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • Interação ss é igual II total menos II exemplo menos II colunas menos II dentro.

Modelo 3: Fator Duplo sem replicação

Um exemplo simples com dados é a seguinte.
Recolher esta tabelaExpandir esta tabela
Anova 3 BASIC principais:Low MED HI
INSTÁVEL123
244
365
Class EXT.TEXTO 486
5107
6128
RICH71410
8126
9102
Anova: Fator Duplo sem replicação
ResumoContagemSomaMédiaVariância
INSTÁVEL3621
3103.3333331,333333
3144.6666672.333333
Class EXT.TEXTO 31864
3227.3333336.333333
3268.6666679.333333
RICH33110.3333312.33333
3268.6666679.333333
321719
Low 94557.5
MED 9788.66666716
HI9515.6666676,25
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Linhas176.6667822.083335.760870.0014762.591094
Colunas68.66667234.333338.9565220.0024553.633716
Erro61.33333163.833333
Total306.666726
Se os valores na coluna SS são calculados corretamente, a precisão de todos os outros valores na tabela anova a seguir.

Excel 2003 e versões posteriores do Excel usam o seguinte computacional procedimento. O procedimento usa DESVQ para calcular os valores na coluna da tabela anova II. Para ilustração, este exemplo pressupõe que o intervalo de células mostradas o exemplo anterior é as células A1: D10. Portanto, os dados numéricos aparecem na B2:D10 células.
  • SS total é aplicado a todos os os dados, such as DEVSQ(B2:D10) DESVQ apenas.
  • SS linhas são II total menos a soma de DESVQ aplicado a cada linha, such as DEVSQ(B2:D2) DEVSQ(B3:D3) + + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • Colunas ss é II total menos a soma de DESVQ aplicado a cada coluna, such as DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10).
  • Erro ss é II total menos linhas II menos colunas II.

Resultados no Excel 2002 e nas versões anteriores do Excel

Em casos extremos onde há quantos dígitos significativos nos dados mas também uma variância pequena, a fórmula Calculadora leva a resultados imprecisos. O apêndice que aparece no posteriormente neste artigo fornece exemplos de problemas roundoff em tais situações extremas.

Resultados em Excel 2003 e em versões posteriores do Excel

Excel 2003 e versões posteriores do Excel usam um procedimento que faz duas passagens através os dados. No, o primeiro transmitir Excel 2003 e versões posteriores do Excel calcular a soma e contagem dos valores dados. A partir desses, Excel pode calcular a significar exemplo (médio).

Na transmitir segundo, Excel calcula a diferença de quadrados entre cada ponto de dados e a significar exemplo, e soma dessas diferenças de quadrados. Como resultado, os resultados no Excel 2003 e em versões posteriores do Excel são mais estáveis numericamente.

Conclusões

Um dois - transmitir abordagem melhora o desempenho numérico em todas as ferramentas ATP ANOVA três em Excel 2003 e em versões posteriores do Excel as compared to versões anteriores do Excel. Os resultados que você obtenha usando Excel 2003 e versões posteriores do Excel nunca são menos precisos que os resultados que você obtenha usando versões anteriores do Excel.

Em casos mais práticos, no entanto, há nenhuma diferença entre esses resultados. Isso ocorre porque não dados exposição geralmente o tipo de comportamento incomum que a seguinte ilustra apêndice. Instabilidade numérica é mais provável que ocorrer em versões anteriores do Excel quando dados contém um número alto de Significant digits com relativamente pouco variação entre valores dados.

Se você usar uma versão anterior do Excel, e se você desejar para ver se Excel 2003 ou uma versão posterior do Excel oferece diferentes resultados anova, comparar os resultados que você obter quando você usar as ferramentas anova na sua versão anterior do Excel com os resultados que você obter quando você usa os procedimentos que usam DESVQ.

Observação os procedimentos que usam DESVQ foram descritos anteriormente neste artigo para a tabela anova que é associado com cada uma das ferramentas associado com cada uma das ferramentas..

Para verificar que estão variâncias corrigir a tabela Resumo para cada intervalo, em Use DEVSQ(range) / (CONTAR ( intervalo ) û 1).

Apêndice: exemplos do desempenho de Excel 2002 e versões anteriores do Excel numérico

Para cada exemplo básico de modelos 1, 2 e 3, anteriormente neste artigo apresentadas saída da ferramenta ATP. Isso incluiu as tabelas de resumo e anova. Dados foi modificados em cada exemplo para criar um exemplo " stressed ". Para fazer isso, adicionando 10 ^ 8 para cada valor de dados. Adicionando uma constante such as 10 ^ 8 para cada valor de dados não afeta variação na tabela Resumo (mas afetará MÉDIA e SOMA de maneiras óbvias). Não ele deve também afetar qualquer entrada na tabela anova.

Se você comparar variâncias nas tabelas de resumo e II nas tabelas anova, você irá aviso que todos os esses incorretamente são calculados em todos os três do seguinte num modelos EXCEPT for uma entrada no modelo 3 que é apontada para com " <---".

Em stressed os todos os casos, os resultados anova que você obtenha usando Excel 2003 e versões posteriores do Excel concordar com os resultados anteriores nos casos básicos (como eles devem).

Anova 1 num modelo com valores grandes dados

Recolher esta tabelaExpandir esta tabela
100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: Fator Único
Resumo
GruposContagemSomaMédiaVariância
Coluna 1 66000000211E + 084.8
A coluna 2 44000000201E + 088
Coluna 3 66000000331E + 081.6
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Entre grupos 020013.805567
Em grupos 64134.923077
Total6415

2 Anova num modelo com valores grandes dados

Recolher esta tabelaExpandir esta tabela
GRUPO 1GRUPO 2 GRUPO 3
Avaliação 1 100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
2 de avaliação 100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: Fator Duplo com duplicação
ResumoGRUPO 1GRUPO 2 GRUPO 3 Total
Avaliação 1
Contagem3339
Soma3000000063000000123000000129E + 08
Média1000000021000000041000000041E + 08
Variância0404
2 de avaliação
Contagem3339
Soma3000000153000000303000000219E + 08
Média1000000051000000101000000071E + 08
Variância0406
Total
Contagem666
Soma600000021600000042600000033
Média100000004100000007100000005.5
Variância4.814.41.6
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Exemplo64164240.0003674.747221
Colunas3221660.0156253.88529
Interação3221660.0156253.88529
Em32122.666666667
Total12817

3 Anova num modelo com valores grandes dados

Recolher esta tabelaExpandir esta tabela
Low MED HI
INSTÁVEL100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
Class EXT.TEXTO 100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
RICH100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: Fator Duplo sem replicação
ResumoContagemSomaMédiaVariância
Linha 1 33000000061000000020
Linha 2 33000000101000000032
Linha 3 33000000141000000052
Linha 4 33000000181000000064<---
Linha 5 33000000221000000076
Linha 6 330000002610000000910
Linha 7 330000003110000001012
Linha 8 330000002610000000910
Linha 9 330000002110000000718
Coluna 1 99000000451000000058
A coluna 2 990000007810000000914
Coluna 3 99000000511000000064
Anova
Fonte de variação IIdfMSFP - valor CRIT F
Linhas12881620.1132812.591094
Colunas3221620.1677723.633716
Erro128168
Total28826

Propriedades

ID do artigo: 829215 - Última revisão: quarta-feira, 10 de janeiro de 2007 - Revisão: 2.0
A informação contida neste artigo aplica-se a:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
Palavras-chave: 
kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo KB829215 KbMtpt kbmt
Tradução automática
IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine Translation ou MT), não tendo sido portanto traduzido ou revisto por pessoas. A Microsoft possui artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais, com o objetivo de oferecer em português a totalidade dos artigos existentes na base de dados de suporte. No entanto, a tradução automática não é sempre perfeita, podendo conter erros de vocabulário, sintaxe ou gramática. A Microsoft não é responsável por incoerências, erros ou prejuízos ocorridos em decorrência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza atualizações freqüentes ao software de tradução automática (MT). Caso tenha encontrado erros neste artigo e queira colaborar no processo de aperfeiçoamento desta ferramenta, por favor preencha o formulário existente na parte inferior desta página. Obrigado.
Clique aqui para ver a versão em Inglês deste artigo: 829215

Submeter comentários

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com