Descrição dos aprimoramentos nas funções estatísticas no Excel 2003 e no Excel 2004 para Mac

IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine Translation ou MT), não tendo sido portanto traduzido ou revisto por pessoas. A Microsoft possui artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais, com o objetivo de oferecer em português a totalidade dos artigos existentes na base de dados de suporte. No entanto, a tradução automática não é sempre perfeita, podendo conter erros de vocabulário, sintaxe ou gramática. A Microsoft não é responsável por incoerências, erros ou prejuízos ocorridos em decorrência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza atualizações freqüentes ao software de tradução automática (MT). Obrigado.

Clique aqui para ver a versão em Inglês deste artigo: 828888
Este artigo foi arquivado. É oferecido "como está" e não será mais atualizado.
Sumário
Este artigo descreve seis categorias de aprimoramentos para as funções estatísticas no Microsoft Office Excel 2003, você (o leitor) aponta para artigos mais específicos e fornece pelo menos alguns avaliação do efeito de usar versões anteriores do Microsoft Excel quando funções foram aprimoradas para o Excel 2003.

Microsoft Excel 2004 para Mac informações

As funções estatísticas no Excel 2004 para Mac foram atualizadas usando os mesmos algoritmos que foram usados para atualizar as funções estatísticas no Microsoft Office Excel 2003. Qualquer informações neste artigo descreve como funciona uma função ou como uma função foi modificada para o Excel 2003 também se aplicam ao Excel 2004 para Mac.
Mais Informações
Para o Excel 2003, aprimoramentos foram feitos nas seguintes áreas de seis:
  1. PROJ.LIN e funções relacionadas.
  2. Funções relacionadas e DIST.NORMP.
  3. Funções que envolvem somas dos quadrados (por exemplo, VAR e DESVPAD).
  4. Distribuição contínua inverso funções (por exemplo, INV.QUI, INVF, INV.NORMP e INVT).
  5. Funções para distribuições distintas (por exemplo, DISTRBINOM e POISSON).
  6. Gerador de número aleatório (aleatório).
Seções separadas abordam cada uma dessas seis áreas. Em áreas três, quatro e cinco, não há um tema comum para aprimoramentos para cada uma das várias funções. Em áreas um a quatro aprimoramentos para uma função tinha útil efeitos sobre o desempenho de outras funções que essencialmente chamá-lo.

Como aprimoramentos foram feitos para o Excel 2003, você deve estar inevitavelmente imaginando sobre o risco de (e a magnitude do) imprecisões nas funções estatísticas nas versões anteriores do Excel. Esses problemas serão discutidos resumidamente em cada uma das seis seções. As seis áreas são classificadas na percepção deste autor de sua importância. Embora a maioria dos usuários não ter que ser o menor bit assuste por desempenho no Microsoft Excel 2002 e versões anteriores, problemas de PROJ.LIN (área 1) são muito mais provável para a superfície de problemas com DISTRBINOM (área de cinco) ou aleatório (área seis).

Há um shortcoming no Excel 2002 e versões anteriores que foi identificado e não corrigido para o Excel 2003. O aplicativo prototypical de ferramenta das ferramentas de análise de teste-t: emparelhadas duas amostras para médias é aquele onde dados incluem medidas no mesmo conjunto de assuntos antes e após um tratamento (por exemplo, pesos antes e após um programa de dieta). Essa ferramenta não irá calcular se houver números desiguais de ausente antes e depois Observações; ele irá calcular respostas incorretas se há ausentes Observações e o número de ausente antes e depois observações são iguais. A menos que você pode garantir que não há nenhum Observações ausentes, a função de teste no Excel é preferencial (porque ele manipula corretamente Observações ausentes).

Para obter mais informações, clique no número abaixo para ler o artigo na Base de dados de Conhecimento da Microsoft:
829252Você pode obter resultados incorretos e rótulos enganosos quando você usa a ferramentas de análise Teste-t no Excel 2003
Duas referências principais que destaque imprecisões numéricos no Microsoft Excel 97 são documentos por Knusel (consulte a Observação 1) para áreas dois, quatro e cinco e McCullough e Wilson (consulte Observação dois) para áreas de um, três e seis. Aprimoramentos para as funções estatísticas no Excel no Microsoft Excel 2000 e no Microsoft Excel 2002 foram relativamente pequenos.

PROJ.LIN e funções relacionadas

Dois aprimoramentos principais foram feitos ao código de PROJ.LIN. A primeira substituído uma fórmula inadequada para soma total dos quadrados em casos onde o terceiro argumento de PROJ.LIN foi definido como FALSE indicando que você não deseja PROJ.LIN para modelar uma interseção (ou constante). Na prática, essa opção é selecionada em uma proporção pequena de casos. Ao chamar LINEST(known_y's, known_x's, FALSE, TRUE) para retornar uma matriz com cinco linhas que contêm informações detalhadas (estatística f, r quadrado, regressão e residual ou erro somas dos quadrados), a fórmula inadequada em versões anteriores do Excel levou a resultados incorretos nas três últimas linhas da matriz de saída. Regressão coeficientes e seus erros padrão não foram afetados. Essa fórmula incorreta pode levar a r negativo regressão quadrados e negativos soma dos quadrados. Isso foi corrigido. Artigo de PROJ.LIN sugere uma solução alternativa para o Excel 2002 e versões anteriores para gerar valores corretos dos resultados nas três últimas linhas da matriz de saída. Isso foi um erro grave como resulta nessas três últimas linhas sempre foram incorretas quando PROJ.LIN foi chamado com seu terceiro argumento definido como falso.

Para obter mais informações, clique no número abaixo para ler o artigo na Base de dados de Conhecimento da Microsoft:
828533Descrição da função PROJ.LIN no Excel 2003 e no Excel 2004 para Mac

Anotações

  • Knusel, l. na precisão de distribuição estatísticas no Microsoft Excel 97 , estatísticas computacional e análise de dados, 26, 377-375, 1998.
  • McCullough, B.D. & B. Wilson, na precisão dos procedimentos estatísticos no Microsoft Excel 97 , estatísticas computacional e análise de dados, 31, 37-27, 1999.
McCullough e Wilson (McC e W) apontado (corretamente) que o Excel 97 foi a problemas de previsão collinear (ou quase collinear) colunas de tipo kana. Um conjunto de colunas de previsão é collinear se um deles pode ser descartado sem afetar a benção de ajuste do modelo de regressão. Em outras palavras, as informações que estão contidas em uma coluna descartada não adiciona nenhum valor porque a coluna descartada pode ser reconstruída das colunas restantes. Exemplos de teste no McC e W incluído colinearidade e próximo colinearidade. Usando uma abordagem de solução ignorado problemas de colinearidade levou resultados imprecisos quando colinearidade estava presente. Esses resultados incluído um número reduzido de dígitos significativos de precisão no coeficientes de regressão e número de graus de liberdade inadequado. Para o Excel 2003, a abordagem da solução foi alterada para usar QR Decomposição. Os resultados são muito melhor níveis de precisão em notoriamente difíceis de casos de teste que são usadas pelos McC e w. Colinearidade é discutida no artigo em PROJ.LIN; o artigo também fornece um pequeno exemplo para percorrer o algoritmo QR Decomposição. Essa deficiência em todas as versões do Excel anteriores ao Excel 2003 terá um sério efeito somente quando houver collinear previsões. Um caso comum onde colinearidade é garantida não ocorrer é se há uma coluna de previsão único e nem todos os valores dessa coluna são as mesmas.

PROJ.LIN aprimorar tem um bom efeito em funções que chamá-lo: ferramenta PROJ.log, tendência e crescimento a regressão linear em ferramentas de análise. A ferramenta gráfica do Excel permite que você se ajustam a uma linha reta para um gráfico de pontos de dados usando uma ferramenta de regressão linear. Infelizmente, os recursos de regressão linear em ferramenta gráfica não tenham sido atualizados no Excel 2003.

Em resumo, se você usar uma versão do Excel anterior ao Excel 2003, você deve rejeitar resultados detalhados de PROJ.LIN nas três últimas linhas da linha de cinco tabela de saída de PROJ.LIN se PROJ.LIN foi chamado com seu terceiro argumento definido como falso. Também estar atento a chance de colinearidade; para a maioria dos conjuntos de dados, colinearidade não deve ser um problema.

Funções relacionadas e DIST.NORMP

NORMSDIST(z) devem ser avaliadas utilizando um procedimento de aproximação. Versões anteriores do Excel usado o mesmo procedimento para todos os valores de z. Para Excel 2003, duas aproximações diferentes são usadas: um para |z| menor ou igual a cinco e um segundo para |z| maior do que cinco. Os dois procedimentos novos são cada mais precisa do que o procedimento anterior sobre o intervalo que elas são aplicadas. Em versões anteriores do Excel, precisão cai em caudas da distribuição produzindo três dígitos significativos para z = 4, conforme relatado em papel do Knusel. Além disso, no ambiente de z = 1.2, DIST.NORMP produz apenas seis dígitos significativos. No entanto, na prática, isso é provavelmente será suficiente para a maioria dos usuários.

Excel 2003 código produz a precisão decimal de pelo menos quinze para qualquer z. Isso significa quinze dígitos significativos para z = 1.2 e (devido à esquerda 0s) dez dígitos significativos para z = 4. Melhorar a precisão de DIST.NORMP tem o efeito lado útil de melhorar as seguintes funções que dependem dele também: int.confiança, INVLOG, DIST.LOGNORMAL, DIST.NORM, INV.NORM, INV.NORMP e TESTEZ. Código para int.confiança, DIST.LOGNORMAL, DIST.NORM e TESTEZ não foi revisado; precisão de cada um deles aperfeiçoada porque cada chama DIST.NORMP essencialmente uma ou mais vezes e usa os resultados de essas chamadas em seus cálculos. Maior precisão de DIST.NORMP também benefited INVLOG, INV.NORM e INV.NORMP. Como esses são distribuição contínua inverso funções (consulte a área quatro abaixo), eles também benefited de pesquisa refinamentos que foram associados com tais funções. Os pesquisa refinamentos na área quatro discutido para outras funções inverso foram implementados para essas três funções inverso no Excel 2002.

Em resumo, se você usar o Excel 2002 e versões anterior, você deve estar satisfeito com DIST.NORMP. No entanto, se você deve ter valores NORMSDIST(z) altamente precisos para z longe de 0 (como |z| maior ou igual a quatro), Excel 2003 pode ser necessário. NORMSDIST(-4) = 0.0000316712; versões anteriores seria precisas apenas longe como 0.0000317. Você pode esperar que "sobre 0.00003" ou "3 cerca chances de 100.000" é provavelmente uma resposta precisa o suficiente para muitos usuários e versões anteriores executar isso para duas casas decimais mais.

Funções que envolvem somas dos quadrados

McCullough e Wilson Enfatize que o Excel apareceu usar "fórmula Calculadora" para calcular VAR. Seu Observação estava correta e pode ser estendida para muitas (mas curiously, nem todos os) funções que calculam a soma dos desvios sobre uma média ao quadrado. A fórmula de cálculo pode ser executada em uma única passagem pelos dados. A velocidade resultante computacional foi provavelmente a principal razão para usá-lo em versões anteriores do Excel. A fórmula alternativa, implementada para o Excel 2003, requer duas passagens. Para VAR a Calculadora fórmula conta o número de observações, soma os quadrados de todas as observações e soma as observações. Deste, ele pode calcular:
Soma dos quadrados das observações – ((sum of observations) ^ 2) / número de observações
O procedimento alternativo conta o número de observações e a soma de observações na primeira passagem. Dele pode calcular a média como soma de observações dividido pelo número de observações. Na segunda passagem, o procedimento calcula:
Soma dos desvios quadrados de observações individuais da média
Com qualquer abordagem computacional, VAR é calculada dividindo o resultado por número de observações – 1; VARP é calculada dividindo o resultado por número de observações.

Com infinitamente precisa aritmética, ambos os procedimentos produzir os mesmos resultados. No entanto, devido a precisão finita do Excel, a fórmula de calculadora é mais propensa a arredondar erros. Em textos sobre estatísticas de computação, a fórmula de calculadora geralmente é apresentada como um exemplo de como não calcular variância. Com a planilha que acompanha o artigo sobre VAR, você pode testar para avaliar a extensão que redonda desativar erros em versões anteriores do Excel provavelmente por apresentar problemas. Você verá que problemas ocorrem quando há muitos dígitos significativos nos dados, mas muito pouca diferença entre valores. Você pode esperar que para a maioria dos usuários, como round desativar erros não provavelmente ser troubling na prática. No entanto, revisar várias funções para substituir o procedimento de duas passagens para a fórmula de Calculadora foi vale a pena porque um procedimento desatualizado e discredited substituída por uma apropriado. Ele também afetado muitas funções.

DEVSQ também calcula a soma dos desvios quadrados sobre uma média. DEVSQ sempre foi implementado usando o procedimento de duas passagens. Portanto, outra alternativa para a computação VAR(data) é calcular DEVSQ(data) / (COUNT(data) – 1). Isso daria os mesmos resultados em todas as versões do Excel. Se você estiver usando o Excel 2002 ou anteriores, você pode computar tanto VAR DEVSQ(data) / (COUNT(data) – d de 1) para ver quanto os resultados são diferentes. A diferença é essencialmente a rodada desativar erro no VAR. Outras funções que exigem uma soma dos desvios quadrados sobre uma média e que sempre usou o procedimento de duas passagens são CORREL e COVAR. CORREL e PEARSON ambos computar o coeficiente de correlação do momento do produto Pearson. Ambos produzir os mesmos resultados no Excel 2003. Em versões anteriores do Excel, PEARSON é implementada com o algoritmo de uma passagem.

Muitas funções envolvem a soma dos desvios quadrados sobre uma média. O procedimento de duas passagens foi implementado para cada uma das seguintes: VAR, VARA, VARP, VARPA, DESVPAD, DESVPADA, DESVPADP, DESVPADPA, PEARSON, inclinação e EPADYX. Outras funções que foram aprimoradas porque eles chamam uma das funções essencialmente na lista anterior incluem: previsão, INTERCEPÇÃO, RQUAD, teste e TESTEZ (quando o usuário omite o desvio padrão dos argumentos). Em ferramentas de análise, cada uma das três ferramentas ANOVA foi aprimorada, substituindo a fórmula da Calculadora pelo procedimento de duas passagens. Existem também versões do VAR, VARP, DESVPAD e DESVPADP que são usadas em tabelas dinâmicas e consolidação de dados. Há um único artigo sobre as funções BDVAREST, BDVARP, BDEST e BDDESVPA.

Para obter mais informações, clique no número abaixo para ler o artigo na Base de dados de Conhecimento da Microsoft:
828125Funções estatísticas do Excel: BDVAREST, BDVARP, BDEST, BDDESVPA e


Todos esses também foram atualizados.

Em resumo, se você usar uma versão anterior do Excel, você deve se preocupar com erros de arredondamento em casos onde dados contém muitos dígitos significativos, mas a variação é pequena. O artigo sobre VAR apresenta exemplos imaginária isso; você pode esperar que esses problemas arredondar não naturalmente ocorrem com freqüência em dados reais.

Para obter mais informações, clique no número abaixo para ler o artigo na Base de dados de Conhecimento da Microsoft:
826112Funções estatísticas do Excel: VAR

Funções de inverso da distribuição contínua

Essas são todas as funções cujo nome termina em "INV". Todos eles usarem pesquisa binária para convergir em um valor para retornar para o usuário. Portanto, precisão, INV.QUI, INV.NORMP e outras funções dependem de dois fatores: precisão das distribuições (por exemplo, DIST.QUI e DIST.NORMP) e refinamento do processo de pesquisa binário base.

Para o Excel 2002, o processo de pesquisa binário foi aprimorado em um caso, INV.NORMP. Este aprimoramento também afeta INV.NORM. INV.NORMP e INV.NORM são funções inverso, de longe mais usadas. A natureza da melhora foi para refinar a pesquisa para que ele continua até que o resultado foi preciso para o limite do Excel precisão, em vez de interromper anteriormente se a probabilidade associada com o valor encontrado dentro de 3 * 10^(-7) da probabilidade correta. Enquanto este refinamento do processo de pesquisa aprimorado INV.NORMP, versão do Excel 2002 ainda necessário para um DIST.NORMP mais precisa.

Para o Excel 2003, a pesquisa de binária aprimorada usada para INV.NORMP para o Excel 2002, foi implementado para cada uma das outras funções de "INV". Como DIST.NORMP também foi aprimorada (área de dois), a versão de INV.NORMP no Excel 2003 é melhor do que a versão no Excel 2002 e ainda melhor do que no Excel 2000 e versões anteriores do Excel.

Em resumo, essas funções irão se comportar bem suficiente em versões anteriores do Excel supondo que chamá-los com um valor de probabilidade (por exemplo, p em NORMSINV(p)) é não muito próximos 0 ou 1 (tais como dentro sobre 10^(-6)).

Funções para distribuições distintas

Knusel apontado DISTRBINOM, DIST.HIPERGEOM e POISSON não calcular numérico resultados (e retorno # núm!) em determinados casos. CRIT.BINOM e DIST.bin.NEG exibem comportamento semelhante. Essas funções produzem resultados precisos, sempre que eles não produzir uma mensagem de erro como # NÚM!.

Esses problemas foram corrigidos. Você pode exibi-los como relativamente sem importância porque eles ocorrem somente para valores improvável de parâmetros de entrada. Por exemplo, DISTRBINOM retornará respostas precisas no Excel 2002 e versões anteriores, desde que o número de tentativas de seja menos de 1,030.

Todas as cinco dessas funções foram corrigidas da mesma forma: continuar a usar código existente em casos onde entradas para as funções de garantia de nenhum problema computacional (como menos de 1,030 tentativas para DISTRBINOM); alternar para um plano alternativo em casos problematical. Para cada uma das cinco funções, esse método usa um processo que permite a avaliação da probabilidade de que deseja sem ter que avaliar um coeficiente combinatorial como COMBIN(1030, 515) ou um fatorial de um grande número como FACT(200). Em cada caso, o plano alternativo tem a mesma abordagem geral.

Para obter mais informações, clique nos números abaixo para ler os artigos na Base de dados de Conhecimento da Microsoft:
827459Funções estatísticas do Excel: DISTRBINOM
828117Funções estatísticas do Excel: CRIT.BINOM
828515Funções estatísticas do Excel: DIST.HIPERGEOM
828361Funções estatísticas do Excel: DIST.bin.NEG
828130Funções estatísticas do Excel: POISSON


Em resumo, usuários de versões anteriores do Excel devem não ser troubled prática por numéricas deficiências porque valores de entrada que causar a # NÚM! os resultados são extremos. Além disso, você poderá ter certeza que, se você receber um resultado diferente de uma mensagem de erro, o resultado é preciso. Erro de arredondamento não é um problema aqui.

Gerador de números aleatórios

Não há padrão testes de aleatoriedade para um fluxo de números aleatórios. Seqüência ’s aleatório de números aleatórios recorrente com uma freqüência muito pequena para passar esses testes. Foi implementado um algoritmo aprimorado que passa todos os testes padrão de aleatoriedade.

A possibilidade de um efeito prático grave em seus dados aleatórios, o gerador de número aleatório no Excel 2002 e versões anteriores é mínima. Por exemplo, você deve ter uma longa seqüência de números aleatórios (como 1 milhão) antes do comportamento repetitivo teria um efeito sério em seus resultados.

Ainda assim, como o algoritmo de substituição foi implementado facilmente, foi vale a pena tentar fazer melhorias.

Em resumo, se você usar uma versão anterior do Excel, não se preocupe com a qualidade de números pseudo-aleatórias geradas pelo aleatório, a menos que você use muitos números aleatórios.

Conclusões

Este artigo de visão geral aborda seis categorias de funções que foram estabelecidas com base no inadequacies no funções estatísticas do Excel que foram relatadas em documentos por Knusel McCullough e Wilson. Aprimoramentos foram feitos funções em cada categoria. Os leitores são incentivados a Consulte artigos sobre funções individuais para obter mais detalhes.

Este artigo foi avisado os usuários do Excel 2002 e versões anteriores para evitar usando resultados nas três últimas linhas da tabela de saída para LINEST(known_y's, known_x's, FALSE, TRUE). Os usuários de todas as versões não devem usar ferramenta das ferramentas de análise de teste-t: emparelhadas duas amostras para médias se houver dados ausentes. Nesses dois casos retornam resultados incorretos, independentemente dos valores de dados.

Em outros casos, é difícil de medir a extensão que imprecisões numéricos no Excel 2002 e versões anteriores afetará os usuários. Para funções em que você fornecer argumentos numéricos, grau de imprecisão geralmente depende do valor desses argumentos (por exemplo, DISTRBINOM com 1.500 tentativas ou NORMSDIST(-7)). Nesses casos esses argumentos normalmente precisam ser "muito" antes que há um risco de sérios problemas numéricos. Para funções em que você fornecer um ou mais intervalos de dados, como qualquer função envolvendo somas dos quadrados (VAR, DESVPAD, inclinação), valores de dados também precisam ser "extremos" em um sentido com muitos dígitos significativos e variação pequena antes de arredondamento problemas têm um efeito. Para PROJ.LIN, você deve estar atento a chance de colinearidade.

Talvez você nunca irá notar uma diferença quando uma planilha é criada no Excel 2002 ou anteriores é recalculada no Excel 2003. No entanto, era importante melhorar a funções cujo precisão numérica encontrado não deve para ser suficiente em testes que foram criados para investigar a capacidade das funções de manipular entradas conhecidas por especialistas da comunidade de estatísticas computacionais para alongar tais funções aos seus limites. Quando as funções foram originalmente adicionadas ao Excel, ninguém pode antecipar usa futura. Por exemplo, técnicas Six Sigma não estavam em uso muito difundido. Agora, não convém retornar valores incorretos de NORMSDIST(-6) ou NORMSDIST(6). Felizmente, aprimoramentos numéricos para o Excel 2003 fará com que essas funções estatísticas apropriado para uso futuro imprevisto.

Aviso: este artigo foi traduzido automaticamente

Propriedades

ID do Artigo: 828888 - Última Revisão: 12/08/2015 04:46:09 - Revisão: 3.4

Microsoft Office Excel 2003, Microsoft Excel 2004 for Mac

  • kbnosurvey kbarchive kbmt kbfunctions kbfuncstat kbinfo KB828888 KbMtpt
Comentários