Vous êtes actuellement hors ligne, en attente de reconnexion à Internet.

Description des effets de fonctions statistiques améliorées pour l'utilitaire d'analyse dans Excel

IMPORTANT : Cet article est issu du système de traduction automatique mis au point par Microsoft (http://support.microsoft.com/gp/mtdetails). Un certain nombre d’articles obtenus par traduction automatique sont en effet mis à votre disposition en complément des articles traduits en langue française par des traducteurs professionnels. Cela vous permet d’avoir accès, dans votre propre langue, à l’ensemble des articles de la base de connaissances rédigés originellement en langue anglaise. Les articles traduits automatiquement ne sont pas toujours parfaits et peuvent comporter des erreurs de vocabulaire, de syntaxe ou de grammaire (probablement semblables aux erreurs que ferait une personne étrangère s’exprimant dans votre langue !). Néanmoins, mis à part ces imperfections, ces articles devraient suffire à vous orienter et à vous aider à résoudre votre problème. Microsoft s’efforce aussi continuellement de faire évoluer son système de traduction automatique.

La version anglaise de cet article est la suivante: 829208
Résumé
Cet article décrit l'effet d'améliorations numériques dans les fonctions statistiques de Microsoft Office Excel 2003 et des versions ultérieures d'Excel sur Analysis ToolPak (ATP) Outils. La plupart des outils de disponibilité appellent des fonctions statistiques d'Excel en cours de calcul des résultats. Dans de nombreux cas, cet article constitue un pointeur vers les articles sur les fonctions statistiques Excel individuelles. En outre, étude de futures améliorations qui sont utiles est inclu pour des disponibilité Outils.

Microsoft Excel 2004 pour Mac d'informations

Les fonctions statistiques dans Excel 2004 pour Mac ont été mises à jour en utilisant les mêmes algorithmes qui ont servi à mettre à jour les fonctions statistiques dans Microsoft Office Excel 2003 et dans les versions ultérieures d'Excel. Les informations dans cet article décrit comment fonctionne une fonction ou comment une fonction a été modifiée pour Excel 2003 et versions ultérieures d'Excel s'appliquent également à Excel 2004 pour Mac.
Plus d'informations
Code de l'ATP pas a été modifié directement à l'exception pour introduire des améliorations dans trois outils d'analyse de variance de disponibilité.

De disponibilité plusieurs outils numériques performances a été amélioré pour Excel 2003 et pour les versions ultérieures d'Excel car l'outil appelle un Excel statistique fonctionner qui a été améliorée pour Excel 2003 et versions ultérieures d'Excel. Dans le cas où les résultats sont différentes pour les versions antérieures d'Excel et versions ultérieures d'Excel, les valeurs pour Excel 2003 et versions ultérieures d'Excel sont plus précis.

La plupart des utilisateurs est remarquer une différence dans les résultats entre différentes versions d'Excel. C'est parce que les différences sont généralement provoqués par des erreurs d'arrondi qui sont significatives uniquement dans les cas extrêmes. Toutefois, cet article doit tout d'abord soulignez le fait un cas où se produire à différences cause d'une formule incorrecte dans Microsoft Excel 2002 et dans les versions antérieures d'Excel. Évitez de l'outil dans ces versions.

Un deuxième exemple implique une formule incorrecte dans Excel 2002 et dans les versions antérieures d'Excel qui conserve dans Excel 2003 et dans les versions ultérieures d'Excel. Évitez de l'outil de disponibilité dans ce scénario pour toutes les versions d'Excel.

Éviter tout d'abord, l'outil régression lorsque vous devez cliquer sur pour vérifier la case à cocher que constante est zéro . Cela a été corrigé dans Excel 2003 et dans les versions ultérieures d'Excel. Ne pas devoir éviter l'outil régression lorsque la case à cocher constante est automatique est désactivée (cas plus classique dans Exercices pratiques).

Ensuite, les utilisateurs de toutes les versions d'Excel Évitez la disponibilité t-test : paire de deux échantillons de significative l'outil à moins que vous pouvez garantir qu'il n'existe aucun observations données manquant. L'outil permet réponses inappropriés (ou aucun réponses à toutes les) s'il existe une ou plusieurs observations manquantes.

Pour plus d'informations sur l'outil t-Test ATP rapprochées pairs deux échantillons, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
829252 Vous pouvez obtenir des résultats incorrects et les étiquettes trompeur lorsque vous utilisez l'utilitaire d'analyse t-Test dans Excel
Si vous souhaitez utiliser cet outil et si il manque données (ou s'il existe encore le risque de données manquantes), la fonction TEST.STUDENT dans Excel traitera il correctement.

Des sections distinctes sont fournies plus loin dans cet article pour les outils disponible à la vente individuelles. Outils qui ne sont pas répertoriés n'ont pas été affectés par les améliorations dans Excel 2003 et dans les versions ultérieures d'Excel.

Analyse de variance : unique facteur, deux facteurs avec réplication et deux facteurs sans réplication

Chacun de ces trois outils d'analyse de variance a été réécrit pour mettre à niveau la procédure de calcul vers un algorithme de deux passes qui est plus numériquement robuste. Ces améliorations sont similaires aux améliorations de fonctions statistiques qui calculent les sommes des écarts au carré sur une moyenne (par exemple : VAR, ECARTYPE, PENTE, fonction PEARSON).

Pour plus d'informations sur l'analyse de variance de disponibilité, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
829215 Description de l'amélioration numérique de l'analyse de variance d'utilitaire d'analyse Outils dans Excel

Corrélation

Cet outil n'a pas été modifié. Toutefois, il existe une petite différence entre l'outil de corrélation et l'outil covariance persiste dans toutes les versions d'Excel. L'outil de corrélation renvoie un tableau de corrélation triangulaire inférieur à 1 sur la diagonale et les corrélations désactiver la diagonale. L'outil utilise CORREL pour calculer les écritures hors diagonale et remplit les écritures avec la valeur qui est renvoyée par CORREL. (Therefore, si une entrée de données est modifiée, aucune entrée dans la table de change. Comparez ce problème avec le comportement de covariance.)

Analyse de covariance

Cet outil renvoie une table covariance triangulaire inférieure avec écarts sur la diagonale et covariances désactiver la diagonale. Cellules sur la diagonale contenir une formule « = VARP(...) » de sorte que si une entrée de données est modifié, le résultat dans la table est également modifié. VAR.P a été améliorée pour Office Excel 2003 et versions ultérieures d'Excel.

Pour plus d'informations sur la fonction VAR.P, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
826393 Les fonctions statistiques d'Excel : VAR.P
L'outil covariance utilise COVAR pour calculer les écritures hors diagonale et complète les entrées avec la valeur qui est renvoyée par COVAR. Par conséquent si une entrée de données change, les entrées hors diagonale ne changent pas.

Statistiques descriptives

Cet outil appelle les fonctions statistiques d'Excel pour tout ce qu'il calcule. Car la fonction VAR et ECARTYPE sont améliorés pour Excel 2003 et versions ultérieures d'Excel, des valeurs différentes sont possibles en raison d'erreurs d'arrondi dans les cas extrêmes.

Pour plus d'informations sur la fonction VAR, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
826112 Les fonctions statistiques d'Excel : VAR

F-test deux pour les écarts

Tout comme l'outil Statistiques descriptives, cet outil appelle VAR. Là encore, des valeurs différentes sont possibles en raison d'erreurs d'arrondi dans les cas extrêmes.

Génération de numéro aléatoires

Cet outil remplit une plage avec observations aléatoires. Valeurs de ces observations sont placés directement dans les cellules pour que ces valeurs de cellule ne soient pas recalculés et remplacées par les observations nouvelles lors de la feuille est recalculée. La fonction ALEA intégrée dans Excel, remplace d'autre part, nombres aléatoires existantes par nouveaux chaque fois que la feuille est recalculée. Vous pouvez utiliser ALEA pour conserver les valeurs. Pour ce faire, copier les résultats dans une plage et puis utiliser la commande le collage spécial pour coller des valeurs dans la même plage.

L'outil de génération aléatoire nombre (RNG) génère également observations aléatoires plusieurs distributions de probabilité à tandis QU'ALEA correspond à l'option unique dans l'outil : Uniform avec plage comprise entre 0 et 1. Cet article explique comment combiner rand, avec les fonctions statistiques dans Excel pour générer ces observations.

Par conséquent, en termes de fonctionnalités, vous pouvez émuler l'outil numéro aléatoire ATP en utilisant rand et certains ingéniosité. Parfois, Ceci est utile, particulièrement lorsque les nombres aléatoires sont souhaitaient.

Pour Excel 2002 et versions antérieures, le Générateur de nombre aléatoire ATP et rand, ont connu médiocres de tests standard de caractère aléatoire. Performances a été une mauvaise, car la longueur d'un cycle avant la séquence de nombres pseudo-aléatoires démarre extensible est trop courte. Ceci est un problème uniquement lorsque les nombres aléatoires sont requis.

RAND, a été améliorée pour Excel 2003 et versions ultérieures d'Excel afin QU'ALEA transmet désormais tous ces tests standard. Séquence de rand, de nombres aléatoires démarrera extensible elle-même après que plus de 1 trillion numéros sont générés.

Pour plus d'informations ALEA, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
828795 Description de la fonction ALEA dans Excel
Toutefois, distinct numéro Générateur aléatoires l'ATP was not upgraded. Comme dans la version de rand, qui est dans Excel 2002 et dans les versions antérieures d'Excel, distinct numéro Générateur aléatoires l'ATP est connu permettent d'effectuer mal sur les tests standard de caractère aléatoire et ont un cycle de répétition court. Ceci a des implications négatifs uniquement si vous avez besoin une très longue série de nombres aléatoires (par exemple, 1 million).

L'outil RNG fournit observations aléatoires à partir de plusieurs distributions de probabilité et Uniform [0,1], la distribution utilisée pour générer des nombres aléatoires à ALEA. L'outil de disponibilité tout d'abord dessine un nombre aléatoire [0,1] Uniform (ou plus d'un tel numéro) et puis convertit la réponse dans une observation parmi les distributions spécifiques suivantes. Profitent du ceux qui préfèrent rand, car ils allez générer plusieurs observations, cet article propose des formules qui utilisent les rand, dans le tableau ci-dessous. Après la table commentaires y sont certains cautionary sur cas distribution normale de l'utilitaire d'analyse.
DistributionFormule Excel à l'aide de rand()
Bernoulli(p)=IF(RAND() < = p, 1, 0)
Binomial(n,p)= CRITBINOM(n, p, RAND())
DiscretVoir ci-dessous
Normal (mu, sigma)= NORMINV(RAND() mu, sigma)
MotifPas véritablement aléatoire
Poisson(Mean)Voir ci-dessous
Uniform (min, max)= faible + (élevé – basse) * rand()
Il existe deux raisons que vous pouvez préférez rand et la formule dans cette table au lieu de l'ATP aléatoire numéro outil dans le cas normal (mu, sigma). Tout d'abord, rand, est un mieux Uniform [0,1] numéro Générateur aléatoires que de disponibilité. Ensuite, outil de l'ATP n'appelle pas Excel est LOI.NORMALE.INVERSE fonctionne, mais possède sa propre version intégrée de la distribution normale inverse. Ce n'est pas aussi précis que la version de LOI.NORMALE.INVERSE est dans Excel 2003 et dans les versions ultérieures d'Excel. Il est inférieure à la fois dans la précision de l'estimation de distribution normale qu'il utilise (Excel utilise la fonction LOI.NORMALE.standard beaucoup améliorée) et le perfectionnement de la recherche binaire (Excel exécute elle beaucoup plus pour garantir une valeur qui est plus proche d'argument de probabilité de NORMINV). En bref, à l'aide de disponibilité dans ce cas ne pas tirer parti des améliorations pour Excel 2003 et versions ultérieures d'Excel dans les fonctions LOI.NORMALE.INVERSE, LOI.NORMALE.standard et ALEA.

D'observations d'une distribution discrète, supposons que les valeurs sont dans la colonne B et que les probabilités de la colonne c. Une serait puis souhaitez pour remplir chaque ligne de la colonne A la probabilité d'observer une valeur strictement inférieur à la valeur de colonne B de la ligne. En supposant qu'il existait 10 valeurs, supposons que ces données sont dans les cellules A1:C10. Puis, comme A1 contient la probabilité d'observer une valeur strictement inférieur à la première valeur, il faut affecter à 0. Vous pouvez utiliser VLOOKUP(RAND(), A1:C10, 2); le quatrième argument RECHERCHEV est facultatif et doivent être omis ou la valeur True. Le « 2 » signifie que vous souhaitez renvoyer la valeur de la deuxième colonne (colonne B dans cet exemple).

L'ATP utilise une adaptation de la méthode de génération de Poisson observations Press, W.H., S.A. Teukolsky, w. t. Vetterling et B.P. Flannery, recettes ou numérique dans C, les images clipart de scientifique informatique , 2e ed., Cambridge University Press, 1992, pp. 293-295. Il existe deux méthodes permettant de profiter facilement des existant Excel fonctions.

Le premier utilise l'observation qu'une distribution également assimilée par une binomiale (n, m/n) pour n grand une variable aléatoire LOI.POISSON avec moyenne m. Vous pouvez ensuite appeler CRITBINOM(n, m/n, RAND()). Choix de n dépend m; n supérieures à 1 000 fois m doit être assez grand.

La seconde est liée à la distribution LOI.POISSON à la Exponential. Si des événements se produisent en fonction d'un processus LOI.POISSON au taux m par unité de temps, la durée entre événements contient une distribution exponentiel avec moyenne 1/m. Pour une observation LOI.POISSON, vous pouvez prendre une séquence d'observations de cette distribution exponentiel et compter le nombre de leur surviennent avant leur somme dépasse 1. Pour obtenir une observation de cette distribution exponentiel, utilisez GAMMAINV(RAND(), 1, 1/m). Cette méthode soit adaptée lorsque m est relativement proche de 0.

Régression

L'outil régression appelle d'Excel la fonction DROITEREG. Cet article sur la fonction DROITEREG décrit complète Améliorations pour Excel 2003 et versions ultérieures d'Excel.

Pour plus d'informations sur la fonction DROITEREG, cliquez sur le numéro ci-dessous pour afficher l'article correspondant dans la Base de connaissances Microsoft :
828533 Description de la fonction DROITEREG dans Excel
Si vous utilisez Excel 2002 ou une version antérieure d'Excel, notez les défauts deux mêmes de l'outil régression de la disponibilité de la fonction DROITEREG :
  • Régression somme des carrés, r mis au carré et valeurs statistique f sont toujours incorrects pour le cas où la régression est forcée à l'origine.

    Pour DROITEREG, cela signifie « troisième argument pour paramètre FALSE au lieu de cela ensemble pour VRAI ou omis. » Pour l'outil de disponibilité, cela signifie « case à cocher constante est automatique est activée. »
  • La fonction DROITEREG et l'outil de disponibilité sont casse aux problèmes colinéarité. L'article de la fonction DROITEREG explique l'approche calcul DROITEREG dans Excel 2003 et les versions ultérieures d'Excel est conçu pour rechercher la colinéarité ou près de la colinéarité lorsqu'il existe et à agir en conséquence.
Les deux de ces défauts DROITEREG ont été surmonter dans Excel 2003 et dans les versions ultérieures d'Excel. Performances de l'outil régression disponibilité va être de même améliorée. Déclinait sans modifications apportées à code l'outil ; il a été améliorée en appelant une fonction Excel améliorée. Cet auteur considère que l'amélioration dans la fonction DROITEREG à la plus importante des améliorations fonction statistique.

Le tableau suivant indique la sortie de l'outil régression pour les versions antérieures d'Excel et versions ultérieures d'Excel avec la case à cocher constante est automatique activée. Il illustre la première shortcoming qui est mentionné précédemment. Dans les versions antérieures d'Excel, la somme de régression des carrés est négative tout comme la valeur R carré.
XD'Y
111
212
313
Excel 2002 et versions antérieures
SORTIE SOMMAIRE
Régression statistiques
R plusieurs65 535
R carré-20.4285714
Ajuster R carré-20.9285714
Erreur type4.629100499
Observations3
ANALYSE DE VARIANCE
DFSÉCURITÉ SOCIALECOMMANDEFSignification F
Régression1-40.85714286-40.85714286-1.90666667# NOMBRE !
Résidu242.8571428621.42857143
Total32
Excel 2003 et versions ultérieures d'Excel version
SORTIE SOMMAIRE
Régression statistiques
R plusieurs0.949342311
R carré0.901250823
Ajuster R carré0.401250823
Erreur type4.629100499
Observations3
ANALYSE DE VARIANCE
DFSÉCURITÉ SOCIALECOMMANDEFSignification F
Régression1391.1428571391.142857118.253333330.14637279
Résidu242.8571428621.42857143
Total3434

t-test : paire de deux échantillons de significative

Comme nous l'avons vu précédemment, éviter cet outil si il y a des chances d'une ou plusieurs valeurs de données manquant. L'application exemple de ce test est une expérience avec des mesures sur sujets avant et après un traitement (tels que pondérations avant et après un plan diet 60 jours). S'il n'y a aucune observations manquantes, l'outil se comportera correctement. S'il existe différents nombres de manquant avant et après les observations, vous recevez un message d'erreur et l'outil va calculer pas tout. Si il manque des observations et les numéros des manquantes avant et après que observations sont égale, l'outil renvoie les réponses qui contiennent plusieurs erreurs.

Procédure standard est de supprimer un objet à partir des données si l'avant ou après la mesure est manquant et pour analyser les données qui contient uniquement les objets qui ont avant et après des mesures. Fonction TEST.STUDENT d'Excel gère les données manquantes conformément à cette procédure standard.

Les autres deux t-test outils, deux supposées égales variances et deux supposées inégales variances, ne partagent pas ce défaut.

Test z: deuxième exemple pour significative

Cet article indiqué que la casse distribution normale de l'outil de génération de nombre aléatoire n'appelle pas la fonction LOI.NORMALE.STANDARD.INVERSE (ou plus précisément, LOI.NORMALE.INVERSE qui appelle NORMSINV) mais possède sa propre procédure inférieure pour rechercher des valeurs normales inverse.

L'outil de test appelle la fonction LOI.NORMALE.STANDARD.INVERSE et tire parti des améliorations pour Excel 2003 et versions ultérieures d'Excel.

Résultats dans les versions antérieures d'Excel

Il existe des ATP outils dont performances a été amélioré pour Excel 2003 et versions ultérieures d'Excel car ils appellent des fonctions statistiques Excel ont été améliorées pour Excel 2003 et versions ultérieures d'Excel. Une des ces améliorations pour la fonction DROITEREG, lorsque vous définissez sur FALSE, son argument troisième implique que l'outil de régression disponibilité renvoie des résultats incorrects dans Excel 2002 et dans les versions antérieures d'Excel lorsque la que constante est zéro Vérifiez case est activée. Dans d'autres cas où les fonctions Excel ont été améliorées, les utilisateurs des versions antérieures ne sont pas susceptibles de Notez les différences (la plupart de ces différences implique erreurs arrondi dans les cas extrêmes).

Trois outils d'analyse de variance de disponibilité ont été améliorées en modifiant code ATP pour remplacer un algorithme plus numériquement robuste (dans le même esprit que l'amélioration dans Microsoft Excel VAR). Les utilisateurs de ces outils dans les versions antérieures d'Excel sont susceptibles de remarquer les différences dans les cas extrêmes.

Avertissement pour les utilisateurs de toutes les versions : éviter la t-test : paire de deux échantillons significative s'il y a les chances slightest de données manquantes.

Résultats dans Excel 2003 et dans les versions ultérieures d'Excel

Des améliorations significatives ont été apportées dans les fonctions statistiques d'Excel. Cela se traduit améliorations dans nombreux outils de disponibilité qu'appeler ces fonctions. Il existe un outil disponible à la vente, le Générateur de nombre aléatoire, qui ne prend pas parti d'une fonction ALEA améliorée (car elle est implémentée de manière autonome et n'appelle pas ALEA). Il s'agit malheureuse, mais encore plus unfortunate est le cas spécial d'observations aléatoires distribués normalement. La distribution normale inverse est également implémentée de manière autonome et n'appelle pas la fonction LOI.NORMALE.STANDARD.INVERSE beaucoup améliorée.

Le tableau suivant répertorie les outils de disponibilité et ces fonctions Excel qui ils appellent qui ont été améliorées pour Excel 2003 et versions ultérieures d'Excel. Les lecteurs sont qualifiés de séparer les articles de chaque fonction Excel qui est appelée.
outil de disponibilité fonctions d'Excel qui sont appelées
Analyse de variance : un facteurVAR, INVERSE.LOI.F
Analyse de variance : deux-facteur avec la réplicationVAR, INVERSE.LOI.F
Analyse de variance : deux facteurs sans répétitionVAR, INVERSE.LOI.F
Corrélation
Analyse de covariance
Statistiques descriptivesLA FONCTION STDEV, LA FONCTION LOI.STUDENT.INVERSE, VAR
Lissage exponentiel
F-test deux pour les écartsVAR, INVERSE.LOI.F
Transformation de Fourier Rapide FFT
Histogramme
La moyenne mobile
Génération de numéro aléatoires
De position
RégressionLA FONCTION DROITEREG
ÉchantillonnageRAND,
t-test : paire de deux échantillons de significativeVAR, FONCTION PEARSON, LA FONCTION LOI.STUDENT.INVERSE
t-test : deux-exemples supposées variances égalesVAR, LA FONCTION LOI.STUDENT.INVERSE
t-test : supposées variances inégales sur deux exemplesVAR, LA FONCTION LOI.STUDENT.INVERSE
Test z: deuxième exemple pour significativeLOI.NORMALE.STANDARD, LOI.NORMALE.STANDARD.INVERSE
Pour toutes les fonctions qui apparaissent dans cette table autres que la fonction DROITEREG et ALEA, vous êtes susceptible de voir des différences entre les versions antérieures d'Excel et versions ultérieures d'Excel seulement raison d'erreurs arrondi dans les cas extrêmes. La fonction DROITEREG a été beaucoup améliorée, comme expliqué précédemment. RAND, a également été améliorée. Curiously, l'outil échantillonnage appelle ALEA, mais l'outil RNG repose sur un Générateur d'autonome donnera baisse des performances lorsqu'une séquence longue d'observations aléatoires est nécessaire.

Conclusions

Sauf pour les modifications code disponible à la vente pour chacun des trois outils d'analyse de variance, code ATP n'a pas été réécrit. Toutefois, il tire parti d'appeler des fonctions Excel améliorées comme indiqué dans le tableau outil disponible à la vente. Défauts de la t-test : paire de deux échantillons pour test significative n'ont pas été résolus pour Excel 2003 ou versions ultérieures d'Excel. Les améliorations plus notables sont susceptibles d'être dans l'outil régression où DROITEREG plus renvoie des résultats incorrects lorsque la case à cocher que constante est automatique est sélectionnée et où la fonction DROITEREG est conçue pour gérer correctement colinéarité.

Avertissement : Cet article a été traduit automatiquement.

Propriétés

ID d'article : 829208 - Dernière mise à jour : 01/22/2007 23:34:37 - Révision : 4.2

Microsoft Office Excel 2007, Microsoft Office Excel 2003, Microsoft Excel 2004 for Mac

  • kbmt kbformula kbexpertisebeginner kbfunctions kbfuncstat kbinfo KB829208 KbMtfr
Commentaires