Excel fonctions statistiques : PEARSON

Résumé

Cet article décrit la fonction PEARSON dans Microsoft Excel. Cet article explique comment utiliser la fonction. En outre, cet article compare les résultats d’échantillonnage de PEARSON dans Microsoft Office Excel 2003 et dans les versions ultérieures d’Excel avec les résultats d’échantillonnage de PEARSON, dans les versions antérieures d’Excel.

Plus d'informations

La fonction PEARSON (matrice1, matrice2) renvoie le Pearson produit-coefficient de corrélation entre deux tableaux de données.

Syntaxe

PEARSON(array1, array2)
Les arguments matrice1 et matrice2, doivent être des nombres, noms, constantes de matrices ou références contenant des nombres.

L’utilisation la plus courante de PEARSON inclut deux plages de cellules qui contiennent les données, comme PEARSON (a1 : A100, B1:B100).

Exemple d’utilisation

Pour illustrer la fonction PEARSON, procédez comme suit :
  1. Créer une feuille de calcul Excel vierge, puis copiez le tableau suivant.
    1= 3 + 10 ^ $D$ 2Puissance de 10 à ajouter aux données
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2avant Excel 2003
    Lorsque D2 = 7.5
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    Lorsque D2 = 8
    #DIV/0!
    0.713772
  2. Sélectionnez la cellule A1 dans votre feuille de calcul Excel vierge, puis collez les entrées de sorte que le tableau remplisse A1:D13 de cellules dans votre feuille de calcul.
  3. Cliquez sur le bouton Options de collage , puis cliquez sur Respecter la mise en forme de Destination. Avec la plage collée étant toujours sélectionnée, utilisez une des procédures suivantes, en fonction de la version d’Excel que vous exécutez :
    • Dans Microsoft Office Excel 2007, cliquez sur l’onglet accueil , cliquez sur Format dans le groupe cellules , puis cliquez sur Ajuster la largeur de colonne.
    • Dans Microsoft Office Excel 2003, pointez sur colonne dans le menu Format , puis cliquez sur Ajustement automatique.
    Remarque Voulez-vous formater les cellules B1 à B6 comme nombre avec 0 décimales.
Cellules A1:A6 et B1:B6 contiennent les deux tableaux de données qui sont utilisés dans cet exemple pour appeler les fonctions PEARSON et CORREL dans les cellules A8 et A9. PEARSON et CORREL calculent le coefficient de corrélation d’échantillonnage de Pearson produit-moment et leurs résultats devraient convenir.

Dans les versions d’Excel antérieures à Excel 2003, PEARSON peut-être présenter des erreurs d’arrondi. Le comportement de PEARSON a été amélioré dans Excel 2003 et dans les versions ultérieures d’Excel. CORREL a toujours été implémenté avec la procédure améliorée qui est à présent utilisée dans Excel 2003 et dans les versions ultérieures d’Excel. Par conséquent, si vous utilisez PEARSON pour une version d’Excel antérieure à Excel 2003, Microsoft vous recommande d’utiliser plutôt coefficient.

Dans les versions d’Excel antérieures à Excel 2003, vous pouvez utiliser la feuille de calcul dans cet article pour exécuter une expérience et découvrir lorsque se produisent des erreurs d’arrondi. Si vous ajoutez une constante à chacune des observations dans B1:B6, il se peut que la valeur de PEARSON ou CORREL ne soit pas affectée. Si vous augmentez la valeur de D2, une plus grande constante est ajoutée à B1 à B6. Si D2 est inférieure à 7, il existe sans erreurs d’arrondi qui apparaissent dans les six premières décimales de PEARSON. Maintenant, modifiez la valeur de D2 à 7.25, 7.5, 7,75 et 8. D6:D13 de cellules de la feuille de calcul affiche des valeurs de PEARSON et CORREL lorsque D2 = 7.5 et lorsque D2 = 8, respectivement.

CORREL est toujours exact, mais les erreurs d’arrondi dans PEARSON sont devenus si graves que la division par 0 se produit lorsque D2 = 8.

Les versions antérieures d’Excel présentent des réponses incorrectes dans ces cas, car les effets des erreurs d’arrondi sont plus profonds avec la formule de calcul utilisée par ces versions. Cependant, les cas dans cette expérience peuvent être consultées comme extrême.

Dans Excel 2003 et dans les versions ultérieures d’Excel, vous ne devez voir aucune modification dans les valeurs d’échantillonnage de PEARSON, si vous essayez de l’expérimentation. Toutefois, D6:D13 de cellules affiche les erreurs d’arrondi mêmes vous procurer dans les versions antérieures d’Excel.

Résultats dans les versions antérieures d’Excel

Si vous nommez les tableaux à deux valeurs x et Y, les versions antérieures d’Excel utilise un seul passage dans les données pour calculer la somme des carrés des x, la somme des carrés de Y, la somme des x, la somme des Y, la somme des nuages et le comptage du nombre d’observations dans chaque tableau. Ces quantités sont ensuite combinées dans la formule de calcul dans le fichier d’aide dans les versions antérieures d’Excel.

Résultats dans Excel 2003 et dans les versions ultérieures d’Excel

La procédure qui est utilisée dans Excel 2003 et dans les versions ultérieures d’Excel utilise un processus en deux passes via les données. Tout d’abord, les sommes de x et de Y et le comptage du nombre d’observations dans chaque tableau sont calculées. À partir de ces éléments, le moyen (moyennes) de X et Y observations peuvent être calculées. Puis, sur la deuxième passe, le carré de la différence entre chaque X et la moyenne de X est trouvé ; Ces différences quadratiques sont additionnés. Le carré de la différence entre chaque Y et la moyenne Y est trouvé ; Ces différences quadratiques sont additionnés. En outre, les produits (X-X moyenne) * (Y – Y moyenne) figurent pour chaque paire de points de données et sont additionnés. Ces trois sommes sont combinées dans la formule de PEARSON. Aucun de ces trois sommes sont affectés en ajoutant une constante à chaque valeur dans le tableau Y (ou le tableau X), car cette même valeur est ajoutée à la moyenne des Y (ou la moyenne de X). Dans les exemples numériques, même avec une haute puissance de 10 dans la cellule D12, ces trois sommes ne sont pas affectées et les résultats de la deuxième passe sont indépendants de l’entrée dans la cellule D2. Par conséquent, les résultats dans Excel 2003 et dans les versions ultérieures d’Excel sont numériquement plus stables.

Conclusions

Une approche de deux passes garantit les meilleures performances numérique de PEARSON dans Excel 2003 et dans les versions ultérieures d’Excel que l’approche d’une étape qui est utilisé dans les versions antérieures d’Excel. Les résultats que vous obtenez dans Excel 2003 et dans les versions ultérieures d’Excel ne sera jamais moins précises que les résultats que vous avez obtenues dans les versions antérieures d’Excel.

CORREL possède la même fonctionnalité et a toujours été implémenté avec l’approche utilisée pour PEARSON dans Excel 2003 et les versions ultérieures d’Excel. Par conséquent, le coefficient est un meilleur choix pour les versions antérieures d’Excel.

Dans les exemples plus pratiques, toutefois, vous n’êtes pas susceptible de remarquer une différence entre les résultats dans Excel 2003 et dans les versions ultérieures d’Excel et dans les versions antérieures d’Excel. Données par défaut sont peu probable présenter le type de comportement inhabituel qui illustre de cette expérience. Instabilité numérique est plus susceptible d’apparaître dans les versions antérieures d’Excel lorsque les données contiennent à la fois un grand nombre de chiffres significatifs et relativement petite variation entre les valeurs de données.

La procédure qui renvoie la somme des carrés des écarts sur une moyenne d’échantillonnage en recherchant la moyenne d’échantillonnage, en calculant chaque écart au carré et puis en additionnant les écarts au carré est plus précise que la procédure de remplacement. (La procédure est fréquemment appelée « formule de la Calculatrice », parce qu’il est utilisable par une calculatrice sur un petit nombre de points de données.) La procédure comprend les étapes suivantes :
  1. Rechercher la somme des carrés de toutes les observations, la taille de l’échantillon et la somme de toutes les observations.
  2. Calculer la somme des carrés de toutes les observations moins ((somme de toutes les observations) ^ 2) / exemple de taille).
Il existe de nombreuses autres fonctions qui ont été améliorées dans Excel 2003 et dans les versions ultérieures d’Excel. Ces fonctions sont améliorées car les versions ultérieures d’Excel remplacement la procédure d’une étape avec la procédure de deux passes qui recherche la moyenne d’échantillonnage au premier passage, puis calcule la somme des carrés des écarts sur cet exemple signifie que dans la deuxième passe.

Une courte liste de ces fonctions inclut les fonctions suivantes :
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • PRÉVISION
  • PENTE
  • ORDONNÉE À L’ORIGINE
  • PEARSON
  • LA FONCTION RSQ
  • ERREUR.
Des améliorations similaires ont été effectuées dans chacun des trois outils d’analyse de la Variance de l’utilitaire d’analyse.
Propriétés

ID d'article : 828129 - Dernière mise à jour : 27 janv. 2017 - Révision : 1

Microsoft Office Excel 2007

Commentaires