Vous pouvez obtenir des résultats incorrects et étiquettes trompeurs lors de l’utilisation de l’utilitaire d’analyse t-Test dans Excel

Résumé

Cet article décrit l’utilitaire d’analyse t-Test nommé le pairées outil. Cet outil n’a pas été modifié pour Microsoft Office Excel 2003 et les versions ultérieures d’Excel. Toutefois, cet outil donne des résultats défectueux lorsqu’il y a des données manquantes. En outre, il existe des données manquantes, ou non sont étiquettes trompeuses dans la sortie de l’outil.

Microsoft Excel 2004 pour les informations Macintosh

Les fonctions statistiques dans Excel 2004 pour Mac ont été mises à jour en utilisant les mêmes algorithmes qu’ont utilisés pour mettre à jour les fonctions statistiques dans Excel 2003 et dans les versions ultérieures d’Excel. Les informations de cet article qui décrit le fonctionne d’une fonction ou comment une fonction a été modifiée pour Excel 2003 et les versions ultérieures d’Excel s’applique également à Excel 2004 pour Mac.

Plus d'informations

Généralement, vous appliquez le t-Test pairées (parfois appelé le t-Test de paires identiques) lorsque vous avez avant et après les mesures sur les expériences de mêmes pour un traitement. Par exemple, vous pourriez mesurer les poids d’un sujet avant et après un plan d’alimentation de 30 jours.

En règle générale, vous débarrasser des données sur n’importe quel sujet dont avant la mesure, ou après que la mesure est manquant. Données incomplètes sur un sujet, les informations sur ce sujet inutiles. Malheureusement, cet outil utilitaire d’analyse se comporte différemment de la pratique normale. Tout d’abord, cet outil utilitaire d’analyse le nombre de sujets avec avant les mesures et le nombre de sujets avec après les mesures. Si les totaux sont différents, vous recevez un message d’erreur et ne continue pas à cet outil utilitaire d’analyse. Par conséquent, par exemple, s’il font a des 49 sujets qui ont à la fois avant et après les mesures et un fiftieth soumis qui a uniquement une mesure avant, l’outil de l’utilitaire d’analyse ne l’analyse.

Si le nombre de sujets qui sont manquants avant que les données est égal au nombre de sujets qui sont manquantes après les données, et ce nombre est positif, l’outil effectue une analyse inappropriée. Par exemple, supposons qu’il y a 50 sujets. Il manque une mesure avant, sujet A et sujet B manque une mesure après 48 autres sujets n’ont aucune donnée manquante. L’outil compte 49 avant les mesures et les 49 après les mesures ; l’outil se comporte comme s’il y a des 49 sujets sans données manquantes. Vous avez l’intention d’éliminer tous les sujets qui il manque une valeur avant ou une valeur après transgressée. Le nombre de sujets, dans cet exemple doit être de 48, 49 pas. Par conséquent, l’outil utilise un nombre incorrect de degrés de liberté. En outre, étant donné que l’outil ignore ni un sujet après la mesure ni de l’objet B avant la mesure, ces deux mesures sont incluses dans les calculs de moyennes des échantillons qui sont utilisés dans la t-statistique. Par conséquent, ces calculé échantillons sont inappropriés.

En résumé, il ne convient pas utiliser l’outil Lorsqu’il existe des données manquantes, car l’outil va calculer pas ou il calcule les formules inappropriés de. Ce cas se produit lorsque le nombre de sujets avec manquant avant que les données est égal au nombre de sujets avec manquant après les données.

L’exemple de la section « Exemple de l’utilisation » de cet article illustre ces problèmes et également les points à confusion des étiquettes dans la sortie de l’outil. La section « Contournement » de cet article propose une solution de contournement dans un cas où vous ne peut pas vérifier l’absence de données manquantes avant d’utiliser l’outil.

Exemple d’utilisation

Pour illustrer le problème des données manquantes, créer une feuille de calcul Excel vierge, puis copiez le tableau suivant. Sélectionnez la cellule A1 dans votre feuille de calcul Excel vierge, puis collez les entrées de sorte que le tableau remplisse A1:I52 de cellules dans votre feuille de calcul.
Expérience 1Expérience 2Expérience 3Expérience 3 modifié afin de supprimer
avantAprèsavantAprèsavantAprèssujets avec les données manquantes
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
Comportement d’unilatérale à 2 t-test
=TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
Outil d’ATP pour Essai 1 :
t-Test : moyennes de deux échantillons pairés moyens
Variable 1Variable 2
On entend par150144.090909090909
Écart1100914.090909090909
Observations1111
Corrélation de Pearson0.952384533866487
Différence hypothétique des moyennes0
DF10
Statistique t1.92092590483801
P (T < = t) unilatéral0.0418403929085198
t unilatéral critique1.81246110219722
P (T < = t) bilatéral0.0836807858170396
t critique bilatéral2.22813884242587
Outil de DAV pour l’essai 2 :
Ne sera pas calculer en raison des nombres de points de données
Outil d’ATP pour expérience 3 :
t-Test : moyennes de deux échantillons pairés moyens
Variable 1Variable 2
On entend par151148.5
Écart1210778.055555555556
Observations1010
Corrélation de Pearson0.936537537274845
Différence hypothétique des moyennes0
DF9
Statistique t0.141327169509421
P (T < = t) unilatéral0.445362157564494
t unilatéral critique1.83311292255007
P (T < = t) bilatéral0.890724315128988
t critique bilatéral2.26215715817358
Une fois que la table est collée dans votre feuille de calcul Excel, cliquez sur le bouton Options de collage , puis cliquez sur Respecter la mise en forme de Destination. Avec la plage collée étant toujours sélectionnée, utilisez une des procédures suivantes, en fonction de la version d’Excel que vous exécutez :
  • Dans Microsoft Office Excel 2007, cliquez sur l’onglet accueil , cliquez sur Format dans le groupe cellules , puis cliquez sur Ajuster la largeur de colonne.
  • Dans Excel 2003, pointez sur colonne dans le menu Format, puis cliquez sur Ajustement automatique.
Vous pouvez utiliser la feuille de calcul pour comparer les résultats de la fonction TTEST d’Excel avec l’outil de l’utilitaire d’analyse. Expérience 1 affiche des données complètes sur des sujets d’onze. La valeur de test dans la cellule A16 est la probabilité que la t-statistique sera supérieure à la valeur observée, en supposant une distribution t avec dix degrés de liberté. Cette valeur, 0.837, apparaît également dans la sortie de l’outil dans la cellule B32. L’étiquette de la cellule A32 doit lire « P (T > = | t |) bilatéral », pas « P (T < = t) bilatéral », mais la réponse numérique est correcte, car aucune donnée manquante dans l’essai 1. De même, l’étiquette dans la cellule A30 doit lire « P (T > = | t |) n’est pas unilatéral », « P (T < = t) unilatéral ». Shorts « t Critical » sont corrects. Ils correspondent au niveau d’importance par défaut, 0,05, et qu’ils utilisent le nombre approprié de degrés de liberté, 10.

Essai 2 a un manquant après la mesure sur un sujet et aucune autre donnée manquante. L’outil refuse à calculer. Les valeurs de test dans les cellules A16 et A17 sont les mêmes. Dans la cellule A16, la C3:D13 de plage de cellules de données est utilisé ; Cela inclut le soumis en dernier lieu, le seul avec des données manquantes. Dans la cellule A17, la C3:D12 de plage de cellules de données est utilisé ; Cela correspond à une expérience avec les dix premiers sujets et aucune données manquantes. Le fait que les résultats sont les mêmes indique que lorsque le test est appelée dans la cellule A16, test ignore correctement l’objet avec les données manquantes.

Expérience 3 a un manquant avant un manquant après la mesure sur deux sujets différents et de mesure. Expérience 3 modifié indique les neuf sujets restants sans données manquantes. Les résultats de test dans les cellules E16 et E17 sont les mêmes. Dans la cellule E16, Student est appelée sur l’expérience 3 données dans les cellules E3:F13. Dans la cellule E17, Student est appelée sur les données 3 d’expérimentation modifié dans les cellules G3:H11. Les résultats sont les mêmes, car test ignore correctement les sujets septième et onzième dans 3 de l’expérience, les deux avec des données manquantes. Si vous examinez la sortie de l’outil pour l’expérimentation 3, le nombre d’avant et après les observations dans les cellules B44 et C44 est dix dans chaque cas. Il est facile de vérifier que SUM(E3:E13) est 1510 et SUM(F3:F13) 1485 ; dans la mesure où il y a 10 observations dans chaque plage, les moyennes respectives sont 151 et 148.5, apparaît dans les cellules B42 et C42. Par conséquent, l’outil n’a pas supprimé tous les sujets et a inclus la mesure après le sujet septième et la mesure avant l’onzième sujet dans son analyse. Le nombre de degrés de liberté dans la cellule b 47 est inapproprié, dans la mesure où il aurait dû être neuf sujets et huit df. Cela rend les entrées incorrectes de démarcation valeurs dans les cellules B50 et B52 (en plus de l’induire en erreur les étiquettes pour les écritures dans les cellules A50 et A52.)

Résultats dans toutes les versions de Microsoft Excel

Malheureusement, cet outil n’a pas résolu pour Excel 2003 et les versions ultérieures d’Excel.

Solution de contournement suggérée pour toutes les versions de Microsoft Excel

Vous pouvez supprimer des sujets avec les données manquantes avant d’utiliser l’outil. Toutefois, il pouvez que vous ne souhaitez pas modifier la feuille de calcul Excel de cette façon. Une procédure d’élimination des sujets avec les données manquantes est indiquée dans les étapes suivantes. Pour vous débarrasser des sujets avec les données manquantes, procédez comme suit :
  1. Copier les plages de deux données vers une nouvelle zone de votre feuille de calcul.
  2. Analyser les données vers le haut à partir de courants en bas des deux plages.
    1. Si la ligne du bas contient des données manquantes, désactivez la ligne du bas. Cela permet de réduire la plage de données. Passez à l’étape 3.
    2. Identifiez la ligne r au-dessus de la ligne du bas, mais la plus proche vers le bas avec les données manquantes.
      1. Copier toutes les données sous la ligne r.
      2. Sélectionnez la ligne r et puis coller les données copiées.
      3. Désactivez la ligne inférieure de données (qui vont dupliquer maintenant en regard de la dernière ligne de données). Cela permet de réduire la plage de données.
  3. Répétez l’étape 2 jusqu'à ce qu’aucun reste de données manquant.
Remarque Vous pouvez utiliser l’outil si vous pouvez garantir qu’il n’y a aucune observations manquantes.

Vous pouvez dupliquer la plupart mais pas tous de l’outil de sortie sans les transformer. Impossible de trouver les valeurs appropriées pour la moyenne et Variance Observations sans beaucoup d’efforts. L’outil recherche des valeurs inappropriées en examinant avant et après les données séparément. Df de l’outil correspond à la valeur courante des Observations moins 1 ; Par conséquent, il convient également s’il y a des données manquantes. Vous ne trouvez pas t Stat sans beaucoup d’efforts, car vous devez examiner avant et après les données en même temps.

Toutefois, vous pouvez trouver de corrélation de Pearson en appliquant PEARSON ou coefficient pour les plages de deux données. Ces fonctions Excel charge les données manquantes correctement. En outre, vous pouvez trouver les probabilités de t (unilatéral) et bilatéral associées aux données en appelant la fonction TTEST d’Excel qui gère correctement les données manquantes. Pour les probabilités d’unilatérale et bilatérale d’expérience 3, vous pouvez appeler la fonction TTEST (E3:E13, F3:F13, 1, 1) et la fonction TTEST (E3:E13, F3:F13, 2, 1) respectivement. Vous pourriez également vérifier que les résultats de ces fonctions correspondent à ceux de l’outil dans l’essai 1, où l’outil se comporte correctement car il n’y a aucuns données manquants. Les appels correspondants pour Essai 1 sont Student (A3:A13, B3:B13, 1, 1) et la fonction TTEST (A3:A13, B3:B13, 2, 1) respectivement.

Pour les chutes critiques, vous devez établir le nombre de degrés de liberté. Dans les essais 1, 2 et 3, les numéros corrects de degrés de liberté sont dix, neuf et huit respectivement. Ces chiffres sont toujours un inférieur au nombre de sujets utiles dans vos données sans manquant avant ou après les mesures. Pour expérimenter 3, par exemple, vous pourrait entrer dans la cellule J3, = IF(OR(ISBLANK(E3), ISBLANK(F3)), 0, 1), puis recopier vers le bas de cette formule dans les cellules J4:J13 et rechercher le df en entrant dans la cellule J14 : =SUM(J3:J13) – 1.

Après avoir établi le df, vous pouvez utiliser la fonction TINV d’Excel. Avec le niveau d’importance 0,05, les appels des essais 1, 2 et 3 est la fonction TINV (0,05, 10), la fonction TINV (0,05, 9) et la fonction TINV (0,05, 8) respectivement. Il renvoie les valeurs « t Critical bilatéral ». Pour obtenir les « t unilatéral valeurs critiques », vous utilisez les appels analogues avec le niveau d’importance a doublé, comme la fonction TINV (0,10, 10), la fonction TINV (0,10, 9) et la fonction TINV (0,10, 8) respectivement.

Conclusions

N’utilisez pas l’utilitaire d’analyse t-Test Paired deux échantillons outil, sauf si vous pouvez vous assurer qu’il n’y a aucun point de données manquant. Cet article décrit des suggestions pour la duplication de la plupart des fonctionnalités de l’outil à l’aide de fonctions Excel, au lieu de l’utilitaire d’analyse.

L’outil fournit également l’induire en erreur « P (T < = t) » étiquettes. Cet article explique les interprétations correctes.
Propriétés

ID d'article : 829252 - Dernière mise à jour : 27 janv. 2017 - Révision : 1

Commentaires