Μπορείτε να αποκτήσετε λανθασμένα αποτελέσματα και τις ετικέτες παραπλανητικό κατά τη χρήση του πακέτου εργαλείων ανάλυσης t-Test στο Excel

Σύνοψη

Αυτό το άρθρο περιγράφει το πακέτο εργαλείων ανάλυσης t-Test που ονομάζεται το ζεύγος δύο υποδείγματα για το εργαλείο μέσα. Αυτό το εργαλείο δεν έχει αλλάξει για το Microsoft Office Excel 2003 και για νεότερες εκδόσεις του Excel. Ωστόσο, αυτό το εργαλείο παρέχει ελαττωματικό αποτελέσματα όταν δεν υπάρχουν δεδομένα που λείπουν. Επιπλέον, έστω και δεν λείπουν δεδομένα, υπάρχουν παραπλανητικό ετικετών στα δεδομένα εξόδου του εργαλείου.

Microsoft Excel 2004 για Macintosh πληροφορίες

Τις στατιστικές συναρτήσεις στο Excel 2004 για Mac ενημερώθηκαν χρησιμοποιώντας το ίδιο αλγορίθμων που χρησιμοποιούνται για να ενημερώσετε τις στατιστικές συναρτήσεις στο Excel 2003 και σε νεότερες εκδόσεις του Excel. Οι πληροφορίες σε αυτό το άρθρο που περιγράφει πώς λειτουργεί μια συνάρτηση ή τον τρόπο τροποποίησης μιας συνάρτησης για το Excel 2003 και για νεότερες εκδόσεις του Excel εφαρμόζεται επίσης σε Excel 2004 για Mac.

Περισσότερες πληροφορίες

Συνήθως, εφαρμόζετε το ζεύγος δύο υποδείγματα Έλεγχος t (μερικές φορές ονομάζεται το ταιριάζουν ζεύγη t-Test) όταν έχετε πριν και μετά από τις μετρήσεις στην ίδια πειράματα για επεξεργασία. Για παράδειγμα, ενδέχεται να μπορείτε να μετρήσετε ένα θέμα βάρους πριν και μετά από ένα σχέδιο δίαιτας 30 ημερών.

Συνήθως, μπορείτε να απαλλαγείτε από δεδομένα με βάση οποιοδήποτε θέμα του οποίου πριν μέτρησης ή μετά τη μέτρηση λείπει. Ατελή δεδομένα σχετικά με ένα θέμα καθιστά άχρηστες πληροφορίες σχετικά με αυτό το θέμα. Δυστυχώς, αυτό το εργαλείο πακέτου εργαλείων ανάλυσης συμπεριφέρεται διαφορετικά από την τυπική πρακτική. Πρώτα, αυτό το εργαλείο πακέτου εργαλείων ανάλυσης υπολογίζει τον αριθμό των θεμάτων με πριν από τις μετρήσεις και τον αριθμό των θεμάτων με μετά από μετρήσεις. Εάν αυτά τα αθροίσματα είναι διαφορετικά, λαμβάνετε ένα μήνυμα λάθους και δεν συνεχίζει αυτό το εργαλείο πακέτου εργαλείων ανάλυσης. Επομένως, για παράδειγμα, εάν υπάρχουν 49 θέματα που όλοι έχουν πριν και μετά τις μετρήσεις και ένα fiftieth θέματος που έχει μόνο μια μέτρηση πριν, το εργαλείο πακέτο εργαλείων ανάλυσης δεν ανάλυσης.

Εάν ο αριθμός των θεμάτων που λείπουν πριν από τα δεδομένα ισούται με τον αριθμό των θεμάτων που λείπουν μετά την δεδομένων και αυτός ο αριθμός είναι θετικός, το εργαλείο εκτελεί μια ακατάλληλη ανάλυση. Για παράδειγμα, ας υποθέσουμε ότι υπάρχουν θέματα 50. Θέμα Α λείπει μια μέτρηση πριν, και Β θέμα λείπει μια μέτρηση μετά και άλλα θέματα 48 έχετε λείπουν δεδομένα. Το εργαλείο υπολογίζει 49 πριν από τις μετρήσεις και 49 μετά μετρήσεων, και το εργαλείο λειτουργεί όπως όταν υπάρχουν 49 θέματα χωρίς δεδομένα που λείπουν. Αυτό παραβιάζει εξαλείφοντας οποιοδήποτε θέμα που λείπει μια τιμή πριν ή μια τιμή μετά το σκοπό. Ο αριθμός των προσώπων στα οποία αναφέρονται σε αυτό το παράδειγμα, θα πρέπει να είναι 48, 49 δεν. Επομένως, το εργαλείο χρησιμοποιεί λανθασμένο αριθμό των βαθμών ελευθερίας. Επιπλέον, επειδή το εργαλείο απορρίπτει του Α κανένα θέμα μετά τη μέτρηση ούτε του θέματος Β πριν από τη μέτρηση, αυτές οι δύο μετρήσεις να συμπεριλαμβάνονται στους υπολογισμούς του δείγματος μέσα που χρησιμοποιούνται για τη στατιστική τιμή t. Επομένως, αυτές υπολογισθεί δειγμάτων είναι ακατάλληλη.

Στη σύνοψη, είναι ακατάλληλο για να χρησιμοποιήσετε το εργαλείο όταν υπάρχει ελλιπή δεδομένα, επειδή το εργαλείο είτε θα δεν υπολογίζει ή θα τον υπολογισμό με ακατάλληλο τύπους. Τελευταία περίπτωση παρουσιάζεται όταν ο αριθμός των θεμάτων με λείπουν πριν από τα δεδομένα ισούται με τον αριθμό των θεμάτων με λείπουν μετά την δεδομένων.

Το παράδειγμα στην ενότητα "Παράδειγμα της χρήσης" αυτού του άρθρου παρουσιάζει αυτά τα προβλήματα και επίσης σημεία αναφέρονται συγκεχυμένες ετικέτες στην έξοδο του εργαλείου. Στην ενότητα "Εναλλακτικός τρόπος αντιμετώπισης" αυτού του άρθρου προτείνει μια λύση σε περίπτωση όπου δεν μπορεί να επαληθεύσει την απουσία ελλιπή δεδομένα πριν να χρησιμοποιήσετε το εργαλείο.

Παράδειγμα χρήσης

Για να απεικονίσει το πρόβλημα των δεδομένα που λείπουν, δημιουργήστε ένα κενό φύλλο εργασίας του Excel και στη συνέχεια αντιγράψτε τον παρακάτω πίνακα. Επιλέξτε το κελί A1 στο κενό φύλλο εργασίας του Excel και στη συνέχεια επικολλήστε τις εγγραφές έτσι ώστε ο πίνακας γεμίζει A1:I52 κελιά στο φύλλο εργασίας σας.
Πείραμα 1Πείραμα 2Πείραμα 3Τροποποιηθεί για να καταργηθεί το πείραμα 3
πριν από τηνμετά απόπριν από τηνμετά απόπριν από τηνμετά απότα θέματα με τα δεδομένα που λείπουν
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
Η συμπεριφορά της δοκιμής t που πλευράς 2
=TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
Εργαλείο ATP για πείραμα 1:
t-Test: ζεύγος δύο υποδείγματα για μέση
Μεταβλητή 1Μεταβλητή 2
Μέση τιμή150144.090909090909
Διακύμανση1100914.090909090909
Παρατηρήσεις1111
Συσχέτισης Pearson0.952384533866487
Υποτιθέμενη διαφορά μέσων0
DF10
t Stat1.92092590483801
P (T < = t) μονόπλευρη0.0418403929085198
t Μονόπλευρη κρίσιμη1.81246110219722
P (T < = t) Αμφίπλευρη0.0836807858170396
t κρίσιμη2.22813884242587
Εργαλείο ATP για πείραμα 2:
Δεν θα υπολογίσει εξαιτίας άνισο αριθμούς datapoints
Εργαλείο ATP για πείραμα 3:
t-Test: ζεύγος δύο υποδείγματα για μέση
Μεταβλητή 1Μεταβλητή 2
Μέση τιμή151148.5
Διακύμανση1210778.055555555556
Παρατηρήσεις1010
Συσχέτισης Pearson0.936537537274845
Υποτιθέμενη διαφορά μέσων0
DF9
t Stat0.141327169509421
P (T < = t) μονόπλευρη0.445362157564494
t Μονόπλευρη κρίσιμη1.83311292255007
P (T < = t) Αμφίπλευρη0.890724315128988
t κρίσιμη2.26215715817358
Αφού ο πίνακας επικολλούνται στο φύλλο εργασίας του Excel, κάντε κλικ στο κουμπί Επιλογές επικόλλησης και, στη συνέχεια, κάντε κλικ στην επιλογή Συμφωνία μορφοποίησης προορισμού. Με την επιλεγμένη περιοχής επικόλλησης, χρησιμοποιήστε μία από τις ακόλουθες διαδικασίες, ανάλογα με την έκδοση του Excel που εκτελείτε:
  • Στο Microsoft Office Excel 2007, κάντε κλικ στην καρτέλα " κεντρική σελίδα ", κάντε κλικ στο κουμπί " μορφή " στην ομάδα " κελιά " και στη συνέχεια κάντε κλικ στο κουμπί Αυτόματη Προσαρμογή πλάτους στήλης.
  • Στο Excel 2003, επιλέξτε στήλη από το μενού " μορφή" και, στη συνέχεια, κάντε κλικ στην επιλογή Αυτόματη προσαρμογή επιλογής.
Μπορείτε να χρησιμοποιήσετε το φύλλο εργασίας για να συγκρίνετε τα αποτελέσματα της συνάρτησης TTEST του Excel με το εργαλείο πακέτου εργαλείων ανάλυσης. Πείραμα 1 δείχνει πλήρη δεδομένα σχετικά με θέματα έντεκα. Η τιμή της συνάρτησης TTEST στο κελί A16 είναι η πιθανότητα ότι της στατιστικής τιμής t θα είναι μεγαλύτερη από την παρατηρούμενη τιμή, με την προϋπόθεση ότι μια κατανομή t με δέκα βαθμούς ελευθερίας. Η τιμή αυτή, 0.837, εμφανίζεται επίσης στην έξοδο του εργαλείου στο κελί B32. Πρέπει να διαβάσετε την ετικέτα στο κελί A32 "P (T > = | t |) δεν Αμφίπλευρη"," P (T < = t) Αμφίπλευρη ", αλλά η αριθμητική απάντηση είναι σωστή, επειδή δεν λείπουν δεδομένα στο πείραμα 1. Ομοίως, πρέπει να διαβάσετε την ετικέτα στο κελί A30 "P (T > = | t |) όχι μονόπλευρη"," P (T < = t) μονόπλευρη ". Η "Μονόπλευρη κρίσιμη" cutoffs είναι σωστές. Αντιστοιχούν στο προεπιλεγμένο επίπεδο σημαντικότητας, 0.05, και χρησιμοποιούν τον σωστό αριθμό βαθμών ελευθερίας, 10.

Πείραμα 2 έχει μία λείπουν μετά τη μέτρηση σε ένα θέμα και δεν υπάρχουν άλλα δεδομένα που λείπουν. Το εργαλείο αρνείται να υπολογίσετε. Οι τιμές της συνάρτησης TTEST στα κελιά A16 και A17 είναι η ίδια. Στο κελί A16, χρησιμοποιείται το C3:D13 περιοχή κελιών δεδομένων; Αυτό περιλαμβάνει το τελευταίο θέμα, ο μόνος με δεδομένα που λείπουν. Στο κελί A17, χρησιμοποιείται το C3:D12 περιοχή κελιών δεδομένων; Αυτό αντιστοιχεί σε ένα πείραμα με τα δέκα πρώτα θέματα και δεν λείπουν δεδομένα. Το γεγονός ότι τα αποτελέσματα είναι τα ίδια δηλώνει ότι όταν καλείται η συνάρτηση TTEST στο κελί A16, το συνάρτηση TTEST απορρίπτει κατάλληλα το θέμα με τα δεδομένα που λείπουν.

Πείραμα 3 έχει λείπει μία πριν από τη μέτρηση και λείπει η μία μετά τη μέτρηση σε δύο διαφορετικά θέματα. Τροποποιηθεί το πείραμα 3 δείχνει τα εννέα υπόλοιπα θέματα χωρίς δεδομένα που λείπουν. Τα αποτελέσματα της συνάρτησης TTEST στα κελιά κελί E16 και E17 είναι τα ίδια. Στο κελί κελί E16, TTEST ονομάζεται στα δεδομένα πείραμα 3 E3:F13 κελιών. Στο κελί E17, TTEST ονομάζεται στα δεδομένα 3 πείραμα τροποποιηθεί G3:H11 κελιών. Τα αποτελέσματα είναι τα ίδια, επειδή η συνάρτηση TTEST κατάλληλα απορρίπτει την έβδομη και ενδέκατη θέματα στο πείραμα 3, τα δύο με δεδομένα που λείπουν. Εάν εξετάζετε το εργαλείο εξόδου για το πείραμα 3, ο αριθμός των πριν και μετά από παρατηρήσεων στα κελιά B44 και C44 είναι δέκα σε κάθε περίπτωση. Είναι εύκολο να βεβαιωθείτε ότι SUM(E3:E13) είναι 1510 και SUM(F3:F13) είναι 1485; επειδή υπάρχουν 10 παρατηρήσεις σε κάθε περιοχή, τις αντίστοιχες μέσες είναι 151 και 148.5, εμφανίζονται στα κελιά B42 και C42. Επομένως, το εργαλείο δεν έχει απορρίψει οποιαδήποτε θέματα και έχει συμπεριλάβει τη μέτρηση μετά για το έβδομο θέμα και η μέτρηση πριν για το θέμα ενδέκατη με την ανάλυσή τους. Ο αριθμός των βαθμών ελευθερίας στο κελί b 47 είναι ακατάλληλη, επειδή πρέπει να υπήρξαν εννέα αντικείμενα και οκτώ df. Με αυτόν τον τρόπο για εσφαλμένες καταχωρήσεις αποκοπής τιμών στα κελιά B50 και B52 (μαζί με παραπλανητικό ετικέτες για τις εγγραφές στα κελιά A50 και A52.)

Αποτελέσματα σε όλες τις εκδόσεις του Excel

Δυστυχώς, το εργαλείο αυτό διορθώθηκε δεν για το Excel 2003 και για νεότερες εκδόσεις του Excel.

Προτεινόμενη λύση για όλες τις εκδόσεις του Excel

Μπορείτε να απαλλαγείτε από τα υποκείμενα με ελλιπή δεδομένα πριν να χρησιμοποιήσετε το εργαλείο. Ωστόσο, δεν μπορείτε να επεξεργαστείτε το φύλλο εργασίας του Excel με αυτόν τον τρόπο. Μια διαδικασία για την εξάλειψη θέματα με τα δεδομένα που λείπουν εμφανίζεται στα παρακάτω βήματα. Για να απαλλαγείτε από τα θέματα με τα δεδομένα που λείπουν, ακολουθήστε τα εξής βήματα:
  1. Αντιγράψτε τα δεδομένα δύο περιοχές σε μια νέα περιοχή του φύλλου εργασίας.
  2. Εξετάστε τα δεδομένα προς τα επάνω από το κοινό κάτω από τις δύο περιοχές.
    1. Εάν η γραμμή κάτω περιέχει δεδομένα που λείπουν, απενεργοποιήστε την κάτω γραμμή. Αυτό μειώνει την περιοχή δεδομένων. Μεταβείτε στο βήμα 3.
    2. Προσδιορισμός γραμμής r πάνω από την κάτω γραμμή, αλλά πλησιέστερα προς τα κάτω με ελλιπή δεδομένα.
      1. Αντιγράψτε όλα τα δεδομένα κάτω από γραμμή r.
      2. Επιλέξτε γραμμή r και, στη συνέχεια, να επικολλήσετε αντιγραμμένα δεδομένα σε αυτό.
      3. Απενεργοποιήστε την κάτω γραμμή δεδομένων (ο οποίος τώρα αναπαράγει την επόμενη στην τελευταία γραμμή δεδομένων). Αυτό μειώνει την περιοχή δεδομένων.
  3. Επαναλάβετε το βήμα 2 έως ότου δεν λείπουν δεδομένα παραμένουν.
Σημείωση Μπορείτε να χρησιμοποιήσετε το εργαλείο, εάν μπορείτε να είστε βέβαιοι ότι δεν υπάρχουν δεν λείπουν παρατηρήσεων.

Μπορείτε να διπλασιάσετε πολλά, αλλά όχι όλους του εργαλείου έξοδο του χωρίς μετατροπή των δεδομένων. Δεν μπορείτε να βρείτε κατάλληλες τιμές για τη μέση απόκλιση και παρατηρήσεων χωρίς μεγάλη προσπάθεια. Το εργαλείο εντοπίσει ακατάλληλες τιμές εξετάζοντας το πριν και μετά από δεδομένα ξεχωριστά. Το εργαλείο df είναι η κοινή τιμή των παρατηρήσεων μείον ένα. Επομένως, είναι επίσης ακατάλληλη εάν υπάρχουν δεδομένα που λείπουν. Δεν μπορείτε να βρείτε t Stat χωρίς μεγάλη προσπάθεια, επειδή πρέπει να εξετάσετε πριν και μετά από δεδομένα ταυτόχρονα.

Ωστόσο, μπορείτε να βρείτε συσχέτισης Pearson εφαρμόζοντας PEARSON ή CORREL τα δεδομένα δύο περιοχές. Και οι δύο αυτές τις συναρτήσεις του Excel χειρίζεται κατάλληλα δεδομένα που λείπουν. Επίσης, μπορείτε να βρείτε τις πιθανότητες μονόπλευρη και Αμφίπλευρη t που σχετίζεται με τα δεδομένα από την κλήση της συνάρτησης TTEST του Excel, το οποίο χειρίζεται κατάλληλα δεδομένα που λείπουν. Για τις πιθανότητες μονόπλευρη και δίπλευρη πείραμα 3, μπορεί να καλέσετε TTEST (E3:E13, F3:F13, 1, 1) και η συνάρτηση TTEST (E3:E13, F3:F13, 2, 1) αντίστοιχα. Μπορείτε επίσης να επαληθεύσετε ότι τα αποτελέσματα αυτών των συναρτήσεων συμφωνούν με εκείνα του εργαλείου στο πείραμα 1, όπου το εργαλείο κατάλληλα συμπεριφέρεται επειδή υπάρχουν δεδομένα λείπουν. Το αντίστοιχο κλήσεις για 1 πείραμα είναι συνάρτηση TTEST (A3:A13, B3:B13, 1, 1) και η συνάρτηση TTEST (A3:A13, B3:B13, 2, 1) αντίστοιχα.

Για την κρίσιμη cutoffs, πρέπει να ορίσετε τον αριθμό των βαθμών ελευθερίας. Στα πειράματα, 1, 2 και 3, τους σωστούς αριθμούς των βαθμών ελευθερίας είναι δέκα, εννέα και οκτώ αντίστοιχα. Αυτοί οι αριθμοί είναι πάντα ένα μικρότερο από τον αριθμό των χρήσιμα θέματα στα δεδομένα σας, χωρίς να χάσετε πριν ή μετά από τις μετρήσεις. Για πείραμα 3, για παράδειγμα, μπορείτε να εισαγάγετε στο κελί J3, = IF(OR(ISBLANK(E3), ISBLANK(F3)), 0, 1), στη συνέχεια, συμπλήρωση των αυτόν τον τύπο στα κελιά J4:J13 και βρείτε df, πληκτρολογώντας στο κελί J14 st?: =SUM(J3:J13) – 1.

Αφού πραγματοποιήσετε df, μπορείτε να χρησιμοποιήσετε τη συνάρτηση TINV του Excel. Με επίπεδο σημαντικότητας 0,05, οι κλήσεις για πειράματα, 1, 2 και 3 θα είναι η συνάρτηση TINV (0.05, 10), η συνάρτηση TINV (0.05, 9) και η συνάρτηση TINV (0.05, 8) αντίστοιχα. Αυτά θα επιστρέψει τις τιμές "t κρίσιμη". Για να πάρετε το "t κρίσιμη μονόπλευρη τιμές", μπορείτε να χρησιμοποιήσετε την ανάλογη κλήσεις με το επίπεδο σημαντικότητας διπλασιάζεται, όπως η συνάρτηση TINV (0.10, 10), η συνάρτηση TINV (0.10, 9) και η συνάρτηση TINV (0.10, 8) αντίστοιχα.

Συμπεράσματα

Μην χρησιμοποιείτε το πακέτο εργαλείων ανάλυσης t-Test δύο ζεύγη δειγμάτων για το εργαλείο μέσα εκτός και αν μπορείτε να βεβαιωθείτε ότι δεν υπάρχουν δεν λείπουν σημείων δεδομένων. Αυτό το άρθρο περιγράφει τις προτάσεις για την αναπαραγωγή τις περισσότερες λειτουργίες του εργαλείου, χρησιμοποιώντας συναρτήσεις του Excel, αντί για το πακέτο εργαλείων ανάλυσης.

Το εργαλείο παρέχει επίσης παραπλανητικό "P (T < = t)" ετικέτες. Αυτό το άρθρο περιγράφει τη σωστή ερμηνείες.
Ιδιότητες

Αναγνωριστικό άρθρου: 829252 - Τελευταία αναθεώρηση: 17 Ιαν 2017 - Αναθεώρηση: 1

Σχόλια