يمكنك الحصول على نتائج غير صحيحة ومضللة تسميات عند استخدام الاختبار t Analysis ToolPak في Excel

ملخص

توضح هذه المقالة Analysis ToolPak الاختبار t يسمى "ازدواج عينتين" لأداة يعني. لم يتم تغيير هذه الأداة لبرنامج Microsoft Office Excel 2003 والإصدارات اللاحقة من Excel. إلا أن هذه الأداة يعطي نتائج خاطئة عندما بيانات مفقودة. بالإضافة إلى ذلك، سواء كانت هناك بيانات مفقودة، أو لا توجد تسميات مضللة في إخراج الأداة.

Microsoft Excel 2004 للحصول على معلومات ماكنتوش

تم تحديث الدالات الإحصائية في Excel 2004 ل Mac باستخدام خوارزميات نفسها التي تم استخدامها لتحديث الدالات الإحصائية في Excel 2003 والإصدارات اللاحقة من Excel. أي تنطبق المعلومات في هذه المقالة تتناول كيفية عمل دالة أو كيفية تعديل دالة لبرنامج Excel 2003 والإصدارات اللاحقة من Excel إلى Excel 2004 لنظام التشغيل mac.

مزيد من المعلومات

عادة، يمكنك تطبيق الاختبار t "ازدواج عينتين" (تسمى في بعض الأحيان الاختبار t أزواج متطابقة) عندما يكون لديك قبل وبعد القياسات على التجارب نفسها لمعاملة. على سبيل المثال، يمكنك قياس الوزن للموضوع قبل وبعد خطة النظام غذائي 30 يوما.

بشكل عام، يمكنك التخلص من البيانات على أي موضوع الذين قبل القياس أو بعد القياس مفقود. بيانات غير كاملة لموضوع يجعل معلومات عن هذا الموضوع غير مجدية. لسوء الحظ، هذه الأداة Analysis ToolPak سلوك مختلف الممارسات النموذجية. أولاً، تحسب هذه الأداة Analysis ToolPak عدد الموضوعات مع قبل القياسات والعدد من الموضوعات مع بعد القياسات. في حالة اختلاف هذه المجاميع، تتلقى رسالة إعلام بخطأ وعدم متابعة هذه الأداة Analysis ToolPak. لذلك، على سبيل المثال، إذا كانت هناك موضوعات 49 لديهم كافة قبل وبعد القياسات وخمسين الموضوع يمكنه فقط قياس قبل، أداة Analysis ToolPak لا التحليل.

إذا كان عدد المواضيع مفقود قبل البيانات يساوي عدد المواضيع التي مفقودة بعد بيانات وهذا الرقم الموجب، تقوم الأداة بتنفيذ تحليل غير مناسبة. على سبيل المثال، افترض أن هناك موضوعات 50. يفتقد موضوع قياس قبل، ويفتقد "ب الموضوع" مقياس بعد 48 مواضيع أخرى تحتوي على أية بيانات مفقودة. تحسب الأداة 49 قبل القياسات و 49 بعد القياسات؛ تعمل الأداة كما لو كانت هناك 49 الموضوعات مع أية بيانات مفقودة. ينتهك هذا القصد الخاص المتمثل في القضاء على أي موضوع الذين قيمة قبل أو قيمة بعد مفقود. يجب أن يكون عدد المواضيع الموجودة في هذا المثال 48 لا 49. لذلك، تستخدم الأداة عدد غير صحيح من درجات الحرية. بالإضافة إلى ذلك، لأنه يتجاهل الأداة الخاص بهذا الموضوع لا بعد القياس لا "ب الموضوع" قبل القياس، يتم تضمين هذه القياسات اثنين في حسابات أوساط العينة المستخدمة في إحصائية t. لذلك، حساب هذه أوساط غير ملائمة.

وباختصار، من غير الملائم لاستخدام الأداة عندما يكون هناك فقدان البيانات، لأنه أما الأداة سيتم حساب أو أنه سيتم حساب مع الصيغ غير مناسبة. وفي الحالة الأخيرة عند عدد الموضوعات مع مفقود قبل البيانات يساوي عدد الموضوعات مع مفقود بعد البيانات.

يوضح المثال في المقطع "مثال لاستخدام" من هذه المقالة هذه المشاكل وأيضا تشير إلى الخلط بين التسميات في إخراج الأداة. يقترح قسم "الحل البديل" من هذه المقالة حلاً بديلاً في حالة حيث لا يمكنك التحقق من عدم فقدان البيانات قبل استخدام الأداة.

مثال للاستخدام

لتوضيح مشكلة فقدان البيانات، إنشاء ورقة عمل Excel فارغة، وقم بنسخ الجدول التالي. حدد الخلية A1 في ورقة عمل Excel فارغة ثم قم بلصق الإدخالات حيث يملأ الجدول A1:I52 الخلايا في ورقة العمل الخاصة بك.
تجربة 1تجربة 2تجربة 3تعديل لإزالة تجربة 3
قبلبعدقبلبعدقبلبعدالموضوعات مع فقدان البيانات
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
سلوك اختبار t الطرف 2
=TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
أداة ATP للتجربة 1:
اختبار t: ازدواج عينتين للوسائل
المتغير 1متغير 2
يعني150144.090909090909
تباين1100914.090909090909
الملاحظات1111
ارتباط Pearson0.952384533866487
فرق المتوسط العينة0
مدافع10
t Stat1.92092590483801
P (T < = t) واحد خلفي0.0418403929085198
t التحديثات الضرورية واحد خلفي1.81246110219722
P (T < = t) الاثنين الذيل0.0836807858170396
t حرجة اثنين الذيل2.22813884242587
أداة ATP للتجربة 2:
سوف يقوم بحساب عدد نقاط البيانات غير متساوية
أداة ATP لتجربة 3:
اختبار t: ازدواج عينتين للوسائل
المتغير 1متغير 2
يعني151148.5
تباين1210778.055555555556
الملاحظات1010
ارتباط Pearson0.936537537274845
فرق المتوسط العينة0
مدافع9
t Stat0.141327169509421
P (T < = t) واحد خلفي0.445362157564494
t التحديثات الضرورية واحد خلفي1.83311292255007
P (T < = t) الاثنين الذيل0.890724315128988
t حرجة اثنين الذيل2.26215715817358
بعد لصق الجدول في ورقة عمل Excel، انقر فوق الزر خيارات اللصق ، ومن ثم انقر فوق تطابق تنسيق الوجهة. مع استمرار تحديد النطاق الذي تم لصقه، استخدم أحد الإجراءات التالية، بما يتناسب مع إصدار Excel الذي تقوم بتشغيله:
  • في Microsoft Office Excel 2007، انقر فوق علامة التبويب الصفحة الرئيسية ، انقر فوق تنسيق ، في المجموعة خلايا ، وثم انقر فوق احتواء تلقائي لعرض العمود.
  • في Excel 2003، أشر إلى عمود في قائمة " تنسيق"، ومن ثم انقر فوق احتواء تلقائي للتحديد.
يمكنك استخدام ورقة العمل لمقارنة نتائج الدالة Excel TTEST باستخدام أداة Analysis ToolPak. يوضح تجربة 1 بيانات كاملة عن المواضيع الأحد عشر. هو قيمة TTEST في الخلية A16 احتمال إحصائية t أن أكبر من القيمة التي تمت ملاحظتها، مع افتراض توزيع t بعشر درجات الحرية. يتم عرض هذه القيمة 0.837، أيضا في إخراج الأداة في الخلية B32. التسمية في الخلية A32 كما يلي: "P (T > = | t |) عدم انتشار الذيل "،" P (T < = t) ذيل اثنين "، ولكن كانت الإجابة رقمية صحيحة لأنه لا توجد أية بيانات مفقودة في التجربة 1. وبالمثل، ينبغي عليك قراءة التسمية في الخلية A30 "P (T > = | t |) عدم واحد-وذيل "،" P (T < = t) خلفي واحد ". قطع "t" حرجة "بشكل صحيح. تناظر الافتراضية مستوى الأهمية 0.05، ويستخدمون عدد درجات الحرية، 10 الصحيح.

يحتوي تجربة 2 مفقودة واحدة بعد القياس على موضوع واحد فقط وليس البيانات المفقودة. يرفض الأداة لحساب. قيم TTEST في الخلايا A16 و A17 هي نفسها. في الخلية A16، يتم استخدام C3:D13 نطاق الخلية البيانات; يتضمن هذا الموضوع الأخير، واحد فقط مع بيانات مفقودة. في الخلية A17، يتم استخدام C3:D12 نطاق الخلية البيانات; هذا يناظر تجربة مع المواضيع العشرة الأولى ولا توجد بيانات مفقودة. حقيقة أن النتائج هي نفسها تشير إلى أنه عندما يتم استدعاء TTEST في الخلية A16 TTEST مناسب يتجاهل الموضوع مع بيانات مفقودة.

له تجربة 3 مفقودة واحدة قبل القياس وفقد آخر بعد القياس على موضوعين مختلفة. يوضح تجربة 3 تعديل بقية المواد التسعة بأية بيانات مفقودة. نتائج TTEST في الخلايا E16 و E17 هي نفسها. في الخلية E16 يسمى TTEST البيانات 3 التجربة الموجودة في الخلايا E3:F13. في الخلية E17 يسمى TTEST على 3 التجربة تعديل البيانات في الخلايا G3:H11. النتائج هي نفسها سبب TTEST يتجاهل مواضيع السابع والحادي عشر في التجربة 3، الاثنين مع فقدان البيانات على النحو المناسب. فحص إخراج الأداة لتجربة 3، العدد من قبل وبعد الملاحظات في الخلايا B44 و C44 حالة عشرة في كل حالة. من السهل التحقق من SUM(E3:E13) 1510 وهو SUM(F3:F13) 1485؛ نظراً لوجود 10 الملاحظات في كل نطاق، هي الوسائل المعنية 151 و 148.5 المعروضة في الخلايا B42 و C42. لذلك، عدم تجاهل أي مواضيع الأداة وشمل قياس بعد للموضوع السابع وقياس قبل الحادي عشر في الموضوع في تحليله. عدد درجات الحرية في الخلية B47 غير مناسب، لأنه كان ينبغي تسعة مواضيع وثمانية مدافع. وهذا يجعل للإدخالات غير الصحيحة من الانقطاع القيم في الخلايا B50 و B52 (بالإضافة إلى مضللة تسميات لهذه الإدخالات في الخلايا A50 و A52.)

النتائج في كافة إصدارات Excel

لسوء الحظ، لم تم تصحيح هذه الأداة لبرنامج Excel 2003 والإصدارات اللاحقة من Excel.

الحل المقترح لكافة إصدارات Excel

يمكنك التخلص من الموضوعات مع فقدان البيانات قبل استخدام الأداة. ومع ذلك، قد لا تحتاج إلى تحرير ورقة عمل Excel بهذه الطريقة. إجراء واحد للتخلص من الموضوعات مع فقدان البيانات الموضحة في الخطوات التالية. للتخلص من الموضوعات مع فقدان البيانات، اتبع هذه الخطوات:
  1. نسخ نطاقات بيانات إلى منطقة جديدة من ورقة العمل الخاصة بك.
  2. مسح البيانات من أسفل العامة النطاقين الأعلى.
    1. إذا احتوى الصف السفلي على فقدان البيانات، قم بإلغاء تحديد الصف السفلي. وهذا يقلل نطاق البيانات. انتقل إلى الخطوة 3.
    2. تعريف صف r أعلى الصف السفلي، لكن الأقرب إلى الأسفل مع فقد بيانات.
      1. نسخ كافة البيانات الموجودة أسفل الصف r.
      2. حدد r صف ثم قم بلصق البيانات المنسوخة فيه.
      3. قم بإلغاء تحديد الصف السفلي للبيانات (التي ستقوم الآن بتكرار بجوار صف البيانات الأخير). وهذا يقلل نطاق البيانات.
  3. كرر الخطوة 2 حتى لا تبقى البيانات المفقودة.
ملاحظة: يمكنك استخدام الأداة إذا كنت تضمن أن هناك أية ملاحظات مفقودة.

يمكنك تكرار الكثير ولكن ليس كل أداة إخراج دون تحويل البيانات. تعذر العثور على القيم المناسبة للوسط وتباين الملاحظات دون كثير من الجهد. عثور الأداة على قيم غير مناسبة عن طريق فحص قبل وبعد البيانات بشكل منفصل. مدافع الأداة القيمة العامة الملاحظات ناقص واحد؛ لذلك، كما أنها غير ملائمة إذا كان هناك بيانات مفقودة. لا يمكن العثور على t Stat دون كثير من الجهد، لأنه يجب عليك فحص قبل وبعد البيانات في نفس الوقت.

ومع ذلك، يمكنك العثور على ارتباط Pearson بتطبيق معامل PEARSON أو CORREL إلى نطاقات البيانات. كل من هذه الدالات Excel معالجة فقدان البيانات بشكل مناسب. أيضا، يمكنك العثور على احتمالات خلفي واحد واثنين ذيل t المقترنة بالبيانات عن طريق استدعاء الدالة TTEST excel، على النحو المناسب بمعالجة بيانات مفقودة. لاحتمالات أحادي الطرف وثنائي الطرف في تجربة 3، يمكن أن نسميه TTEST (E3:E13، F3:F13، 1, 1) و TTEST (E3:E13، F3:F13، 2, 1) على التوالي. يمكن أيضا التحقق من أن نتائج هذه الدالات متوافقة مع تلك الأداة في "التجربة الأولى"، حيث يتصرف الأداة بشكل مناسب لأنه ليست هناك بيانات مفقودة. المكالمات المقابلة "التجربة الأولى" هي TTEST (A3:A13، B3:B13، 1, 1) و TTEST (A3:A13، B3:B13، 2, 1) على التوالي.

قطع هامة، يجب عليك تأسيس عدد درجات الحرية. في تجربة 1 و 2 و 3، الأرقام الصحيحة لدرجات الحرية تسعة عشر وثمانية على التوالي. تكون هذه الأرقام دائماً أحد أقل من عدد المواضيع مفيدة في البيانات دون مفقود قبل أو بعد القياسات. لتجربة 3، على سبيل المثال، يمكنك يمكن إدخال في خلية J3، = IF(OR(ISBLANK(E3)، ISBLANK(F3))، 0, 1)، ثم تعبئة لأسفل هذه الصيغة في الخلايا J4:J13 وإيجاد مدافع عن طريق إدخال في الخلية J14: =SUM(J3:J13)-1.

بعد تأسيس df، يمكنك استخدام الدالة TINV من Excel. مع مستوى الأهمية 0.05، تدعو التجارب 1 و 2 و 3 سيكون TINV (0.05, 10) و TINV (0.05, 9) TINV (0.05, 8) على التوالي. هذه بإرجاع قيم "t حرجة ذيل اثنين". للحصول على "t خلفي واحد القيم الحرجة"، يجب أن تستخدم مكالمات مماثلة مع مستوى الأهمية مضاعفة، مثل TINV (0.10, 10) و TINV (0.10, 9) TINV (0.10, 8) على التوالي.

الاستنتاجات

لا تستخدم Analysis ToolPak الاختبار t الزوجي عينتين لأداة يعني ما لم يمكن التأكد من عدم وجود لم نقاط البيانات المفقودة. توضح هذه المقالة اقتراحات لتكرار معظم وظائف الأداة باستخدام دالات Excel، بدلاً من Analysis ToolPak.

توفر الأداة أيضا مضللة "P (T < = t)" تسميات. توضح هذه المقالة تفسيرات الصحيح.
خصائص

رقم الموضوع: 829252 - آخر مراجعة: 15‏/01‏/2017 - المراجعة: 1

تعليقات