وصف رقمي تحسين أدوات Analysis ToolPak ANOVA في Excel

ملخص

توضح هذه المقالة التحسينات رقمية في كل من ثلاثة أدوات ANOVA حزمة أدوات التحليل. توضح هذه المقالة أيضا نتائج غير دقيقة في Microsoft Excel 2002 وفي الإصدارات السابقة من Excel في الحالات القصوى.

مزيد من المعلومات

تتطلب العديد من الدالات حساب مجموع الانحرافات التربيعية حول وسط. للقيام بذلك بدقة، استخدم Microsoft Office Excel 2003 والإصدارات اللاحقة من Excel إجراء تمريرين الذي يبحث عن متوسط على المسار الأول، ومن ثم يحسب الانحرافات التربيعية حول الوسط على المسار الثاني.

في الحسابي الدقيق, يحدث نفس النتيجة في الإصدارات السابقة من Excel باستخدام "الصيغة الحاسبة". يتم تسمية هذه الصيغة لأنه قيد الاستخدام على نطاق واسع عند استخدام الإحصائيين الحاسبات بدلاً من أجهزة الكمبيوتر. الصيغة الحاسبة، الإصدارات السابقة من Excel جمع مربعات الملاحظات وثم طرح من هذا الإجمالي الكمية التالية:
((sum of observations)^2) / number of observations
يحدث هذا الحساب في مرور واحدة عبر البيانات.

في الدقة الحسابية محدد، الصيغة الحاسبة عرضه لأخطاء roundoff في الحالات القصوى. استخدام Excel 2002 والإصدارات السابقة من Excel الصيغة الحاسبة لمعظم الوظائف التي تتطلب مجموع الانحرافات التربيعية حول متوسط (مثل VAR و STDEV ميل و PEARSON). ومع ذلك، إصدارات Excel استخدم الإجراء تمريرين عددياً أكثر قوة لوظائف CORREL و COVAR DEVSQ أيضا.

ويوصي الخبراء في حساب الإحصائيات لا تستخدم الصيغة الحاسبة. يتم تقديم الصيغة الحاسبة ك "كيفية عدم القيام بذلك" في نصوص حول حساب الإحصائيات. لسوء الحظ، جعل الثلاث من أدوات ANOVA Analysis ToolPak (ATP) الاستخدام الواسع النطاق للصيغة الحاسبة أو أسلوب واحد تمرير مكافئ في Excel 2002 وفي الإصدارات السابقة من Excel.

Excel 2003 والإصدارات اللاحقة من Excel استخدم الإجراء مرتين لكافة الطرازات ATP ANOVA الثلاثة. تتناول هذه المقالة التحسينات الحسابية التالية في ثلاثة طرازات ANOVA ATP الخاصة:
  • عامل وحيد
  • ثنائي Factor مع النسخ المتماثل
  • ثنائية العامل دون النسخ المتماثل
تتناول هذه المقالة هذه النماذج فيما بعد.

لأنه يستخدم Excel دائماً إجراء مرتين مع DEVSQ، هذه المادة تجعل الاستخدام المتكرر لأنه وصف الإجراءات المحسنة. هذه الإجراءات المنقحة فاعلية استدعاء DEVSQ أو استخدام وظيفة الذي هو بالضبط نفس وظائف DEVSQ للتعليمات البرمجية.

لكل أداة ANOVA، إخراج ATP يحتوي على جدول ملخص بقيمة عدد مجموع ومتوسط، والتباين، وجدول ANOVA له التراكمية متنوعة من المربعات والقيم SS، مدافع، و MS وقيمة P. يتم حساب النتائج في الجدول الموجز عن طريق استدعاء دالات Excel حساب مجموع، متوسط و var. هذه المهام الأربع، يخضع VAR فقط أخطاء roundoff.

Excel 2002 والإصدارات السابقة من Excel بتطبيق VAR باستخدام الصيغة الحاسبة. تتناول المقالة التالية حول VAR التحسينات التي حدثت في Excel 2003 والإصدارات اللاحقة من Excel. هذه المقالة يتيح لك باختبار بيانات رقمية لمشاهدة عندما تكون أخطاء roundoff من المحتمل أن يحدث في الإصدارات السابقة من Excel.

لمزيد من المعلومات حول VAR، انقر فوق رقم المقالة التالي لعرضها في "قاعدة المعارف ل Microsoft":

الدالات الإحصائية في excel 826112 : VAR



كما تتناول هذه المقالة ثلاثة طرازات ANOVA، تركز على جداول الإخراج ANOVA. في كل حالة، كانت الجداول الموجزة حسن تصرف في Excel 2003 والإصدارات اللاحقة من Excel. في Excel 2002 والإصدارات السابقة من Excel، تحدث مشاكل في العمود تباين عندما بيانات القيم المتطرفة.

ومع ذلك، تتضمن هذه المقالة الجداول الموجزة في مقاطع النموذج لأن تفيد هذه الجداول للمقارنة عند مراجعة الأمثلة المعدلة في الملحق.

نموذج 1: عامل وحيد

مثال بسيط مع البيانات كما يلي.
النموذج الأساسي ANOVA 1:
123
244
365
486
57
68
Anova: عامل وحيد
ملخص
مجموعاتالعددالمجموعمتوسطتباين
العمود 16213.5 بوصة3.5 بوصة
العمود 242056.666667
العمود 36335.53.5 بوصة
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
بين المجموعات12.7526.3751.5068180.2578973.805567
ضمن مجموعات55134.230769
الإجمالي67.7515
استخدام Excel 2002 والإصدارات السابقة من Excel المستعارة التالية لحساب مجموع مربعات:
GrandSum = 0;GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0;
GrandMeanSqrd = 0;
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
GrandSum = GrandSum + sum of observations in s-th sample;
GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
GrandSampleMeanSqrd = GrandSampleMeanSqrd +
(sum of observations in s-th sample^2)/size of s-th sample;
GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs – GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd – GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs – GrandSampleMeanSqrd;

يعتبر هذا الأسلوب الصيغة 'الحاسبة' بشكل أساسي. حساب مجموع مربعات الملاحظات هذا النهج، وثم يطرح كمية منها، مثلما VAR حساب مجموع مربعات الملاحظات ومن ثم يطرح
مجموع الملاحظات^ 2/حجم العينة. لقد تم حذف المستعارة مشابه للنموذج 2 والنموذج 3.

مرة أخرى، نموذج 2 والنموذج 3، يتم حساب مجموع مربعات ويتم طرح كمية من مجموع المربعات كما في الصيغة الحاسبة. لسوء الحظ، نصوص الإحصاءات الأساسية كثيرا ما تقترح نهجاً ل ANOVA مثل تلك الموضحة سابقا في هذه المقالة.

Excel 2003 والإصدارات اللاحقة من Excel استخدام طريقة مختلفة لحساب الإدخالات في عمود جدول ANOVA SS. للتوضيح، تفترض هذه المقالة أن تظهر البيانات الرقمية في المثال السابق في A2:C7 الخلايا مع فقدان البيانات في الخلايا B6 و B7.
  • هي SS إجمالي DEVSQ تطبق على كافة البيانات، مثل DEVSQ(A2:C7) فقط. DEVSQ يعمل بشكل صحيح على الرغم من أن البيانات مفقودة.
  • بين مجموعات SS هي SS الإجمالي مطروحاً منه مجموع DEVSQ تطبيقها على كل عمود، مثل DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • ضمن مجموعات SS هي SS الإجمالي ناقص بين المجموعات.
يتم حساب الإدخالات في عمود جدول ANOVA SS بشكل صحيح، اتبع دقة الإدخالات الأخرى في الجدول.

النموذج 2: ثنائية العامل مع النسخ المتماثل

مثال بسيط مع البيانات كما يلي.
النموذج الأساسي ANOVA 2المجموعة 1المجموعة 2المجموعة 3
الابتدائية الأولى123
244
365
2 التجريبية486
5107
6128
Anova: ثنائية العامل مع النسخ المتماثل
ملخصالمجموعة 1المجموعة 2المجموعة 3الإجمالي
الابتدائية الأولى
العدد3339
المجموع6121230
متوسط2443.333333
تباين141مقاس 2.5 بوصة
2 التجريبية
العدد3339
المجموع15302166
متوسط51077.333333
تباين1416.25
الإجمالي
العدد666
المجموع214233
متوسط3.5 بوصة75.5
تباين3.5 بوصة143.5 بوصة
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
نموذج72172366.22E-054.747221
الأعمدة37218.59.250.0037093.88529
تفاعل924.52.250.1479733.88529
ضمن24122
الإجمالي14217
مرة أخرى، إذا كان حساب الإدخالات في عمود SS بشكل صحيح، دقة كافة الإدخالات الأخرى في الجزء ANOVA الإخراج التالي.

هنا هو عملية حسابية لبرنامج Excel 2003 والإصدارات اللاحقة من Excel. يستخدم هذا الإجراء DEVSQ لحساب الإدخالات في عمود جدول ANOVA SS. للتوضيح، يفترض هذا المثال أن تظهر البيانات الرقمية في الخلايا B2:D7.
  • هي SS إجمالي DEVSQ تطبق على كافة البيانات، مثل DEVSQ(B2:D7) فقط.
  • نموذج SS هي SS الإجمالي مطروحاً منه مجموع DEVSQ تطبيقها على كل عينة مثل DEVSQ(B2:D4) + DEVSQ(B5:D7).
  • أعمدة SS هي SS الإجمالي مطروحاً منه مجموع DEVSQ تطبيقها على كل عمود، مثل DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7).
  • ضمن SS هي مجموع DEVSQ تطبيقها لكل محاكمة أو زوج مجموعة، مثل DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • تفاعل SS يساوي SS الإجمالي ناقص عينة ناقص الأعمدة ناقص داخل.

النموذج 3: ثنائية العامل دون النسخ المتماثل

مثال بسيط مع البيانات كما يلي.
النموذج الأساسي ANOVA 3:منخفضميد
مرحبا
ضعيف123
244
365
فئة متوسط486
5107
6128
المنسق71410
8126
9102
Anova: ثنائية العامل دون النسخ المتماثل
ملخصالعددالمجموعمتوسطتباين
ضعيف3621
3103.3333331.333333
3144.6666672.333333
فئة متوسط31864
3227.3333336.333333
3268.6666679.333333
المنسق33110.3333312.33333
3268.6666679.333333
321719
منخفض
94557.5
ميد
9788.66666716
مرحبا9515.6666676.25
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
الصفوف176.6667822.083335.760870.0014762.591094
الأعمدة68.66667234.333338.9565220.0024553.633716
خطأ61.33333163.833333
الإجمالي306.666726
إذا كان يتم حساب القيم في عمود SS صحيح، يتبع دقة كافة القيم الأخرى في جدول ANOVA.

استخدام Excel 2003 والإصدارات اللاحقة من Excel هذه الإجراءات الحسابية. يستخدم الإجراء DEVSQ لحساب القيم في عمود جدول ANOVA SS. للتوضيح، يفترض هذا المثال أن نطاق الخلايا هو موضح في المثال السابق هو A1:D10 الخلايا. ولذلك، تظهر البيانات الرقمية في الخلايا B2:D10.
  • هي SS إجمالي DEVSQ تطبق على كافة البيانات، مثل DEVSQ(B2:D10) فقط.
  • صفوف SS هي SS الإجمالي مطروحاً منه مجموع DEVSQ تطبيقها على كل صف، مثل DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • أعمدة SS هي SS الإجمالي مطروحاً منه مجموع DEVSQ تطبيقها على كل عمود، مثل DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10).
  • خطأ SS هي SS الإجمالي ناقص الصفوف ناقص الأعمدة.

النتائج في Excel 2002 وفي الإصدارات السابقة من Excel

في الحالات القصوى حيث توجد العديد من الأرقام المعنوية في البيانات ولكن أيضا تباين صغيرة أو الصيغة الحاسبة تؤدي إلى نتائج غير دقيقة. الملحق الذي يظهر فيما بعد في هذه المقالة أمثلة roundoff مشاكل في مثل هذه الحالات القصوى.

النتائج في Excel 2003 والإصدارات اللاحقة من Excel

استخدام Excel 2003 والإصدارات اللاحقة من Excel إجراء يجعل مرورين عبر البيانات. في المسار الأول، Excel 2003 والإصدارات اللاحقة من Excel حساب مجموع وعدد قيم البيانات. من ذلك، يمكن Excel حساب متوسط العينة (متوسط).

في المسار الثاني، Excel بحساب الفرق التربيعي بين كل نقطة بيانات أو متوسط العينة وثم جمع هذه الفروق التربيعية. وكنتيجة لذلك، النتائج في Excel 2003 والإصدارات اللاحقة من Excel أكثر استقرارا رقمياً.

الاستنتاجات

تمريرين يحسن أداء رقمية في كل ثلاث أدوات ATP ANOVA في Excel 2003 والإصدارات اللاحقة من Excel بالمقارنة بالإصدارات السابقة من Excel. لا يتم النتائج التي تحصل باستخدام Excel 2003 والإصدارات اللاحقة من Excel أقل دقة من النتائج التي تحصل عليها باستخدام الإصدارات السابقة من Excel.

وفي الحالات الأكثر عملية، على الرغم من ذلك، ليس هناك فرق بين هذه النتائج. وهذا لأن البيانات لا يحمل هذا نوع السلوك غير عادية التذييل التالي يوضح بشكل عام. استقرار الرقمية الأكثر احتمالاً أن يحدث في الإصدارات السابقة من Excel عندما بيانات يحتوي على عدد كبير من الأرقام المعنوية مع تباين صغيرة نسبيا بين قيم البيانات.

إذا كنت تستخدم إصدار سابق من Excel، وإذا كنت تريد أن ترى ما إذا كان Excel 2003 أو إصدار أحدث من Excel يعطيك نتائج ANOVA مختلفة، مقارنة النتائج التي تحصل عليها عند استخدام أدوات ANOVA في الإصدار الأقدم من Excel مع النتائج التي تحصل عليها عند استخدام الإجراءات التي تستخدم DEVSQ.

ملاحظة: ووصفت الإجراءات التي تستخدم DEVSQ سابقا في هذه المقالة لجدول ANOVA المقترن بكل أداة من الأدوات.

للتحقق من صحة بجدول ملخص لكل نطاق الفروق، استخدم DEVSQ (نطاق)/(العدد (نطاق) – 1).

التذييل: أمثلة عددية أداء Excel 2002 والإصدارات السابقة من Excel

على سبيل المثال الأساسية كل من النماذج 1 و 2 و 3، تقديم هذه المقالة قبل إخراج الأداة ATP. وشمل ذلك الجداول الموجزة و ANOVA. تعديل البيانات في كل مثال لإنشاء مثال "أكد". يتم ذلك عن طريق إضافة 10 ^ 8 لكل قيمة بيانات. إضافة ثابت مثل 10 ^ 8 لكل قيمة من قيم البيانات لا يؤثر على التباين في الجدول الموجز (لكنها تؤثر على المتوسط ومجموع طرق واضحة). أنه يجب أن لا يؤثر على أي إدخال في جدول ANOVA.

عند مقارنة نسب الفرق في الجداول الموجزة و SS في الجداول ANOVA، ستلاحظ كل هذه بشكل غير صحيح حساب في الثلاث أكد الطرازات التالية باستثناء إدخال واحد في النموذج 3 المشار إليه بواسطة "<---".

وفي جميع الحالات أكد، يتفق ANOVA النتائج التي تحصل باستخدام Excel 2003 والإصدارات اللاحقة من Excel مع النتائج السابقة في الحالات الأساسية (كما يجب).

أكد ANOVA 1 نموذج مع قيم البيانات الكبيرة

100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: عامل وحيد
ملخص
مجموعاتالعددالمجموعمتوسطتباين
العمود 166000000211E + 084.8
العمود 244000000201E + 088
العمود 366000000331E + 081.6
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
بين المجموعات020013.805567
ضمن مجموعات64134.923077
الإجمالي6415

أكد ANOVA 2 نموذج مع قيم البيانات الكبيرة

المجموعة 1المجموعة 2المجموعة 3
الابتدائية الأولى100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
2 التجريبية100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: ثنائية العامل مع النسخ المتماثل
ملخصالمجموعة 1المجموعة 2المجموعة 3الإجمالي
الابتدائية الأولى
العدد3339
المجموع3000000063000000123000000129E + 08
متوسط1000000021000000041000000041E + 08
تباين0404
2 التجريبية
العدد3339
المجموع3000000153000000303000000219E + 08
متوسط1000000051000000101000000071E + 08
تباين0406
الإجمالي
العدد666
المجموع600000021600000042600000033
متوسط100000004100000007100000005.5
تباين4.814.41.6
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
نموذج64164240.0003674.747221
الأعمدة3221660.0156253.88529
تفاعل3221660.0156253.88529
ضمن32122.666666667
الإجمالي12817

أكد ANOVA 3 نموذج مع قيم البيانات الكبيرة

منخفضميد
مرحبا
ضعيف100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
فئة متوسط100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
المنسق100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: ثنائية العامل دون النسخ المتماثل
ملخصالعددالمجموعمتوسطتباين
الصف 133000000061000000020
الصف 233000000101000000032
الصف 333000000141000000052
الصف 433000000181000000064<---
الصف 533000000221000000076
الصف 6330000002610000000910
الصف 7330000003110000001012
صف 8330000002610000000910
الصف 9330000002110000000718
العمود 199000000451000000058
العمود 2990000007810000000914
العمود 399000000511000000064
ANOVA
مصدر التبايناتSSمدافعمللي ثانيةFقيمة Pالحرجة F
الصفوف12881620.1132812.591094
الأعمدة3221620.1677723.633716
خطأ128168
الإجمالي28826
خصائص

رقم الموضوع: 829215 - آخر مراجعة: 15‏/01‏/2017 - المراجعة: 1

تعليقات