Excel'de Çözümleme Araç Paketi'ni ANOVA Araçlar sayısal gelişme açıklaması

Özet

Bu makalede, her üç Analysis ToolPak ANOVA aracı sayısal geliştirmeleri açıklanır. Bu makalede ayrıca Microsoft Excel 2002 ve önceki Excel sürümlerinde aşırı durumlarda tutarsız sonuçlar gösterilmektedir.

Daha fazla bilgi

Birçok işlevleri hakkında bir ortalaması sapmaların toplamı hesaplama gerektirir. Bunu doğru bir şekilde yapmak için Microsoft Office Excel 2003 ve Excel'in daha sonraki sürümleri ilk geçişte ortalamasını bulur ve ardından ikinci geçişi üzerinde ortalama sapmaların hesaplar bir iki taramalı yordamı kullanın.

Kesin aritmetik aynı sonucu "hesap makinesi formülü." kullanan önceki Excel sürümlerinde oluşur. İstatistikçiler yerine bilgisayar hesap makineleri kullanıldığında yaygın kullanımda olduğu için bu formülü şekilde adlandırılır. Hesap Makinesi formülüyle, Excel'in önceki sürümlerinde gözlemler karelerinin toplamını ve sonra aşağıdaki miktar bu toplamından çıkarın:
((sum of observations)^2) / number of observations
Bu hesaplama verileri tek bir geçiş gerçekleşir.

Aritmetik sınırlı kesinlik içinde aşırı durumlarda roundoff hataları hesap makinesi formülü tabidir. Excel 2002 ve önceki Excel sürümlerinde bir ortalaması (örneğin VAR, STDSAPMA, eğim ve PEARSON) hakkında sapmaların toplamı gerektiren çoğu işlev hesap makinesi formülünü kullanın. Ancak, Excel'in bu sürümleri de korelasyon ve Kovaryans SAPKARE işlevleri için sayısal olarak daha güçlü iki taramalı yordamı kullanın.

İstatistiksel bilgi işlem içinde uzmanlar hesap makinesi formülü kullanmayın öneririz. Hesap Makinesi formülü hakkında istatistiksel hesaplama metinleri "değil yapmak nasıl" sunulmuştur. Ne yazık ki, Excel 2002 ve önceki Excel sürümlerinde ANOVA Çözümleme Araç Paketi'ni (ATP) araçların üç hesap makinesi formül veya eşdeğer bir tek taramalı yaklaşım yaygın kullanımı olun.

Excel 2003 ve Excel'in daha sonraki sürümleri için tüm üç KM ANOVA modelleri iki taramalı yordamı kullanın. ATP'in üç ANOVA modellerinde aşağıdaki hesaplama geliştirmeleri anlatılmaktadır:
  • Tek Faktör
  • İki etken
  • İki Faktörlü Yinelemesiz
Bu makalede, bu modellerden daha sonra anlatılmaktadır.

Excel, her zaman iki taramalı yordamı SAPKARE ile kullanılmış olduğundan, bu makalede geliştirilmiş yordamlar tanımlamak için sık sık kullanımını sağlar. Yeniden düzenlenen bu yordamları etkili SAPKARE çağırmak veya kod, işlevsellik tam olarak SAPKARE'ın işlevselliği ile aynıdır kullanabilirsiniz.

Count, Topla, ortalama ve sapma değerleri içeren bir Özet Tablo ve çeşitli kareler toplamı ve SS, df, değerleri olan bir ANOVA tablosu her ANOVA aracı için ATP çıktı içeren MS, F ve P-değeri. COUNT, Topla, ortalama ve örneklemeyi Excel işlevlerini çağırarak sonuçlarında Özet Tablo hesaplanan Bu dört işlevlerini, sadece VAR tabi roundoff hatası sayısıdır.

Excel 2002 ve önceki Excel sürümlerinde VAR hesap makinesi formülü kullanarak da uygulayabilirsiniz. VAR ile ilgili aşağıdaki makaleyi Excel 2003'te ve Excel'in daha sonraki sürümleri oluşan geliştirmeleri açıklar. Bu makalede ayrıca, sayısal veriler önceki Excel sürümlerinde oluşma olasılığı roundoff hatalarla zaman görmek için denemeler sağlar.

VAR hakkında daha fazla bilgi için Microsoft Bilgi Bankası'ndaki makaleyi görüntülemek üzere aşağıdaki makale numarasını tıklatın:

826112 excel istatistiksel fonksiyonlar: VAR



Üç model ANOVA anlatılmaktadır gibi ANOVA çıktı tablolar üzerinde odaklanır. Her durumda, Özet tabloları Excel 2003'te ve Excel'in daha sonraki sürümleri iyi çalışan. Aşırı değerleri veri varsa, Excel 2002 ve önceki Excel sürümlerinde, sorunları fark sütununda oluşur.

Ancak, bu tabloları ekte değişiklik örnekleri gözden geçirdiğinizde karşılaştırma için yararlı olduğu için bu makalede modeli bölümlerde Özet Tablolar içerir.

Model 1: Tek Etmenli

Basit bir örnek verilerle aşağıdaki gibidir.
ANOVA 1 TEMEL MODELİ:
123
211
365
186
57
68
Anova: Tek etken
ÖZET
GruplarıSayımıTOPLAOrtalamaVaryans
Sütun 16213.53.5
Sütun 212056.666667
Sütun 36335.53.5
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Gruplar arasında12.7526.3751.5068180.2578973.805567
Gruplar içinde55134.230769
Toplam67.7515
Excel 2002 ve önceki Excel sürümlerinde karelerinin toplamlarını hesaplamak için aşağıdaki yarı kodu kullanın:
GrandSum = 0;GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0;
GrandMeanSqrd = 0;
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
GrandSum = GrandSum + sum of observations in s-th sample;
GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
GrandSampleMeanSqrd = GrandSampleMeanSqrd +
(sum of observations in s-th sample^2)/size of s-th sample;
GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs – GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd – GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs – GrandSampleMeanSqrd;

Bu yaklaşım aslında hesap makinesi formülüdür. Bu yaklaşım gözlemler karelerinin toplamlarını hesaplar ve sonra sadece VAR gözlemler karelerinin toplamını hesaplar ve sonra da çıkarır gibi bunları bir miktar çıkarır
gözlemler toplamı^ 2 /örnek boyutu. Benzer sahte kod modeli 2 ve 3 modeli için çıkarılmıştır.

Yine, model 2 ve 3 model, kareler toplamı hesaplanır ve bir miktar hesap makinesi formülü olduğu gibi karelerinin toplamını den çıkarılır. Ne yazık ki, temel istatistik metinleri sık yaklaşımlar için ANOVA gibi bu makalenin önceki bölümlerinde gösterilen bir önerin.

Excel 2003 ve Excel'in daha sonraki sürümleri ANOVA tablosu SS sütunundaki girdilerin hesaplamak için farklı bir yaklaşım kullanın. Gösterim amacıyla, bu makalede, sayısal veriler önceki örnekte B6 ve B7 arasındaki hücreleri kaybolan verileri içeren hücreleri A2:C7 içinde görünür varsayar.
  • Toplam SS yalnızca SAPKARE uygulanan tüm verileri DEVSQ(A2:C7) gibi olur. SAPKARE veriler eksik olsa da düzgün çalışır.
  • DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7) her sütun, uygulanan SAPKARE toplamı eksi toplam SS grupları SS arasında olur.
  • Gruplar içinde SS toplam SS arasında SS grupları eksi olur.
ANOVA tablosu SS sütunundaki girişleri doğru hesaplanır, tablodaki diğer girişleri doğruluğunu izleyin.

Model 2: Çift Faktörlü çoğaltma

Basit bir örnek verilerle aşağıdaki gibidir.
ANOVA 2 TEMEL MODELİGrup 1Grup 2Grup 3
Deneme 1123
211
365
deneme 2186
5107
6128
Anova: Çift Faktörlü çoğaltma
ÖZETGrup 1Grup 2Grup 3Toplam
Deneme 1
Sayımı3339
TOPLA6121230
Ortalama2113.333333
Varyans1112.5
deneme 2
Sayımı3339
TOPLA15302166
Ortalama51077.333333
Varyans1116.25
Toplam
Sayımı666
TOPLA214233
Ortalama3.575.5
Varyans3.5143.5
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Örnek72172366.22E-054.747221
Sütunlar37218,5 inç9,250.0037093.88529
Etkileşim924.52,250.1479733.88529
İçinde24122
Toplam14217
SS sütunundaki girdiler doğru hesaplanıyorsa, yeniden çıktı ANOVA kısmındaki diğer tüm girişleri doğruluğunu izler.

Excel 2003 ve Excel'in daha sonraki sürümleri için hesaplama yordam aşağıdadır. Bu yordam SAPKARE ANOVA tablosu SS sütunundaki girdilerin hesaplamak için kullanır. Gösterim amacıyla bu örnek, sayısal veri hücreleri B2:D7 içinde görünen varsayar.
  • Toplam SS yalnızca SAPKARE uygulanan tüm verileri DEVSQ(B2:D7) gibi olur.
  • DEVSQ(B2:D4) + DEVSQ(B5:D7) her örnek, uygulanan SAPKARE toplamı eksi toplam SS SS örnek olur.
  • DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7) her sütun, uygulanan SAPKARE toplamı eksi toplam SS SS sütunlar var.
  • SS içinde her deneme veya grup çifti, DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7) gibi uygulanan SAPKARE toplamıdır.
  • Örnek SS sütunları SS SS içinde eksi eksi eksi toplam SS SS etkileşim eşittir.

Model 3: Yinelemesiz çift etken

Basit bir örnek verilerle aşağıdaki gibidir.
ANOVA 3 TEMEL MODELİ:DÜŞÜKMED
HI
ZAYIF123
211
365
ORTA SINIF186
5107
6128
ZENGİN71410
8126
9102
Anova: Yinelemesiz çift etken
ÖZETSayımıTOPLAOrtalamaVaryans
ZAYIF3621
3103.3333331,333333
3144.6666672.333333
ORTA SINIF31861
3227.3333336.333333
3268.6666679.333333
ZENGİN33110.3333312.33333
3268.6666679.333333
321719
DÜŞÜK
94557.5
MED
9788.66666716
HI9515.6666676.25
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Satır176.6667822.083335.760870.0014762.591094
Sütunlar68.66667234.333338.9565220.0024553.633716
Hata61.33333163.833333
Toplam306.666726
SS sütunundaki değerler doğru hesaplanıyorsa, ANOVA tablodaki diğer tüm değerlerin doğruluğunu izler.

Excel 2003 ve sonraki sürümleri Excel hesaplama yordamını kullanın. Yordam SAPKARE ANOVA tablosu SS sütunundaki değerleri hesaplamak için kullanır. Gösterim amacıyla bu örnek önceki örnekte gösterilen hücre hücreleri A1:D10 olduğunu varsayar. Bu nedenle, sayısal veri hücreleri B2:D10 içinde görünür.
  • Toplam SS yalnızca SAPKARE uygulanan tüm verileri DEVSQ(B2:D10) gibi olur.
  • DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10) her satır, uygulanan SAPKARE toplamı eksi toplam SS SS satırları olur.
  • DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10) her sütun, uygulanan SAPKARE toplamı eksi toplam SS SS sütunlar var.
  • SS SS sütunlarını eksi satırlar SS eksi toplam SS hatadır.

Excel 2002 ve önceki Excel sürümlerinde sonuçları

Burada veri çok fazla anlamlı basamak vardır ancak aynı zamanda küçük bir fark, hesap makinesi formülü tutarsız sonuçlar verecektir olağanüstü durumlarda. Bu makalede yer ekin gibi olağanüstü durumlarda roundoff sorunlardan örnekler verilmektedir.

Sonuçları Excel 2003'te ve Excel'in daha sonraki sürümleri

Excel 2003 ve sonraki sürümleri Excel verileri üzerinden iki geçiş yapan bir yordamı kullanın. İlk geçişte, Excel 2003 ve sonraki sürümleri Excel Topla ve veri değerleri sayısını hesaplayın. Bu, Excel örnek ortalama ortalama (ortalama) hesaplar.

İkinci geçişi Excel örnek ortalamanın her veri noktası arasındaki karesi alınmış farkı hesaplar ve sonra bu kareleri alınmış farkların toplar. Sonuç olarak, Excel 2003'te ve Excel'in daha sonraki sürümleri sonuçları sayısal daha kararlı.

Sonuçları

İki taramalı yaklaşım tüm üç KM ANOVA aracı Excel 2003'te ve Excel'in önceki sürümlerinde karşılaştırıldığında, Excel'in sonraki sürümlerinde bulunan sayısal performansı artırır. Excel 2003 ve Excel'in daha sonraki sürümleri kullanarak elde sonuçları asla Excel'in önceki sürümlerini kullanarak elde sonuçları daha düşüktür.

En kullanışlı durumlarda, ancak fark yoktur bu sonuçlar arasında. Veri türü aşağıdaki ekte gösterilmiştir beklenmedik davranışlar genellikle sergilemez olmasıdır. Sayısal kararsızlık en anlamlı basamak çeşitlemesiyle nispeten daha az veri değerleri arasında çok sayıda veri içerdiğinde, Excel'in önceki sürümlerinde ortaya olasılığı yüksektir.

Excel'in daha önceki bir sürümünü kullanıyorsanız ve Excel 2003 veya sonraki bir sürümünü, Excel'in farklı ANOVA sonuçları verir olup olmadığını görmek isterseniz, önceki Excel sürümünde SAPKARE kullandığınız yordamlar kullandığınızda elde sonuçları ile ANOVA araçlarını kullandığınızda elde sonuçları karşılaştırın.

Not: Araçların her biri ile ilgili olan ANOVA tablosu için bu makalenin SAPKARE kullanan yordamlarda açıklandığı gibi.

Varyans Özet tablosundaki her aralık için doğru olduğunu doğrulamak için (aralık) SAPKARE kullanın / (COUNT (aralık) – 1).

Ek: Excel 2002'in performansı ve Excel'in önceki sürümlerinde sayısal örnekleri

1, 2 ve 3 modellerinden her temel örnek için bu makalede daha önce ATP aracın çıkış sunumu. Bu Özet ve ANOVA tablolar dahil. "Stressed" bir örnek oluşturmak için her örnekte veri değiştirildi. Bu 10 ekleyerek yapılır ^ her veri değeri için 8. 10 gibi bir sabit ekleme ^ 8 her veri değeri için varyans özet tabloda etkilemez (ancak belirgin şekilde etkiler, ortalama ve toplam). ANOVA tablosu herhangi bir girdi de etkilememelidir.

Varyans Özet Tablolar ve SS ANOVA tablolarında karşılaştırırsanız, bunların hepsi yanlış aşağıdaki stressed modeller dışında bir giriş ile verilir modelinde 3 üçünü de hesaplanmasını göreceksiniz "<---".

(Bunlar gerektiği gibi) tüm stressed durumlarda, Excel 2003 ve Excel'in daha sonraki sürümleri kullanarak elde ANOVA sonuçları temel durumlarda önceki sonuçları ile kabul edersiniz.

Büyük veri değerleri ile model ANOVA 1 kullanımı yoğun

100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
Anova: Tek etken
ÖZET
GruplarıSayımıTOPLAOrtalamaVaryans
Sütun 166000000211E+084.8
Sütun 214000000201E+088
Sütun 366000000331E+081.6
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Gruplar arasında020013.805567
Gruplar içinde64134.923077
Toplam6415

Büyük veri değerleri ile model ANOVA 2 baskı altında

Grup 1Grup 2Grup 3
Deneme 1100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
deneme 2100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
Anova: Çift Faktörlü çoğaltma
ÖZETGrup 1Grup 2Grup 3Toplam
Deneme 1
Sayımı3339
TOPLA3000000063000000123000000129E + 08
Ortalama1000000021000000041000000041E+08
Varyans0101
deneme 2
Sayımı3339
TOPLA3000000153000000303000000219E + 08
Ortalama1000000051000000101000000071E+08
Varyans0106
Toplam
Sayımı666
TOPLA600000021600000042600000033
Ortalama100000004100000007100000005.5
Varyans4.814.41.6
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Örnek64164240.0003674.747221
Sütunlar3221660.0156253.88529
Etkileşim3221660.0156253.88529
İçinde32122.666666667
Toplam12817

Büyük veri değerleri ile model ANOVA 3 kullanımı yoğun

DÜŞÜKMED
HI
ZAYIF100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
ORTA SINIF100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
ZENGİN100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
Anova: Yinelemesiz çift etken
ÖZETSayımıTOPLAOrtalamaVaryans
Satır 133000000061000000020
Satır 233000000101000000032
Satır 333000000141000000052
Satır 433000000181000000061<---
Satır 533000000221000000076
Satır 6330000002610000000910
Satır 7330000003110000001012
Satır 8330000002610000000910
Satır 9330000002110000000718
Sütun 199000000451000000058
Sütun 2990000007810000000914
Sütun 399000000511000000061
ANOVA
Çeşitleme kaynağıSSDFMSFP-değeriF crit
Satır12881620.1132812.591094
Sütunlar3221620.1677723.633716
Hata128168
Toplam28826
Özellikler

Makale No: 829215 - Son İnceleme: 24 Şub 2017 - Düzeltme: 1

Geri bildirim