Bạn hiện đang ngoại tuyến, hãy chờ internet để kết nối lại

Mô tả số cải thiện công cụ phân tích ToolPak ANOVA trong Excel

QUAN TRỌNG: Bài viết này được dịch bằng phần mềm dịch máy của Microsoft chứ không phải do con người dịch. Microsoft cung cấp các bài viết do con người dịch và cả các bài viết do máy dịch để bạn có thể truy cập vào tất cả các bài viết trong Cơ sở Kiến thức của chúng tôi bằng ngôn ngữ của bạn. Tuy nhiên, bài viết do máy dịch không phải lúc nào cũng hoàn hảo. Loại bài viết này có thể chứa các sai sót về từ vựng, cú pháp hoặc ngữ pháp, giống như một người nước ngoài có thể mắc sai sót khi nói ngôn ngữ của bạn. Microsoft không chịu trách nhiệm về bất kỳ sự thiếu chính xác, sai sót hoặc thiệt hại nào do việc dịch sai nội dung hoặc do hoạt động sử dụng của khách hàng gây ra. Microsoft cũng thường xuyên cập nhật phần mềm dịch máy này.

Nhấp chuột vào đây để xem bản tiếng Anh của bài viết này:829215
TÓM TẮT
Bài viết này mô tả số cải tiến trong mỗi của các ba phân tích ToolPak ANOVA công cụ. Bài viết này cũng minh hoạ kết quả không chính xác trong Microsoft Excel 2002 và trong phiên bản trước của Excel trong tình huống cực độ.
THÔNG TIN THÊM
Nhiều chức năng yêu cầu tính toán tổng bình phương độ lệch về một có nghĩa là. Để làm điều này một cách chính xác, Microsoft Office Excel 2003 và sau đó các phiên bản Excel sử dụng một vượt qua hai thủ tục mà thấy bình trên đèo đầu tiên, và sau đó tính toán bình phương độ lệch về bình trên đèo thứ hai.

Trong số học chính xác, như nhau kết quả xuất hiện trong phiên bản trước của Excel sử dụng công thức tính"." Công thức này được đặt tên như vậy bởi vì nó đã sử dụng phổ biến rộng rãi khi thống kê sử dụng máy tính bỏ túi thay vì các máy tính. Công thức tính, phiên bản trước của Excel tổng các ô vuông của các quan sát, và sau đó trừ từ tổng số sau đây số lượng:
((sum of observations)^2) / number of observations
Tính toán này xuất hiện trong một pass duy nhất thông qua các dữ liệu.

Trong hữu hạn chính xác số học, công thức tính là tùy thuộc vào roundoff lỗi trong trường hợp cực đoan. Excel 2002 và phiên bản trước của Excel sử dụng công thức tính hầu hết các chức năng yêu cầu một khoản bình phương sai về một có nghĩa là (chẳng hạn như VAR, STDEV, DỐC và PEARSON). Tuy nhiên, các phiên bản Excel cũng sử dụng các bộ thủ tục thông hai đạo mạnh mẽ cho CORREL, COVAR và DEVSQ chức năng.

Chuyên gia trong tính toán thống kê khuyên rằng bạn không sử dụng các công thức tính. Công thức tính toán được trình bày như là "làm thế nào không phải là để làm điều đó" trong các văn bản về tính toán thống kê. Thật không may, tất cả ba của các phân tích ToolPak (ATP) ANOVA cụ làm cho sử dụng rộng rãi của công thức tính toán hoặc diện đương đơn thông tiếp cận trong Excel 2002 và trong phiên bản trước của Excel.

Excel 2003 và sau đóPhiên bản Excel sử dụng các thủ tục thông hai cho tất cả các mô hình ATP ANOVA ba. Bài viết này thảo luận về những cải tiến tính toán trong ATP của ba ANOVA mô hình:
  • Yếu tố
  • Hai nhân tố với sao chép
  • Hai yếu tố mà không cần nhân rộng
Bài viết này bàn về các mô hình sau này.

Bởi vì Excel đã luôn luôn sử dụng các thủ tục thông hai với DEVSQ, làm cho bài viết này thường xuyên sử dụng nó để mô tả các thủ tục được cải thiện. Những sửa đổi thủ tục, hoặc là có hiệu quả gọi DEVSQ hoặc sử dụng mã chức năng mà là chính xác giống như chức năng của DEVSQ.

Đối với mỗi công cụ ANOVA, ATP đầu ra có một tổng quan về với các giá trị của Bá tước, Sum, trung bình, và Phương sai, và một bảng ANOVA có khoản tiền khác nhau của hình vuông và các giá trị của SS, DF, MS, F và P-giá trị. Kết quả trong bảng tóm tắt được tính bằng cách gọi Chức năng Excel COUNT, SUM, bình và VAR. Những chức năng bốn, chỉ VAR có thể roundoff lỗi.

Excel 2002 và phiên bản trước của Excel thực hiện VAR bằng cách sử dụng công thức tính. Bài viết sau đây về VAR mô tả những cải tiến xảy ra trong Excel 2003 và trong sau này các phiên bản của Excel. Bài viết này cũng cho phép bạn thử nghiệm với dữ liệu số để xem khi roundoff lỗi có khả năng xảy ra trong trước đó các phiên bản của Excel.

Để biết thêm chi tiết về VAR, nhấp vào số bài viết sau đây để xem bài viết trong cơ sở kiến thức Microsoft:
826112Trội chức năng thống kê: VAR


Như bài viết này thảo luận về các mô hình ba ANOVA, nó tập trung vào các bảng đầu ra ANOVA. Trong mỗi trường hợp, các bản tóm tắt bảng là well-behaved trong Excel 2003 và trong sau này các phiên bản của Excel. Trong Excel 2002 và trong phiên bản trước của Excel, vấn đề xảy ra trong cột phương sai khi dữ liệu có giá trị cực.

Tuy nhiên, điều này bài viết bao gồm các bảng tóm tắt trong các mô hình phần vì những bảng hữu ích cho việc so sánh khi bạn xem xét các ví dụ sửa đổi trong các Phụ lục.

Mô hình 1: Yếu tố

Một ví dụ đơn giản với dữ liệu là như sau.
ANOVA 1 BASIC MẪU:
123
244
365
486
57
68
ANOVA: đơn Yếu tố
TÓM TẮT
Các nhómCountTổng hợpBìnhPhương sai
Cột 16213.53.5
Cột 242056,666667
Cột 36335.53.5
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Giữa Các nhóm12,7526.3751.5068180.2578973.805567
Trong vòng Các nhóm55134.230769
Tổng cộng67.7515
Excel 2002 và phiên bản trước của Excel sử dụng mã giả sau đây để tính toán các khoản tiền của hình vuông:
GrandSum = 0;GrandSumOfSqs = 0; GrandSampleMeanSqrd = 0; GrandMeanSqrd = 0; GrandSampleSize = 0;For s = 1 to Number_of_Samples do   GrandSum = GrandSum + sum of observations in s-th sample;   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +      (sum of observations in s-th sample^2)/size of s-th sample;   GrandSampleSize = GrandSampleSize + size of s-th sampleEndfor;GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;TotalSS = GrandSumOfSqs – GrandMeanSqrd;BetweenGroupsSS = GrandSampleMeanSqrd – GrandMeanSqrd;WithinGroupsSS = GrandSumOfSqs – GrandSampleMeanSqrd;
Cách tiếp cận này là chủ yếu là công thức tính. Cách tiếp cận này tính các khoản tiền của ô vuông của các quan sát, và sau đó trừ một số lượng từ họ, cũng giống như VAR tính tổng bình phương của các quan sát, và sau đó trừ Tổng quan sát^ 2 /mẫu Kích thước. Mã giả tương tự cho các mô hình 2 và mẫu 3 đã bỏ qua.

Một lần nữa, đối với mô hình 2 và mẫu 3, hình vuông một khoản tiền được tính toán và một số lượng trừ từ tổng quảng trường như trong công thức tính. Thật không may, văn bản cơ bản thống kê thường xuyên đề xuất phương pháp tiếp cận cho ANOVA như là một trong đó sẽ được hiển thị trước đó trong bài viết này.

Excel 2003 và sau đó các phiên bản Excel sử dụng một cách tiếp cận khác nhau để tính toán các mục khác nhau trong cột SS của các ANOVA bảng. Để minh hoạ, bài viết này giả định rằng các dữ liệu số trong các ví dụ trước đó xuất hiện trong các tế bào A2:C7 với dữ liệu bị thiếu trong các tế bào B6 và B7.
  • Tổng SS là chỉ DEVSQ áp dụng cho tất cả các dữ liệu, chẳng hạn như DEVSQ(A2:C7). DEVSQ hoạt động một cách chính xác mặc dù dữ liệu bị thiếu.
  • Giữa các nhóm SS là SS tổng trừ đi tổng DEVSQ áp dụng cho mỗi cột, chẳng hạn như DEVSQ(A2:A7) + DEVSQ(B2:B7) + DEVSQ(C2:C7).
  • Trong các nhóm SS là SS tổng trừ đi giữa các nhóm SS.
Nếu mục trong cột SS Table ANOVA được tính toán một cách chính xác, tính chính xác của các mục khác trong bảng theo.

Mô hình 2: Hai nhân tố với sao chép

Một ví dụ đơn giản với dữ liệu là như sau.
ANOVA 2 BASIC MÔ HÌNHnhóm 1nhóm 2nhóm 3
xét xử 1123
244
365
xét xử 2486
5107
6128
ANOVA: Hai nhân tố với Sao chép
TÓM TẮTnhóm 1nhóm 2nhóm 3Tổng cộng
xét xử 1
Count3339
Tổng hợp6121230
Bình2443,333333
Phương sai1412.5
xét xử 2
Count3339
Tổng hợp15302166
Bình51077.333333
Phương sai1416.25
Tổng cộng
Count666
Tổng hợp214233
Bình3.575.5
Phương sai3.5143.5
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Mẫu72172366.22E-054.747221
Cột37218,59,250.0037093.88529
Tương tác924.52,250.1479733.88529
Trong vòng24122
Tổng cộng14217
Một lần nữa, nếu mục trong cột SS được tính toán một cách chính xác, sự chính xác của tất cả các mục khác ở ANOVA của đầu ra sau.

Dưới đây là thủ tục tính toán Excel 2003 và cho sau này các phiên bản của Excel. Thủ tục này sử dụng DEVSQ để tính toán các mục khác nhau trong cột SS Table ANOVA. Cho minh hoạ, ví dụ này giả định rằng các dữ liệu số xuất hiện trong các tế bào B2:D7.
  • Tổng SS là chỉ DEVSQ áp dụng cho tất cả các dữ liệu, chẳng hạn như DEVSQ(B2:D7).
  • Mẫu SS là SS tổng trừ đi tổng DEVSQ áp dụng cho mỗi mẫu, chẳng hạn như DEVSQ(B2:D4) + DEVSQ(B5:D7).
  • Cột SS là SS tổng trừ đi tổng DEVSQ áp dụng cho mỗi cột, chẳng hạn như DEVSQ(B2:B7) + DEVSQ(C2:C7) + DEVSQ(D2:D7).
  • Trong vòng SS là tổng DEVSQ áp dụng cho mỗi phiên tòa hoặc nhóm cặp, chẳng hạn như DEVSQ(B2:B4) + DEVSQ(C2:C4) + DEVSQ(D2:D4) + DEVSQ(B5:B7) + DEVSQ(C5:C7) + DEVSQ(D5:D7).
  • Tương tác SS bằng tổng SS trừ mẫu SS trừ Cột SS trừ đi trong vòng SS.

Mẫu 3: Hai nhân tố mà không cần nhân rộng

Một ví dụ đơn giản với dữ liệu là như sau.
ANOVA 3 CƠ BẢN MẪU:LOW MED Chào bạn
NGHÈO123
244
365
UPPER LỚP HỌC486
5107
6128
PHONG PHÚ71410
8126
9102
ANOVA: Hai nhân tố mà không cần Sao chép
TÓM TẮTCountTổng hợpBìnhPhương sai
NGHÈO3621
3103,3333331.333333
3144.6666672,333333
UPPER LỚP HỌC31864
3227.3333336.333333
3268.6666679.333333
PHONG PHÚ33110.3333312.33333
3268.6666679.333333
321719
LOW 94557.5
MED 9788.66666716
Chào bạn9515,6666676.25
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Các hàng176.6667822.083335.760870.0014762.591094
Cột68.66667234.333338.9565220.0024553.633716
Lỗi61.33333163.833333
Tổng cộng306.666726
Nếu các giá trị trong cột SS được tính toán một cách chính xác, các tính chính xác của tất cả các giá trị khác trong bảng ANOVA sau.

Excel 2003 và sau đó Phiên bản Excel sử dụng thủ tục tính toán sau đây. Các thủ tục sử dụng DEVSQ để tính toán các giá trị trong cột SS Table ANOVA. Để minh hoạ, Ví dụ này giả định rằng phạm vi của các tế bào được hiển thị trong ví dụ trước đó là các tế bào A1:D10. Vì vậy, các dữ liệu số xuất hiện trong các tế bào B2:D10.
  • Tổng SS là chỉ DEVSQ áp dụng cho tất cả các dữ liệu, chẳng hạn như DEVSQ(B2:D10).
  • Hàng SS là SS tổng trừ đi tổng DEVSQ áp dụng cho mỗi hàng, chẳng hạn như DEVSQ(B2:D2) + DEVSQ(B3:D3) + DEVSQ(B4:D4) + DEVSQ(B5:D5) + DEVSQ(B6:D6) + DEVSQ(B7:D7) + DEVSQ(B8:D8) + DEVSQ(B9:D9) + DEVSQ(B10:D10).
  • Cột SS là SS tổng trừ đi tổng DEVSQ áp dụng cho mỗi cột, chẳng hạn như DEVSQ(B2:B10) + DEVSQ(C2:C10) + DEVSQ(D2:D10).
  • Lỗi SS là SS tổng trừ hàng SS trừ cột SS.

Kết quả trong Excel 2002 và trong phiên bản trước của Excel

Trong trường hợp cực đoan trong trường hợp không có chữ số quan trọng nhiều trong các dữ liệu nhưng cũng một phương sai nhỏ, công thức tính dẫn đến không chính xác kết quả. Phụ lục xuất hiện sau này trong bài viết này cung cấp cho các ví dụ về vấn đề roundoff trong tình huống cực như vậy.

Kết quả trong Excel 2003 và trong sau này các phiên bản Excel

Excel 2003 và sau đó Phiên bản Excel sử dụng một thủ tục mà làm cho hai đi qua các dữ liệu. Ngày đầu tiên vượt qua, Excel 2003 và sau đó các phiên bản Excel tính toán số tiền và bá tước của dữ liệu các giá trị. Từ đây, Excel có thể tính toán mẫu bình (trung bình).

Ngày thứ hai đèo, Excel tính toán khác nhau bình phương giữa mỗi điểm dữ liệu và các mẫu có nghĩa là, và sau đó tiền những khác biệt này bình phương. Như là kết quả, kết quả trong Excel 2003 và trong sau này các phiên bản Excel là ổn định hơn numerically.

Kết luận

Một cách tiếp cận thông hai cải thiện hiệu suất soá trong cả ba ATP ANOVA công cụ trong Excel 2003 và trong sau này các phiên bản của Excel so với phiên bản trước của Excel. Những kết quả mà bạn có được bằng cách sử dụng Excel 2003 và sau đó các phiên bản Excel không bao giờ ít chính xác hơn so với những kết quả mà bạn có được bằng cách sử dụng trước đó các phiên bản của Excel.

Trong trường hợp thực tế nhất, tuy nhiên, không có không có sự khác biệt giữa các kết quả này. Điều này là bởi vì dữ liệu không thường thể hiện các loại hành vi bất thường mà các Theo phụ lục minh hoạ. Sự bất ổn định số là rất có thể xảy ra trong Phiên bản trước của Excel khi dữ liệu chứa một số lượng đáng kể chữ số với tương đối ít thay đổi giữa các giá trị dữ liệu.

Nếu bạn sử dụng một phiên bản cũ của Excel, và nếu bạn muốn nhìn thấy cho dù Excel 2003 hoặc một sau này Phiên bản của Excel cung cấp cho bạn kết quả khác nhau ANOVA, so sánh kết quả mà bạn có được khi bạn sử dụng các công cụ ANOVA trong của bạn Phiên bản trước của Excel với kết quả mà bạn có được khi bạn sử dụng các thủ tục mà sử dụng DEVSQ.

Chú ý Các thủ tục mà sử dụng DEVSQ đã mô tả trước đó trong bài viết này cho bảng ANOVA được liên kết với nhau của các công cụ.

Để xác minh rằng chênh lệch là chính xác trong bảng tóm tắt cho mỗi phạm vi, sử dụng DEVSQ)phạm vi) / (TÍNH ()phạm vi) – 1).

Phụ lục: Số ví dụ về hiệu suất của Excel 2002 và phiên bản trước của Excel

Đối với mỗi ví dụ cơ bản từ các mô hình 1, 2 và 3, bài viết này trước đây trình bày công cụ ATP đầu ra. Nó bao gồm các bản tóm tắt và ANOVA bảng. Dữ liệu được lần trong mỗi ví dụ để tạo ra một ví dụ "căng thẳng". Điều này được thực hiện bằng cách thêm 10 ^ 8 để mỗi giá trị dữ liệu. Thêm một liên tục như 10 ^ 8 để mỗi giá trị dữ liệu không ảnh hưởng phương sai trong bảng tóm tắt (mà sẽ ảnh hưởng đến Trung bình và tổng bằng nhiều cách rõ ràng). Nó sẽ cũng không ảnh hưởng đến bất cứ mục nhập trong các ANOVA bảng.

Nếu bạn so sánh chênh lệch trong sơ lược về bảng và SS ở bảng ANOVA, bạn sẽ nhận thấy rằng tất cả các không chính xác được tính toán trong tất cả ba sau đây nhấn mạnh các mô hình ngoại trừ một mục nhập trong mô hình 3 đó là chỉ đến với"<>".

Trong tất cả các trường hợp căng thẳng, ANOVA kết quả mà bạn có được bằng cách sử dụng Excel 2003 và các phiên bản sau của Excel đồng ý với kết trước đó quả trong trường hợp cơ bản (như họ nên).

ANOVA 1 nhấn mạnh mẫu với các giá trị dữ liệu lớn

100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
100000004100000008100000006
100000005100000007
100000006100000008
ANOVA: đơn Yếu tố
TÓM TẮT
Các nhómCountTổng hợpBìnhPhương sai
Cột 166000000211E + 084.8
Cột 244000000201E + 088
Cột 366000000331E + 081.6
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Giữa Các nhóm020013.805567
Trong vòng Các nhóm64134.923077
Tổng cộng6415

ANOVA 2 nhấn mạnh mẫu với các giá trị dữ liệu lớn

nhóm 1nhóm 2nhóm 3
xét xử 1100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
xét xử 2100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
ANOVA: Hai nhân tố với Sao chép
TÓM TẮTnhóm 1nhóm 2nhóm 3Tổng cộng
xét xử 1
Count3339
Tổng hợp3000000063000000123000000129E + 08
Bình1000000021000000041000000041E + 08
Phương sai0404
xét xử 2
Count3339
Tổng hợp3000000153000000303000000219E + 08
Bình1000000051000000101000000071E + 08
Phương sai0406
Tổng cộng
Count666
Tổng hợp600000021600000042600000033
Bình100000004100000007100000005.5
Phương sai4.814,41.6
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Mẫu64164240.0003674.747221
Cột3221660.0156253.88529
Tương tác3221660.0156253.88529
Trong vòng32122.666666667
Tổng cộng12817

ANOVA 3 nhấn mạnh mẫu với các giá trị dữ liệu lớn

LOW MED Chào bạn
NGHÈO100000001100000002100000003
100000002100000004100000004
100000003100000006100000005
UPPER LỚP HỌC100000004100000008100000006
100000005100000010100000007
100000006100000012100000008
PHONG PHÚ100000007100000014100000010
100000008100000012100000006
100000009100000010100000002
ANOVA: Hai nhân tố mà không cần Sao chép
TÓM TẮTCountTổng hợpBìnhPhương sai
Hàng 133000000061000000020
Hàng 233000000101000000032
Hàng 333000000141000000052
Hàng 433000000181000000064<>
Hàng 533000000221000000076
Hàng 6330000002610000000910
Hàng 7330000003110000001012
Hàng 8330000002610000000910
Hàng 9330000002110000000718
Cột 199000000451000000058
Cột 2990000007810000000914
Cột 399000000511000000064
ANOVA
Nguồn Biến thểSSDFMSFP-giá trịF Crit
Các hàng12881620.1132812.591094
Cột3221620.1677723.633716
Lỗi128168
Tổng cộng28826

Cảnh báo: Bài viết này đã được dịch tự động

Thuộc tính

ID Bài viết: 829215 - Xem lại Lần cuối: 08/30/2011 09:58:00 - Bản sửa đổi: 2.0

Microsoft Office Excel 2007

  • kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo kbmt KB829215 KbMtvi
Phản hồi