La descrizione di miglioramento numerico in ANOVA Strumenti di analisi strumenta in Excel

Traduzione articoli Traduzione articoli
Identificativo articolo: 829215 - Visualizza i prodotti a cui si riferisce l?articolo.
Espandi tutto | Chiudi tutto

In questa pagina

Sommario

In questo articolo si descrivono i miglioramenti numerici nei ciascun tre strumenti ANOVA Strumenti di analisi. I risultati in Microsoft Excel 2002 e nelle versioni precedenti di Excel nelle situazioni estreme non accurati in questo articolo si illustrano inoltre.

Informazioni

Molte funzioni richiedono il calcolo della somma di deviazioni quadrate a proposito di un media. Per effettuare l'operazione accuratamente, Excel 2003 di Microsoft Office e le versioni successive di Excel utilizzano una procedura in due fasi che consente sopra il primo passaggio di trovare il media e che quindi calcola le deviazioni quadrate a proposito del media sopra il seconda passaggio.

Nell'aritmetica precisa, lo stesso risultato si verifica nelle versioni precedenti di Excel che utilizzano "la formula di calcolatrice" Questa formula pertanto si denomina perchÚ esso era in uso diffuso quando gli statistician hanno utilizzato le calcolatrici invece che i computer. Con la formula di calcolatrice, le versioni precedenti di Excel sommano i quadrati delle osservazioni e quindi sottrarre la seguente quantitÓ da questa totale:
((sum of observations)^2) / number of observations
Questo calcolo si Ŕ verificato in un singolo passaggio nei dati.

Nella precisione aritmetica finita, la formula di calcolatrice Ŕ gli errori roundoff nei casi estremi. In Excel 2002 e nelle versioni precedenti di Excel si utilizza la formula di calcolatrice per pi¨ funzioni che richiedono una somma delle deviazioni quadrate a proposito di un media (come VAR, DEV.ST, PENDENZA e PEARSON). Queste versioni di Excel tuttavia anche utilizzano la procedura pi¨ numericamente affidabile in due fasi per le funzioni CORRELAZIONE, COVARIANZA e DEV.Q.

Gli esperti nell'elaborazione statistica consigliano di non utilizzare la formula di calcolatrice. La formula di calcolatrice si presenta nei testi a proposito dell'elaborazione statistica "come come non lo esegue". Tutti i tre strumenti ANOVA Analysis ToolPak (ATP) utilizzano diffusi purtroppo la formula di calcolatrice o un approccio equivaluto single-pass in Excel 2002 e nelle versioni precedenti di Excel.

Excel 2003 e le versioni successive di Excel utilizzano la procedura in due fasi per tutti i tre modelli ATP ANOVA. In questo articolo si illustrano i seguenti miglioramenti di calcolo nei tre modelli ANOVA di ATP:
  • Singolo fattore
  • A due fattori con la replica
  • A due fattori senza la replica
Questi modelli in questo articolo si illustrano in seguito.

PoichÚ Excel sempre ha utilizzato la procedura con DEV.Q in due fasi, questo articolo lo utilizza frequente per descrivere le procedure migliorate in questo articolo. Efficacemente, queste routine modificate chiamano DEV.Q o utilizzano il codice cui funzionalitÓ Ŕ esattamente lo stesso come la funzionalitÓ di DEV.Q.

Per ciascuno strumento ANOVA, l'output ATP contiene una tabella Riepilogo con i valori di Count, di Somma, di Media e di Scostamento e una tabella ANOVA che ha le varie sommi dei quadrati e dei valori di SS gdl MS, F e P-value. I risultati nella tabella di riepilogo si calcolano chiamando le funzioni di Excel COUNT, SOMMA, MEDIA e VAR. Di queste quattro funzioni, solo VAR Ŕ gli errori roundoff.

In Excel 2002 e nelle versioni precedenti di Excel implementano VAR utilizzando la formula di calcolatrice. Nel seguente articolo a proposito di VAR si descrivono i miglioramenti che si sono verificato in Excel 2003 e nelle versioni successive di Excel. Questo articolo consente inoltre di sperimentare con i dati numerici per visualizzarli quando Ŕ probabile che gli errori roundoff si siano verificati nelle versioni precedenti di Excel.

Per ulteriori informazioni su VAR, fare clic sul seguente numero di articolo per visualizzare l'articolo del Microsoft Knowledge Base:
826112 Excel le funzioni statistiche : il VAR


Come i tre modelli ANOVA si illustrano in questo articolo, esso Ŕ incentrato nelle tabelle di output ANOVA. In ogni caso, le tabelle Riepilogo sono ben in Excel 2003 e nelle versioni successive di Excel. I problemi si verifica che in Excel 2002 e nelle versioni precedenti di Excel, quando i dati presentino i valori estremi nella colonna di Scostamento.

Questo articolo tuttavia include le tabelle Riepilogo delle sezioni di modello perchÚ queste tabelle sono utili per il confronto quando si verificano gli esempi modificati nell'appendice.

Modello 1: Singolo fattore

Un esempio semplice con i dati Ŕ la seguente.
Riduci questa tabellaEspandi questa tabella
BASIC MODELLO ANOVA 1:
123
244
365
486
57
68
Anova: Singolo fattore
RIEPILOGO
GruppiCountSommaMediaVarianza
Colonna 1 6213,53,5
Colonna 2 42056,666667
Colonna 3 6335,53,5
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Fra gruppi 12,7526,3751,5068180,2578973,805567
Dentro gruppi 55134,230769
Totale67,7515
In Excel 2002 e nelle versioni precedenti di Excel si utilizza il seguente pseudocodice per calcolare le sommi di quadrati:
GrandSum = 0;
GrandSumOfSqs = 0; 
GrandSampleMeanSqrd = 0; 
GrandMeanSqrd = 0; 
GrandSampleSize = 0;

For s = 1 to Number_of_Samples do
   GrandSum = GrandSum + sum of observations in s-th sample;
   GrandSumOfSqs = GrandSumOfSqs + sum of squared observations in s-th sample;
   GrandSampleMeanSqrd = GrandSampleMeanSqrd  +
      (sum of observations in s-th sample^2)/size of s-th sample;
   GrandSampleSize = GrandSampleSize + size of s-th sample
Endfor;

GrandMeanSqrd = (GrandSum^2) / GrandSampleSize;

TotalSS = GrandSumOfSqs ? GrandMeanSqrd;
BetweenGroupsSS = GrandSampleMeanSqrd ? GrandMeanSqrd;
WithinGroupsSS = GrandSumOfSqs ? GrandSampleMeanSqrd;
Questo approccio Ŕ essenzialmente la formula di calcolatrice. Questo approccio calcola le sommi dei quadrati di osservazioni quindi questo approccio sottrarre una quantitÓ da esse come VAR calcola la somma dei quadrati delle osservazioni e quindi sottrarre sum of observations appena ^ 2/ l'esempio <VAR> dimensiona </VAR>. Si Ŕ omesso il pseudocodice simile per il modello 2 e per il modello 3.

Per il modello 2 e per il modello 3, nuovamente, le sommi dei quadrati si calcolano e la somma di quadrati la formula di calcolatrice sottrarre una quantitÓ. I testi statistici di base suggeriscono gli approcci frequentemente purtroppo per ANOVA come uno visualizzato in precedenza in questo articolo.

Excel 2003 e le versioni successive di Excel utilizzano un diverso approccio per calcolare le varie immissioni nella colonna SS della tabella ANOVA. Allo scopo illustrativo, in questo articolo si presuppone che i dati numerici nell'esempio precedente si visualizzano in A2:C7 di celle con i dati nelle celle B6 e B7 che si mancano.
  • SS totale Ŕ appena DEV.Q applicato a tutti i dati come DEVSQ(A2:C7). DEV.Q funziona correttamente pur mancare il dato.
  • Fra SS Gruppi, Ŕ SS Totale la somma di DEV.Q applicato a ogni colonna come DEVSQ(A2:A7), DEVSQ(B2:B7)+ DEVSQ(C2:C7).
  • Dentro SS Gruppi, Ŕ SS Totale SS Gruppi Fra.
Se si calcolano le immissioni nella colonna SS della tabella ANOVA correttamente, si segue la precisione delle altre voci nella tabella.

Modello 2: A due fattori con la replica

Un esempio semplice con i dati Ŕ la seguente.
Riduci questa tabellaEspandi questa tabella
BASIC MODELLO ANOVA 2gruppo 1 gruppo 2 gruppo 3
1 di valutazione 123
244
365
2 di valutazione 486
5107
6128
Anova: a due fattori con la replica
RIEPILOGOgruppo 1gruppo 2 gruppo 3 Totale
1 di valutazione
Count3339
Somma6121230
Media2443,333333
Varianza1412,5
2 di valutazione
Count3339
Somma15302166
Media51077,333333
Varianza1416,25
Totale
Count666
Somma214233
Media3,575,5
Varianza3,5143,5
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Esempio72172366.22E- 054,747221
Colonne37218,59,250,37093,88529
Interazione924,52,250,1479733,88529
Dentro24122
Totale14217
Se le immissioni nella colonna SS si calcolano correttamente, la precisione di tutti gli altri movimenti nella parte ANOVA dell'output si segue nuovamente.

La procedura di calcolo per Excel 2003 e per le versioni successive di Excel consente. Questa routine utilizza DEV.Q per calcolare le varie immissioni nella colonna SS della tabella ANOVA. Allo scopo illustrativo, questo esempio presuppone che i dati numerici si visualizzano in B2:D7 di celle.
  • SS totale Ŕ appena DEV.Q applicato a tutti i dati come DEVSQ(B2:D7).
  • SS di esempio Ŕ SS Totale la somma di DEV.Q associato a ogni campione come DEVSQ(B2:D4)+ DEVSQ(B5:D7).
  • Le colonne SS sono SS Totale la somma di DEV.Q applicato a ogni colonna come DEVSQ(B2:B7), DEVSQ(C2:C7)+ DEVSQ(D2:D7).
  • Dentro SS, Ŕ la somma di DEV.Q associato a ogni versione di valutazione o alla coppia di gruppo come DEVSQ(B2:B4), DEVSQ(C2:C4), DEVSQ(D2:D4), DEVSQ(B5:B7), DEVSQ(C5:C7)+ DEVSQ(D5:D7).
  • L'interazione SS corrisponde a SS Totale SS Esempio SS Colonne SS Dentro.

Model 3: A due fattori senza la replica

Un esempio semplice con i dati Ŕ la seguente.
Riduci questa tabellaEspandi questa tabella
BASIC MODELLO ANOVA 3:BASSA MED HI
SCARSO123
244
365
CLASSE MID 486
5107
6128
COMPLETO71410
8126
9102
Anova: a due fattori senza la replica
RIEPILOGOCountSommaMediaVarianza
SCARSO3621
3103,3333331,333333
3144,6666672,333333
CLASSE MID 31864
3227,3333336,333333
3268,6666679,333333
COMPLETO33110,3333312,33333
3268,6666679,333333
321719
BASSA 94557,5
MED 9788,66666716
HI9515,6666676,25
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Righe176,6667822,083335,760870,14762,591094
Colonne68,66667234,333338,9565220,24553,633716
Errore61,33333163,833333
Totale306,666726
Se i valori nella colonna SS si calcolano correttamente, si segue la precisione di tutti gli altri valori nella tabella ANOVA.

Excel 2003 e le versioni successive di Excel utilizzano la seguente procedura di calcolo. La routine utilizza DEV.Q per calcolare i valori nella colonna SS della tabella ANOVA. Allo scopo illustrativo, questo esempio presuppone che l'intervallo di celle mostrate nell'esempio precedente Ŕ A1:D10 di celle. I dati numerici pertanto si visualizzano in B2:D10 di celle.
  • SS totale Ŕ appena DEV.Q applicato a tutti i dati come DEVSQ(B2:D10).
  • SS di righe Ŕ SS Totale la somma di DEV.Q associato a ogni riga come DEVSQ(B2:D2), DEVSQ(B3:D3), DEVSQ(B4:D4), DEVSQ(B5:D5), DEVSQ(B6:D6), DEVSQ(B7:D7), DEVSQ(B8:D8), DEVSQ(B9:D9)+ DEVSQ(B10:D10).
  • Le colonne SS sono SS Totale la somma di DEV.Q applicato a ogni colonna come DEVSQ(B2:B10), DEVSQ(C2:C10)+ DEVSQ(D2:D10).
  • L'errore SS Ŕ SS Totale SS Righe SS Colonne.

Risultati in Excel 2002 e nelle versioni precedenti di Excel

Nei casi estremi che pi¨ cifre significative si trovano nei dati ma che una varianza piccola, la formula di calcolatrice, porta inoltre ai risultati non accurati. L'appendice visualizzata nel seguito di questo articolo fornisce gli esempi di problemi roundoff nelle situazioni estreme di tipo.

Risultati in Excel 2003 e nelle versioni successive di Excel

Excel 2003 e le versioni successive di Excel utilizzano una procedura che effettua due passaggi nei dati. Sopra il primo passaggio, Excel 2003 e le versioni successive di Excel calcolano la somma e il conteggio dei valori di dati. Da ci˛, Ŕ possibile calcolare il media di esempio (media) in Excel.

Sopra il seconda passaggio, in Excel, calcola il quadrato di differenza fra ogni valore e fra il media di esempio e quindi somma il quadrato di queste differenze. I risultati in Excel 2003 e nelle versioni successive di Excel sono pi¨ stabili numericamente di conseguenza.

Conclusioni

Un approccio in due fasi migliora la prestazione numerica in tutti i tre strumenti ATP ANOVA in Excel 2003 e nelle versioni successive di Excel alle versioni precedenti di Excel. I risultati che si ottengono utilizzando Excel 2003 e le versioni successive di Excel non sono pi¨ accurati mai dei risultati che si ottengono utilizzando le versioni precedenti di Excel.

Nei casi pi¨ pratici, tuttavia non esiste alcuna differenza di questi risultati. Ci˛ Ŕ perchÚ i dati non presentano in genere il tipo di comportamento insolito che illustra l'Appendice illustrata di seguito. ╚ probabile che l'instabilitÓ numerica si sia verificata nelle versioni precedenti di Excel quando il dato contiene un valore alto delle cifre significative relativamente con meno variazione tra i valori di dati.

Se si utilizza una versione precedenti di Excel e se si desidera visualizzare se Excel 2003 o una versione successiva di Excel fornisce diversi risultati ANOVA, confrontare i risultati che si ottengono ne se gli strumenti ANOVA si utilizzano nella versione precedenti di Excel con i risultati che si ottengono ne se si utilizzano le routine che utilizzano DEV.Q.

Nota: Le routine che utilizzano DEV.Q erano descritte in precedenza in questo articolo per la tabella ANOVA associata a ciascuno strumento.

Per verificare che Varianze siano corrette nella tabella Riepilogo per ogni intervallo, utilizzare DEV.Q ( intervallo)/ (CONTARE l'u 1 (l' intervallo)).

Appendice: Gli esempi numerici della prestazione di Excel 2002 e versioni precedenti di Excel

Per ogni esempio di base dai modelli 1, 2 e 3, questo articolo ha presentato l'output dello strumento ATP in precedenza. Ci˛ ha incluso le tabelle Sommario e ANOVA. Il dato si modificava in ogni esempio per creare un esempio "sollecitato". Si esegue l'operazione aggiungendo 10 ^ 8 a ogni valore di dati. Aggiungere una costante come 10 ^ 8 a ogni valore di dati non influisce su Varianza nella tabella Riepilogo (ma influirÓ nei modi ovvi su Media e su Somma). Esso non dovrebbe inoltre influenzare alcuna voce nella tabella ANOVA.

Se si confrontano Varianze nelle tabelle Riepilogo e SS nelle tabelle ANOVA, noterÓ che si calcolano non correttamente tutti di ci˛ in tutti i tre della seguente che ha sollecitato i modelli salvo un movimento nel modello 3 che si scegliere " <B> < - </B> ".

In tutti i casi sollecitati, i risultati ANOVA che si ottengono utilizzando Excel 2003 e le versioni successive di Excel corrispondono (come esse dovrebbero concordare ai risultati precedenti nei casi di base).

1 ANOVA ha sollecitato il modello con i valori di dati di dimensioni grandi

Riduci questa tabellaEspandi questa tabella
100.000.001100.000.002100.000.003
100.000.002100.000.004100.000.004
100.000.003100.000.006100.000.005
100.000.004100.000.008100.000.006
100.000.005100.000.007
100.000.006100.000.008
Anova: Singolo fattore
RIEPILOGO
GruppiCountSommaMediaVarianza
Colonna 1 6600.000.0211E+ 084,8
Colonna 2 4400.000.0201E+ 088
Colonna 3 6600.000.0331E+ 081,6
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Fra gruppi 020013,805567
Dentro gruppi 64134,923077
Totale6415

2 ANOVA ha sollecitato il modello con i valori di dati di dimensioni grandi

Riduci questa tabellaEspandi questa tabella
gruppo 1gruppo 2 gruppo 3
1 di valutazione 100.000.001100.000.002100.000.003
100.000.002100.000.004100.000.004
100.000.003100.000.006100.000.005
2 di valutazione 100.000.004100.000.008100.000.006
100.000.005100.000.010100.000.007
100.000.006100.000.012100.000.008
Anova: a due fattori con la replica
RIEPILOGOgruppo 1gruppo 2 gruppo 3 Totale
1 di valutazione
Count3339
Somma300.000.006300.000.012300.000.0129E+ 08
Media100.000.002100.000.004100.000.0041E+ 08
Varianza0404
2 di valutazione
Count3339
Somma300.000.015300.000.030300.000.0219E+ 08
Media100.000.005100.000.010100.000.0071E+ 08
Varianza0406
Totale
Count666
Somma600.000.021600.000.042600.000.033
Media100.000.004100.000.007100.000.005,5
Varianza4,814,41,6
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Esempio64164240,3674,747221
Colonne3221660,156253,88529
Interazione3221660,156253,88529
Dentro32122.666666667
Totale12817

3 ANOVA ha sollecitato il modello con i valori di dati di dimensioni grandi

Riduci questa tabellaEspandi questa tabella
BASSA MED HI
SCARSO100.000.001100.000.002100.000.003
100.000.002100.000.004100.000.004
100.000.003100.000.006100.000.005
CLASSE MID 100.000.004100.000.008100.000.006
100.000.005100.000.010100.000.007
100.000.006100.000.012100.000.008
COMPLETO100.000.007100.000.014100.000.010
100.000.008100.000.012100.000.006
100.000.009100.000.010100.000.002
Anova: a due fattori senza la replica
RIEPILOGOCountSommaMediaVarianza
Riga 1 3300.000.006100.000.0020
Riga 2 3300.000.010100.000.0032
Riga 3 3300.000.014100.000.0052
Riga 4 3300.000.018100.000.0064<---
Riga 5 3300.000.022100.000.0076
Riga 6 3300.000.026100.000.00910
Riga 7 3300.000.031100.000.01012
Riga 8 3300.000.026100.000.00910
Riga 9 3300.000.021100.000.00718
Colonna 1 9900.000.045100.000.0058
Colonna 2 9900.000.078100.000.00914
Colonna 3 9900.000.051100.000.0064
ANOVA
Origine di variazione SSgdlMICROSOFTFP-value Crit F
Righe12881620,1132812,591094
Colonne3221620,1677723,633716
Errore128168
Totale28826

ProprietÓ

Identificativo articolo: 829215 - Ultima modifica: mercoledý 10 gennaio 2007 - Revisione: 2.0
Le informazioni in questo articolo si applicano a
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
Chiavi:á
kbexpertisebeginner kbfunctions kbprogramming kbfuncstat kbinfo KB829215 KbMtit kbmt
Traduzione automatica articoli
Il presente articolo Ŕ stato tradotto tramite il software di traduzione automatica di Microsoft e non da una persona. Microsoft offre sia articoli tradotti da persone fisiche sia articoli tradotti automaticamente da un software, in modo da rendere disponibili tutti gli articoli presenti nella nostra Knowledge Base nella lingua madre dell?utente. Tuttavia, un articolo tradotto in modo automatico non Ŕ sempre perfetto. Potrebbe contenere errori di sintassi, di grammatica o di utilizzo dei vocaboli, pi¨ o meno allo stesso modo di come una persona straniera potrebbe commettere degli errori parlando una lingua che non Ŕ la sua. Microsoft non Ŕ responsabile di alcuna imprecisione, errore o danno cagionato da qualsiasi traduzione non corretta dei contenuti o dell?utilizzo degli stessi fatto dai propri clienti. Microsoft, inoltre, aggiorna frequentemente il software di traduzione automatica. Nel caso in cui si riscontrino degli errori e si desideri inviare dei suggerimenti, Ŕ possibile completare il questionario riportato alla fine del presente articolo.
Clicca qui per visualizzare la versione originale in inglese dell?articolo: 829215
LE INFORMAZIONI CONTENUTE NELLA MICROSOFT KNOWLEDGE BASE SONO FORNITE SENZA GARANZIA DI ALCUN TIPO, IMPLICITA OD ESPLICITA, COMPRESA QUELLA RIGUARDO ALLA COMMERCIALIZZAZIONE E/O COMPATIBILITA' IN IMPIEGHI PARTICOLARI. L'UTENTE SI ASSUME L'INTERA RESPONSABILITA' PER L'UTILIZZO DI QUESTE INFORMAZIONI. IN NESSUN CASO MICROSOFT CORPORATION E I SUOI FORNITORI SI RENDONO RESPONSABILI PER DANNI DIRETTI, INDIRETTI O ACCIDENTALI CHE POSSANO PROVOCARE PERDITA DI DENARO O DI DATI, ANCHE SE MICROSOFT O I SUOI FORNITORI FOSSERO STATI AVVISATI. IL DOCUMENTO PUO' ESSERE COPIATO E DISTRIBUITO ALLE SEGUENTI CONDIZIONI: 1) IL TESTO DEVE ESSERE COPIATO INTEGRALMENTE E TUTTE LE PAGINE DEVONO ESSERE INCLUSE. 2) I PROGRAMMI SE PRESENTI, DEVONO ESSERE COPIATI SENZA MODIFICHE, 3) IL DOCUMENTO DEVE ESSERE DISTRIBUITO INTERAMENTE IN OGNI SUA PARTE. 4) IL DOCUMENTO NON PUO' ESSERE DISTRIBUITO A SCOPO DI LUCRO.

Invia suggerimenti

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com