Possibile restituzione di risultati non corretti ed etichette fuorvianti quando si utilizza il test t strumenti di analisi di Excel

Traduzione articoli Traduzione articoli
Identificativo articolo: 829252 - Visualizza i prodotti a cui si riferisce l?articolo.
Espandi tutto | Chiudi tutto

In questa pagina

Sommario

In questo articolo viene descritto il test t strumenti di analisi con due campioni accoppiati per medie. Questo strumento non Ŕ stato modificato per Microsoft Office Excel 2003 o versioni successive, ma quando alcuni dati sono mancanti vengono restituiti risultati errati. Inoltre, anche se non mancano dati, nell'output dello strumento sono presenti etichette fuorvianti.

Informazioni su Microsoft Excel 2004 per Macintosh

Le funzioni statistiche in Excel 2004 per Mac sono state aggiornate utilizzando gli stessi algoritmi adoperati per aggiornare le funzioni statistiche di Microsoft Office Excel 2003. Tutte le informazioni contenute in questo articolo che descrivono il funzionamento di una funzione oppure le modifiche apportate a una funzione per Excel 2003 e versioni successive. Le informazioni di questo articolo relative al funzionamento o alla modifica di una funzione di Excel 2003 e delle versioni successive di Excel riguardano anche Excel 2004 per Mac.

Informazioni

Normalmente il test t strumenti di analisi con due campioni accoppiati per medie, definito a volte test t con coppie corrispondenti, viene utilizzato quando sono presenti misure rilevate prima e dopo per le stesse prove di un trattamento. Ad esempio, Ŕ possibile misurare il peso di un soggetto prima e dopo un piano dietetico di 30 giorni.

I dati relativi a un soggetto di cui mancano le misure prima e dopo il trattamento vengono di solito eliminati. I dati incompleti su un soggetto rendono inutili le informazioni relative a tale soggetto. Purtroppo questo strumento di analisi presenta un comportamento diverso dalla pratica normale. Prima di tutto viene contato il numero di soggetti con misure rilevate prima e il numero di soggetti con misure rilevate dopo il trattamento. Se questi totali risultano diversi verrÓ visualizzato un messaggio di errore e l'esecuzione dello strumento di analisi verrÓ interrotta. Pertanto, se ad esempio sono presenti 49 soggetti con misurazioni prima e dopo il trattamento e 15 soggetti con misurazioni prima del trattamento, l'analisi non verrÓ completata.

Se il numero di soggetti con dati rilevati prima mancanti Ŕ uguale al numero di soggetti con dati rilevati dopo mancanti e tale numero Ŕ positivo, verrÓ eseguita un'analisi non corretta. Si supponga ad esempio di esaminare 50 soggetti. Per il soggetto A manca la misura rilevata prima, mentre per il soggetto B manca la misura rilevata dopo il trattamento e per gli altri 48 soggetti i dati sono tutti disponibili. Verranno contate 49 misure prima e 49 misure dopo il trattamento, come se l'analisi riguardasse 49 soggetti senza dati mancanti. Il risultato non rispetta l'intento di eliminare tutti i soggetti con un valore mancante prima o dopo il trattamento. Il numero di soggetti in questo esempio dovrebbe essere 48, non 49. Questo strumento utilizza pertanto un numero errato di gradi di libertÓ. PoichÚ non viene eliminata la misura dopo del soggetto A nÚ la misura prima del soggetto B, queste due misure sono incluse nei calcoli delle medie di esempio utilizzate nella statistica T, che risultano pertanto errate.

In sintesi, non Ŕ opportuno utilizzare questo strumento quando vi sono dati mancanti, poichÚ il calcolo non verrÓ effettuato oppure verranno utilizzate formule non corrette. Quest'ultimo caso si presenta quando il numero di soggetti con dati mancanti rilevati prima Ŕ uguale al numero di soggetti con dati mancanti rilevati dopo un trattamento.

Nella sezione "Esempio di utilizzo" di questo articolo vengono illustrati questi problemi con riferimenti alle etichette fuorvianti contenute nell'output dello strumento. Nella sezione "Workaround" di questo articolo viene riportata una soluzione alternativa utilizzabile qualora non sia possibile verificare l'assenza di dati mancanti prima di avviare lo strumento.

Esempio di utilizzo

Per illustrare il problema dei dati mancanti, creare un foglio di lavoro di Excel vuoto, quindi copiare la seguente tabella. Selezionare la cella A1 nel foglio di lavoro vuoto, quindi incollare le voci della tabella nelle celle A1:I52 del foglio di lavoro.
Riduci questa tabellaEspandi questa tabella
Prova 1Prova 2Prova 3Prova 3 modificata per rimuovere i
primadopoprimadopoprimadoposoggetti con dati mancanti
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
FunzionalitÓ del test t a due code
=TEST.T(A3:A13, B3:B13,2,1)=TEST.T(C3:C13, D3:D13, 2, 1)=TEST.T(E3:E13, F3:F13, 2, 1)
=TEST.T(C3:C12, D3:D12, 2, 1)=TEST.T(G3:G11, H3:H11, 2, 1)
Strumento di analisi per la prova 1:
Test t: due campioni accoppiati per medie
Variabile 1Variabile 2
Media150144.090909090909
Varianza1100914.090909090909
Osservazioni1111
Correlazione di Pearson0.952384533866487
Differenza ipotizzata per le medie0
gdl10
Stat t1.92092590483801
P(T<=t) una coda0.0418403929085198
t critico una coda1.81246110219722
P(T<=t) due code0.0836807858170396
t critico due code2.22813884242587
Strumento di analisi per la prova 2:
Il calcolo non viene effettuato a causa dei numeri di dati dissimili
Strumento di analisi per la prova 3:
Test t: due campioni accoppiati per medie
Variabile 1Variabile 2
Media151148.5
Varianza1210778.055555555556
Osservazioni1010
Correlazione di Pearson0.936537537274845
Differenza ipotizzata per le medie0
gdl9
Stat t0.141327169509421
P(T<=t) una coda0.445362157564494
t critico una coda1.83311292255007
P(T<=t) due code0.890724315128988
t critico due code2.26215715817358
Dopo avere incollato la tabella nel foglio di lavoro di Excel, fare clic su Opzioni Incolla, quindi su Applica formattazione di destinazione. Con l'intervallo incollato ancora selezionato, utilizzare una delle procedure seguenti, a seconda della versione di Excel in uso:
  • In Microsoft Office Excel 2007, fare clic sulla scheda Home, scegliere Formato nel gruppo Celle, quindi fare clic su Adatta larghezza colonne.
  • In Excel 2003, scegliere Colonna dal menu Formato, quindi Adatta.
╚ possibile utilizzare il foglio di lavoro per confrontare i risultati della funzione TEST.T di Excel con lo strumento di analisi. La Prova 1 mostra i dati completi di 11 soggetti. Il valore di TEST.T nella cella A16 corrisponde alla probabilitÓ che la statistica T sia maggiore del valore osservato, presupponendo una distribuzione T con dieci gradi di libertÓ. Questo valore, 0,837, viene riportato anche nella cella B32 dell'output dello strumento. L'etichetta nella cella A32 dovrebbe essere "P(T >= |t|) due code", non "P(T<=t) due code", tuttavia la risposta numerica Ŕ corretta poichÚ non vi sono dati mancanti nella Prova 1. In modo analogo, l'etichetta nella cella A30 dovrebbe essere "P(T >= |t|) una coda", non "P(T<=t) una coda". I limiti per "t critico" sono corretti. Corrispondono al livello di significativitÓ predefinito, 0,05, utilizzando il numero corretto di gradi di libertÓ, 10.

Nella Prova 2 vi Ŕ una misura dopo mancante per un soggetto senza altri dati mancanti. Il calcolo non viene effettuato. I valori di TEST.T nelle celle A16 e A17 sono gli stessi. Nella cella A16 viene utilizzato l'intervallo di celle di dati C3:D13 che comprende l'ultimo soggetto, il solo per il quale i dati siano mancanti. Nella cella A17 viene utilizzato l'intervallo di celle di dati C3:D12 che corrisponde a una prova con i primi dieci soggetti e nessun dato mancante. Il fatto che i risultati siano gli stessi indica che quando viene chiamata la funzione TEST.T nella cella A16, il soggetto con dati mancanti viene correttamente eliminato.

Nella Prova 3 vi sono una misura dopo e una misura prima mancanti per due diversi soggetti. Nella Prova 3 modificata vengono esaminati i nove soggetti rimanenti senza dati mancanti. I risultati di TEST.T nelle celle E16 ed E17 sono gli stessi. Nella cella E16 viene richiamata la funzione TEST.T sui dati di Prova 3 nelle celle E3:F13. Nella cella E17, viene chiamata la funzione TEST.T sui dati di Prova 3 modificata nelle celle G3:H11. I risultati sono gli stessi poichÚ con TEST.T vengono correttamente eliminati i soggetti settimo e undicesimo nella Prova 3, i due soggetti con dati mancanti. Se si esamina l'output dello strumento per la Prova 3, si noterÓ che le osservazioni relative a prima e dopo nelle celle B44 e C44 corrispondono sempre a 10. ╚ facile verificare che SOMMA(E3:E13) Ŕ 1510 e SOMMA(F3:F13) Ŕ 1485. PoichÚ in ogni intervallo sono presenti 10 osservazioni, le rispettive medie saranno 151 e 148,5 riportate nelle celle B42 e C42. Lo strumento non ha quindi eliminato alcun soggetto, includendo la misura dopo per il settimo soggetto e la misura prima per l'undicesimo soggetto dell'analisi. Il numero di gradi di libertÓ nella cella B47 non Ŕ corretto, poichÚ avrebbero dovuto essere indicati nove soggetti e otto gdl. Le voci relative ai valori limite nelle celle B50 e B52 non sono corrette e nelle celle A50 e A52 sono presenti etichette fuorvianti per tali voci.

Risultati in tutte le versioni di Excel

Purtroppo questo strumento non Ŕ stato corretto per Excel 2003 e versioni successive.

Workaround suggerito per tutte le versioni di Excel

╚ possibile eliminare i soggetti con dati mancanti prima di utilizzare lo strumento. ╚ tuttavia possibile che non si desideri modificare un foglio di Excel in questo modo. Nella procedura seguente Ŕ illustrato un metodo per eliminare i soggetti con dati mancanti. Per eliminare soggetti con dati mancanti, attenersi alla seguente procedura:
  1. Copiare i due intervalli di dati in una nuova area del foglio di lavoro.
  2. Analizzare i dati verso l'alto dalla riga inferiore comune dei due intervalli.
    1. Se nella riga inferiore vi sono dati mancanti, cancellarla. L'intervallo di dati viene ridotto. Andare al passaggio 3.
    2. Sopra la riga inferiore identificare la riga r pi¨ vicina alla riga inferiore con dati mancanti.
      1. Copiare tutti i dati sotto la riga r.
      2. Selezionare la riga r, quindi incollarvi i dati copiati.
      3. Cancellare la riga inferiore di dati (nella quale verranno duplicate la riga di dati successiva fino all'ultima). L'intervallo di dati viene ridotto.
  3. Ripetere il passaggio 2 finchÚ non vi saranno pi¨ dati mancanti.
Nota ╚ possibile utilizzare lo strumento se si Ŕ certi che non vi siano osservazioni mancanti.

╚ possibile duplicare una buona parte ma non tutto l'output dello strumento senza trasformare i dati. Non Ŕ possibile trovare i valori relativi a Media, Varianza e Osservazioni se non con una procedura complessa. Con questo strumento vengono trovati valori non corretti esaminando i dati prima e dopo separatamente. Il valore gdl dello strumento corrisponde al valore comune delle osservazioni meno una, pertanto il risultato non sarÓ corretto se vi sono dati mancanti. Non Ŕ possibile trovare Statistica T semplicemente, poichÚ Ŕ necessario esaminare contemporaneamente i dati rilevati prima e dopo.

La correlazione di Pearson pu˛ tuttavia essere trovata applicando la funzione PEARSON o CORRELAZIONE ai due intervalli di dati. Queste due funzioni di Excel consentono di gestire correttamente i dati mancanti. ╚ inoltre possibile trovare le probabilitÓ a una coda e a due code associate ai dati richiamando la funzione TEST.T di Excel, che gestisce i dati mancanti correttamente. Per le probabilitÓ a una coda e a due code nella Prova 3, Ŕ possibile richiamare rispettivamente TEST.T(E3:E13, F3:F13, 1, 1) e TEST.T(E3:E13, F3:F13, 2, 1). ╚ inoltre possibile verificare che i risultati di queste funzioni corrispondono a quelli dello strumento nella Prova 1, in cui il funzionamento Ŕ corretto perchÚ non vi sono dati mancanti. Le chiamate corrispondenti per Prova 1 sono rispettivamente TEST.T(A3:A13, B3:B13, 1, 1) e TEST.T(A3:A13, B3:B13, 2, 1).

Per i limiti di t critico Ŕ necessario stabilire il numero di gradi di libertÓ. Nelle prove 1, 2 e 3 i numeri di gradi di libertÓ corretti sono rispettivamente 10, 9 e 8. Questi numeri sono sempre uno in meno del numero di oggetti utili presenti nei dati senza misure prima e dopo mancanti. Per la Prova 3, ad esempio, Ŕ possibile immettere nella cella J3, =SE(O(VAL.VUOTO(E3), VAL.VUOTO(F3)), 0, 1), quindi inserire questa formula nelle celle J4:J13 e individuare i dgl immettendo nella cella J14: =SOMMA(J3:J13) ? 1.

Dopo avere stabilito il valore di gdl, sarÓ possibile utilizzare la funzione INV.T di Excel. Con il livello di significativitÓ 0,05 le chiamate per Prova 1, 2 e 3 saranno rispettivamente INV.T(0,05, 10), INV.T(0,05, 9) e INV.T(0,05, 8). Verranno restituiti i valori di "t critico due code". Per ottenere i valori di "t critico una coda", utilizzare chiamate analoghe raddoppiando il livello di significativitÓ, ad esempio INV.T(0,10, 10), INV.T(0,10, 9) e INV.T(0,10, 8) rispettivamente.

Conclusioni

Non utilizzare il test t strumenti di analisi con due campioni accoppiati per medie, a meno di essere certi che non vi siano dati mancanti. In questo articolo vengono forniti suggerimenti per la duplicazione della maggior parte delle funzionalitÓ dello strumento utilizzando le funzioni di Excel anzichÚ lo strumento di analisi.

Lo strumento restituisce inoltre etichette "P(T<=t)" fuorvianti. In questo articolo vengono descritte le interpretazioni corrette.

ProprietÓ

Identificativo articolo: 829252 - Ultima modifica: mercoledý 21 marzo 2007 - Revisione: 3.0
Le informazioni in questo articolo si applicano a
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
  • Microsoft Excel 2004 for Mac
Chiavi:á
kbformula kbexpertisebeginner kbprb kbfunctions kbfuncstat KB829252
LE INFORMAZIONI CONTENUTE NELLA MICROSOFT KNOWLEDGE BASE SONO FORNITE SENZA GARANZIA DI ALCUN TIPO, IMPLICITA OD ESPLICITA, COMPRESA QUELLA RIGUARDO ALLA COMMERCIALIZZAZIONE E/O COMPATIBILITA' IN IMPIEGHI PARTICOLARI. L'UTENTE SI ASSUME L'INTERA RESPONSABILITA' PER L'UTILIZZO DI QUESTE INFORMAZIONI. IN NESSUN CASO MICROSOFT CORPORATION E I SUOI FORNITORI SI RENDONO RESPONSABILI PER DANNI DIRETTI, INDIRETTI O ACCIDENTALI CHE POSSANO PROVOCARE PERDITA DI DENARO O DI DATI, ANCHE SE MICROSOFT O I SUOI FORNITORI FOSSERO STATI AVVISATI. IL DOCUMENTO PUO' ESSERE COPIATO E DISTRIBUITO ALLE SEGUENTI CONDIZIONI: 1) IL TESTO DEVE ESSERE COPIATO INTEGRALMENTE E TUTTE LE PAGINE DEVONO ESSERE INCLUSE. 2) I PROGRAMMI SE PRESENTI, DEVONO ESSERE COPIATI SENZA MODIFICHE, 3) IL DOCUMENTO DEVE ESSERE DISTRIBUITO INTERAMENTE IN OGNI SUA PARTE. 4) IL DOCUMENTO NON PUO' ESSERE DISTRIBUITO A SCOPO DI LUCRO.

Invia suggerimenti

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com