Funzioni statistiche di Excel: PEARSON

IMPORTANTE: il presente articolo è stato tradotto tramite un software di traduzione automatica di Microsoft ed eventualmente revisionato dalla community Microsoft tramite la tecnologia CTF (Community Translation Framework) o da un traduttore professionista. Microsoft offre articoli tradotti manualmente e altri tradotti automaticamente e rivisti dalla community con l’obiettivo di consentire all'utente di accedere a tutti gli articoli della Knowledge Base nella propria lingua. Tuttavia, un articolo tradotto automaticamente, anche se rivisto dalla community, non sempre è perfetto. Potrebbe contenere errori di vocabolario, di sintassi o di grammatica. Microsoft declina ogni responsabilità per imprecisioni, errori o danni causati da una traduzione sbagliata o dal relativo utilizzo da parte dei clienti. Microsoft aggiorna frequentemente il software e gli strumenti di traduzione automatica per continuare a migliorare la qualità della traduzione.

Clicca qui per visualizzare la versione originale in inglese dell’articolo: 828129
Sommario
In questo articolo viene descritta la funzione di PEARSON in Microsoft Excel. In questo articolo viene descritto come utilizzare la funzione. Inoltre, in questo articolo confronta risultati di PEARSON in Microsoft Office Excel 2003 e nelle versioni successive di Excel con i risultati di PEARSON in versioni precedenti di Excel.
Informazioni
La funzione PEARSON (Matrice1; matrice2) restituisce coefficiente di correlazione del momento prodotto di Pearson tra due matrici di dati.

Sintassi

PEARSON(array1, array2)
Argomenti matrice1 e matrice2, devono essere numeri, nomi, costanti di matrice o riferimenti che contengono numeri.

L'utilizzo più comune di PEARSON comprende due intervalli di celle che contengono dati, ad esempio PEARSON (a1: A100, B1: B100).

Esempio dell'utilizzo di

Per illustrare la funzione PEARSON, attenersi alla seguente procedura:
  1. Creare un foglio di lavoro vuoto e quindi copiare la seguente tabella.
    1= 3 + 10 ^ $D$ 2Potenza di 10 da aggiungere ai dati
    2= 4 + 10 ^ $D$ 20
    3= 2 + 10 ^ $D$ 2
    4= 5 + 10 ^ $D$ 2
    5= 4 + 10 ^ $D$ 2
    6= 7 + 10 ^ $D$ 2precedente a Excel 2003
    Quando D2 = 7,5
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    Quando D2 = 8
    ERRORE #DIV/0!
    0.713772
  2. Selezionare la cella A1 nel foglio di lavoro vuoto e quindi incollare le voci in modo che la tabella occupi le celle a1: D13 del foglio di lavoro.
  3. Fare clic sul pulsante Opzioni Incolla e quindi fare clic su Applica formattazione di destinazione. Con l'intervallo incollato ancora selezionato, utilizzare una delle procedure seguenti, a seconda della versione di Excel in esecuzione:
    • In Microsoft Office Excel 2007, fare clic sulla scheda Home , fare clic su formato nel gruppo celle e quindi fare clic su Adatta larghezza colonne.
    • In Microsoft Office Excel 2003, scegliere colonna dal menu formato e fare clic su Adatta.
    Nota È possibile formattare l'intervallo di celle B1: B6 come numero con 0 posizioni decimali.
Le celle a1: a6 e intervallo B1: B6 contiene le matrici di due dati che vengono utilizzate in questo esempio per chiamare le funzioni PEARSON e la funzione correlazione nelle celle A8 e A9. PEARSON e correlazione calcolare il coefficiente di correlazione del momento prodotto di Pearson e devono accettare i risultati.

Nelle versioni di Excel precedenti a Excel 2003, PEARSON può presentare errori di arrotondamento. Il comportamento di PEARSON è stato migliorato in Excel 2003 e nelle versioni successive di Excel. CORRELAZIONE è sempre stata implementata con la procedura migliore è ora utilizzata in Excel 2003 e nelle versioni successive di Excel. Se si utilizza PEARSON per una versione di Excel precedente a Excel 2003, si consiglia di utilizzare invece correlazione.

Nelle versioni di Excel precedenti a Excel 2003, è possibile utilizzare il foglio di lavoro in questo articolo per eseguire un esperimento e individuare quando si verificano errori di arrotondamento. Se si aggiunge una costante a ciascuna delle osservazioni nell'intervallo B1: B6, il valore della funzione PEARSON o correlazione non dovrebbe interessato. Se si aumenta il valore in D2, una costante maggiore viene aggiunto all'intervallo B1: B6. Se D2 è inferiore a 7, non sono disponibili errori di arrotondamento rispettando le prime sei cifre decimali di PEARSON. A questo punto, modificare il valore di D2 in 7,25, 7,5, 7,75 e 8. D13 celle del foglio di lavoro Mostra i valori di PEARSON e correlazione quando D2 = 7,5 e quando D2 = 8, rispettivamente.

CORRELAZIONE è corretto, ma errori di arrotondamento in PEARSON sono diventati così gravi che si verifica la divisione per 0 quando D2 = 8.

Versioni precedenti di Excel risultati non corretti in questi casi perché gli effetti degli errori di arrotondamento risultano più evidenti con la formula di calcolo utilizzata in tali versioni. Comunque, i casi in questo esperimento possono essere visualizzati come estremo.

In Excel 2003 e nelle versioni successive di Excel, non le modifiche ai valori di PEARSON dovrebbe essere visualizzato se si tenta l'esperimento. Tuttavia, celle D13 Mostra gli stessi errori di arrotondamento che si ottiene nelle versioni precedenti di Excel.

Risultati nelle versioni precedenti di Excel

Se le matrici di dati di due x e Y, le versioni precedenti di Excel di utilizzare un unico passaggio sui dati per calcolare la somma dei quadrati delle x, la somma dei quadrati di Y, la somma di x, la somma di Y, la somma di XY e il conteggio del numero di osservazioni in ogni matrice. Queste quantità vengono quindi combinate nella formula di calcolo nel file della Guida nelle versioni precedenti di Excel.

Risultati in Excel 2003 e nelle versioni successive di Excel

La procedura utilizzata in Excel 2003 e nelle versioni successive di Excel viene utilizzato un processo in due passaggi attraverso i dati. Innanzitutto, le somme di x e Y e il conteggio del numero di osservazioni in ogni matrice vengono calcolati. Da questi, i mezzi (medie) di X e Y osservazioni possono essere calcolate. Quindi, al secondo passaggio, il quadrato della differenza tra ogni X e la media di X è presente; quadrati delle differenze vengono sommati. Il quadrato della differenza tra ogni Y e la media di Y è presente; quadrati delle differenze vengono sommati. Inoltre, i prodotti (X – X Media) * (Y: Y Media) per ogni coppia di coordinate si trovano e vengono sommati. Questi tre somme vengono combinate nella formula di PEARSON. Nessuno di questi tre somme interessati aggiungendo una costante a ogni valore in matrice Y o X array, poiché viene aggiunto lo stesso valore per la media di Y (o la media di X). Negli esempi numerici, anche con una potenza elevata di 10 nella cella D12, queste tre somme non sono interessate e i risultati del secondo passaggio sono indipendenti della voce nella cella D2. Di conseguenza, i risultati in Excel 2003 e nelle versioni successive di Excel sono numericamente più stabili.

Conclusioni

Un approccio a due passaggi garantisce prestazioni numeriche migliori di PEARSON in Excel 2003 e nelle versioni successive di Excel, l'approccio di un passaggio che viene utilizzato nelle versioni precedenti di Excel. I risultati ottenuti in Excel 2003 e nelle versioni successive di Excel non sarà mai meno precisi di quelli ottenuti nelle versioni precedenti di Excel.

CORRELAZIONE con le stesse funzionalità ed è sempre stata implementata con l'approccio utilizzato per PEARSON in Excel 2003 e versioni successive di Excel. Pertanto, la correlazione è una scelta migliore per le versioni precedenti di Excel.

Negli esempi più pratici, tuttavia, non è così probabile notare una differenza tra i risultati in Excel 2003 e nelle versioni successive di Excel e i risultati nelle versioni precedenti di Excel. Dati in genere non dimostrano il tipo di comportamento inusuale illustrato in questo esperimento. L'instabilità numerica è più probabile che compaiano nelle versioni precedenti di Excel quando i dati contengono un elevato numero di cifre significative e variazione relativamente ridotta tra i valori dei dati.

La procedura che consente di trovare la somma delle deviazioni al quadrato su una media del campione in modo da ottenere la media del campione, calcolando il quadrato di ciascuna deviazione e sommando tali deviazioni al quadrato è più accurata di quella alternativa. (Procedura alternativa viene spesso definita come la "formula calcolatrice", perché è adatto per l'utilizzo da parte di una calcolatrice con un numero ridotto di punti dati.) La procedura alternativa prevede i passaggi seguenti:
  1. Trovare la somma dei quadrati di tutte le osservazioni, la dimensione del campione e la somma di tutte le osservazioni.
  2. Calcolare la somma dei quadrati di tutte le osservazioni meno ((somma di tutte le osservazioni) ^ 2) / campione di dimensione).
Esistono molte altre funzioni sono state migliorate in Excel 2003 e nelle versioni successive di Excel. Queste funzioni sono migliori poiché versioni successive di Excel sostituire la routine di un passaggio con la procedura a due passaggi che consente di trovare la media del campione al primo passaggio e quindi Calcola significa che la somma dei quadrati delle deviazioni relative all'esempio al secondo passaggio.

Un breve elenco di tali funzioni include le seguenti funzioni:
  • VAR
  • VARP
  • STDEV
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • PREVISIONE
  • PENDENZA
  • INTERCETTA
  • PEARSON
  • FUNZIONE RQ
  • ERR
Miglioramenti simili sono stati apportati in ciascuno dei tre strumenti di analisi della varianza disponibili negli strumenti di analisi.

Avviso: questo articolo è stato tradotto automaticamente

Proprietà

ID articolo: 828129 - Ultima revisione: 03/14/2015 07:11:00 - Revisione: 3.0

Microsoft Office Excel 2007

  • kbformula kbexpertisebeginner kbinfo kbmt KB828129 KbMtit
Feedback