Funzioni statistiche di Excel: PEARSON

Riepilogo

In questo articolo viene descritta la funzione di PEARSON in Microsoft Excel. In questo articolo viene illustrato come utilizzare la funzione. Inoltre, questo articolo confronta i risultati di PEARSON in Microsoft Office Excel 2003 e nelle versioni successive di Excel con i risultati di PEARSON in versioni precedenti di Excel.

Ulteriori informazioni

La funzione PEARSON (Matrice1; matrice2) restituisce il coefficiente di correlazione del momento prodotto di Pearson tra due matrici di dati.

Sintassi

PEARSON(array1, array2)
Gli argomenti, matrice1 e matrice2, devono essere numeri, nomi, costanti di matrice o riferimenti contenenti numeri.

L'utilizzo più comune di PEARSON comprende due intervalli di celle che contengono i dati, quali PEARSON (a1: A100, B1: B100).

Esempio di utilizzo

Per illustrare la funzione PEARSON, attenersi alla seguente procedura:
  1. Creare un foglio di lavoro vuoto e quindi copiare la seguente tabella.
    13 + 10 = ^ $D$ 2Potenza di 10 da aggiungere ai dati
    2=4 + 10^$D$20
    3=2 + 10^$D$2
    4=5 + 10^$D$2
    5=4+10^$D$2
    6=7+10^$D$2precedente a Excel 2003
    Quando D2 = 7,5
    =PEARSON(A1:A6,B1:B6)0.702038
    =CORREL(A1:A6,B1:B6)0.713772
    Quando D2 = 8
    #DIV/0!
    0.713772
  2. Selezionare la cella A1 nel foglio di lavoro vuoto e quindi incollare le voci in modo che la tabella occupi le celle a1: D13 del foglio di lavoro.
  3. Fare clic sul pulsante Opzioni Incolla e quindi fare clic su Applica formattazione di destinazione. Con l'intervallo incollato ancora selezionato, utilizzare una delle seguenti procedure, a seconda della versione di Excel in esecuzione:
    • In Microsoft Office Excel 2007, fare clic sulla scheda Home , fare clic su formato nel gruppo celle e quindi fare clic su Adatta larghezza colonne.
    • In Microsoft Office Excel 2003, scegliere colonna dal menu formato e quindi fare clic su Adatta.
    Nota: Si consiglia di formattare le celle B1:B6 come numero con 0 posizioni decimali.
A1: a6 celle e B1:B6 contengono le matrici di due dati che vengono utilizzate in questo esempio per chiamare la funzione di correlazione e PEARSON nelle celle A8 e A9. PEARSON e correlazione calcolare il coefficiente di correlazione del momento prodotto di Pearson e devono accettare i risultati.

Nelle versioni di Excel precedenti a Excel 2003, PEARSON può presentare errori di arrotondamento. Il comportamento di PEARSON è stato migliorato in Excel 2003 e nelle versioni successive di Excel. CORRELAZIONE è sempre stata implementata con la procedura migliore che viene ora utilizzata in Excel 2003 e nelle versioni successive di Excel. Se si utilizza PEARSON per la versione di Excel precedente a Excel 2003, si consiglia di utilizzare invece la funzione correlazione.

Nelle versioni di Excel precedenti a Excel 2003, è possibile utilizzare il foglio di lavoro in questo articolo per eseguire un esperimento e individuare quando si verificano errori di arrotondamento. Se si aggiunge una costante a ciascuna delle osservazioni in B1:B6, il valore di PEARSON o correlazione non dovrebbe essere interessato. Se si aumenta il valore D2, una costante maggiore viene aggiunto a B1:B6. Se D2 è inferiore a 7, non sono presenti errori di arrotondamento che appaiono nelle prime sei posizioni decimali di PEARSON. A questo punto è possibile modificare il valore di D2 in 7,25, 7,5, 7,75 e 8. D6:D13 le celle del foglio di lavoro Mostra valori di PEARSON e correlazione quando D2 = 7,5 e quando D2 = 8, rispettivamente.

CORRELAZIONE è corretto, ma gli errori di arrotondamento in PEARSON sono diventati così gravi che si verifica la divisione per 0 quando D2 = 8.

Versioni precedenti di Excel presentano risposte errate in questi casi, poiché gli effetti di errori di arrotondamento risultano più evidenti con la formula di calcolo utilizzata in tali versioni. Tuttavia, i casi in questo esperimento possono essere visualizzati come estremo.

In Excel 2003 e nelle versioni successive di Excel, verrà non visualizzata alcuna modifica i valori di PEARSON se si tenta l'esperimento. Tuttavia, D6:D13 celle Mostra gli stessi errori di arrotondamento che si ottiene nelle versioni precedenti di Excel.

Risultati nelle versioni precedenti di Excel

In caso di assegnazione di matrici di dati di due x e Y, le versioni precedenti di Excel di utilizzare un unico passaggio dei dati per calcolare la somma dei quadrati delle x, la somma dei quadrati di Y, la somma di x, la somma di Y, la somma di dispersione e il conteggio del numero di osservazioni in ogni matrice. Queste quantità vengono quindi combinate nella formula di calcolo nel file della Guida nelle versioni precedenti di Excel.

Risultati in Excel 2003 e nelle versioni successive di Excel

La routine che viene utilizzata in Excel 2003 e nelle versioni successive di Excel utilizza un processo a due passaggi. Innanzitutto, le somme di x e Y e il conteggio del numero di osservazioni in ogni matrice vengono calcolati. Da questi, i mezzi (medie) di X e Y osservazioni possono essere calcolate. Quindi, al secondo passaggio, viene trovato il quadrato della differenza tra ogni X e la media di X. quadrati delle differenze vengono sommati. Il quadrato della differenza tra ogni Y e la media di Y è presente; quadrati delle differenze vengono sommati. Inoltre, i prodotti (X – X Media) * (Y: Y Media) vengono rilevati per ogni coppia di coordinate e vengono sommati. Questi tre somme vengono combinate nella formula di PEARSON. Nessuno di questi tre somme sono interessati aggiungendo una costante a ogni valore in una matrice di Y (o matrice X), in quanto viene aggiunto lo stesso valore per la media di Y (o la media di X). Negli esempi numerici, anche con una potenza elevata di 10 nella cella D12, queste tre somme non sono interessate e i risultati del secondo passaggio sono indipendenti della voce nella cella D2. Di conseguenza, i risultati in Excel 2003 e nelle versioni successive di Excel sono numericamente più stabili.

Conclusioni

Un approccio a due passaggi garantisce prestazioni numeriche migliori di PEARSON in Excel 2003 e nelle versioni successive di Excel rispetto a quella di un passaggio che viene utilizzato nelle versioni precedenti di Excel. I risultati ottenuti in Excel 2003 e nelle versioni successive di Excel non sarà mai meno precisi di quelli ottenuti nelle versioni precedenti di Excel.

CORRELAZIONE ha la stessa funzionalità ed è sempre stata implementata con l'approccio utilizzato per PEARSON in Excel 2003 e versioni successive di Excel. Pertanto, la funzione correlazione è una scelta migliore per le versioni precedenti di Excel.

Negli esempi più pratici, tuttavia, non siete facile notare una differenza tra i risultati in Excel 2003 e nelle versioni successive di Excel e i risultati nelle versioni precedenti di Excel. In genere non presentano spesso il tipo di comportamento inusuale illustrato in questo esperimento in dati tipici. L'instabilità numerica è più probabile che compaiano nelle versioni precedenti di Excel quando i dati contengono un numero elevato di cifre significative e variazione relativamente ridotta tra i valori dei dati.

La procedura che consente di trovare la somma delle deviazioni al quadrato su una media campione individuando la media del campione, calcolando il quadrato di ciascuna deviazione e sommando le deviazioni al quadrato è più accurata la procedura alternativa. (La procedura alternativa viene spesso definita "formula calcolatrice" perché è adatto per l'utilizzo da parte di una calcolatrice con un numero ridotto di punti dati.) La procedura alternativa prevede i passaggi seguenti:
  1. Trovare la somma dei quadrati di tutte le osservazioni, la dimensione del campione e la somma di tutte le osservazioni.
  2. Calcolare la somma dei quadrati di tutte le osservazioni meno ((somma di tutte le osservazioni) ^ 2) / campione di dimensione).
Esistono molte altre funzioni che sono state migliorate in Excel 2003 e nelle versioni successive di Excel. Tali funzioni risultano migliorate in quanto le versioni successive di Excel sostituire la routine di un passaggio con la procedura a due passaggi che viene trovata la media al primo passaggio e quindi calcola la somma dei quadrati delle deviazioni relative all'esempio significato al secondo passaggio.

Un breve elenco di tali funzioni include le seguenti funzioni:
  • VAR
  • FUNZIONE VAR
  • DEV.
  • STDEVP
  • DVAR
  • DVARP
  • DSTDEV
  • DSTDEVP
  • PREVISIONE
  • PENDENZA
  • INTERCETTA
  • PEARSON
  • FUNZIONE RQ
  • ERR.
Miglioramenti simili sono stati apportati in ciascuno dei tre strumenti di analisi della varianza di analisi.
Proprietà

ID articolo: 828129 - Ultima revisione: 30 gen 2017 - Revisione: 1

Microsoft Office Excel 2007

Feedback