La correlazione lineare fra due variabili statistiche
1.
2.
3. Diagramma a dispersione Lo scopo è quindi quello di interpolare i dati rilevati con una funzione che sintetizzi in modo opportuno l’andamento del fenomeno studiato. Quando si parla di interpolare si intende determinare, a partire dai dati rilevati, una funzione che rappresenti il fenomeno, mediante una legge matematica o mediante una tabella di valori più regolari. X Y 20 2 40 6 50 5 60 8
4. Con questa formula si minimizza la somma dei quadrati e non la somma delle semplici differenze fra valori rilevati e valori teorici, poichè le differenze negative potrebbero compensare quelle positive fornendo un risultato non significativo.
5.
6.
7.
8.
9.
10.
11. Lo studio della regressione consiste nella determinazione di un coefficiente che esprime la relazione, più o meno intensa, fra le due variabili considerate. Applicando il metodo dei minimi quadrati si ottiene la retta y = a 1 + b 1 x che è detta retta di regressione di Y rispetto ad X. Per misurare l’intensità, o forza del legame, fra le due variabili, nel caso sempre di regressione lineare, si introduce una misura della loro correlazione data dal coefficiente di correlazione lineare di Bravais – Pearson, che può variare da -1 a 1.
12. Prendiamo ora in considerazione la retta di regressione di X su Y che possiamo scrivere come x = a 2 + b 2 y Soffermiamo ora l’attenzione sui coefficienti b 1 e b 2 . Notiamo come b 1 rappresenti il coefficiente angolare della prima retta di regressione, mentre b 2 non rappresenti il coefficiente angolare della seconda retta di regressione ma il suo reciproco. I due coefficienti b 1 e b 2 possono essere facilmente calcolati con le seguenti formule: Grazie a questi ultimi due coefficienti, possiamo facilmente calcolare r con la formula seguente:
13.
14.
15. Molto interessante risulta essere anche il quadrato del coefficiente r, detto coefficiente di determinazione , il quale indica la percentuale di variabilità totale dovuta alla dipendenza lineare della y dalla x. Se r 2 si avvicina a 1, il modello di regressione lineare è efficace.