DATI E PREVISIONI c 2ij Calcoliamo 2 = _: ij a ij (7,87)2 ( 2,36)2 (1,28)2 2 = _ + _ + + _ 20,7939 12,13 32,36 0,72 In questo caso h = 3 e n = 180. Perciò: 20,7939 C = _ 0,06 180 2 Poiché il valore di C è molto vicino a 0, possiamo concludere che il reddito annuo lordo e il numero delle automobili possedute da una famiglia sono indipendenti. FISSA I CONCETTI Q Q Q Q Esercizi da pag. 568 Contingenza: cij = oij aij (differenza tra frequenza osservata e frequenza teorica). Chi quadrato: misura la distanza tra una distribuzione osservata e quella teorica di valori attesi 2 (o ij a ij) di indipendenza assoluta, 2 = ____________ a ij i, j Contingenza quadratica media: rapporto tra l indice chi quadrato e il numero n delle unità 2 statistiche, = _ n Indice di contingenza di Cramér: rapporto tra la contingenza quadratica media e il minore tra il 2 numero delle righe e quello delle colonne h diminuito di 1, C = _ = _ con 0 C 1 n(h 1) (h 1) 3 La retta di regressione e la correlazione lineare Uno dei modi in cui la ricerca sperimentale si avvale della statistica riguarda l obiettivo di stabilire se un carattere Y dipenda, e in che misura, da un carattere X. In particolare, date le distribuzioni statistiche di X e Y, ci poniamo il problema di vedere se esiste una funzione matematica f, espressa da qualche formula algebrica, tale che, con buona approssimazione, risulti Y = f(X). Ci chiediamo, quindi, se esista o meno una formula matematica che leghi Y a X. Il passaggio da leggi statistiche a leggi matematiche risulta, infatti, utile per analizzare più a fondo come un fenomeno possa evolvere e così fare previsioni. Non solo, ma è spesso importante nell analizzare, in particolare, fenomeni che incidono sul contesto sociale e la vita della collettività, stabilire se due diversi caratteri, seppure non abbiano l un l altro un legame di dipendenza, siano comunque tra loro correlati. KEYWORDS K di diagramma a dispersione / scatter plot 528 Una serie di dati statistici è quasi sempre caratterizzata da inevitabili errori di misura compiuti nella rilevazione dei dati stessi, oltre che dalla variabilità relativa al fenomeno. Il primo passo utile per stabilire una legge di dipendenza di un carattere Y da un carattere X è allora la costruzione del cosiddetto diagramma a dispersione. Con questa denominazione indichiamo la rappresentazione grafica su un piano cartesiano di n punti le cui coordinate sono coppie di osservazioni relative a due variabili statistiche X e Y .
3 - La retta di regressione e la correlazione lineare