Caricare documenti e articoli online 
INFtub.com è un sito progettato per cercare i documenti in vari tipi di file e il caricamento di articoli online.


 
Non ricordi la password?  ››  Iscriviti gratis
 

LA DISSOMIGLIANZA

matematica




LA DISSOMIGLIANZA

    In questa lezione vedremo come confrontare due distribuzioni, relative allo stesso carattere ma a collettivi diversi.

    Consideriamo due distribuzioni relative a due collettivi diversi ma allo stesso carattere; indichiamole con distribuzione A e distribuzione B:

   

 

    Definiamo uguali due distribuzioni che verificano le seguenti condizioni:

 

n Ai = n Bi     




Definiamo simili due distribuzioni quando abbiamo l'uguaglianza delle frequen 939j92j ze relative o percentuali per ogni modalità. I problemi sorgono quando due distribuzioni non sono nè uguali nè simili; in tale circostanza dobbiamo calcolare degli indici di dissomiglianza per vedere quanto le due distribuzioni differiscono tra loro.

Indici di dissomiglianza per un carattere quantitativo.
Consideriamo due distribuzioni secondo un carattere quantitativo di diversa numerosità. Ricordiamo che, essendo il carattere quantitativo, le modalità Xi sono dei numeri.

 

 

    Un indice semplice di dissomiglianza è dato dalla seguente relazione che non è altro che una media delle differenze tra le modalità relative a termini cograduati. Per un esempio completo e dettagli vedere il documento  " Indici di dissomiglianza ".

 

Indici di dissomiglianza per un carattere ordinato rettilineo.

Ricordiamo che abbiamo definito  "simili" due distribuzioni che presentano l'uguaglianza delle frequen 939j92j ze relative con  fAi = fBi. Se il carattere è ordinato rettilineo la condizione appena vista implica che  FAi = FBi, ovvero c'è similitudine se c'è uguaglianza fra le cumulate.

In tal caso l'indice assoluto semplice di dissomiglianza è dato da:

 
  

l'indice semplice relativo è dato dalla seguente relazione:

 

Nel caso in cui le distribuzioni presentino delle classi i procedimenti non cambiano, basta semplicemente considerare il valore centrale di ogni classe. Per approfondimenti in merito vedere  "Dissomiglianza in classi" a pag. 5)

In questa lezione abbiamo definito il concetto di dissomiglianza ed abbiamo visto i più importanti indici. Nel link suggerito troverete alcuni esempi relativi a diverse situazioni.

































Domande

A cosa serve lo studio della dissomiglianza?

Quando due distribuzioni si possono definire uguali?

Quando due distribuzioni si possono definire simili?

Se il carattere è diviso in classi come si deve procedere?

Che differenza c'è, in generale, tra un indice assoluto ed un indice relativo? (Questa domanda è cattivella!!!).






Glossario
A

AREOGRAMMA

Particolare tipo di rappresentazione grafica in cui la frequenza o la quantità di una data modalità vengono rappresentate attraverso l'area di una figura piana. In particolare tale area dovrà essere proporzionale alla frequenza rappresentata.

AMPIEZZA DELLA CLASSE

L'ampiezza di una data classe si calcola facendo la differenza fra l'estremo superiore e quello inferiore della classe in esame.

C

CAMPIONE

Parte della popolazione costruita in modo tale da rappresentare al meglio la popolazione da cui viene estratto. Lo scopo della costruzione di un campione è quello di lavorare su un collettivo più piccolo della popolazione, per poi espandere i risultati ottenuti a tutta la popolazione.

CAMPO  DI  VARIAZIONE

Il campo di variazione è una misura della variabilità di una distribuzione e si ottiene calcolando la differenza fra il termine più grande e quello più piccolo della distribuzione.

CARATTERE

In ogni ricerca statistica studiamo una o più caratteristiche delle unità rilevate; queste caratteristiche vengono definite con il termine carattere. Il carattere si manifesta nelle unità attraverso varie modalità.

CENSIMENTO

Rilevazione generale della popolazione di un paese; il censimento si effettua ogni 10 anni e va a rilevare alcune caratteristiche di tutta la popolazione.

CENTRO

Data una distanza, il centro di una distribuzione è il valore che, rispetto alla distanza considerata, rappresenta al meglio la popolazione

CLASSI

Le classi sono il frutto della divisione delle modalità di un carattere in gruppi. In particolare,  le modalità di un carattere come il peso o l'altezza, per semplificare il lavoro, possono essere raggruppate insieme, creando un'unica modalità, generalmente rappresentata dal valore centrale della classe.

CONCENTRAZIONE

Attributo che si dà ad un carattere quantitativo trasferibile. Si dice che, in una distribuzione la concentrazione è massima quando tutto l'ammontare del carattere si trova in una sola unità; al contrario, si dice che un carattere è equidistribuito quando l'ammontare è equamente diviso fra tutte le unità della popolazione. La concentrazione rientra nelle misure della variabilità di una distribuzione.

COGRADUAZIONE

La tabella di cograduazione si calcola in ambito di dissomiglianza e serve per gestire più facilmente i dati cograduati. In particolare ci dice che modalità presentano i dati cograduati.

COGRADUATI (DATI)

Definiamo termini cograduati di una distribuzione quei termini che occupano lo stesso posto nella graduatoria dei termini di una distribuzione. 

D

DATO ANOMALO

Un dato è definito anomalo quando è molto diverso dagli altri dati della distribuzione. Tale diversità può attribuirsi ad errore (di rilevazione o inserimento) o all'inizio di una nuova fase del fenomeno.

DETERMINAZIONE (indice di)

Visto nell'ambito della regressione, l'indice r indica la bontà di accostamento di ciascuna delle rette di regressione ai dati osservati. Abbiamo che

              

Se  r = 0 allora le due rette di regressione coincidono con gli assi cartesiani (con origine posta nel baricentro). Se  r2 = 1 allora  i punti osservati sono allineati e le due rette di regressione sono sovrapposte. In altre parole, tanto più l'indice di determinazione è vicino a 1 tanto più le rette descriveranno meglio la distribuzione osservata.

DEVIANZA TOTALE

In ambito di regressione, definiamo devianza totale la distanza fra ogni valore osservato Yj e la media Y.  E' valida la seguente relazione:  DEV. TOT. = DEV. REG. + DEV. RES

DEVIANZA DI REGRESSIONE

In ambito di regressione è la distanza fra i valori teorici Y*j e la media Y. E' anche chiamata devianza spiegata dalla regressione.

DEVIANZA RESIDUA

In ambito di regressione, indica la distanza fra la distribuzione osservata e la distribuzione teorica rappresentata dai punti della retta di regressione. 

DIPENDENZA IN MEDIA

Data una distribuzione secondo due caratteri, diciamo che se Y è indipendente in media da X allora le distribuzioni parziali secondo il carattere Y hanno la stessa media aritmetica. Ricordiamo che una situazione di connessione nulla implica indipendenza in media. Un indice di dipendenza in media è quello proposto da Pearson  (vedi lezioni)  che assume valore 1 nel caso di dipendenza perfetta di Y da X; assume invece valore 0 nel caso di indipendenza in media.

M

MODALITA'

Ogni carattere si presenta nelle unità attraverso delle modalità. Ad esempio il carattere sesso si presenta con le modalità maschio e femmina.

V

VALORE CENTRALE DI UNA CLASSE

Il valore centrale di una classe è la misura che più frequentemente si usa nelle elaborazioni di caratteri divisi in classi. Si trova sommando gli estremi della classe e dividendo il risultato per 2.




Privacy




Articolo informazione


Hits: 5579
Apprezzato: scheda appunto

Commentare questo articolo:

Non sei registrato
Devi essere registrato per commentare

ISCRIVITI



Copiare il codice

nella pagina web del tuo sito.


Copyright InfTub.com 2024