Caricare documenti e articoli online 
INFtub.com è un sito progettato per cercare i documenti in vari tipi di file e il caricamento di articoli online.


 
Non ricordi la password?  ››  Iscriviti gratis
 

La variabile statistica a 2 dimensioni

tecnica



LEZIONE #3


La variabile statistica a 2 dimensioni

Supponiamo che nel censimento di una data popolazione si registrino, per ciascun individuo, i valori assunti da due diverse caratteristiche, che indicheremo genericamente come X e Y (es. peso e altezza degli abitanti di un comune, o diametro e peso di una partita di pillole prodotte in un certo giorno da una casa farmaceutica). Per ordinare i risultati di tale indagine si utilizza una variabile statistica doppia, che consiste in una tabella a doppia entrata. Sulla prima colonna si indicano i valori assunti dalla caratteristica X e sulla prima riga i valori della caratteristica Y. In generale i valori argomentali (o le classi) delle due caratteristiche saranno diverse; indicheremo con n il numero delle classi della caratteristica X e con m quello della Y. Nel seguito utilizzeremo l'indice i, crescente dall'alto in basso, come indice di riga (i=1,2,., n) e l'indice j, crescente da sinistra a destra, come indice di colonna (j=1,2,.,m). Nella generica posizione (i,j) (in corrispondenza della coppia di valori (xi,yj)) si indica la frequenza assoluta Nij o relativa fij con cui la coppia di valori (xi,yj) si presenta nella popolazione. Valgono per le frequenze assolute e relative le stesse proprieta' gia' enunciate per la variabile statistica monodimensionale. La somma di tutti gli elementi della tabella viene sinteticamente indicata tramite una doppia sommatoria, una sull'indice i e l'altra sull'indice j. Fissata una riga (i=i*), si sommano tutti gli elementi che appartengono ad essa facendo variare l'indice di colonna j, quindi si sommano i valori della riga successiva (i**=i*+1) sempre scorrendo l'indice di colonna e cosi' via.

Vediamo come si ordinano in una variabile statistica doppia i risultati ottenuti da un'indagine su una popolazione di 10 individui, sulle caratteristiche X= peso e Y=altezza, che a priori possono assumere valori reali qualsiasi:




x

y






1.66 222b11c


1.66 222b11c














Possiamo assumere come valori argomentali delle due componenti, direttamente i valori che si sono presentati, o piu' sensatamente si possono suddividere i valori in classi. In tale secondo caso assumeremo che tutti gli individui di una classse assumano il valore argomentale scelto come rappresentante la classe stessa.

Ad esempio costruiamo le classi di peso seguenti 50-59,60-69,70-79,80-89, rappresentate dai valori 55,65,75,85,95; e le classi di altezza 1.60-1.69,1.70-1.79,1.80 1.89,1.90-1.99, rappresentate dai valori centrali 1.65, 1.75, 1.85, 1.95, e trasformiamo i valori che cadono in una classe nel valore rappresentativo della classe:



x

y






















A questo punto riordiniamo la tabella, ad esempio per valori crescenti del peso


x

Y






















E infine calcoliamo le frequenze relative di ciascuna coppia di valori argomentali della tabella a doppia entrata 





j

 
X\Y






i

 































La somma delle frequenze relative di tutte le coppie sara' pari ad 1.


 


Rappresentazione grafica delle variabili satistiche a 2 dimensioni

Nel caso in cui la variabile assuma valori in un insieme discreto di punti, noti a priori, si puo' rappresentare graficamente il risultato dell'indagine riportando sul piano cartesiano xy le coppie di valori argomentali e in corrispondenza le frequenze relative di ciascuna coppia.

Il digramma cumulativo di frequenza in corrispondenza di ciascuna coppia di valori argomentali assumera' il valore della somma delle frequenze relative di tutte le coppie con ascissa e ordinata minori o uguali a quelle della coppia considerata.

Nel caso in cui la variabile statistica assume valori in un insieme continuo, si possono rappresentare i risultati dell'indagine tramite istogramma e funzione cumulativa di frequenza.

Sul piano xy si riporteranno rispettivamente in ascissa e in ordinata i valori delle le classi in cui sono suddivisi i valori argomentali della componente X e della componente Y della variabile doppia.

Nel caso dell'istogramma, poi, per ciascun areola Dxi Dyj si calcola l'altezza del diagramma h(xi,yj)=fij/(Dxi Dyj). Il volume di ciascun parallelepipedo con area di base Dxi Dyj  e altezza hij rappresenta la frequenza degli individui che hanno valori argomentali compresi contemporaneamente nei due intervalli. La somma di tutti i volumi sara' pari a 1.





La funzione cumulativa di frequenza, fissata la classe rappresentata da xi e yj, si ottiene sommando le frequenze relative di tutte le classi per cui e' contemporaneamente  la componente x e' minore o uguale a xi e la componente y minore o uguale a yj.

Ad esempio F(65,1.65)=F22=f11+f12+f21+f22= 0.4.  Come nel caso monodimensionale F varia sempre da 0 a 1.


Distribuzioni marginali

Supponiamo di voler conoscere la distribuzione di una soltanto delle due componenti nella popolazione. Nel nostro esempio si tratterebbe di ordinare in una variabile statistica monodimensionale i valori della caratteristica che interessa trascurando l'altra.

Ad esempio se ci concentrassimo sulla componente X, ovvero il peso avremmo:



x

y























xi













E analogamente potremmo ordinare la sola caratteristica y.

Vogliamo ricavare la stessa informazione, cioe' la distribuzione della caratteristica X nella popolazione a partire dalla variabile doppia in tabella.

Basta a tale scopo osservare che, ad esempio sulla riga i-esima sono registrate le frequenze relative allo stesso valore della caratteristica xi, associata  al variare dell'indice j a valori diversi della caratteristica y. La somma di tutte le frequenze della riga i-esima dara' dunque la frequenza led valore xi , indipendentemente dalla caratteristica y.

In altre parole, se, a partire dai dati non ordinati, vogliamo determinare la frequenza relativa della classe di peso 65, considereremo sia l'individuo con le caratteristiche (60,1.62), che quello con (68,1.75), che infine quello con caratteristiche (60,1.60), ottenendo frequenza 0.3. Di tali individui 2 appartengono alla classe congiunta delle due caratteristiche (65,1.65), f22=0.2 e uno alla classe congiunta (65,1.75), f23=0.1. Di tale di tale distinzione non mi accorgo se ordino solo la caratteristica x, viceversa ne tengo conto se ordino sulla base delle sue caratteristiche, come nella tabella. Per annullare la distinzione sulla caratteristica y, bastera' sommare f22+f23=0.3.

Chiameremo le frequenze marginali della componente X qi, quelle della componente Y rj. Si avra'

,  .


Le distribuzioni marginali sono variabili statistiche monodimensionali la cui somma delle frequenze relative e' pari a 1.

   



Distribuzioni condizionate

Supponiamo di voler conoscere come si distribuisca la variabile peso tra gli individui che presentano un valore di altezza pari a 1.65.

Dai nostri dati non ordinati, rileviamo che sono presenti 4 persone con altezza pari a 1.65, quelli evidenziati in tabella:


x

y






















La distribuzione della variabile peso si otterra' estraendo le coppie di valori con y=1.65

x

y










e riordinandole sulla base della caratteristica peso:


x



fx|y=1.65




Analogamente si puo' calcolare la distribuzione della componente Y , condizionata ad un certo valore della X.

Condizionare ad un valore di una delle due componenti, implica una restrizione della popoazione di partenza al gruppo di individui che posseggono il valore fissato della variabile che condiziona.


Sia N(x=55,y=1.65) , il numero di individui in possesso delle caratteristiche (x=55,y=1.65), sia N(y=1.65) il numero di individui che posseggono la caratteristica (y=65). Il numero di individui che presenta la caratteristica x=55, tra quelli che hanno caratteristica altezza pari a 1.65, sara' data da:


 


ovvero dal rapporto tra la frequenza relativa congiunta della coppia (x=55,y=1.65) e la frequenza relativa marginale  di y=1.65.

Tale frequenza condizionata si indica nella maniera seguente:

f(x=55|y=1.65)= .


Nell'esempio considerato essa e' pari a


f(x=55|y=1.65)=0.2/0.4=2/4





Privacy




Articolo informazione


Hits: 3268
Apprezzato: scheda appunto

Commentare questo articolo:

Non sei registrato
Devi essere registrato per commentare

ISCRIVITI



Copiare il codice

nella pagina web del tuo sito.


Copyright InfTub.com 2024