![]() | ![]() |
|
|
Nella pratica puo' essere utile, nota la distribuzione di una caratteristica in una popolazione, ricavare quella di un'altra caratteristica funzione della prima, senza ricorrere ad una ulteriore indagine sulla popolazione.
Esempi di variabili satistiche funzioni di un'altra li abbiamo implicitamente introdotti quando abbiamo calcolato la varianza della X, parlando della variabile scarto V=X-mX e del suo quadrato V2=(X-mX)2. Usiamo la variabile V2 calcoliamone la distribuzione di frequenza.
Data una trasformazione tra variabili statistiche occorre in primo luogo ricavare i valori argomentali della nuova distribuzione, quindi riordinarli e calcolarne le frequenze ricavandole da quelle della X.
Sia, ad esempio
i valori argomentali della variabile scarto e del suo quadrato , essendo mX=3 saranno:
xi |
|
|
|
|
|
vi=xi-mX |
|
|
|
|
|
vi2=(xi-mX)2 |
|
|
|
|
|
Che, ordinati in ordine crescente saranno:
vi2 |
|
|
|
Per concludere la trasformazione, calcoliamo le frequenze relative della variabile V2. Il valore argomentale 0 si presenta quando X assume il valore argomentale 3, come si vede dalla tabella di trasformazione dei valori argomentali. La frequenza relativa del valore 3 nella popolazione e dunque del valore 0 sara' la stessa, pari cioe' a 1/5. Il vaore argomentale 1, invece, si presenta sia quando X assume il valore 2 che quando assume il valore 4. La frequenza allora di 1 sara' pari alla frequenza di 2 piu' la frequenza di 4, pari cioe' a 1/5+1/5=2/5. Analogamente la frequenza del valore 4 sara' pari a 2/5.
Detto vi2 l'iesimo valore argomentale della variabile V e fi' la corrispondente frequenza relativa, questa si ottiene sommando le frequenze relative dei valori argomentali della X che si trasformano in vi2.
In seguito indicheremo la trasformazione tra le variabili statistiche X e Y, lineare o non lineare che sia, come Y=g(X).
Data una variabile statistica monodimensionale (la caratteristica e' una sola) si puo' definire l'operatore media MX[ ], come quell'operatore che applicato ad X o a una funzione di X ne restituisce la media pesata con le frequenze relative di X
la media di X e' dunque l'operatore media applicato a X
la varianza di X e' ottenuta applicando l'operatore media alla funzione di X , g(X)=(X-mX)2
Sia Y=g(X). La media di Y si ottiene applicando l'operatore media MY alla variabile Y, ovvero facendo la media pesata sulle frequenze di Y. Cio' presuppone il calcolo di tali frequenze a partire da quelle della variabile X. Il teorema della media ci permette di calcolare la media di Y senza calcolarne le frequenze per tale teorema infatti
Il teorema si dimostra facilmente nel caso di trasformazioni di variabili statistiche.
Sia
Sia Y=g(X)=(X-mX)2, trasformazione non lineare. I valori argomentali della variabile Y in corrispondenza ai valori crescenti della X, con le rispettive frequenze sono:
xi |
|
|
|
|
|
g(xi)=(xi-mX)2 |
|
|
|
|
|
fi=f(xi)=f(xi-mX)2 |
|
|
|
|
|
Se ci fermassimo a questo stadio della trasformazione, ovvero non riordinassimo i valori argomentali della variabile Y, ne calcoleremmo la media nel seguente modo:
mY = 4
= g(x1) f1+ g(x2) f2 + g(x3) f3 + g(x4) f4 +g(x5) f5=
dopo il riordino, essendo g(x1)=g(x5) e g(x2)=g(x4), si ha
vi2 |
|
|
|
f'i |
|
|
|
e la media viene calcolata come:
mY= 0 0.4=g(x3)f'1+g(x2)f'2+g(x1)f'3
che tornando indietro nella trasformazione si dimostra essere pari alla media calcolata prima del riordino, infatti
g(x3)f'1+g(x2)f'2+g(x1)f'3= g(x3)f3+g(x2)(f2+f4)+g(x1)(f1+f5)=
= g(x3)f3+g(x2)f2+ g(x2)f4+g(x1)f1+ g(x1)f5= g(x3)f3+g(x2)f2+ g(x4)f4+g(x1)f1+ g(x5)f5
L'operatore media e' lineare, ovvero, in
una dimensione,
MX=aMX+b
Infatti:
Se
a g(xi ) b " xi
a MX[g(X)] b
Infatti:
In particolare se xi allora MX[X]
Se xi 0 & MX[X]=0
allora la variabile statistica assume solo il valore 0 con frequenza relativa1
Infatti da , poiche'
si ricava necessariamente che se necessariamente
; poiche'
almeno una delle fi e' diversa da zero, essendo
, tale frequenza
sara' in corrispondenza del valore xi=0, e assumera' il valore 1.
Se g(xi) h(xi) " xi
MX[g(X)] MX[h(X)]
La varianza delle variabile statistica X , come abbiamo gia' visto, e' data da:
In base alla prima delle propireta' dell'operatore media,
Vale inoltre il seguente teorema (Tchebycev):
La frequenza
relativa degli xi per cui , ovvero
dei valori argomentali di X compresi nell'intervallo [(mX-lsX), (mX+lsX)], e' maggiore di
Quindi la frequenza relativa dei valori argomentali compresi nell'intervallo [(mX-3sX), (mX+3sX)] e' sempre maggiore di 0.89, qualunque si la distribuzione di frequenza.
Dimostrazione
Sia h(xi)=(xi-mX)2, insieme di punti giacenti su una parabola con concavita' verso l'alto e vertice in (mX,0).
Costruiamo una funzione di X, g(X) che sia minore di h per qualunque valore di xi.
Per le proprieta' della media
ovvero
Privacy |
Articolo informazione
Commentare questo articolo:Non sei registratoDevi essere registrato per commentare ISCRIVITI |
Copiare il codice nella pagina web del tuo sito. |
Copyright InfTub.com 2025