Caricare documenti e articoli online 
INFtub.com è un sito progettato per cercare i documenti in vari tipi di file e il caricamento di articoli online.


 
Non ricordi la password?  ››  Iscriviti gratis
 

INTRODUZIONE ALLA STATISTICA

matematica



INTRODUZIONE ALLA STATISTICA


La statistica trae i suoi risultati dalla elaborazione dei dati forniti dall'osservazione di un insieme di casi. Tali osservazioni possono riguardare la vita sociale o il mondo naturale.



UNITà STATISTICHE E COLLETTIVI


I casi,oggetto di osservazione, si chiamano unità statistiche. Esse possono essere:

a) unità semplici, come i singoli individui;

b)unità composte,cioè aggregati come le famiglie

c)unità multiple, formate da due o più unità semplici legate da un vincolo, come marito e moglie ecc..

L'insieme di più unità statistiche costituisce il collettivo.

I collettivi possono essere finiti, cioè costituiti da un numero finito di unità,  infiniti, cioè ipotetici o indefiniti, quando sono costituiti da un numero imprecisato di unità.


CARATTERI E MODALITà




I caratteri sono le proprietà delle unità statistiche che vogliamo 636e44g misurare o enumerare, cioè quell'aspetto che vogliamo studiare. Un carattere si dice quantitativo se è misurabile e quindi esprimibile con un numero (età, altezza ecc..),si dice qualitativo in caso contrario (professione, titolo di studio ecc..).

Un carattere quantitativo si dice variabile statistica mentre un carattere qualitativo mutabile.

Le variabili possono essere:

continue,quando assumono valori reali (quantità di pioggia caduta in un carto periodo dell'anno,il peso di un bambino misurato in una certa data ecc);

discrete, quando assumono solo valori interi ( .



Si definisce modalità ciascuna delle varianti con cui un carattere quantitativo o qualitativo si presenta.


ESEMPI: Sono modalità: femmina per il carattere "genere".


FENOMENI COLLETTIVI


I collettivi sono oggetto di studio dei fenomeni collettivi, ossia fenomeni naturali o sociali, la cui misurazione richiede l'analisi delle diverse unità che fanno parte del collettivo. Il collettivo statistico può essere chiamato anche popolazione.

Tuttavia a volte, per ridurre i costi o il tempo di realizzazione dell'indagine, si rileva un campione della popolazione.


LE FASI DELL'INDAGINE STATISTICA


Lo studio statistico di un fenomeno si articola in diverse fasi:

a)  analisi del problema:si valuta la questione valutando il contesto e tutti gli elementi conosciuti;

b)  definizione degli obiettivi ossia individuare e fissare lo scopo dell'indagine;

c)  rilevazione dei dati

d)  elaborazione dei dati grezzi in dati derivati e presentazione sintetica dei risultati mediante tabelle e grafici);


e)  interpretazione o spiegazione  dei risultati.


CAPITOLO 2-LA RILEVAZIONE E LA CLASSIFICAZIONE DEI DATI


In molte indagini statistiche si parte da un materiale già rilevato dallo Stato o da enti pubblici o privati. In altre indagini occorre procedere espressamente.


LE FONTI STATISTICHE


Le principali fonti statistiche sono l' Istituto nazionale di statistica, che istituzionalmente effettua gran parte della rilevazione statistica ufficiale italiana e provvede alla diffusione del materiale raccolto, sotto forma di pubblicazioni periodiche e occasionali.

Le pubblicazioni periodiche dell'ISTAT sono l'Annuario statistico italiano e il Compendio statistico italiano, che riguardano tutti i campi di attività del nostro Paese.

Le altre pubblicazioni dell'ISTAT sono dedicate ai singoli settori come il settore demografico, sanitario assistenziale (Statistiche della sanità), dell'istruzione (Statistiche culturali), della famiglia e società, della Pubblica Amministrazione, della giustizia (Statistiche giudiziarie), del lavoro e delle singole attività produttive.

Il panorama delle indagini statistiche effettuate dall'ISTAT comprende anche i Censimenti della popolazione.

Alle fonti ISTAT vanno affiancate quelle curate dal Ministero dell'Economia come i Rapporti sulla situazione economica e sociale del Paese.

Sono invece fonti statistiche internazionali i rapporti stilati dall'ONU riguardanti i fenomeni demografici, dall'OMS (Organizzazione Mondiale della Sanità) riguardanti la Sanità a livello mondiale, l'UNESCO riguardante l'istruzione e la FAO (Organizzazione della Agricoltura e del cibo).


PIANO DELLA RILEVAZIONE


Il soggetto che deve panificare un'indagine statistica, deve innanzi tutto conoscere lo scopo cui mira la rilevazione e il capitale finanziario e umano di cui dispone.

Occorre quindi:

a) definire l'unità statistica oggetto di studio per garantire l'esattezza della ricerca. Ad esmpio, dovendo censire una popolazione è chiaro che l'unità che deve formare il collettivo statistico è l'individuo, però è molto più comodo assumere come unità di rilevazione la famiglia;

b) stabilire i caratteri qualitativi, per i quali occorre ricorrere a nomenclature specifiche riguardanti il campo di indagine, e le scale convenzionali da utilizzare per rilevare ad esempio i differenti colori degli occhi, o i caratteri quantitativi, per i quali per i quali occorre precisare l'unità di misura e lo strumento di misurazione se richiesto;

c) indicare i mezzi tecnici ossia i supporti e gli strumenti da usare come questionari, modelli o schede, i soggetti che devono effettuare le rilevazioni. A tal proposito è necessario distinguere le rilevazioni automatiche, in cui vi è una dichiarazione spontanea (nascite, morti), dalle rilevazioni riflesse i cui dati sono raccolti da personale preposto.

d) fissare  l'estensione territoriale ossia l'area entro la quale devono trovarsi le unità da rilevare, i limiti di tempo ossia la durata della rilevazione in relazione alla frequenza nel tempo delle unità da analizzare. Particolare attenzione, infatti, si pone per stabilire quando conviene eseguire la rilevazione.

1923 una relazione di Bowley e Jensen  dimostrò la bontà dei risultati che si potevano ottenere sostituendo al collettivo totale un campione statistico rappresentativo delle caratteristiche del collettivo stesso.

Le rilevazioni campionarie consentono di ridurre il tempo e i costi, tuttavia non è sempre possibile utilizzarle. Infatti, nel caso di rilevazioni concernenti il movimento di stato civile è utile effettuare indagini complete poiché sono utili per atti amministrativi.

Le rilevazioni parziali si distinguono in rappresentative, che illustrano il fenomeno collettivo in scala proporzionale, non rappresentative, che escludono dal collettivo le unità che presentano il carattere con intensità inferiore a determinati limiti o che appartengono a determinate zone.

Si giunge alla formazione dei campioni mediante:

a)  scelta casuale delle unità statistiche;

b)  scelta ragionata delle stesse.

Caratteristica fondamentale per la scelta casuale è che le singole unità abbiano la stessa probabilità di entrare a far parte del campione.

Nella scelta ragionata le unità campionate sono scelte mediante la frazione di campionamento:


n/N × 100

in tale frazione il rapporto tra il campione (n) e il collettivo (N) dicesi intervallo di campionamento.


CAMPIONI OTTENUTI MEDIANTE SCELTA CASUALE


Per formare campioni a scelta casuale è necessario conoscere la base , cioè la documentazione sotto forma di elenchi, delle unità statistiche che dovranno formare il campione.

Se le unità di rilevazione sono le famiglie, la base può essere data dall'elenco delle famiglie iscritte nel registro delle famiglie dei comuni. Se quest'ultimo non è presente si può ricorrere al campione casuale per area, nel quale ci si serve di carte topografiche della città in cui vengono delimitate e numerate piccole aree. Fra esse se ne sceglie a caso un certo numero a cui corrispondono aree campione.

E' utilizzabile anche il campionamento sistematico nel quale ci sono intervalli prestabiliti di divisione tra un unità e l'altra.

Altro metodo è l'utilizzo delle tavole dei numeri aleatori o casuali costituite da cifre ricavate attraverso estrazioni sulle varie ruote del lotto in Italia.

Tale metodo richiede la numerazione preventiva di tutte le unità che costituiscono il collettivo totale.

Supponiamo ad esempio di voler formare un campione n=100 unità da una popolazione di N=8000 unità. Nella tavola dei numeri prendiamo in considerazione tante colonne quante sono le cifre di N ossia 4 cifre. Dobbiamo quindi, scegliere i primi cento numeri di quattro cifre inferiori ad 8000. A ciascun numero estratto corrisponderanno i 100 elementi della popolazione da includere nel campione.

Dicesi,invece,scelta a grappolo quella scelta che ricade su unità che presentano una caratteristica comune come ad esempio i condomini di uno stesso edificio.


CAMPIONI STRATIFICATI


La bontà dei risultati delle rilevazioni campionarie dipendono dalla dimensione del campione e dall'eterogeneità del fenomeno in esame.

Per aumentare la precisione dei dati ottenibili mediante un'indagine campionaria si può incrementare il numero di unità da includere nell'indagine ma ciò comporta un aumento dei costi. L'unica possibilità è dividere la popolazione in strati o classi ed estraendo un campione rappresentativo da ciascuna classe. Con questo tipo di campionamento è possibile tenere conto delle frequenze massime e minime che un fenomeno assume.

Tale procedimento quindi consente di:

a)  eliminare la formazione di alcuni campioni sottorappresentativi,sovra rappresentativi o non rappresentativi del fenomeno;

b)  distribuire la dimensione complessiva del campione nei vari strati in modo da ridurre la eterogeneità complessiva del campione stesso. In questo caso occorrerà riequilibrare il campione---------


CAMPIONI A DUE STADI


Per minimizzare i costi di un'indagine campionaria si ricorre all'individuazione di unità primarie e secondarie di rilevazione.

Ad esempio, volendo formare un campione a due stadi dai 21 milioni di famiglie residenti negli 8103 comuni italiani, con frazione di campionamento del 2%, sarà opportuno formare un campione di 801 comuni (pari al 10% della totalità dei comuni)dai quali estrarre il 20% delle famiglie.

Poiché le famiglie sono nel complesso 21 milioni, il nostro campione al 2% ne deve comprendere 420.000:


21.000.000×2 420.000 famiglie,

100


che devono essere rilevate in 801 comuni. Conoscendo dai dati che in questi comuni risiede il 10% del totale delle famiglie pari a

21.000.000×10 2.100.000 famiglie,

100


la quota media di campionamento relativa alla selezione delle famiglie nell'ambito degli 801 comuni di primo stadio risulta dal rapporto


420.000×100 20%

2.100.000


CAMPIONI MEDIANTE SCELTA RAGIONATA


Tali campioni si fondano sulla conoscenza che l'operatore ha del fenomeno e sono utili per ampie indagini su poche unità territoriali o per ricerche su beni industriali la cui analisi può richiedere l'inclusione di particolari unità di rilevazione. Il principale inconveniente è costituito dal fatto che la validità dell'indagine scade quando si passa dall'esame dei caratteri che segnano variazioni omogenee con quelli considerati a caratteri eterogenei. Ci troviamo nella prima situazione quando la ricerca, ad esempio, riguarda uno specifico tipo di aziende individuate come rappresentative di un settore economico secondo l'opinione dell'operatore. Ci troviamo invece nel secondo caso quando si ricorre al procedimento per quota  con il quale si seleziona la popolazione oggetto di studio secondo alcune variabili come zone geografiche, sesso, età, professione, ecc..

Un altro tipo di scelta non casuale è costituito dalla selezione per unità-tipo, rappresentative degli aspetti tipici presi in analisi dall'indagine. Ad esempio, per la costruzione di un campione di province, potrebbero essere scelte quattro unità provinciali con caratteristiche differenziate tali da consentire una rappresentatività delle varie realtà del Paese.


RACCOLTA DEI DATI. FENOMENI DI STATO E FENOMENI DI FLUSSO


Le rilevazioni si distinguono in occasionali,cioè fatte in vista di particolari necessità(studio sulle condizioni dei contadini in Sicilia effettuato nel 1980), periodiche, se avvengono ad intervalli regolari di tempo(es:censimento), continue, se avvengono senza interruzioni( come quelle rilevate dall'Ufficio di Stato civile).

I fenomeni che si concretizzano in riferimento a dati istanti di tempo si dicono di stato. Vi sono invece fenomeni soggetti ad un rinnovamento continuo e si dicono perciò di flusso.


INTENSITà, MODALITà E FREQUENZA


Si intensità il numero che esprime la grandezza di un carattere quantitativo.

La somma delle intensità individuali rappresenta l'intensità globale del carattere.

Le modalità sono le varianti con cui il carattere si presenta.

Dicesi  frequenza il numero che esprime quante volte una data modalità si presenta nel collettivo.


SPOGLIO O CLASSIFICAZIONE DEI DATI RILEVATI. TABELLE DI SPOGLIO


Allo scopo di rendere più semplice il trattamento dei dati è utile organizzare i dati grezzi in tabelle di spoglio. La presenza di grande masse di dati hanno favorito lo sviluppo di hardware e software per l'elaborazione statistica, tra i quali il Sistema SAS (Sistema di analisi statistica)e il sistema SPSS(Programma statistico per le scienze sociali). Il SAS è nato nel Nord Carolina grazie ad alcuni ricercatori. Esso permette la trasformazione e l'elaborazione di ogni genere di dati consentendo così  di affrontare ogni tipo di problema.

Il sistema SPSS è più semplice per l'utente occasionale e molto utile per quello esperto.


ERRORI DI RILEVAZIONE


I tipi più comuni di errori nell'assunzione dei dati sono dovuti a:

1-Imperfezioni dei questionari o dei metodi di rilevazione del fenomeno;

2-l'individuo che effettua la rilevazione;

3-l'individuo intervistato.

Gli errori nello spoglio dei dati sono dovuti a:

1-di errata interpretazione di alcune risposte;

2-di trascrizione (es.56 invece di 65);

3-di riferimento (attribuire ad un fenomeno i dati relativi ad un altro);

4-di elaborazione (quelli di arrotondamento);

Tra quelli relativi alla grandezza da osservare gli errori possono essere:

1-accidentali quando dipendono da circostanze fortuite. Sono ad esempio affetti da errori accidentali quei dati statistici ottenuti mediante stime, le quali possono risultare in eccesso o in difetto e gli errori di misura commessi nella misurazione di una grandezza;

2-costanti quando si commettono con la stessa intensità in tutte le osservazioni;

3-sistematici quando è proporzionale alla grandezza osservata;

4-di distribuzione quando ad esempio vi è la mancata denuncia di certe malattie che ne modificano la distribuzione.


CORREZIONE DEGLI ERRORI:


A)METODO DIRETTO E METODO DELL'INGRANDIMENTO DELLE CLASSI:


Il procedimento diretto per correggere gli errori è risalire alle fonti. Un procedimento per ridurre o eliminare errori dovuti a spostamenti di frequenze e di intensità tra le modalità è quello dell'ingrandimento delle classi che consiste nel riunire più dati in un'unica classe in modo da fare avvenire fra gli errori una certa compensazione.


B)PEREQUAZIONE GRAFICA


Rappresentando nel piano cartesiano i valori delle frequenze e tracciando poi ad occhio una linea continua che passi tra questi estremi in modo da indicare l'andamento evolutivo del fenomeno.


C)LACUNE


Si desumono i dati mancanti da altri dati relativi a fenomeni diversi da quello che interessa purchè sia in una certa relazione con esso, ricorrendo ad esempio al processo di interpolazione ossia inserire uno o più dati mancanti tra quelli già noti.


ERRORE ASSOLUTO ED ERRORE RELATIVO:


Le misure dei caratteri quantitativi continui(es. peso)sono approssimate e dipendono alla precisione in questo caso dello strumento utilizzato.

Se indichiamo con X il valore esatto della grandezza e con x un valore osservato della stessa grandezza, la quantità:


x-X è l'errore di x,esso può essere positivo negativo o nullo;


|x-X|    è l'errore in valore assoluto cioè a indipendentemente dal suo segno;


x-X  è l'errore relativo di x.

X





Privacy




Articolo informazione


Hits: 2138
Apprezzato: scheda appunto

Commentare questo articolo:

Non sei registrato
Devi essere registrato per commentare

ISCRIVITI



Copiare il codice

nella pagina web del tuo sito.


Copyright InfTub.com 2024