Inferenza statistica

Materie:Appunti
Categoria:Informatica
Download:244
Data:15.10.2001
Numero di pagine:4
Formato di file:.doc (Microsoft Word)
Download   Anteprima
inferenza-statistica_1.zip (Dimensione: 45.41 Kb)
readme.txt     59 Bytes
trucheck.it_inferenza-statistica.doc     107 Kb


Testo

Inferenza statistica
Relazione sulla stima intervallare della media e della probabilità:
Scopo
Realizzare un programma scritto in linguaggio di programmazione C++ che attraverso un’opportuna gestione input-output calcoli la stima intervallare della media e della probabilità.
Cenno teorico
La stima intervallare della media e della probabilità fa parte di un capitolo molto importante del calcolo statistico e per darne un’esatta definizione bisogna partire dalle basi dando la definizione di inferenza statistica:
sono tutti i metodi che trasferiscono le informazioni da un campione casuale alla popolazione. I problemi dell’inferenza statistica sono problemi di induzione che riguardano decisioni statistiche. Tali decisioni presentano una certa probabilità di essere corrette e il compito dello statistico consiste nel cercare di rendere massima tale probabilità in base ai dati campionari a disposizione.
Stando però aderenti al nostro scopo iniziale si nota che dobbiamo compiere una stima e questo termine è usato in statistica per indicare una valutazione approssimativa, dovuta alla mancanza di informazione complete, di una grandezza. Esistono due tipi di stime valide per i parametri una puntuale e l’altra intervallare, noi useremo solamente la seconda. Sono stime intervallari le stime espresse con due numeri che indicano un intervallo entro il quale cade, con una probabilità ben definita, un parametro della popolazione.
Le stime per intervallo possono essere determinate solamente se è nota la distribuzione campionaria della statistica così indicheremo:
- - come il parametro della popolazione che deve essere stimato
- T (dipende dai dati del campione)è lo stimatore utilizzato per ottenere la stima di .
Ora è necessario soffermarsi sul criterio utilizzato per il quale possiamo dire se la stima di u ottenuta, può essere considerata una buona stima, cioè se si avvicina adeguatamente al valore vero del parametro da stimare. Tutto questo può avvenire in base alle proprietà degli stimatori:
- correttezza
uno stimatore T del parametro si dice corretto se il suo valore medio E(T) coincide con per qualsiasi valore di T:
in poche parole deve avvenire che E(T) = i (se questo non si verifica allora è uno stimatore distorto).
E(T)= E(T)
(stimatore corretto) (stimatore distorto)
- efficienza
Uno stimatore è tanto più efficiente quanto minore è la sua varianza.
Ad esempio se si considera un parametro che può essere valutato mediante due stimatori corretti T1 e T2, tra i due risulterà migliore quello con varianza minore nell’esempio è T2.

- consistenza
Uno stimatore si dice consistente quando, al crescere delle dimensioni del campione, converge verso il parametro della popolazione da stimare:

Si nota come all’aumentare delle dimensioni del campione, la distribuzione dello stimatore T si concentra sempre più attorno al parametro i.
Il metodo delle stime intervallari permette di determinare, sulla base delle osservazioni campionarie, un intervallo detto fiduciario, entro il quale si trova, con una prefissata probabilità detta livello fiduciario, il parametro da stimare.
Il livello fiduciario viene indicato con (1- ). Si tratta quindi di scegliere un opportuno stimatore T corretto ed efficiente, la cui distribuzione campionaria, nota, dipende dall’unico parametro ) da stimare. Fatto questo, poiché si conosce la sua distribuzione di probabilità, è possibile determinare due valori, detti valori critici, T1 e T2 tali che:
P(T1 < < T2) =1 -
Dove T1 e T2 sono i limiti dell’intervallo e (1-D) è il livello fiduciario. Il livello di significatività è detto e rappresenta la probabilità che il parametro r non sia compreso nell’intervallo (T1,T2), in poche parole la probabilità di compiere un errore affermando che il valore del parametro è compreso nell’intervallo.

Nel nostro programma dovevamo stimare due parametri:
- la media della popolazione
a seconda dello stimatore che conosciamo possiamo utilizzare varie formule per la stima intervallare della media:
➢ Se è noto S = Xs ± Zc __
√n
dove ± Zc sono i due valori critici che dipendono solo da (1-a) e Xs è X segnato cioè la media campionaria.
➢ Se è noto ŝ = Xs ± Zc ŝ __
√n
in questo caso è noto S corretto (sqm) che appunto è stimatore corretto di i.
➢ Se è noto S = Xs ± Zc S __
√n
in quest’altro caso si conosce lo scarto quadratico medio o deviazione standard campionaria.
- la probabilità della popolazione
Dato un campione di n elementi in cui sono stati osservati f successi, la frequenza relativa fr dei successi risulta:
fr = f/n
fr è uno stimatore corretto e consistente di P infatti
P(fr1 < P < fr2) =1 - per definizione è l’intervallo fra il 95% e il 99%.
Quindi P = fr ± Zc √ fr (1-fr)
n
Descrizione tecnica del programma
Nella schermata iniziale del programma viene chiesto in input il valore del campione n. Immesso il dato che comunque può essere variato anche successivamente, la seconda schermata:

Programma per il calcolo della stima intervallare della media

1. Ri-immetti N
2. Intervallo per la media
3. Intervallo per la probabilità
4. Esci
Scelta:
è il menù principale di scelta dove è possibile ri-imettere il valore di N oppure di proseguire con i calcoli scegliendo fra l’intervallo per la media oppure quello per la probabilità, premendo 4 si provoca l’arresto del programma con la conseguente uscita da esso.
Se l’utente sceglie l’opzione 2:
Calcolo dell'intervallo per la media

Immetti il valore di X:
la schermata precedente ci permette di inserire il valore della probabilità campionaria quindi X segnato.
Successivamente:

Calcolo dell'intervallo per la media
Cosa conosci?:
1. Sigma
2. S
3. S Corretto
4. Indietro

La schermata di gestione del calcolo della stima intervallare della media è stata creata in modo da fare il calcolo a seconda dei parametri che conosce l’utente infatti a seconda del tasto premuto il programma svolge lo stesso la stima intervallare ma usa delle formule diverse, che abbiamo descritto nella parte teorica.
Premendo 4 si ritorna al menu di gestione principale.
L’output dei risultati presenta la stima intervallare della media al 95% a sinistra e al 99% sulla destra dello schermo.
Se l’utente nel menu di gestione principale sceglie l’opzione 3 il programma svolge la stima intervallare della probabilità:
Calcolo dell'intervallo per la probabilità
Immetti il valore di fr (0

Esempio