Matlab per applicazioni statistiche
|
|
- Virginio Poggi
- 8 anni fa
- Visualizzazioni
Transcript
1 Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha ancora incontrato la diffusione che merita in statistica, dove continuano ad essergli preferiti sistemi alternativi quali GAUSS o S/Plus. La mia opinione è che Matlab sia di gran lunga superiore agli altri sistemi: per l efficienza e la rapidità di esecuzione; per la semplicità nell importazione e nella gestione dei dati; per la qualità dell help in linea; per il livello degli strumenti di debugging; per la possibilità di interfacciare semplicemente codice C; infine, per la disponibilità di un package statistico relativamente completo. In queste pagine verranno illustrati alcuni argomenti di un corso base di statistica inferenziale attraverso simulazioni ed esperimenti in Matlab. Il package statistico di Matlab si trova nella cartella \toolbox\stats; per avere una lista di tutte le funzioni disponibili basta digitare help stats Versione preliminare e incompleta ad uso interno degli studenti del dottorato IMT; per favore non circolare. 1
2 La filosofia che ispira la trattazione è di illustrare i concetti statistici e probabilistici attraverso l uso di simulazioni; uno strumento affine anche se non basato sul sistema Matlab in questo senso è il Laboratorio virtuale di probabilità e statistica ( 2 Probabilità 2.1 Funzioni di densità e cumulate Vediamo in primo luogo come costruire il grafico di una funzione di densità di probabilità. Prendiamo ad esempio la distribuzione t di Student, a cui corrisponde la funzione tpdf. Dall help (help tpdf) apprendiamo che la funzione prende due argomenti: y = tpdf(x,v) un vettore di ascisse x e i gradi di libertà v, e restituisce un vettore y che contiene i valori della pdf in corrispondenza delle ascisse. Dobbiamo quindi in primo luogo costruire un vettore di ascisse. Se vogliamo vedere il grafico della funzione di densità tra 5 e 5, il comando x=[-5:0.1:5] ; produrrà una progressione aritmetica di ragione 0.1 che parte da 5 e termina a 5. I valori della pdf di una distribuzione t di Student con 3 gradi di libertà si otterranno quindi digitando yt=tpdf(x,3); A questo punto possiamo costruire il grafico: plot(x,yt) Se si aggiungono ulteriori argomenti, si può controllare l aspetto del grafico: plot(x,yt, r. ) produce un grafico a punti di colore rosso. Una lista completa delle opzioni si può ottenere digitando help plot. Un grafico a punti può essere utile nel caso di distribuzioni discrete, visto che la probabilità è definita solo in corrispondenza di valori interi delle ascisse. Disegniamo ora, utilizzando la stessa griglia di ascisse, la funzione di densità di una distribuzione normale standardizzata 2
3 yn=normpdf(x,0,1); plot(x,yn) Se si desidera visualizzare più grafici sovraimposti, si utilizza il comando hold: hold on; plot(x,yt, r ); hold off; Esercizio 1. Disegnare il grafico della funzione cumulata di probabilità di una distribuzione χ 2 3. Esercizio 2. Disegnare il grafico della funzione di massa di probabilità di una distribuzione binomiale con n = 10 e p = Numeri casuali Matlab possiede un generatore di numeri (matrici) pseudo-casuali uniformi (rand) e normali standardizzati (randn); gli argomenti che questi generatori richiedono sono il numero di righe e colonne desiderati. Ad esempio, per avere un vettore colonna di dieci numeri casuali uniformi si digita: rand(10,1) Il computer è una macchina deterministica e non è in grado di produrre numeri veramente casuali. In effetti, se si fissa il seme del generatore, si ottiene la stessa sequenza di numeri: rand( state,0) Questo può essere utile negli studi di simulazione, o per controllare i risultati. Si noti che i due generatori rand e randn si basano su due semi diversi, per cui fissare il seme di uno non ha effetto sull altro. Nel package stats sono inoltre compresi ulteriori generatori. Si noti che essi utilizzano la routine rand, per cui per fissare il seme bisogna fare riferimento al seme di quest ultima. Se ad esempio vogliamo un campione di 100 osservazioni da una distribuzione esponenziale con media 1.8, digitiamo rr=exprnd(1.8,100,1); Esercizio 3. Generare un vettore di 100 numeri casuali da una distribuzione t con 3 gradi di libertà. 3
4 2.3 Istogramma e cdf empirica Una volta generati dei numeri casuali, si può visualizzare il risultato costruendone l istogramma: hist(rr) Se si desidera specificare il numero di intervalli che l istogramma deve utilizzare, lo si può inserire come secondo argomento: hist(rr,20) Uno secondo modo per visualizzare le proprietà empiriche di un campione è quello di disegnare la cdf empirica: cdfplot(rr) 2.4 Stima kernel Un modo più raffinato per valutare le proprietà distributive di un campione è quello di usare una stima kernel della funzione di densità. Attraverso la stima kernel otteniamo una sorta di pdf empirica, che in un certo senso può essere pensata come istogramma smussato. Nel package stats di Matlab non c è una funzione che esegue a stima kernel, ma ne ho messa a disposizione una sul mio sito personale ( il nome della funzione è kernel1. Per poterla utilizzare, è necessario copiare il file kernel1.m nella directory work o in un altra directory presente nella search path. La funzione kernel1 prende come argomento un vettore e restituisce come output un vettore di ascisse x e un vettore di densità stimate p. Per visualizzare il grafico di una stima di densità kernel per il campione rr, si deve quindi digitare [pk,xk]=kernel1(rr); plot(xk,pk) Esercizio 4. Generare un campione di 100 osservazioni da una distribuzione t con 4 gradi di libertà. Eseguire una stima kernel e riportarla nello stesso grafico della vera funzione di densità. Esercizio 5. Ripetere l esercizio precedente con un campione di 1000 osservazioni. Notare eventuali cambiamenti. 4
5 3 Stima puntuale 3.1 Proprietà finite di uno stimatore Uno stimatore è una variabile aleatoria e come tale possiede una propria distribuzione. Una realizzazione della variabile aleatoria stimatore prende il nome di stima. Per valuatre empiricamente la distribuzione di uno stimatore si deve quindi raccogliere un campione di stime. Supponiamo di aver a che fare con un campione di 10 unità da una popolazione con distribuzione esponenziale a media 3; utilizzeremo la media campionaria come stimatore della media della popolazione. Per costruire la distribuzione dello stimatore dobbiamo estrarre ripetutamente campioni di dieci unità e calcolare su ognuno di essi la media campionaria. Se vogliamo valutare la distribuzione dello stimatore con un campione di 1000 stime, costruiamo una matrice di numeri aleatori con distribuzione esponenziale a media 3 di dimensioni ; ogni colonna rappresenterà gli esiti di un operazione di campionamento che viene poi ripetuta per 100 volte. xe=exprnd(3,10,1000); A questo punto ricaviamo il campione di 1000 stime della media, che risulta essere la media per colonna di xe. me=mean(xe,1); Otteniamo così un vettore di dimensione Notiamo che, se avessimo voluto la media per riga, avremmo dovuto digitare mean(xe,2); A questo punto si può generare l istogramma di me, che rappresenta la distribuzione dello stimatore media campionaria. hist(me) Notiamo che non ha forma esattamente campanulare, ma presenta asimmetria. In effetti, un campione di 10 unità non è sufficientemente ampio affinché valga il teorema del limite centrale e la distribuzione della media campionaria sia Gaussiana. Ripetendo lo stesso esperimento con un campione di 100 unità si nota che la distribuzione tende alla simmetria attorno al 3. ma=mean(exprnd(3,100,1000),1); hist(ma) 5
6 In effetti, si può osservare che la media delle stime è molto vicina a 3: mean(ma) Questa è una conseguenza del fatto che la media campionaria è uno stimatore corretto della media della popolazione. Uno stimatore non corretto è la varianza campionaria N s 2 i=1 = (x i x) 2. N Se consideriamo la distribuzione esponenziale con media 3 di cui sopra, la varianza della popolazione sarà 3 2. Se pensiamo di stimarla (su campioni di 10 osservazioni) utilizzando la varianza campionaria notiamo che la media delle stime non è molto vicina a 9. ve=var(xe,1); mean(ve) Se invece utilizziamo la varianza campionaria corretta (che Matlab usa di default) N s 2 i=1 = (x i x) 2. N 1 il risultato si avvicina alla varianza della popolazione. ve=var(xe); mean(ve) Un altra proprietà di uno stimatore è l efficienza, ovvero la sua varianza. Uno stimatore più efficiente (con varianza minore) sarà da preferirsi in quanto la componente erratica delle stime sarà minore. Esercizio 6. Verificare che la varianza campionaria corretta è meno efficiente della varianza campionaria non corretta. 3.2 Proprietà asintotiche di uno stimatore In molti casi le proprietà di uno stimatore sono da intendersi in senso asintotico, ovvero valgono al tendere a infinito della numerosità campionaria. Uno stimatore può ad esempio essere distorto ma corretto asintoticamente: se consideriamo la varianza non corretta, osserviamo che per N essa equivale alla varianza corretta. Per verificare le proprietà asintotiche di uno stimatore possono essere utili grafici ricorsivi. Consideriamo un campione di 1000 osservazioni da 6
7 una distribuzione normale standardizzata. Per visualizzare l evoluzione della media campionaria al crescere della dimensione campionaria possiamo digitare: xn=randn(1000,1); nn=[1:1:1000] ; mn=cumsum(xn)./nn; plot(mn) Osserviamo che al crescere del numero di osservazioni la media campionaria tende alla media della popolazione. Esercizio 7. Utilizzando la formula s 2 = N i=1 x2 i N [ N i=1 x i] 2 N 2, mostrare che la varianza campionaria distorta è asintoticamente corretta. 4 Test di ipotesi e intervalli di confidenza Il package stats di Matlab include due funzioni per effettuare test di ipotesi nel campionamento da una normale: ztest per il caso di varianza nota e ttest per il caso di varianza ignota. Il prototipo della funzione ztest è [h,p,ci,zval] = ztest(x,m,sigma,alpha,tail) Gli argomenti in input sono quindi: x campione di dati, m valore della media sotto H 0, sigma varianza della popolazione, alpha livello di significatività (default 0.05), tail tipo di test: bidirezionale (0, default), unidirezionale a destra (1), unidirezionale a sinistra ( 1). La funzione restituisce come output: h esito del test: (0 non rifiuto, 1 rifiuto), 7
8 p p-value della statistica test, ci intervallo di confidenza per la media, zval valore della statistica test. Il prototipo della funzione ttest è identico, l unica differenza è che non è ovviamente necessario sigma, e che la statistica test stats viene qui restituito come struttura che riporta sia il valore che il numero di gradi di libertà: [h,p,ci,stats] = ttest(x,m,alpha,tail) 4.1 Significatività Eseguiamo ora uno studio di simulazione per verificare che il test funzioni correttamente, ovvero che commetta errori di I tipo una frazione di volte prossima al livello di significatività. Consideriamo un campione di 30 elementi da una distribuzione normale standardizzata, e sottoponiamo a verifica l ipotesi nulla H 0 : µ = 0; assumiamo che la varianza non sia nota e utilizziamo quindi la funzione ttest. Poiché la funzione ammette come argomento un vettore ma non una matrice, dobbiamo eseguire lo studio di simulazione all interno di un ciclo for. q=zeros(1000,1); for i=1:1000 xn=randn(30,1); [q(i,1),tmp1,tmp2,tmp3]=ttest(xn,0); end clear tmp* i mean(q) Osserviamo che la proporzione effettiva di rifiuti dell ipotesi nulla è prossima al livello di significatività del test. 4.2 Funzione di potenza Anche la funzione di potenza può essere costruita per via di simulazione: q=zeros(1000,1); h1=[-1:0.1:1] ; n1=rows(h1); pot=zeros(n1,1); 8
9 for k=1:n1 randn( state,0); for i=1:1000 xn=randn(30,1)+h1(k,1); [q(i),tmp1,tmp2,tmp3]=ttest(xn,0); end pot(k,1)=mean(q); end plot(h1,pot) clear tmp* i q n1 In primo luogo si genera un vettore h1 che contiene le possibili medie della popolazione. Poi, per ogni elemento di h1, si ricava empiricamente la potenza, ovvero si conta la proporzione di rifiuti di H 0. Per ogni nuovo valore di h1 dobbiamo resettare il seme del generatore di numeri casuali, per evitare che la funzione di potenza presenti irregolarità dovute all errore di campionamento. Esercizio 8. Costruire la funzione di potenza per un test unidirezionale a destra sulla media di una distribuzione normale standardizzata con campioni di 10 osservazioni. Ripetere per campioni di 50 osservazioni. Notare le differenze. 4.3 Intervalli di confidenza Un ultimo risultato che si può ricavare dalle funzioni ztest e ttest è costituito dagli intervalli di confidenza per la media, che viene restituito come vettore di due elementi (estremo inferiore e superiore) ci. Mostriamo ora come l ampiezza dell intervallo si riduca all aumentare delle osservazioni: in primo luogo generiamo un campione di 100 osservazioni da una distribuzione normale standardizzata e dichiariamo un vettore di medie mn e una matrice che contiene gli estremi degli intervalli di confidenza cin. xn=randn(100,1); mn=zeros(90,1); cin=zeros(90,2); A questo punto scriviamo un ciclo for che riempia ricursivamente mn e cin, partendo da campioni di 11 osservazioni e incrementando di uno fino a coprire tutto il campione disponibile. Potremo così controllare l evoluzione degli intervalli di confidenza. 9
10 for i=11:100 mn(i-10,1)=mean(xn(1:i,1)); [tmp1,tmp2,cin(i-10,:),tmp3]=ttest(xn(1:i,1),0); end clear tmp* i plot(mn, k- ) hold on plot(cin, k: ) hold off 10
Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliEsercitazione n.2 Inferenza su medie
Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliLa distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
DettagliEsercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010
Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe
Dettagli1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.
Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliEsercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test
STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che
DettagliUniversità del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
DettagliLa grafica. La built-in funzione grafica plot. x spezzata poligonale. discretizzato
La grafica. Il Matlab possiede un ambiente grafico abbastanza potente paragonabile a software grafici operanti in altri contesti. In questo corso ci limiteremo ad illustrare solo una funzione grafica,
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliFONDAMENTI DI PSICOMETRIA - 8 CFU
Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180
DettagliEsercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.
Esercizio 1 Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli. Tabella A 138 150 144 149 164 132 125 157 161 135 150 145 145 142 156
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
Dettagliiovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi
iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliMetodi Stocastici per la Finanza
Metodi Stocastici per la Finanza Tiziano Vargiolu vargiolu@math.unipd.it 1 1 Università degli Studi di Padova Anno Accademico 2011-2012 Lezione 6 Indice 1 Il metodo bootstrap 2 Esercitazione 3 Interpolazione
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica
Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -
DettagliIntroduzione al MATLAB c Parte 2
Introduzione al MATLAB c Parte 2 Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 18 gennaio 2008 Outline 1 M-file di tipo Script e Function Script Function 2 Costrutti di programmazione
DettagliSTATISTICA INFERENZIALE
STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p
DettagliFORMULE: Operatori matematici
Formule e funzioni FORMULE Le formule sono necessarie per eseguire calcoli utilizzando i valori presenti nelle celle di un foglio di lavoro. Una formula inizia col segno uguale (=). La formula deve essere
DettagliUtilizzo delle formule in Excel
Utilizzo delle formule in Excel Excel è dotato di un potente motore di calcolo che può essere utilizzato per elaborare i dati immessi dagli utenti. I calcoli sono definiti mediante formule. Ogni formula
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
Dettagli15. Antico gioco russo
15. Antico gioco russo In un antico gioco russo, attraverso i risultati casuali ottenuti dall allacciamento di cordicelle, i giovani cercavano una previsione sul tipo di legame che si sarebbe instaurata
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliEsercitazione n.4 Inferenza su varianza
Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliGrafici delle distribuzioni di frequenza
Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma
DettagliEXCEL FUNZIONI PRINCIPALI
EXCEL FUNZIONI PRINCIPALI Funzione SE() Sintassi: SE(VERIFICA, VALORE SE VERO, VALORE SE FALSO): verifica un valore e ritorna una risposta in base al risultato vero/falso Esempio: =SE(A2=15; "OK"; "NO")
DettagliUniversità del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliAppunti sugli Elaboratori di Testo. Introduzione. D. Gubiani. 19 Luglio 2005
Appunti sugli Elaboratori di Testo D. Gubiani Università degli Studi G.D Annunzio di Chieti-Pescara 19 Luglio 2005 1 Cos è un elaboratore di testo? 2 3 Cos è un elaboratore di testo? Cos è un elaboratore
DettagliTemi di Esame a.a. 2012-2013. Statistica - CLEF
Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliAnalisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda
Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato
DettagliSiamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.
DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti
DettagliR - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre 2013. Università Roma Tre
R - Esercitazione 5 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre Lunedì 2 Dicembre 2013 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x,
Dettagli11. Analisi statistica degli eventi idrologici estremi
. Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche
DettagliStudente: SANTORO MC. Matricola : 528
CORSO di LAUREA in INFORMATICA Corso di CALCOLO NUMERICO a.a. 2004-05 Studente: SANTORO MC. Matricola : 528 PROGETTO PER L ESAME 1. Sviluppare una versione dell algoritmo di Gauss per sistemi con matrice
DettagliCalcolo delle probabilità
Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità
DettagliGUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL
GUIDA RAPIDA BOZZA 23/07/2008 INDICE 1. PERCHÉ UNA NUOVA VERSIONE DEI MODULI DI RACCOLTA DATI... 3 2. INDICAZIONI GENERALI... 4 2.1. Non modificare la struttura dei fogli di lavoro... 4 2.2. Cosa significano
DettagliPROGRAMMA SVOLTO NELLA SESSIONE N.
Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE
DettagliPotenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1
Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo
DettagliGuida all uso di Java Diagrammi ER
Guida all uso di Java Diagrammi ER Ver. 1.1 Alessandro Ballini 16/5/2004 Questa guida ha lo scopo di mostrare gli aspetti fondamentali dell utilizzo dell applicazione Java Diagrammi ER. Inizieremo con
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliMatematica generale CTF
Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005
esercitazione 2 p. 1/12 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 28/05/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Nel gico del
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliTeoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati
Teoria della Stima. Stima della Media e di una Porzione di Popolazione Introduzione La proceduta in base alla quale ad uno o più parametri di popolazione si assegna il valore numerico calcolato dalle informazioni
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliLE SUCCESSIONI 1. COS E UNA SUCCESSIONE
LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe
DettagliIl calendario di Windows Vista
Il calendario di Windows Vista Una delle novità introdotte in Windows Vista è il Calendario di Windows, un programma utilissimo per la gestione degli appuntamenti, delle ricorrenze e delle attività lavorative
DettagliStrumenti informatici 13.1
1 Strumenti informatici 1.1 I test post-hoc nel caso del confronto fra tre o più proporzioni dipendenti e la realizzazione del test Q di Cochran in SPSS Nel caso dei test post-hoc per il test Q di Cochran,
DettagliRendering air show e verifica della sincronizzazione
Capitolo 5 Rendering air show e verifica della sincronizzazione 5.1 Introduzione Il Rendering 3D dell evoluzioni acrobatiche costituisce uno degli aspetti cruciali dell applicazione realizzata. L ambiente
DettagliSoluzione dell esercizio del 2 Febbraio 2004
Soluzione dell esercizio del 2 Febbraio 2004 1. Casi d uso I casi d uso sono riportati in Figura 1. Figura 1: Diagramma dei casi d uso. E evidenziato un sotto caso di uso. 2. Modello concettuale Osserviamo
DettagliFormattazione e Stampa
Formattazione e Stampa Formattazione Formattazione dei numeri Formattazione del testo Veste grafica delle celle Formattazione automatica & Stili Formattazione dei numeri Selezionare le celle, poi menu:
DettagliSISTEMI DI NUMERAZIONE DECIMALE E BINARIO
SISTEMI DI NUMERAZIONE DECIMALE E BINARIO Il sistema di numerazione decimale (o base dieci) possiede dieci possibili valori (0, 1, 2, 3, 4, 5, 6, 7, 8 o 9) utili a rappresentare i numeri. Le cifre possiedono
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliInferenza statistica I Alcuni esercizi. Stefano Tonellato
Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,
DettagliIN MATLAB distribuzione di frequenza. >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end. IN MATLAB distribuzione di frequenza
IN MATLAB distribuzione di frequenza 2-1 4. Usare la function histc(dati,x) 2-2 1. Riportare i dati in un file (ad esempio dati.mat); 2. load ascii dati: viene creata una variabile dati contenente il campione;
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliServizi di consulenza specialistica per IGRUE 2009 2012
Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Dettagli2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk
DettagliUn gioco con tre dadi
Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.
DettagliEsercitazione n.1 (v.c. Binomiale, Poisson, Normale)
Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione
DettagliProf.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
DettagliCosa è un foglio elettronico
Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti
DettagliEsame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie
Facoltà di Scienze Motorie CHE COS È UN FOGLIO ELETTRONICO Una tabella che contiene parole e numeri che possono essere elaborati applicando formule matematiche e funzioni statistiche. Esame di Informatica
Dettagli