Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.
|
|
- Cristoforo Scala
- 8 anni fa
- Visualizzazioni
Transcript
1 FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di una distribuzione statistica possono essere ottenute dalla rappresentazione grafica. Solitamente si considerano i seguenti aspetti: numero di massimi: una distribuzione si dice unimodale se presenta un solo massimo, plurimodale in caso contrario; simmetria: una distribuzione si dice simmetrica (rispetto alla mediana) se le modalità che sono equidistanti dalla mediana hanno la stessa frequenza.
2 Asimmetria di una distribuzione Se una distribuzione non presenta assi di simmetria, si dice asimmetrica. Due tipi di asimmetria: asimmetria positiva: vi è un maggiore addensamento delle osservazioni in corrispondenza dei valori più bassi o, in altre parole, l istogramma si prolunga dalla parte dei valori più grandi. asimmetria negativa: vi è un maggiore addensamento delle osservazioni in corrispondenza dei valori più grandi o, in altre parole, l istogramma si prolunga dalla parte dei valori più bassi. Salvo casi particolari, per una distribuzione continua valgono le seguenti relazioni: ( ) ( ) ( ) M X = M X = Moda X : simmetria e ( ) ( ) ( ) M X < M X < Moda X : asimmetria negativa e ( ) ( ) ( ) Moda X < M X < M X asimmetria positiva e
3 LE MISURE DI VARIABILITÀ (VAR. QUANTITATIVE) Il problema Supponiamo di voler confrontare gli enti locali di due regioni, A e B, sulla base dei valori assunti dall entità delle entrate proprie. Per semplicità supponiamo che sia di A che di B facciano parte solo EL: regione A regione B 500, , 00 media aritm.= 500 media aritm.= 500 Il valore medio assunto dalle entrate è uguale nelle regioni, ma la situazione in termini di disuguaglianza tra gli enti è molto diversa da regione a regione!!! Il valor medio non è sufficiente da solo a descrivere la distribuzione dei dati abbiamo bisogno di un indicatore statistico che fornisca una misura sintetica della diversità tra le entrate 3
4 Complichiamo un po l esempio impiegando un numero più elevato di dati e ricorriamo ad un istogramma: DISTR A DISTR B ni ni Totale 577 Le due distr. hanno la stessa media aritmetica = 0,59!!! tuttavia la DIST B è maggiormente dispersa DISTR A DISTR B 4
5 L attitudine di un carattere quantitativo X ad assumere valori differenti tra le unità componenti un insieme statistico è chiamata variabilità. Un fenomeno che mostra assenza di variabilità risulta, per lo statistico, poco interessante La variabilità costituisce una caratteristica dei collettivi statistici e può essere descritta mediante indicatori che godano di particolari proprietà: una misura di variabilità deve annullarsi quando, e solo quando, tutte le unità del collettivo presentano il medesimo stato di grandezza del carattere una misura di variabilità deve assumere valori crescenti all aumentare della variabilità. Il concetto di variabilità è strettamente legato all indice di variabilità utilizzato e pertanto non è corretto mettere a confronto misure di variabilità ottenute con indici diversi. 5
6 Due categorie di misure di variabilità (più una) Possiamo distinguere due categorie di misure di variabilità: indici che misurano la variabilità del carattere mediante una sintesi delle misure della diversità tra ogni termine della distribuzione ed una media (indici di variabilità basati sullo scostamento da una media); indici che misurano la variabilità del carattere misurando la diversità fra due particolari termini della distribuzione o fra due quantili (intervalli di variabilità); A queste due categorie se ne aggiunge una terza (che non studieremo in dettaglio) indici che misurano la variabilità del carattere mediante una sintesi delle misure della diversità di tutti i termini della distribuzione fra loro, cioè della diversità esistente fra le modalità di tutte le possibili coppie di unità della distribuzione 6
7 Indici di variabilità basati sullo scostamento da una media Varianza La varianza è definita come la media (aritmetica) degli scarti al quadrato dalla media aritmetica. Con riferimento ad un protocollo elementare, cioè ad un insieme di valori,,..., n : n V ( X ) = σ ( ) = i n i= Formula semplificata: σ n = i i= n Perché le differenze al quadrato? Il quadrato esalta le differenze più elevate e rende le differenze sempre positive (altrimenti si annullerebbero) 7
8 Esempio regione A regione B 500, , 00 = 500 = 500 σ = ( 500 ) + ( 500 ) = 0 σ = ( ) + ( ) = Calcolo della varianza utilizzando la formula calcolatoria Reddito mensile di 4 individui:, 3,, 5 Media aritmetica: Media dei quadrati: ( ) M ( X ) = =.75 4 M X ( ) ( ) = = 9.75 Varianza: V ( X ) = 9.75 (.75) =.9 4 8
9 Se le n osservazioni sono classificate in una distribuzione di frequenze secondo le k modalità puntuali di un carattere discreto, la varianza è: K V ( ) = σ = ( ) n = ( ) f n K j j j j j= j= La formula semplificata per il calcolo della varianza diventa: σ = K j n j = M ( X ) j= n Se le modalità sono raggruppate in classi occorrerà sostituire alla singola modalità j un valore rappresentativo della j-esima classe ˆ j (usualmente il valore centrale della classe). NB La varianza è espressa nel quadrato dell unità di misura di X. Si tratta quindi di una misura dimensionata il cui valore dipende oltre che dalla variabilità, dall ordine di grandezza del fenomeno e dall unità di misura della variabile X. 9
10 Esempio Calcolo della varianza in una distribuzione per classi di valori applicando la formula semplificata Consideriamo la distribuzione della spesa mensile pro-capite riferita ad un collettivo di 48 individui: classi di spesa ( 00 euro) ˆ j n j ˆ j n j ˆ j ˆ j n j > Totale Medie 9,07,76 Poiché le modalità sono raggruppate in classi, abbiamo calcolato un valore rappresentativo della classe ˆ j (il valore centrale). 0
11 Media dei quadrati K j n j =, 76 n = j La media aritmetica, calcolata sulla base degli stessi valori X rappresentativi della classe, è pari a 9,07. Avremo quindi che σ K j n j n j= = =,76 9, 07 = 30, 48 Ovviamente, al posto della formula calcolatoria, avremmo potuto applicare la definizione. Come nel calcolo della media aritmetica, aver raggruppato le modalità in classi comporta una certa approssimazione nel calcolo della varianza. (il calcolo effettuato sul protocollo elementare avrebbe portato ad un risultato leggermente diverso).
12 Una proprietà della varianza. Se Y = ax + b allora ( ) = ( + ) = ( ) V Y V ax b a V X In particolare, quindi: Se Y = ax allora V Y = V ax = a V X ( ) ( ) ( ) Se Y = X + b allora V ( Y ) = V ( X + b) = V ( X ) Esempio Uso della proprietà della varianza (e della media aritmetica) per cambiamenti nella scala di misurazione Supponiamo di voler individuare media e varianza della spesa mensile pro-capite espressa in Lire anziché in euro. Poiché euro = 936,7 lire, potremmo moltiplicare tutti i dati per 936,7 e ripetere il procedimento sopra illustrato. Tuttavia, nel caso avessimo già calcolato media e varianza in euro (come nel nostro caso) possiamo sfruttare le proprietà di media e varianza ed evitare di effettuare di nuovo tutti i calcoli. Sia Y=936,7 X
13 Avremo che: M(Y) = 936,7 M(X) = 936,7 9,07 =7563,5 V(Y) = 936,7 V(X) = 936,7 30,48 = =48947 Scarto quadratico medio (deviazione standard) È la radice quadrata della varianza: S( X ) = σ = σ E espresso nella stessa unità di misura di X ed è l errore che si commette, in media, sostituendo ai dati la media aritmetica L importanza dello scarto quadratico medio come misura di variabilità si evince anche dalle seguenti relazioni proprie di distribuzioni unimodali ed approssimativamente simmetriche: l intervallo [ σ, σ ] 6 l intervallo [ σ, σ ] l intervallo [ 3σ, 3σ ] + comprende circa il 67% delle osservazioni; + comprende circa il 95% delle osservazioni; + comprende approssimativamente tutte le osservazioni. 3
14 Standardizzazione di una variabile quantitativa Lo scarto quadratico medio è inoltre utilizzato per operare una trasformazione lineare ai dati originari, detta standardizzazione. I valori standardizzati z,z,...,z n corrispondenti alle n osservazioni,,..., n di un carattere quantitativo X, sono definiti come: z i = i σ La distribuzione degli scarti standardizzati origina una variabile Z per cui risulta: M Z = 0 per la proprietà della media aritmetica b) V( Z ) = in quanto: a) ( ) ( ) V Z n n n ( zi z ) zi ( i ) i= i= i= σ n n σ n σ = = = = Gli scarti ridotti sono numeri puri poiché esprimono lo scarto assoluto in unità di scarto quadratico medio. 4
15 Devianza Il numeratore della varianza è detto devianza: n ( i ) i ( ) Dev( X ) = = n = nv X i= i= n La devianza è una quantità additiva. Infatti, se l insieme delle n unità statistiche viene suddiviso in G gruppi, indicati con {, i =,..., n },,, {, i,..., n } i ig = con G G n = n (g=,,g identifica il gruppo - i=,,n g identifica l unità entro il gruppo g) la somma dei quadrati degli scarti delle n determinazioni di X dalla loro media aritmetica si scompone in due addendi: la somma delle G devianze calcolate all interno di ogni gruppo (dev. Entro), la devianza delle G medie aritmetiche di gruppo (indicate con, per g =,..., G) attorno a (dev. Tra) g = g g 5
16 G n g G ( ) = ( ) + ( ) Dev X n ig g g g g = i= g = Dev relativa al gruppo g Dev tra i gruppi Somma delle Dev dei gruppi = Dev entro Esempio Il capo del personale di un azienda suggerisce ai vertici dell azienda stessa di assumere alla catena di montaggio solo uomini in quanto, a suo parere, sono più veloci delle donne nell effettuare l operazione loro assegnata. E vera l affermazione del capo del personale? 6
17 Esperimento scientifico Con riferimento a 0 maschi e 0 femmine si misura il numero medio giornaliero di pezzi prodotti X Maschi Femmine Per prima cosa calcoliamo le medie: M = ( ) = F = ( ) = = 9. M F 7
18 Calcoliamo la devianza tra G ( ) ( ) Dev X = n = TRA g g g= ( ) ( ) = = 360 Calcoliamo la devianza entro. La devianza entro ognuno dei due gruppi è pari a: n g ig ng g, i= otteniamo che: Dev( X ) Dev( X ) 0 e quindi DevENTRO X ( ig g ) M = 4747 = ( ) = = 995 g= i= Infine: Dev( X ) = Dev ( X ) + Dev ( X ) = 556 TRA ENTRO F 8
19 Dev(X) % Entro % Tra 360 4% Totale % Solo il 4% della variabilità totale del numero di pezzi prodotti dipende dalla differenza in media tra i due sessi è abbastanza inverosimile che gli uomini siano più veloci delle donne nel lavorare a quella catena di montaggio!!! Commenti Abbiamo visto come la scomposizione della devianza nelle sue componenti tra ed entro possa essere utile per studiare se i gruppi che formano una popolazione sono effettivamente diversi rispetto ai caratteri considerati nell analisi Abbiamo tratto alcune conclusioni basandoci su argomenti informali (è abbastanza plausibile che, i risultati tendono a ). In questo caso le conclusioni sono abbastanza chiare ma è evidente la necessità di un modo di ragionare più formale e oggettivo Rimane infatti aperta la domanda: quanto è verosimile che un diverso campione di 40 operai ci avrebbe condotti alle stesse conclusioni? 9
20 Altri indici di variabilità basati sullo scostamento da una media Scostamento semplice dalla media aritmetica in una distribuzione di frequenze Scostamento semplice dalla mediana in una distribuzione di frequenze n S ( X ) = n i = k S ( X ) = n j j n j = n S ( X ) = M ( X ) Me i e n i = k S ( X ) = M ( X ) n Me j e j n j = i Nota: S ( X ) S ( X ) Me 0
21 Intervalli di variabilità Campo di variazione e differenza interquartile,,..., n di osservazioni del carattere X, il campo di variazione, R, è definito dalla differenza tra il più grande ( n) ed il più piccolo ( ) dei valori osservati Dato l insieme { } R = ( n) ( ) problema: è un indice che, in presenza di valori anomali, assume valori poco sensati,,..., n di osservazioni del carattere X, la differenza interquartile W è definita come la differenza tra il terzo ed il primo quartile: Dato l insieme { } W = Q ( X ) Q ( X ) 3 campo di variabilità riferito al 50% delle unità centrali
22 Indicatori adimensionali di variabilità Problema Si consideri la spesa pro-capite mensile di 3 individui aventi reddito mens. pari a 000 euro (situazione A) e quella riferita a 3 individui che hanno reddito pari a 3000 euro (B): redd. A spesa: 300, 50, 400 σ, A=6,36 redd. B spesa: 900, 750, 00 σ, B=87,08 La spesa è maggiormente variabile con riferimento agli individui del collettivo A o del collettivo B? Non è possibile avvalersi degli indicatori fin qui trattati per confrontare la variabilità di caratteri diversi, o quella di un medesimo carattere espresso in metriche differenti o quella di caratteri caratterizzati da ordini di grandezza differenti. sono necessari indicatori adimensionali della variabilità.
23 Coefficiente di variazione E' dato dal rapporto tra lo scarto quadratico medio e la media aritmetica. σ CV ( X ) = (spesso è moltiplicato per 00) Il coefficiente di variazione è normalmente utilizzato solo quando tutti i valori della distribuzione sono positivi. Infatti, per caratteri che assumono valori negativi e positivi, la media aritmetica non rappresenta l ordine di grandezza effettivo. Le misure adimensionali della variabilità sono particolarmente utili per confrontare la variabilità di distribuzioni diverse. Con riferimento ai dati precedenti: Media Varianza Scarto Spesa A ,36 Spesa B ,08 sembra che la variabilità sia più elevata in B, ma CV A = 9,69 e CV B = 9,69!?! gli ordini medi di grandezza tra i due gruppi sono molto diversi e ciò influenza anche i valori dei rispettivi scarti quadratici medi (lo s.q.m. non è adimensionale) è necessario standardizzare rispetto al diverso livello medio del fenomeno 3
24 Esempio Una compagnia di assicurazioni ha la necessità di valutare se la variabilità del numero annuale di incidenti stradali per milioni di miglia-veicolo nello stato del New Meico è maggiore o minore rispetto a quella degli interi Stati Uniti (periodo ): New Meico USA
25 Calcolando media aritmetica e varianza per le due serie di dati otteniamo che: New Meico US σ Se vogliamo stabilire quale delle due serie è maggiormente variabile, non possiamo confrontare direttamente le varianze: dobbiamo standardizzare rispetto al diverso livello medio del fenomeno. New Meico US σ CV In termini di CV la variabilità delle due serie è molto simile. E possibile concludere che la maggior varianza della serie relativa al solo New Meico dipende dal più alto numero medio di incidenti per miglio/veicolo in questo stato rispetto agli interi USA. 5
26 Una particolare rappresentazione grafica: i Bo plots Rappresentazione che si avvale di valori medi e di indici di variabilità. Utile nella comparazione tra le caratteristiche di due o più collettivi E caratterizzato da tre elementi principali. Una linea o un punto che indicano la posizione di una media della distribuzione.. Un rettangolo la cui altezza indica la variabilità dei valori prossimi alla media. 3. Due segmenti che partono dai lati maggiori del rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione. Configurazioni tipiche dei Bo plot Tipo : Tipo :. Mediana. Differenza interquartile 3. Minimo e massimo. Media aritmetica. ± σ 3. ±.96 σ 6
27 Esempio Utilizziamo i Bo plot per confrontare la distribuzione del numero annuale di incidenti stradali per milioni di miglia-veicolo nello stato del New Meico e negli interi Stati Uniti per il periodo : I Bo plot di tipo sono in generale più informativi di quelli di tipo, che contengono un ipotesi di disposizione simmetrica delle osservazioni intorno alla media, consideriamo quindi in questa sede il tipo di bo plot più utilizzato, che è quello che ha come media la mediana. Per disegnare i Bo plot del tipo dobbiamo calcolare minimi e massimi, mediana, primo e terzo quartile: NM US Minimo I quartile Mediana III quartile Massimo
28 Bo plot tipo 6 4 Bo Plot ( Incidenti stradali NM e US) Commenti: è evidente che nel New Meico il numero di incidenti per anno è tendenzialmente più alto che in tutti gli Stati Uniti; NM US n.b.: la base del rettangolo è arbitraria Median 5%-75% Min-Ma i dati del New Meico sono più variabili; c è asimmetria positiva, ovvero, in entrambi i collettivi, i valori massimi tendono ad essere più lontani dalla mediana rispetto ai minimi; 8
29 Dati incidenti stradali (ordinati in modo crescente) New Meico USA
30 Teorema di Chebychev Quali informazioni una media e un indice di variabilità forniscono congiuntamente su una distribuzione incognita? Supponiamo di conoscere per un certo carattere quantitativo X solo la media e lo scarto quadratico medio. Non disponiamo, cioè, delle singole osservazioni {,,..., } n. Il teorema afferma, a grandi linee, che la frequenza relativa delle unità che presentano valori esterni ad un intervallo simmetrico rispetto alla media non può essere superiore ad una certa quantità, cioè: ( kσ ) f i k Chiaramente l importanza del teorema cessa quando si conosce la distribuzione del carattere. In tal caso possiamo determinare con esattezza la frequenza delle unità esterne o interne a un determinato intervallo. 30
31 Esempio La spesa media familiare mensile di un certo collettivo è pari a, (in milioni di lire) con deviazione standard pari a 0, (mil.). Qual è la frequenza rel. delle famiglie che hanno un consumo superiore o inferiore a volte la dev. standard più la media? Spesa superiore a,+*0,=,6 spesa inferiore a,-*0,=0,8 <= ¼ = 0,5 La quota di famiglie che consuma più di,6 o meno di 0,8 è inferiore o uguale al 5% del totale delle famiglie. 3
32 LE MISURE DI ETEROGENEITÀ (VAR. QUALITATIVE) Consideriamo un fenomeno qualitativo rilevato su scala nominale, con k modalità. Si def. Eterogeneità del carattere il grado di diversità che esiste fra le modalità di un carattere qualitativo. In una distribuzione di frequenza: Si ha eterogeneità nulla quando tutte le unità presentano la medesima modalità del fenomeno in oggetto: f j = per un certo j f j =0 per ogni altro j Si ha eterogeneità massima quando tutte le unità sono ripartite uniformemente tra le k odalità del carattere: f j =/k per ogni j 3
33 Indice di eterogeneità di Gini E il complemento ad della somma dei quadrati delle frequenze relative: G k = f 0 G ( k ) / k j= j Esempio Consideriamo la distribuzione per titolo di studio in due paesi dell Unione Europea. In quale dei due paesi c è maggiore eterogeneità rispetto a tale variabile? f j f j titolo di studio Paese A Paese B Paese A Paese B Analfabeta lic.elementare lic.media inf diploma o superiore Tot G A =-0.408=0.589 G B = =
Il concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliIndici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliStatistica. Alfonso Iodice D Enza iodicede@unina.it
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 16 Outline 1 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliStatistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Statistica (Prof. Capitanio) Slide n. 1 Materiale di supporto per le lezioni. Non sostituisce il libro di testo MEDIA GEOMETRICA M g = x g = n n x i i=1 1 PROPRIETA 1) Identità di prodotto ( ) n n M =
DettagliIndici (Statistiche) che esprimono le caratteristiche di simmetria e
Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
Dettagli2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk
DettagliMatematica generale CTF
Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliGrafici delle distribuzioni di frequenza
Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma
DettagliAnalisi e diagramma di Pareto
Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliStatistica descrittiva: prime informazioni dai dati sperimentali
SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliVARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.
VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliESERCIZI DI STATISTICA DESCRITTIVA
ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,
DettagliSiamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.
DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliStatistica descrittiva
Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto
DettagliLABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
DettagliStatistica descrittiva
Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliCLASSIFICAZIONE DEI CARATTERI
CLASSIFICAZIONE DEI CARATTERI Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse (caratteri). Il modo in cui un carattere si manifesta in un unità statistica è
DettagliCapitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
DettagliLE SUCCESSIONI 1. COS E UNA SUCCESSIONE
LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe
Dettaglif(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da
Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede
DettagliOCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliCome descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca
Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
Dettagli= variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del 2000 = 500; PIL del 2001 = 520:
Fig. 10.bis.1 Variazioni percentuali Variazione percentuale di x dalla data zero alla data uno: x1 x 0 %x = 100% x 0 = variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliPsicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE
Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliProbabilità discreta
Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che
DettagliCapitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliRAPPRESENTAZIONE DEI DATI
Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone
DettagliDott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
DettagliINDICI DI TENDENZA CENTRALE
INDICI DI TENDENZA CENTRALE NA Al fine di semplificare la lettura e l interpretazione di un fenomeno oggetto di un indagine statistica, i dati possono essere: organizzati in una insieme di dati statistici
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliLE FUNZIONI A DUE VARIABILI
Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliAPPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI
APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliBrugnaro Luca Boscaro Gianni (2009) 1
STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliSTATISTICA DESCRITTIVA. Le misure di tendenza centrale
STATISTICA DESCRITTIVA Le misure di tendenza centrale 1 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 2 Esempio Nella tabella seguente sono riportati
DettagliMisure finanziarie del rendimento: il Van
Misure finanziarie del rendimento: il Van 6.XI.2013 Il valore attuale netto Il valore attuale netto di un progetto si calcola per mezzo di un modello finanziario basato su stime circa i ricavi i costi
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
Dettagli2. Leggi finanziarie di capitalizzazione
2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliSTATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007
A STATISTICA (A-K) a.a. 007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 007 STESS N.O. RD 00 GORU N.O. RD 006 ) La distribuzione del numero degli occupati (valori x 000) in una provincia
DettagliMisure finanziarie del rendimento: il Van
Misure finanziarie del rendimento: il Van 12.XI.2014 Il valore attuale netto Il valore attuale netto di un progetto si calcola l per mezzo di un modello finanziario basato su stime circa i ricavi i costi
DettagliCalcolo delle probabilità
Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità
DettagliStatistica. Le rappresentazioni grafiche
Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliSOLUZIONI D = (-1,+ ).
SOLUZIONI. Data la funzione f() ( ) ln( ) a) trova il dominio di f b) indica quali sono gli intervalli in cui f() risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliSistemi di Numerazione Binaria NB.1
Sistemi di Numerazione Binaria NB.1 Numeri e numerali Numero: entità astratta Numerale : stringa di caratteri che rappresenta un numero in un dato sistema di numerazione Lo stesso numero è rappresentato
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAnalisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA
Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA 1 Distribuzione di frequenza Punto vendita e numero di addetti PUNTO VENDITA 1 2 3
DettagliCONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)
CONTINUITÀ E DERIVABILITÀ Esercizi proposti 1. Determinare lim M(sin) (M(t) denota la mantissa di t) kπ/ al variare di k in Z. Ove tale limite non esista, discutere l esistenza dei limiti laterali. Identificare
DettagliSTATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi di riepilogo - 14 dicembre 2007
STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi di riepilogo - 14 dicembre 2007 Esercizio 1 In Tabella 1 è riportato il numero di crediti maturati al 30 settembre 2007
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
DettagliINTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.
INTEGRALI DEFINITI Sia nel campo scientifico che in quello tecnico si presentano spesso situazioni per affrontare le quali è necessario ricorrere al calcolo dell integrale definito. Vi sono infatti svariati
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliIndice. pagina 2 di 10
LEZIONE PROGETTAZIONE ORGANIZZATIVA DOTT.SSA ROSAMARIA D AMORE Indice PROGETTAZIONE ORGANIZZATIVA---------------------------------------------------------------------------------------- 3 LA STRUTTURA
DettagliIl significato della MEDIA e della MEDIANA in una raccolta di dati numerici
Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Ogni qual volta si effettua una raccolta di dati di tipo numerico è inevitabile fornirne il valore medio. Ma che cos è il valore
Dettagli( x) ( x) 0. Equazioni irrazionali
Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza
DettagliLA RETTA. Retta per l'origine, rette orizzontali e verticali
Retta per l'origine, rette orizzontali e verticali LA RETTA Abbiamo visto che l'equazione generica di una retta è del tipo Y = mx + q, dove m ne rappresenta la pendenza e q il punto in cui la retta incrocia
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliTransitori del primo ordine
Università di Ferrara Corso di Elettrotecnica Transitori del primo ordine Si consideri il circuito in figura, composto da un generatore ideale di tensione, una resistenza ed una capacità. I tre bipoli
DettagliEsercizi di riepilogo Statistica III canale, anno 2008
Esercizio 1 - Esercizio 5 esame 22 giugno 2004 Esercizi di riepilogo Statistica III canale, anno 2008 Data la seguente distribuzione di 100 dipendenti di un azienda in base al tempo impiegato (in minuti)
DettagliStatistica. L. Freddi. L. Freddi Statistica
Statistica L. Freddi Statistica La statistica è un insieme di metodi e tecniche per: raccogliere informazioni su un fenomeno sintetizzare l informazione (elaborare i dati) generalizzare i risultati ottenuti
DettagliMacroeconomia, Esercitazione 2. 1 Esercizi. 1.1 Moneta/1. 1.2 Moneta/2. 1.3 Moneta/3. A cura di Giuseppe Gori (giuseppe.gori@unibo.
acroeconomia, Esercitazione 2. A cura di Giuseppe Gori (giuseppe.gori@unibo.it) 1 Esercizi. 1.1 oneta/1 Sapendo che il PIL reale nel 2008 è pari a 50.000 euro e nel 2009 a 60.000 euro, che dal 2008 al
DettagliStatistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2008/2009 Statistica Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza
DettagliCONCETTO DI LIMITE DI UNA FUNZIONE REALE
CONCETTO DI LIMITE DI UNA FUNZIONE REALE Il limite di una funzione è uno dei concetti fondamentali dell'analisi matematica. Tramite questo concetto viene formalizzata la nozione di funzione continua e
DettagliMATEMATICA 2001. p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).
MATEMATICA 2001 66. Quale fra le seguenti affermazioni è sbagliata? A) Tutte le funzioni ammettono la funzione inversa B) Una funzione dispari è simmetrica rispetto all origine C) Una funzione pari è simmetrica
DettagliProposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014
Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 14 Problema 1 Punto a) Osserviamo che g (x) = f(x) e pertanto g () = f() = in quanto Γ è tangente all asse delle ascisse,
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliSTATISTICA ECONOMICA STATISTICA PER L ECONOMIA
STATISTICA ECONOMICA STATISTICA PER L ECONOMIA a.a. 2009-2010 Facoltà di Economia, Università Roma Tre Archivio Statistico delle Imprese Attive (ASIA) L archivio è costituito dalle unità economiche che
DettagliESAME DI STATISTICA Nome: Cognome: Matricola:
ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli
DettagliTeoria e metodologia estimativa
Teoria e metodologia estimativa Definizioni L estimo è la parte della scienza economica definibile come l insieme dei principi logici e metodologici che regolano e, quindi, consentono la motivata, oggettiva
DettagliElementi di informatica
Elementi di informatica Sistemi di numerazione posizionali Rappresentazione dei numeri Rappresentazione dei numeri nei calcolatori rappresentazioni finalizzate ad algoritmi efficienti per le operazioni
Dettagli