STATISTICA SOCIALE

Anno accademico 2018/2019 - 1° anno

Obiettivi formativi

Il corso ha l’obiettivo di fornire allo studente, strumenti di analisi delle fonti di dati istituzionali e non, per la costruzione di un data- base, tecniche di trasformazione dei dati, costruzione di indicatori compositi e modelli di analisi multivariata, tecniche ei piani di campionamento, test non parametrici più diffusi.Statistica descrittiva e inferenziale.


Modalità di svolgimento dell'insegnamento

Il corso affronta i principali argomenti relativi alla gestione di un’indagine statistica. Gli argomenti sono trattati seguendo il percorso logico delle fasi di un’attività di ricerca: la specificazione del problema, la raccolta dei dati, l’elaborazione, l’analisi dei dati e la valutazione dei risultati conseguiti secondo specifiche dimensioni d’analisi spazio-temporale.


Prerequisiti richiesti

Nozioni di base di statistica descrittiva e inferenziale.


Frequenza lezioni

Fortemente consigliata anche se non obbligatoria


Contenuti del corso

Il corso è suddiviso in tre moduli, con i seguenti contenuti:

Modulo 1 - Fonti e sistemi di indicatori. Strumenti per l’analisi territoriale dei dati

Le fonti delle informazioni statistiche. Modelli di rilevazione delle informazioni da fonti istituzionali. I sistemi statistici informativi. Procedure d’integrazione fra data-bases. Le trasformazioni dei dati. Classificazione tipologica di tassi, rapporti, numeri indici. La questione degli indicatori. Le tecniche di costruzione e di standardizzazione degli indicatori.

 

Modulo 2 - Piani di campionamento. Test d’ipotesi non parametrici

Piani di campionamento. Disegno di campionamento. Dimensioni campionarie. Errori di campionamento. Criteri di selezione dei campioni. Test su un campione: binomiale, χ2, Kolmogorov-Smirnov

Test su campioni a due misure dipendenti: McNemar, dei segni. Test su due campioni indipendenti: esatto di Fisher, χ2, della mediana, Wilcoxon-Mann-Whitney.

 

Modulo 3 - Modelli di analisi delle serie spazio-temporali. Cenni su strumenti di analisi multivariata.

Analisi delle serie temporali:

a. procedimento classico

b. procedimento moderno: modello di Box-Jenkins, tipologia dei processi stocastici: stazionari, invertibili, lineari, autoregressivi (AR), casuali o a media mobile (MA), modelli ARMA o ARIMA

Serie spazio-temporali. I principi e la logica dell’analisi multidimensionale e multivariata. I paradossi dell’analisi multivariata. La tipologia delle matrici.


Testi di riferimento

Per il modulo 1:

ISTAT (2011), Navigando tra le fonti demografiche e sociali, ISTAT, Roma,http://www3.istat.it/dati/catalogo/20100325_01/Navigando_tra_le_fonti_demografiche_sociali.pdf

Bonarini F. (2006), Guida alle fonti statistiche socio-demografiche, CLEUP, Padova, pp. 1-142; 231-308.

Cavaleri P. e Venturini F. (a cura di) (2004), Documenti e dati pubblici sul web. Guida all'informazione di fonte pubblica in rete, Il Mulino, Bologna.D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma (Cap. 10 e 11).

OECD (2008), Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing

 

Per il modulo 2:

G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.

L. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39.S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

 

Per il modulo 3:

Fraire M. e Rizzi A. (1998), Statistica, Carocci, Roma, pp. 445-478.

L. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77.



Programmazione del corso

 ArgomentiRiferimenti testi
1Modulo 1A: Le fonti delle informazioni statistiche. Modelli di rilevazione delle informazioni da fonti istituzionali ISTAT (2011), Navigando tra le fonti demografiche e sociali, ISTAT, Roma, http://www3.istat.it/dati/catalogo/20100325_01/Navigando_tra_le_fonti_demografiche_sociali.pdf  
2Modulo 1B: I sistemi statistici informativi. Procedure d’integrazione fra data-bases. Bonarini F. (2006), Guida alle fonti statistiche socio-demografiche, CLEUP, Padova, pp. 1-142; 231-308. Cavaleri P. e Venturini F. (a cura di) (2004), Documenti e dati pubblici sul web. Guida all'informazione di fonte pubblica in rete, Il Mulino, Bologna. 
3Modulo 1C: Le trasformazioni dei dati. Classificazione tipologica di tassi, rapporti, numeri indici. La questione degli indicatori. Le tecniche di costruzione e di standardizzazione degli indicatori.D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma (Cap. 10 e 11). OECD (2008), Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing. 
4Modulo 2A: Piani di campionamento Disegno di campionamento Dimensioni campionarie Errori di campionamento G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84. 
5Modulo 2B: Criteri di selezione dei campioniL. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39. 
6Modulo 2C: Test su un campione: binomiale, χ2, Kolmogorov-Smirnov Test su campioni a due misure dipendenti: McNemar, dei segni Test su due campioni indipendenti: esatto di Fisher, χ2, della mediana, Wilcoxon-Mann-WhitneyS. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191. 
7Modulo 3A: Analisi delle serie temporali: a. procedimento classico b. procedimento moderno: modello di Box-Jenkins tipologia dei processi stocastici: stazionari, invertibili, lineari, autoregressivi (AR), casuali o a media mobile (MA), modelli ARMA o ARIMA Serie spazio-temporaliFraire M. e Rizzi A. (1998), Statistica, Carocci, Roma, pp. 445-478. 
8Modulo 3B: I principi e la logica dell’analisi multidimensionale e multivariata I paradossi dell’analisi multivariata La tipologia delle matrici L. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77. 

VERIFICA DELL'APPRENDIMENTO

Modalità di verifica dell'apprendimento

L'esame sarà scritto. Per i frequentanti sono previste tre prove intermedie. Le date verranno concordate di volta in volta con gli studenti per venire incontro alle esigenze degli stessi. Si provvederà, tuttavia, a darne informazione tramite avviso con notevole anticipo. Per svolgere la verifica di apprendimento del modulo successivo è necessario aver superato la verifica di apprendimento del modulo precedente. La prova consisterà nella risoluzione di due esercizi e la risposta a tre domande inerenti al modulo in oggetto. Sarà possibile portare con se: calcolatrice e tavole di distribuzione di probabilità.

Per chi decidesse di sostenere l'esame per intero, la prova si svolgerà negli appelli ufficiali, consisterà nella risoluzione di due esercizi e la risposta a cinque domande in 90 minuti. Sarà possibile portare con se: calcolatrice e tavole di distribuzione di probabilità.


Esempi di domande e/o esercizi frequenti

1) Le fonti delle informazioni statistiche.

2) Campionamento probabilistico e non probabilistico

3) I processi stocastici stazionari

Esercizio 1

Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.

 

Prov

Attraz

InsSoc

InsOcc

Torino

40,6

37,3

39,4

Milano

65

46,2

55,8

Trento

46,1

62,2

37,1

Vicenza

57,3

64,7

51,8

Treviso

58,4

58,3

47,6

 

 

 

 

 

 

 

 

 

 

Esercizio 2

Un ricercatore vuole verificare se la scelta di frequentare un determinato Corso di Laurea è condizionata dal genere. Estratti casualmente 15 soggetti, frequentanti il corso, rileva che 3 sono maschi e 12 sono femmine. Verificare ad un livello di significatività α = 0.05 che il genere non influenza la scelta.