ANALISI DEI DATI

Anno accademico 2025/2026 - Docente: ROSARIO GIUSEPPE D'AGATA

Risultati di apprendimento attesi

Il corso mira a fornire gli strumenti metodologici necessari per poter trarre informazioni operative da un insieme di dati. Un’attenzione particolare sarà rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento critico sulle fonti e sulla creazione di indicatori con particolare riferimento a quelli utilizzati nell’ambito della P.A. Un’importanza particolare, inoltre, sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi, ecc. (questionario). Infine, il corso fornirà gli strumenti base per condurre un'analisi delle reti sociali ed un'analisi testuale 

Modalità di svolgimento dell'insegnamento

La frequenza non è obbligatoria ma fortemente consigliata. 

 

Prerequisiti richiesti

Lo studente deve essere in possesso delle nozioni fondamentali di matematica come da programma di qualsiasi istituto superiore di secondo grado e delle nozioni basilari di statistica descrittiva ed inferenziale.

Frequenza lezioni

Per i frequentanti è prevista una prova intermedia alla fine di ciascun modulo; per un totale di 3 prove intermedie.  Per i frequentanti, inoltre, sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database

Contenuti del corso

Il primo modulo si concentrerà sulla progettazione di un'indagine statistica a partire dall'analisi delle fonti statistiche ufficiali, nazionali ed internazionali. In questa fase un'attenzione particolare sarà rivolta alle strategie di campionamento e alla costruzione del questionario compresi alcuni cenni sulle tecniche di scaling. Il secondo modulo prevede un approfondimento del concetto di indicatore, nello specifico si tratteranno gli argomenti legati alla costruzione di un indicatore composito. Il terzo modulo prevede lo studio dei test non parametrici più utilizzati in ambito sociale ed alcuni cenni di analisi multivariata

Testi di riferimento

D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni, Carocci, Roma.  

Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Programmazione del corso

 ArgomentiRiferimenti testi
1Analisi delle fonti, piani di campionamento e costruzione di un data baseD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 19 a pag. 123) 
2La stesura di un questionario ed il ruolo degli indicatori nella ricerca sociale. D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 125 a pag. 240 e da da pag. 373 a pag. 423) 
3Analisi delle reti sociali. Analisi testuale e test non parametriciD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 481 a pag. 567) Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Per i frequentanti sono previste tre prove intermedie, ciascuna a fine di ogni modulo trattato. Per poter sostenere la successiva prova bisogna aver superato la precedente. La prima verifica consiste nella presentazione di un progetto di indagine che contempli tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda verifica si svolgerà in laboratorio multimediale e prevederà l’esclusivo utilizzo di excel o R. In merito alla terza verifica, lo studente concorderà col docente una tecnica di analisi affrontata durante il corso e consegnerà un paper che verrà discusso in aula

 

 

Per i non frequentanti

L’esame sarà interamente scritto, consterà di 4 esercizi e 8 quesiti a risposta aperta che coprono l’intero programma. Lo studente avrà a disposizione 100 minuti per svolgere il compito.

Modalità di valutazione

Non idoneo
Conoscenza e comprensione argomento: Lo studente non ha compreso l'argomento neanche in termini generali
Capacità di analisi e sintesi: del tutto assenti
Utilizzo di referenze: per nulla appropriato
Conoscenza e comprensione argomento: Lo studente ha compreso l'argomento solo in termini generali e vaghi. Notevoli lacune e rilevanti errori 
Capacità di analisi e sintesi: appena sufficienti
Utilizzo di referenze: assente o minimamente appropriato
21-23
Conoscenza e comprensione argomento: Conoscenza in termini generali con lacune ma senza rilevanti imprecisioni
Capacità di analisi e sintesi: sufficienti
Utilizzo di referenze: sufficienti ma non adeguatamente approfondite
24-26
Conoscenza e comprensione argomento: Conoscenza più specifica anche se con qualche imprecisione
Capacità di analisi e sintesi: buone. Gli argomenti sono espressi coerentemente con, seppur limitata, capacità critica
Utilizzo di referenze: poco oltre le referenze standard
27-29
Conoscenza e comprensione argomento: Conoscenza più che buona e senza imprecisioni
Capacità di analisi e sintesi: Ha notevoli capacità di analisi e di sintesi 
Utilizzo di referenze: Ha approfondito gli argomenti e riesce a proporre esempi che vanno oltre il testo della prova
 
30-30L
Conoscenza e comprensione argomento: Conoscenza ottima
Capacità di analisi e sintesi: ottima capacità di analisi e di sintesi. Notevole capacità critica 
Utilizzo di referenze: Importanti approfondimenti."


Esempi di domande e/o esercizi frequenti

Quesiti

 

1) La qualità dei dati

2) I rapporti statistici

3) Campionamento casuale  a Grappoli

4) Le fasi di un test non parametrico

5) La scala di Guttman

6) Il metodo CAPI

7) Dal concetto all'indicatore

8) Il ruolo di ISTAT


 

Esercizio 1

Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.

 

Prov

Attraz

InsSoc

InsOcc

Torino

40,6

37,3

39,4

Milano

65

46,2

55,8

Trento

46,1

62,2

37,1

Vicenza

57,3

64,7

51,8

Treviso

58,4

58,3

47,6

 

 

 

 

 

Esercizio 2

Sia data la seguente distribuzione di pesi rilevati su 51 studenti. Verificare l’ipotesi che la distribuzione dalla quale è estratto il campione sia  normale. (α=0.05)

Kg

40- 45

46-50

51-55

56-60

Totale

ni

7

12

17

15

51

 

 Esercizio 3

 

La tabella nostra l’esito di un’indagine condotta su 116 studenti in merito alla valutazione del corso di Laurea L16. Ad un livello di significatività α=0.05 è possibile stabilire che nella popolazione di riferimento vi sia un giudizio sostanzialmente positivo?

negativo

abbastanza negativo

abbastanza positivo

positivo

Totale

1

6

64

45

116