DATA MINING, STATISTICA SOCIALE ED INFORMATIZZAZIONE DEI DATI
Modulo FONTI, SISTEMI DI INDICATORI E PIANI DI CAMPIONAMENTO

Anno accademico 2025/2026 - Docente: ROSARIO GIUSEPPE D'AGATA

Risultati di apprendimento attesi

Il corso mira a fornire gli strumenti metodologici necessari per poter trarre informazioni operative da un insieme di dati. Un’attenzione particolare sarà rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento critico sulle fonti e sulla creazione di indicatori con particolare riferimento a quelli utilizzati nell’ambito dei servizi sociali. Un’importanza particolare, inoltre, sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi, ecc. (questionario). Infine, il corso fornirà gli strumenti base per condurre un'analisi delle reti sociali

Modalità di svolgimento dell'insegnamento

La frequenza non è obbligatoria ma fortemente consigliata. 

 

Prerequisiti richiesti

Lo studente deve essere in possesso delle nozioni fondamentali di matematica come da programma di qualsiasi istituto superiore di secondo grado e delle nozioni basilari di statistica descrittiva ed inferenziale.

Frequenza lezioni

Per i frequentanti è prevista una prova intermedia alla fine di ciascun modulo; per un totale di 3 prove intermedie.  Per i frequentanti, inoltre, sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database

Contenuti del corso

Il primo modulo si concentrerà sulla progettazione di un'indagine statistica a partire dall'analisi delle fonti statistiche ufficiali, nazionali ed internazionali. In questa fase un'attenzione particolare sarà rivolta alle strategie di campionamento e alla costruzione del questionario compresi alcuni cenni sulle tecniche di scaling. Il secondo modulo prevede un approfondimento del concetto di indicatore, nello specifico si tratteranno gli argomenti legati alla costruzione di un indicatore composito. 

Testi di riferimento

D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni, Carocci, Roma.  

Programmazione del corso

 ArgomentiRiferimenti testi
1Analisi delle fonti, piani di campionamento e costruzione di un data baseD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 19 a pag. 123) 
2La stesura di un questionario ed il ruolo degli indicatori nella ricerca sociale. D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 125 a pag. 240 e da da pag. 373 a pag. 423) 
3Analisi delle reti sociali. Analisi testuale e test non parametriciD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 529 a pag. 567) 

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Per i frequentanti sono previste 2 prove intermedie, ciascuna a fine di ogni modulo trattato. Per poter sostenere la successiva prova bisogna aver superato la precedente. La prima verifica consiste nella presentazione di un progetto di indagine che contempli tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda verifica si svolgerà in laboratorio multimediale e prevederà l’esclusivo utilizzo di excel o R.

 

 

Per i non frequentanti

L’esame sarà interamente scritto, consterà di 3 esercizi e 8 quesiti a risposta aperta che coprono l’intero programma. Lo studente avrà a disposizione 100 minuti per svolgere il compito.

Modalità di valutazione

Non idoneo
Conoscenza e comprensione argomento: Lo studente non ha compreso l'argomento neanche in termini generali
Capacità di analisi e sintesi: del tutto assenti
Utilizzo di referenze: per nulla appropriato
Conoscenza e comprensione argomento: Lo studente ha compreso l'argomento solo in termini generali e vaghi. Notevoli lacune e rilevanti errori 
Capacità di analisi e sintesi: appena sufficienti
Utilizzo di referenze: assente o minimamente appropriato
21-23
Conoscenza e comprensione argomento: Conoscenza in termini generali con lacune ma senza rilevanti imprecisioni
Capacità di analisi e sintesi: sufficienti
Utilizzo di referenze: sufficienti ma non adeguatamente approfondite
24-26
Conoscenza e comprensione argomento: Conoscenza più specifica anche se con qualche imprecisione
Capacità di analisi e sintesi: buone. Gli argomenti sono espressi coerentemente con, seppur limitata, capacità critica
Utilizzo di referenze: poco oltre le referenze standard
27-29
Conoscenza e comprensione argomento: Conoscenza più che buona e senza imprecisioni
Capacità di analisi e sintesi: Ha notevoli capacità di analisi e di sintesi 
Utilizzo di referenze: Ha approfondito gli argomenti e riesce a proporre esempi che vanno oltre il testo della prova
 
30-30L
Conoscenza e comprensione argomento: Conoscenza ottima
Capacità di analisi e sintesi: ottima capacità di analisi e di sintesi. Notevole capacità critica 
Utilizzo di referenze: Importanti approfondimenti."


Esempi di domande e/o esercizi frequenti

Quesiti

 

1) La qualità dei dati

2) I rapporti statistici

3) Campionamento casuale  a Grappoli

4) Le fasi di un test non parametrico

5) La scala di Guttman

6) Il metodo CAPI

7) Dal concetto all'indicatore

8) Il ruolo di ISTAT