DATA MINING, STATISTICA SOCIALE ED INFORMATIZZAZIONE DEI DATI
Modulo FONTI, SISTEMI DI INDICATORI E PIANI DI CAMPIONAMENTO
Anno accademico 2025/2026 - Docente:
ROSARIO GIUSEPPE D'AGATA
Risultati di apprendimento attesi
Il
corso mira a fornire gli strumenti metodologici necessari per poter trarre
informazioni operative da un insieme di dati. Un’attenzione particolare sarà
rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento
critico sulle fonti e sulla creazione di indicatori con particolare riferimento
a quelli utilizzati nell’ambito dei servizi sociali. Un’importanza particolare, inoltre,
sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta
delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi,
ecc. (questionario). Infine, il corso fornirà gli strumenti base per condurre un'analisi delle reti sociali
Modalità di svolgimento dell'insegnamento
La frequenza non
è obbligatoria ma fortemente consigliata.
Prerequisiti richiesti
Lo studente deve essere in possesso delle nozioni
fondamentali di matematica come da programma di qualsiasi istituto superiore di
secondo grado e delle nozioni basilari di statistica descrittiva ed
inferenziale.
Frequenza lezioni
Per i frequentanti è prevista una prova intermedia alla fine di ciascun modulo; per un totale di 3 prove intermedie. Per i frequentanti, inoltre, sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database
Contenuti del corso
Il
primo modulo si concentrerà sulla progettazione di un'indagine statistica a
partire dall'analisi delle fonti statistiche ufficiali, nazionali ed
internazionali. In questa fase un'attenzione particolare sarà rivolta alle
strategie di campionamento e alla costruzione del questionario compresi alcuni
cenni sulle tecniche di scaling.
Il
secondo modulo prevede un approfondimento del concetto di indicatore, nello
specifico si tratteranno gli argomenti legati alla costruzione di un indicatore
composito.
Testi di riferimento
D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni, Carocci, Roma.
Programmazione del corso
| | Argomenti | Riferimenti testi |
| 1 | Analisi delle fonti, piani di campionamento e costruzione di un data base | D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma. (da pag. 19 a pag. 123) |
| 2 | La stesura di un questionario ed il ruolo degli indicatori nella ricerca sociale. | D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma. (da pag. 125 a pag. 240 e da da pag. 373 a pag. 423) |
| 3 | Analisi delle reti sociali. Analisi testuale e test non parametrici | D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma. (da pag. 529 a pag. 567) |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
Per i frequentanti sono
previste 2 prove intermedie, ciascuna a fine di ogni modulo trattato. Per
poter sostenere la successiva prova bisogna aver superato la precedente. La prima
verifica consiste nella presentazione di un progetto di indagine che contempli
tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda
verifica si svolgerà in laboratorio multimediale e prevederà l’esclusivo
utilizzo di excel o R.
Per i non frequentanti
L’esame sarà interamente
scritto, consterà di 3 esercizi e 8 quesiti a risposta aperta che coprono l’intero programma. Lo studente
avrà a disposizione 100 minuti per svolgere il compito.
Modalità di valutazione
L'attribuzione del punteggio segue il seguente schema:
Non idoneo
Conoscenza e comprensione argomento: Lo studente non ha compreso l'argomento neanche in termini generali
Capacità di analisi e sintesi: del tutto assenti
Utilizzo di referenze: per nulla appropriato
18-20
Conoscenza e comprensione argomento: Lo studente ha compreso l'argomento solo in termini generali e vaghi. Notevoli lacune e rilevanti errori
Capacità di analisi e sintesi: appena sufficienti
Utilizzo di referenze: assente o minimamente appropriato
21-23
Conoscenza e comprensione argomento: Conoscenza in termini generali con lacune ma senza rilevanti imprecisioni
Capacità di analisi e sintesi: sufficienti
Utilizzo di referenze: sufficienti ma non adeguatamente approfondite
24-26
Conoscenza e comprensione argomento: Conoscenza più specifica anche se con qualche imprecisione
Capacità di analisi e sintesi: buone. Gli argomenti sono espressi coerentemente con, seppur limitata, capacità critica
Utilizzo di referenze: poco oltre le referenze standard
27-29
Conoscenza e comprensione argomento: Conoscenza più che buona e senza imprecisioni
Capacità di analisi e sintesi: Ha notevoli capacità di analisi e di sintesi
Utilizzo di referenze: Ha approfondito gli argomenti e riesce a proporre esempi che vanno oltre il testo della prova
30-30L
Conoscenza e comprensione argomento: Conoscenza ottima
Capacità di analisi e sintesi: ottima capacità di analisi e di sintesi. Notevole capacità critica
Utilizzo di referenze: Importanti approfondimenti."
Esempi di domande e/o esercizi frequenti
Quesiti
1) La qualità dei dati
2) I rapporti
statistici
3) Campionamento
casuale a Grappoli
4) Le fasi di un
test non parametrico
5) La scala di Guttman
6) Il metodo CAPI
7) Dal concetto all'indicatore
8) Il ruolo di ISTAT