STATISTICA MULTIVARIATA E RICERCA VALUTATIVAModulo TECNICHE, MODELLI E PROCEDURE DI CALCOLO PER L'ANALISI STATISTICA DEI DATI
Anno accademico 2022/2023 - Docente: Venera TOMASELLIRisultati di apprendimento attesi
Modalità di svolgimento dell'insegnamento
Lezioni frontali. Applicazione dei contenuti appresi alla risoluzione di problemi empirici. Discussione dei risultati.
Seminari di approfondimento su temi specifici previsti in programma al punto 3.
Attività di ricerca: consultazione bibliografica e raccolta dati.
Laboratori di analisi dei dati con addestramento sui packages di calcolo statistico.
Presentazioni di papers sui temi analizzati.
Prerequisiti richiesti
Conoscenze di logica e statistica metodologica di base
Frequenza lezioni
Fortemente consigliata e necessaria per le applicazioni empiriche e di laboratorio di calcolo proposte a lezione e per poter accedere alle prove d'esame.
Contenuti del corso
1. Analisi fattoriale - Analisi di clustering - Tecniche di Matching per l'analisi del rischio.
2. Modelli di regressione multipla - Modelli log-lineari • Modelli di regressione non lineare e logistica - Modelli multilevel • Modelli di equazioni strutturali.
3. Argomenti di approfondimento: Seminario di addestramento sul programma R Studio - programmazione R Studio per le scienze sociali - funzioni statistiche con R Studio - scraping.
Testi di riferimento
1. Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 1-144; 175-208.
per le tecniche di Matching: - https://openknowledge.worldbank.org/bitstream/handle/10986/25030/9781464807794.pdf?sequence=2&isAllowed=y
- https://www.amazon.it/Effect-Introduction-Research-Design-Causality/dp/1032125780
per le applicazioni dei software:
Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 1-56; 335-440
Manuali digitali dei software utilizzati.
in italiano da consultare eventualmente:
Gallucci M., Leone L., Berlingeri M. (2017), Modelli statistici per le scienze sociali, Pearson, Milano, pp. 323-406 (analisi fattoriale).
Fabbris L. (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77; 301-351 (analisi dei gruppi).
2. Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 145-174; 289-362.
per le applicazioni dei software:
Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 57-272; 441-570.
Manuali digitali dei software utilizzati.
in italiano da consultare eventualmente:
Bohrnstedt G. W. and Knoke D. (1998), Statistica per le scienze sociali, Il Mulino, Bologna, pp. 207-375 (modelli di regressione non lineare e logistica).
Gallucci M., Leone L., Berlingeri M. (2017), Modelli statistici per le scienze sociali, Pearson, Milano, pp. 41-98 (modelli di regressione multipla).
3. Argomenti di approfondimento: James Lang & Paul Teetor, R Cookbook, 2nd Edition (https://www.tidytextmining.com/)
Materiali extra per approfondimento: http://www.sthda.com/english/ https://app.rawgraphs.io/
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | 1. Analisi dei gruppi - Matching per l'analisi del rischio - Analisi fattoriali.Lezioni frontali, raccolta dati da fonti ufficiali, esercitazioni su fogli di calcolo e risoluzione di problemi applicativi | Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. pp. 1-144; 175. |
2 | 1a. Utilizzo dei software di elaborazione dati | Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 1-56; 335-440 |
3 | 2. Modelli di regressione multipla • Modelli di regressione non lineare e logistica - • Modelli di equazioni strutturali • Modelli multilevel | Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 145-174; 289-362. |
4 | 2a. Utilizzo dei software di elaborazione dati | Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 57-272; 441-570. |
5 | 3. Seminario di addestramento sul programma R Studio - Tecniche di scraping e | James Lang & Paul Teetor, R Cookbook, 2nd Edition (https://rc2e.com/) Julia SIlge & David Robinson, Text Mining with R: a Tidy Approach (https://www.tidytextmining.com/). |
6 | 3a. Materiali extra per approfondimento su R Studio: | https://sicss.io/boot_camp; https://www.sthda.com/english/; https://www.r-graph-gallery.com/index.html https://app.rawgraphs.io/; https://corplingstats.wordpress.com/. |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
Saranno richieste documentate elaborazioni dei dati mediante software, formulazione di progetti e presentazioni su argomenti a scelta.
La prova scritta è obbligatoria e prevede domande a risposta aperta ed interpretazione di output di elaborazione dati mediante programmi di calcolo.
La prova si intende superata se lo studente ottiene alla prova scritta una votazione complessiva non inferiore a 18/30.
Al fine di ottenere una votazione complessiva eventualmente superiore a 26/30 è necessario sostenere la prova orale.
Esempi di domande e/o esercizi frequenti
Argomenti indicati nella programmazione