STATISTICA MULTIVARIATA E RICERCA VALUTATIVA
Modulo TECNICHE, MODELLI E PROCEDURE DI CALCOLO PER L'ANALISI STATISTICA DEI DATI

Anno accademico 2022/2023 - Docente: Venera TOMASELLI

Risultati di apprendimento attesi

Acquisizione di conoscenze e sviluppo di competenze per l'analisi multivariata dei dati

Modalità di svolgimento dell'insegnamento

Lezioni frontali. Applicazione dei contenuti appresi alla risoluzione di problemi empirici. Discussione dei risultati.
Seminari di approfondimento su temi specifici previsti in programma al punto 3.
Attività di ricerca: consultazione bibliografica e raccolta dati.
Laboratori di analisi dei dati con addestramento sui packages di calcolo statistico.
Presentazioni di papers sui temi analizzati.

Prerequisiti richiesti

Conoscenze di logica e statistica metodologica di base

Frequenza lezioni

Fortemente consigliata e necessaria per le applicazioni empiriche e di laboratorio di calcolo proposte a lezione e per poter accedere alle prove d'esame.

Contenuti del corso

1. Analisi fattoriale - Analisi di clustering - Tecniche di Matching per l'analisi del rischio.
2. Modelli di regressione multipla - Modelli log-lineari • Modelli di regressione non lineare e logistica - Modelli multilevel • Modelli di equazioni strutturali. 
3. Argomenti di approfondimento: Seminario di addestramento sul programma R Studio - programmazione R Studio per le scienze sociali - funzioni statistiche con R Studio - scraping.

Testi di riferimento

1. Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 1-144; 175-208.
    per le tecniche di Matching: - https://openknowledge.worldbank.org/bitstream/handle/10986/25030/9781464807794.pdf?sequence=2&isAllowed=y 

                                                  -   https://www.amazon.it/Effect-Introduction-Research-Design-Causality/dp/1032125780

per le applicazioni dei software:

Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 1-56; 335-440
Manuali digitali dei software utilizzati.

in italiano da consultare eventualmente:
Gallucci M., Leone L., Berlingeri M. (2017), Modelli statistici per le scienze sociali, Pearson, Milano, pp. 323-406 (analisi fattoriale).
Fabbris L. (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77; 301-351 (analisi dei gruppi).

2. Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 145-174; 289-362.

per le applicazioni dei software:
Hahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 57-272; 441-570.
Manuali digitali dei software utilizzati.

in italiano da consultare eventualmente:
Bohrnstedt G. W. and Knoke D. (1998), Statistica per le scienze sociali, Il Mulino, Bologna, pp. 207-375 (modelli di regressione non lineare e logistica).
Gallucci M., Leone L., Berlingeri M. (2017), Modelli statistici per le scienze sociali, Pearson, Milano, pp. 41-98 (modelli di regressione multipla).

3. Argomenti di approfondimento: James Lang & Paul Teetor, R Cookbook, 2nd Edition (https://www.tidytextmining.com/)
Materiali extra per approfondimento: http://www.sthda.com/english/ https://app.rawgraphs.io/ 

Programmazione del corso

 ArgomentiRiferimenti testi
11. Analisi dei gruppi - Matching per l'analisi del rischio - Analisi fattoriali.Lezioni frontali, raccolta dati da fonti ufficiali, esercitazioni su fogli di calcolo e risoluzione di problemi applicativi Bartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. pp. 1-144; 175.
21a. Utilizzo dei software di elaborazione datiHahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 1-56; 335-440
32. Modelli di regressione multipla • Modelli di regressione non lineare e logistica - • Modelli di equazioni strutturali • Modelli multilevelBartholomew D. J., Steele F., Moustaki I., Galbraith J. I. (2008). Analysis of Multivariate Social Science Data. Boca Raton, FL: CRC Press, Taylor & Francis, pp. 145-174; 289-362.
42a. Utilizzo dei software di elaborazione datiHahs-Vaughn, D. L. (2017). Applied Multivariate Statistical Concepts. New York, NY: Routledge, pp. 57-272; 441-570.
53. Seminario di addestramento sul programma R Studio - Tecniche di scraping e James Lang & Paul Teetor, R Cookbook, 2nd Edition (https://rc2e.com/) Julia SIlge & David Robinson, Text Mining with R: a Tidy Approach (https://www.tidytextmining.com/).
63a. Materiali extra per approfondimento su R Studio: https://sicss.io/boot_camp; https://www.sthda.com/english/; https://www.r-graph-gallery.com/index.html https://app.rawgraphs.io/; https://corplingstats.wordpress.com/.

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Saranno richieste documentate elaborazioni dei dati mediante software, formulazione di progetti e presentazioni su argomenti a scelta. 

La prova scritta è obbligatoria e prevede domande a risposta aperta ed interpretazione di output di elaborazione dati mediante programmi di calcolo.
La prova si intende superata se lo studente ottiene alla prova scritta una votazione complessiva non inferiore a 18/30.
Al fine di ottenere una votazione complessiva eventualmente superiore a 26/30 è necessario sostenere la prova orale.

Esempi di domande e/o esercizi frequenti

Argomenti indicati nella programmazione

ENGLISH VERSION