DATA MINING, STATISTICA SOCIALE ED INFORMATIZZAZIONE DEI DATI
Modulo FONTI, SISTEMI DI INDICATORI E PIANI DI CAMPIONAMENTO

Anno accademico 2022/2023 - Docente: ROSARIO GIUSEPPE D'AGATA

Risultati di apprendimento attesi

Il corso mira a fornire gli strumenti metodologici necessari per poter trarre informazioni operative da un insieme di dati. Un’attenzione particolare sarà rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento critico sulle fonti e sulla creazione di indicatori con particolare riferimento all’analisi del territorio in un’ottica di costruzione di un Piano di Zona. Un’importanza particolare, inoltre, sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi, ecc. (questionario). Alla fine del corso, lo studente sarà in grado, inoltre, di utilizzare i principali test non parametrici utili per la ricerca in ambito sociale.

Modalità di svolgimento dell'insegnamento

La frequenza non è obbligatoria ma fortemente consigliata

Prerequisiti richiesti

Lo studente deve essere in possesso delle nozioni fondamentali di matematica come da programma di qualsiasi istituto superiore di secondo grado e delle nozioni basilari di statistica descrittiva ed inferenziale

Frequenza lezioni

Per i frequentanti sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database 

Contenuti del corso

Il primo modulo si concentrerà sulla progettazione di un'indagine statistica a partire dall'analisi delle fonti statistiche ufficiali, nazionali ed internazionali. In questa fase un'attenzione particolare sarà rivolta alle strategie di campionamento e alla costruzione del questionario compresi alcuni cenni sulle tecniche di scaling.

Il secondo modulo prevede un approfondimento del concetto di indicatore, nello specifico si tratteranno gli argomenti legati alla costruzione di un indicatore composito. La seconda parte del modulo prevede, infine, si concentrerà sui test non parametrici più utilizzati in ambito sociale

Testi di riferimento

Modulo 1

D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte prima (da pag. 23 a pag. 190)

G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.

Modulo 2

D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte seconda (da pag. 283 a pag. 314)
Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing.

S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-19

Programmazione del corso

 ArgomentiRiferimenti testi
1L'indagine statistica in ambito socialeD. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte prima (da pag. 23 a pag. 190)G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.
2La costruzione di un indicatore composito e i test non parametriciD. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte seconda (da pag. 283 a pag. 314)Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing.S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Per i frequentanti sono previste 2 prove intermedie, ciascuna a fine di ogni modulo trattato. Per poter sostenere la successiva prova bisogna aver superato la precedente. La prima verifica consiste nella presentazione di un progetto di indagine che contempli tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda verifica si svolgerà in laboratorio multimediale e prevedrà l’esclusivo utilizzo di Excel.

 

 

Per i non frequentanti

L’esame sarà interamente scritto, consterà di 3 esercizi e 6 quesiti a risposta aperta che coprono l’intero programma. Lo studente avrà a disposizione 100 minuti per svolgere il compito.

Esempi di domande e/o esercizi frequenti

 

Esercizio 1

Il risultato ottenuto rilevando il reddito al primo impiego negli ultimi 7 anni dei laureati di una prestigiosa università romana è il seguente:

 

Anno

2002

2003

2004

2005

2006

2007

2008

Reddito

780

640

610

570

640

620

610

 

Avvalendosi degli strumenti statistici appresi, analizzare e commentare l’evoluzione del fenomeno considerato

 

Esercizio 2

La tabella 1 riporta la distribuzione della Popolazione residente al 1° Gennaio 2019 per età e sesso del Comune di Aci Bonaccorsi. Alla luce degli strumenti statistici appresi descrivere in linea generale la realtà demografica del territorio osservato

 

Esercizio 3

Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.

 

Prov

Attraz

InsSoc

InsOcc

Torino

40,6

37,3

39,4

Milano

65

46,2

55,8

Trento

46,1

62,2

37,1

Vicenza

57,3

64,7

51,8

Treviso

58,4

58,3

47,6

 

 

 

 

 

Quesiti

1) Le fonti delle informazioni statistiche.

2) Le indagini multiscopo

3) Il campionamento probabilistico e non probabilistico

4) Il ruolo degli indicatori nella ricerca sociale

5) Riflessioni sull’opportunità di sintetizzare più indicatori semplici

6) La Social Network Analysis

Tabella 1 - Popolazione residente al 1° Gennaio 2019 per età, sesso. Comune: Aci Bonaccorsi

Età

Maschi

Femmine

Totale

Età

Maschi

Femmine

Totale

Età

Maschi

Femmine

Totale

0

13

16

29

34

21

22

43

68

22

25

47

1

22

10

32

35

27

21

48

69

24

22

46

2

11

17

28

36

22

22

44

70

14

22

36

3

22

17

39

37

21

30

51

71

12

16

28

4

16

24

40

38

19

27

46

72

18

12

30

5

17

23

40

39

22

22

44

73

7

17

24

6

18

16

34

40

23

44

67

74

14

14

28

7

17

17

34

41

27

18

45

75

11

15

26

8

15

27

42

42

26

41

67

76

14

9

23

9

12

29

41

43

22

30

52

77

11

24

35

10

18

17

35

44

27

26

53

78

9

12

21

11

16

27

43

45

29

25

54

79

12

17

29

12

17

20

37

46

29

25

54

80

9

19

28

13

34

11

45

47

30

29

59

81

8

10

18

14

28

14

42

48

28

26

54

82

6

5

11

15

12

19

31

49

24

32

56

83

5

8

13

16

13

16

29

50

22

33

55

84

6

9

15

17

16

17

33

51

37

26

63

85

4

8

12

18

16

22

38

52

24

31

55

86

6

9

15

19

26

17

43

53

36

32

68

87

8

8

16

20

25

22

47

54

34

33

67

88

5

9

14

21

15

15

30

55

26

27

53

89

2

7

9

22

17

25

42

56

22

26

48

90

3

5

8

23

12

10

22

57

21

33

54

91

0

4

4

24

18

29

47

58

22

21

43

92

1

5

6

25

19

24

43

59

25

28

53

93

0

3

3

26

18

16

34

60

19

18

37

94

0

2

2

27

17

16

33

61

28

20

48

95

1

1

2

28

23

23

46

62

16

14

30

96

0

1

1

29

21

16

37

63

19

18

37

97

0

1

1

30

28

25

53

64

15

22

37

98

0

3

3

31

19

19

38

65

18

21

39

99

0

0

0

32

31

26

57

66

14

23

37

100 e +

0

0

0

33

22

16

38

67

13

18

31

TOTALE

1684

1864

3548

ENGLISH VERSION