TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI

Anno accademico 2017/2018 - 2° anno
Docenti Crediti: 6
SSD
  • SPS/07 - Sociologia generale
  • INF/01 - Informatica
Organizzazione didattica: 150 ore d'impegno totale, 114 di studio individuale, 36 di lezione frontale
Semestre:
ENGLISH VERSION

Prerequisiti richiesti

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Corso di statistica di base

  • INTRODUZIONE AL DATA MINING

    Conoscenze di base di informatica


Frequenza lezioni

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Praticamente obbligatoria.

  • INTRODUZIONE AL DATA MINING

    libera


Contenuti del corso

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Il corso si focalizzerà sullo studio dell’analisi monovariata, bivariata e multivariata utilizzando il linguaggio R, ossia un ambiente open source per la gestione dei dati, l’analisi statistica, la produzione di grafici e, più in generale, per l’uso di moltissimi metodi formali (Networks Analysis, Time Series Analysis, Differential Equations, Machine Learning, Multivariate Statistics, ecc.).

    Il corso prevede la trattazione di:

    1) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica;

    2) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R;

    3) operazioni di lettura e scrittura su file esterni mediante in linguaggio R;

    4) rappresentazioni grafiche dei dati mediante il linguaggio R;

    5) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e

    costrutti iterativi (if, ifelse, for, while, break, repeat, next);

    6) statistica descrittiva univariata e bivariata mediante il linguaggio R;

    7) correlazione e regressione lineare mediante il linguaggio R;

    8) analisi delle componenti principali mediante il linguaggio R;

    9) cluster analysis mediante il linguaggio R;

    10) network analysis mediante il linguaggio R;

  • INTRODUZIONE AL DATA MINING

    SI introduce il tema del dato e dell’informazione. SI passa poi alle tecniche relazionali di archiviazione e recupero del dato. Si discute dei “data base management systems” e del sistema delle transazioni che garantisce la coerenza del dato. Si introduce anche l’algebra relazionale che rappresenta la logica per il recupero dell’informazione dalle basi di dati relazionali e che rappresenta la base dei linguaggi di interrogazione SQL


Testi di riferimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Dispense del docente

  • INTRODUZIONE AL DATA MINING

    - Opzionale: Introduction to Computational Social Science, Principle and Applications. Claudio Cioffi-Revilla (In inglese)
    - Opzionale: Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Viktor Mayer-Schönberger, Kenneth N. Cukier e R. Merlini


Programmazione del corso

TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
 ArgomentiRiferimenti testi
11) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica; Dispense del cocente 
22) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R;Dispense del cocente 
33) operazioni di lettura e scrittura su file esterni mediante in linguaggio R;Dispense del cocente 
44) rappresentazioni grafiche dei dati mediante il linguaggio R;Dispense del cocente 
55) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next); Dispense del cocente 
66) statistica descrittiva univariata e bivariata mediante il linguaggio R;Dispense del cocente 
77) correlazione e regressione lineare mediante il linguaggio R;Dispense del cocente 
88) analisi delle componenti principali mediante il linguaggio R;Dispense del cocente 
99) cluster analysis mediante il linguaggio R;Dispense del cocente 
1010) network analysis mediante il linguaggio R;Dispense del cocente 

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    prova pratica al computer


Esempi di domande e/o esercizi frequenti

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Uso delle funzioni di base principali di R.
    Come si installano e si caricano i pacchetti in R.
    Come si costruisce e si opera su un vettore, una matrice, un dataframe in R.
    Come si costrisce un grafico in R.
    Come si costruisce una funzione in R.
    Come si svolge l’analisi di correlazione e regressione in R.