TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI

Anno accademico 2015/2016 - 2° anno

Obiettivi formativi

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
    Gli obiettivi del modulo sono condurre lo studente:
    -alla conoscenza del linguaggio R e ad auto-apprendere le sue potenzialità mediante l’uso delle risorse disponibili in internet.
    -alla conoscenza di alcuni argomenti di statistica monovariata e multivariata mediante applicazioni con il linguaggio R.
  • INTRODUZIONE AL DATA MINING
    Dare una panoramica delle tecniche di gestione di basi di dati e delle nozioni di data e text mining per derivare, in maniera automatica, pattern di interesse. Negli ultimi anni queste tecniche si sono via via consolidate per l’aumento imponente della quantità di dati digitali raccolti in seguito al tracciamento elettronico delle attività che svolgiamo abitualmente: acquisti online, attività sui social media, accesso a online news, etc. Analisi accurate di questi dati permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati sociali.

Prerequisiti richiesti

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    nessuno


Frequenza lezioni

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Fortemente consigliata


Contenuti del corso

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Il corso prevede la trattazione di:

    - vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti in R;

    -operazioni di lettura e scrittura su file esterni in R;

    -rappresentazioni grafiche dei dati in R;

    -programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi -statistica univariata e bivariata con R.

    -correlazione e regressione lineare con R.

    -analisi delle componenti principali con R.

    -cluster analysis con R.

  • INTRODUZIONE AL DATA MINING


    Lo studente imparerà alcune delle tecniche
    di Data Mining orientate all’estrazione
    di informazione rilevante a partire da grandi masse di dati strutturati.
    Particolare attenzione verrà posta alle tecniche di classificazione di dati
    tramite alberi binari e agli algoritmi associativi basati su regole. Si intende dare una panoramica delle
    tecniche informatiche e degli algoritmi di analisi di basi di dati di grandi
    dimensioni al fine di scoprire correlazioni esistenti tra i dati. Negli ultimi
    anni queste tecniche si sono via via consolidate per l’aumento imponente della
    quantità di dati raccolti in seguito al tracciamento elettronico delle attività
    che svolgiamo abitualmente: acquisti al supermercato, attività sui social media
    (quali Facebook), accesso a news su Internet, emails, solo per fare qualche
    esempio, generano flussi enormi di dati. Analisi accurate di questi dati
    permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati
    sociali. Si studieranno sia tecniche di analisi di dati strutturati (Data
    Mining Algorithms) che dati non strutturati (Text Mining algorithms).


Testi di riferimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Testi adottati:

    1. Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo
    2. Michael J. Crawley - The R Book, 2nd Edition. Casa Edistrice Wiley


    Letture consigliate:

    1. Brian Everitt, Torsten Hothorn - An Introduction to Applied Multivariate Analysis with R. Springer. 2011
    2. Yanchang Zhao, Yonghua Cen - Data Mining Applications With R. Academic Press. 2013
    3. Espa G., Micciolo R. - Problemi ed esperimenti di statistica con R. Apogeo, 2008.
    4. Iacus S., Masarotto G. - Laboratorio di statistica con R. McGraw Hill Companies, 2007.
    5. Paganoni A., Ieva F., Vitelli V. - Laboratorio di statistica con R. Eserciziario. Pearson, 2012.
    6. Matloff N. - The Art of R Programming. No Starch Press, 2011.
    7. Torgo L. - Data Mining with R. Learning with Case Studies. Chapman & Hall/CRC, 2011.
  • INTRODUZIONE AL DATA MINING
    Materiale fornito dal docente

Programmazione del corso

TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
 ArgomentiRiferimenti testi
1sintassi di base del linguaggio R: vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti;Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
2operazioni di lettura e scrittura su file esterniFranco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
3rappresentazioni grafiche dei datiFranco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
4programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next)Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 

VERIFICA DELL'APPRENDIMENTO

Modalità di verifica dell'apprendimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    prova pratica al computer