Statistica per big data economico/aziendali
A.A. 2025/2026
Learning objectives
Il corso si propone di introdurre ed illustrare specifiche metodologie statistiche, informatiche e di machine learning per l'analisi dei Big Data nelle applicazioni economiche, aziendali e finanziarie. Tutto il corso verterà principalmente sul linguaggio di programmazione Python che di gran lunga è il più usato nelle applicazioni Big Data, ma si dedicheranno alcune parti al linguaggio R e ad altri linguaggi più classici come Java. Sul lato statistico si proporranno temi di statistical learning supervisionato e non supervisionato con qualche accenno alla statistica bayesiana.
Expected learning outcomes
Al termine del corso, lo studente avrà acquisito adeguate competenze statistiche e di programmazione che gli consentiranno di padroneggiare gli strumenti necessari per l'analisi dei Big Data e l'estrapolazione delle informazioni di interesse in ambito economico, aziendale e finanziario.
Periodo: Terzo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Course syllabus and organization
Edizione unica
Responsabile
Periodo
Terzo trimestre
Programma
Gli argomenti del corso sono:
- algebra matriciale, matrici dei dati e statistiche descrittive
- Cluster analysis (metodi gerarchici e non gerarchici) con interpretazione in R
- Analisi delle componenti principali con interpretazione in R
- Alberi decisionali (CART) con interpretazione in R
- Bootstrap con interpretazione in R
- Random forest con interpretazione in R
- algebra matriciale, matrici dei dati e statistiche descrittive
- Cluster analysis (metodi gerarchici e non gerarchici) con interpretazione in R
- Analisi delle componenti principali con interpretazione in R
- Alberi decisionali (CART) con interpretazione in R
- Bootstrap con interpretazione in R
- Random forest con interpretazione in R
Prerequisiti
Al fine di affrontare adeguatamente i contenuti proposti nel corso, gli studenti dovranno aver maturato adeguate competenze in ambito statistico e matematico.
Metodi didattici
Il corso sarà organizzato attraverso lezioni teoriche e lezioni pratiche dove interpretare output in R
Materiale di riferimento
- Slides a disposizione sul sito del corso;
- Witten et al. (2020). Introduzione all'apprendimento statistico, Piccin (https://www.piccin.it/it/statistica
introduzione-all-apprendimento-statistico-con-applicazioni-in-r-9788829930944.html).
- Crawley (2012) The R book, Wiley.
- Parte informatica (Python): Bowles (2015). Machine Learning in Python, Wiley.
- Parte informatica (Cloud computing): Barrie Sosinsky (2010): Cloud Computing Bible,
Wiley.
- Parte informatica (Database relazionali): Atzeni et al. (2018).Basi di dati. McGraw-
Hill
- Witten et al. (2020). Introduzione all'apprendimento statistico, Piccin (https://www.piccin.it/it/statistica
introduzione-all-apprendimento-statistico-con-applicazioni-in-r-9788829930944.html).
- Crawley (2012) The R book, Wiley.
- Parte informatica (Python): Bowles (2015). Machine Learning in Python, Wiley.
- Parte informatica (Cloud computing): Barrie Sosinsky (2010): Cloud Computing Bible,
Wiley.
- Parte informatica (Database relazionali): Atzeni et al. (2018).Basi di dati. McGraw-
Hill
Modalità di verifica dell’apprendimento e criteri di valutazione
Tre Homeworks facoltativi.
Esame scritto con domande aperte e domande a risposta multipla sulla teoria, su R e su Python
Esame scritto con domande aperte e domande a risposta multipla sulla teoria, su R e su Python
Professor(s)
Ricevimento:
Ogni Mercoledì 10-12
DEMM, stanza 31, 3° p (Previa Appuntamento inviando una mail)