Statistica per big data economico/aziendali

A.A. 2025/2026
6
Crediti massimi
40
Ore totali
SSD
SECS-S/03
Lingua
Italiano
Learning objectives
Il corso si propone di introdurre ed illustrare specifiche metodologie statistiche, informatiche e di machine learning per l'analisi dei Big Data nelle applicazioni economiche, aziendali e finanziarie. Tutto il corso verterà principalmente sul linguaggio di programmazione Python che di gran lunga è il più usato nelle applicazioni Big Data, ma si dedicheranno alcune parti al linguaggio R e ad altri linguaggi più classici come Java. Sul lato statistico si proporranno temi di statistical learning supervisionato e non supervisionato con qualche accenno alla statistica bayesiana.
Expected learning outcomes
Al termine del corso, lo studente avrà acquisito adeguate competenze statistiche e di programmazione che gli consentiranno di padroneggiare gli strumenti necessari per l'analisi dei Big Data e l'estrapolazione delle informazioni di interesse in ambito economico, aziendale e finanziario.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Course syllabus and organization

Edizione unica

Responsabile
Periodo
Terzo trimestre

Programma
Gli argomenti del corso sono:
- algebra matriciale, matrici dei dati e statistiche descrittive
- Cluster analysis (metodi gerarchici e non gerarchici) con interpretazione in R
- Analisi delle componenti principali con interpretazione in R
- Alberi decisionali (CART) con interpretazione in R
- Bootstrap con interpretazione in R
- Random forest con interpretazione in R
Prerequisiti
Al fine di affrontare adeguatamente i contenuti proposti nel corso, gli studenti dovranno aver maturato adeguate competenze in ambito statistico e matematico.
Metodi didattici
Il corso sarà organizzato attraverso lezioni teoriche e lezioni pratiche dove interpretare output in R
Materiale di riferimento
- Slides a disposizione sul sito del corso;
- Witten et al. (2020). Introduzione all'apprendimento statistico, Piccin (https://www.piccin.it/it/statistica
introduzione-all-apprendimento-statistico-con-applicazioni-in-r-9788829930944.html).
- Crawley (2012) The R book, Wiley.
- Parte informatica (Python): Bowles (2015). Machine Learning in Python, Wiley.
- Parte informatica (Cloud computing): Barrie Sosinsky (2010): Cloud Computing Bible,
Wiley.
- Parte informatica (Database relazionali): Atzeni et al. (2018).Basi di dati. McGraw-
Hill
Modalità di verifica dell’apprendimento e criteri di valutazione
Tre Homeworks facoltativi.
Esame scritto con domande aperte e domande a risposta multipla sulla teoria, su R e su Python
SECS-S/03 - STATISTICA ECONOMICA - CFU: 6
Lezioni: 40 ore
Docente: Rossini Luca
Professor(s)
Ricevimento:
Ogni Mercoledì 10-12
DEMM, stanza 31, 3° p (Previa Appuntamento inviando una mail)