Statistica per big data economico/aziendali
A.A. 2022/2023
Learning objectives
Il corso si propone di introdurre ed illustrare specifiche metodologie statistiche, informatiche e di machine learning per l'analisi dei Big Data nelle applicazioni economiche, aziendali e finanziarie. Tutto il corso verterà principalmente sul linguaggio di programmazione Python che di gran lunga è il più usato nelle applicazioni Big Data, ma si dedicheranno alcune parti al linguaggio R e ad altri linguaggi più classici come Java. Sul lato statistico si proporranno temi di statistical learning supervisionato e non supervisionato con qualche accenno alla statistica bayesiana.
Expected learning outcomes
Al termine del corso, lo studente avrà acquisito adeguate competenze statistiche e di programmazione che gli consentiranno di padroneggiare gli strumenti necessari per l'analisi dei Big Data e l'estrapolazione delle informazioni di interesse in ambito economico, aziendale e finanziario.
Periodo: Terzo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Course syllabus and organization
Edizione unica
Periodo
Terzo trimestre
Metodi di insegnamento.
Le lezioni si terranno solo in presenza in aula.
Le lezioni si terranno solo in presenza in aula.
Programma
PRIMA PARTE: Metodi statistici
1.1 Cluster analysis: metodi avanzati
1.2 Analisi delle componenti principali e cenni ad altri metodi di riduzione dimensionale
1.3 Alberi decisionali
1.4 Il bootstrap
1.5 Random forest
SECONDA PARTE: Introduzione alla programmazione e al data management
1) Introduzione alla programmazione in R e Python per le applicazioni statistiche ed economiche
2) Introduzione al cloud computing
3) Introduzione al web scraping
4) Introduzione al database relazionale e non relazionale
5) Cenni al linguaggio SQL
1.1 Cluster analysis: metodi avanzati
1.2 Analisi delle componenti principali e cenni ad altri metodi di riduzione dimensionale
1.3 Alberi decisionali
1.4 Il bootstrap
1.5 Random forest
SECONDA PARTE: Introduzione alla programmazione e al data management
1) Introduzione alla programmazione in R e Python per le applicazioni statistiche ed economiche
2) Introduzione al cloud computing
3) Introduzione al web scraping
4) Introduzione al database relazionale e non relazionale
5) Cenni al linguaggio SQL
Prerequisiti
Conoscenza delle tecniche statistiche e matematiche di base. La conoscenza di alcune tecniche di programmazione è utile ma non essenziale.
Metodi didattici
Le lezioni saranno svolte con il coinvolgimento attivo degli studenti, soprattutto nella parte di programmazione. Gli studenti saranno spesso invitati a seguire attivamente (cioè anche sui loro portatili personali) passi di programmi informatici proposti in aula assieme al docente, in un approccio "what-if". Si lavorerà anche in gruppi per condividere l'apprendimento.
Materiale di riferimento
James, Witten, Hastie, Tibshirani (2013). Introduction to Statistical Learning, Springer
Sosinsky (2010). Cloud Computing Bible, Wiley
Crawley (2012) The R book, Wiley.
Raschka, Mirjalili (2013). Python Machine Learning
Wiktorski, (2019). Data-intensive Systems, Springer.
Atzeni et al. (2018).Basi di dati. McGraw-Hill.
Sosinsky (2010). Cloud Computing Bible, Wiley
Crawley (2012) The R book, Wiley.
Raschka, Mirjalili (2013). Python Machine Learning
Wiktorski, (2019). Data-intensive Systems, Springer.
Atzeni et al. (2018).Basi di dati. McGraw-Hill.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consisterà in un test con domande che prevedono risposte multiple. Durante il corso si proporranno alcuni task sia in aula che da consegnare a breve termine che concorreranno al punteggio finale.
SECS-S/03 - STATISTICA ECONOMICA - CFU: 6
Lezioni: 40 ore
Docente:
Manzi Giancarlo