INTRODUZIONE ALLA DATA SCIENCE

INTRODUZIONE ALLA DATA SCIENCE

_
iten
Codice
101747
ANNO ACCADEMICO
2020/2021
CFU
6 cfu al 3° anno di 8759 INFORMATICA (L-31) GENOVA
SETTORE SCIENTIFICO DISCIPLINARE
INF/01
LINGUA
Italiano
SEDE
GENOVA (INFORMATICA )
periodo
2° Semestre
materiale didattico

PRESENTAZIONE

Il corso consiste in una serie di attività collegate tra loro mirate ad introdurre temi generali legati all’area della Data Science e Data Engineering In particolare vedremo una panoramica legata alla costruzione di sistemi ed applicazioni informatiche per la raccolta, gestione, analisi e visualizzazione di dati. Ogni attività sarà costituita da alcune lezioni, seminari informativi e attività laboratoriale 

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

Introduzione a strumenti utile nell'area della Data Science come Python e librerie collegate (itertools, numpy, scipy, ecc) ed esempi di applicazioni dell'informatica e della statistica all'analisi di dati

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

Il corso ha un molteplici obiettivo

- introdurre all'uso di strumenti molto usati nell'ambito della Data Science come il linguaggio Python,  Jupyter Notebook, Google Colab, librerie di analisi e visualizzazione di dati e grafi;

- introdurre alcuni concetti e metodi comunemente usati per l'analisi di dati (PCA, clustering, time series, ecc)

- mostrare esempi e ambiti applicativi della data science attraverso seminari e laboratori

I risultati di apprendimento vengono valutati in base ad attività di laboratorio e presentazioni da parte degli studenti

PREREQUISITI

Programmazione
Matematica e statistica di base
 

Modalità didattiche

Lezioni frontali
Briefing su esercitazioni di laboratorio e soluzioni proposte dagli studenti
Consegna di 5 esercitazioni proposte durante il corso e di un esercizio finale riepilogativo 

 

PROGRAMMA/CONTENUTO

Introduzione a Python

Costrutti

Immagini e matrici

Dizionari

Scoping e Classi

Ereditarietà ed Eccezioni

Pandas

Iteratori/generatori, map, reduce

Analisi di dati:

- itertools

- scipy

- pca

- regressione lineareNotebook Grafici e Regressione LineareURL

- clustering (combinazione KNN e PCA)

- time series

Data visualization:

- GeoPandas

- Plotly

Grafi con NetworkX

Introduzione a sistemi distribuiti, HPC e Big Data

Introduzione a Internet of Things/Edge Computing

TESTI/BIBLIOGRAFIA

Lucidi, lezioni registrate e note messe a dispozione dai docenti
Introduzione alla Programmazione in Python - Apogeo
Big Data Analysis - Apogeo

DOCENTI E COMMISSIONI

Ricevimento: Su appuntamento in presenza o Teams

Commissione d'esame

GIORGIO DELZANNO (Presidente)

LEZIONI

Modalità didattiche

Lezioni frontali
Briefing su esercitazioni di laboratorio e soluzioni proposte dagli studenti
Consegna di 5 esercitazioni proposte durante il corso e di un esercizio finale riepilogativo 

 

INIZIO LEZIONI

Febbraio 2021

ESAMI

Modalità d'esame

L'esame consiste in un quiz online e una presentazione (in presenza o remoto) dei laboratori consegnati durante l'anno

Modalità di accertamento

La validazione dei quiz sarà automatica per le domande online e dai docenti per domande aperte e laboratori.
Tale validazione è mirata a valutare l'apprendimento da parte dello studente di concetti e strumenti descritti nel corso.