LA MATEMATICA DEL MACHINE LEARNING

LA MATEMATICA DEL MACHINE LEARNING

_
iten
Codice
98795
ANNO ACCADEMICO
2018/2019
CFU
7 cfu al 1° anno di 9011 MATEMATICA (LM-40) GENOVA

6 CFU al 3° anno di 8766 STATISTICA MATEM. E TRATTAM. INFORMATICO DEI DATI (L-35) GENOVA

SETTORE SCIENTIFICO DISCIPLINARE
MAT/06
SEDE
GENOVA (MATEMATICA)
periodo
2° Semestre
materiale didattico

PRESENTAZIONE

L'insegnamento proposto intende offrire un'introduzione alla teoria matematica del machine learning, i cui strumenti sono alla base dei moderni algoritmi di apprendimento automatico e dell'analisi dati in grandi dimensioni. L'insegnamento è rivolto agli studenti della laurea magistrale in matematica. Per la natura degli argomenti trattati, le lezioni possono essere seguite anche dagli studenti della laurea triennale in SMID. 

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

L’obiettivo primario è quello di fornire allo studente il linguaggio e gli strumenti di base dell’apprendimento automatico, con particolare enfasi al caso supervisionato. L’approccio seguito si basa su una formulazione del problema del machine learning come problema inverso stocastico. Lo studente dovrà inoltre conoscere alcuni degli algoritmi più noti, comprendendone sia le proprietà statistiche sia quelle computazionali.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

I principali risultati di apprendimento attesi sono

  • la padronanza delle nozioni di base del machine learning
  • la conoscenza delle proprietà di alcuni algoritmi di apprendimento sia dal punto di vista statistico sia numerico ed implementativo 
  • l'abilità di usare gli algoritmi su dati sintetici e/o reali discutendone la ragionevolezza dei risultati

PREREQUISITI

Analisi Matematica 1 e 2, Algebra Linerare e Probabilità.

Modalità didattiche

Lezioni frontali di teoria e esercitazioni di laboratorio 

PROGRAMMA/CONTENUTO

  • introduzione all'apprendimento supervisionato come problema di regressione (random design): errore atteso, algoritmi di apprendimento e loro consistenza;
  • no-free lunch theorem, stime ottimali e condizioni a priori;
  • disuguaglianza di concentrazione in spazi di Hilbert (solo per gli studenti con 7CFU);
  • spazi di Hilbert a nucleo riproducente;
  • richiami di teoria degli operatori lineare e teorema spettrale per operatori compatti (solo per gli studenti con 7CFU);
  • algoritmi supervisionati classici (minimi quadrati regolarizzati, Support Vector Machines, ecc.) e loro consistenza;
  • algoritmi per sparsità (Lasso ed Elastic Net);
  • algortimi basati sulla discesa del gradiente stocastico;
  • algoritmi approssimati per dati di grandi dimensioni:
  • introduzione al manifold learning;
  • introduzione al deep learning.

TESTI/BIBLIOGRAFIA

  • L. Rosasco, Introductory Machine Learning Notes, University of Genoa,  (http://lcsl.mit.edu/courses/ml/1718/MLNotes.pdf)
  • Steinwart, Ingo, Christmann, Andreas, Support vector machines, Springer, ISBN 978-0-387-77241-7
  • Cucker, Felipe, Zhou, Ding-Xuan, Learning theory: an approximation theory viewpoint, Cambridge University Press 2007, ISBN  978-0-521-86559-3

DOCENTI E COMMISSIONI

Commissione d'esame

ERNESTO DE VITO (Presidente)

LORENZO ROSASCO (Presidente)

SILVIA VILLA

LEZIONI

Modalità didattiche

Lezioni frontali di teoria e esercitazioni di laboratorio 

INIZIO LEZIONI

In accordo con il calendario accademico approvato dal Consiglio di Corsi di Studi.

ESAMI

Modalità d'esame

L'esame consiste nella preparazione di una breve tesina  scritta (di circa dieci pagine) e la relativa discussione in sede di esame. Lo studente può scegliere uno delle seguente tipologie

  1. sviluppare uno degli argomenti in programma
  2. analizzare e discutere un articolo di ricerca legati alle tematiche trattate a lezione
  3. sviluppo di un codice in un linguaggio di programmazione a scelta dello studente di uno o più algoritmi trattati a lezione
  4. utilizzo di codice esistente per l'analisi di dati sintentici e reali e discussione critica dei risultati ottenuti

Lo studente deve concordare preventivamente con i docenti l'argomento della tesina, la cui ampiezza e la profondità sarà diversificata a secondo che l'insegnamento sia di 6 0 7 CFU.

Modalità di accertamento

La preparazione della tesina e la relativa discussione sono finalizzate a verificare il raggiungimento da parte dello studente di una sufficiente capacità critica ed autonomia di ragionamento nell'ambito del machine learning.

Inoltre, la scrittura della tesi serve a verificare la capacità dello studente di elaborare in forma scritta  le proprie idee.

Le diverse tipologie di argomenti permette di modulare le competenze richieste a seconda che lo studente sia della laurea triennale o della laurea magistrale.