STATISTICAL MODELS

STATISTICAL MODELS

_
iten
Ultimo aggiornamento 09/05/2021 11:13
Codice
41601
ANNO ACCADEMICO
2021/2022
CFU
9 cfu al 1° anno di 11267 ECONOMICS AND DATA SCIENCE (LM-56) GENOVA
SETTORE SCIENTIFICO DISCIPLINARE
SECS-S/01
LINGUA
Inglese
SEDE
GENOVA (ECONOMICS AND DATA SCIENCE )
periodo
2° Semestre
propedeuticita
materiale didattico

PRESENTAZIONE

L'insegnamento di Statistical models intende fornire gli elementi fondamentali dell’inferenza classica tramite verosimiglianza, dell’analisi dei modelli di regressione e classificazione per le applicazioni in campo economico e sociale, e una introduzione alle tecniche di simulazione in ambito statistico.

OBIETTIVI E CONTENUTI

OBIETTIVI FORMATIVI

Il corso si propone di fornire una precisa panoramica dell'inferenza statistica a un livello intermedio. La prima parte riguarda la statistica matematica classica, basata sulla verosimiglianza, con alcuni cenni alle tecniche basate sulla simulazione. La seconda parte del corso e' invece incentrata sulle principali tecniche di regressione e classificazione. Verranno in particolare trattati i modelli lineari generalizzati sia per riposte discrete che per risposte continue. Saranno poi illustrati alcuni metodi di regressione e classificazione non parametrici, e verranno infine affrontati metodi classici di validazione, selezione del modello e riduzione della dimensionalità.

OBIETTIVI FORMATIVI (DETTAGLIO) E RISULTATI DI APPRENDIMENTO

L’insegnamento è articolato in due parti:

  1. Elementi di statistica inferenziale classica: principali classi di distribuzioni univariate e multivariate, simulazione, modelli statistici, verosimiglianza e sue proprietà.
  2. Modelli di regressione di classificazione: Regressione multipla, teoria dei modelli lineari generalizzati, regressione logistica e per conteggi, tecniche nonparametriche. Tecniche diagnostiche e metodi di selezione del modello.

Tutti gli argomenti saranno accompagnati da esercizi pratici in R, in modo che lo studente possa affiancare alla comprensione degli argomenti trattati anche la capacita' di applicare corrette analisi statistiche in contesti reali e di comprendere gli output delle procedure statistiche.

Conoscenza e comprensione: Gli studenti dovranno conoscere le principali tecniche e i principali strumenti per la statistica inferenziale. Dovranno essere in grado di inquadrare tali strumenti in termini generali (sia teorici che applicati), e di analizzarne gli strumenti matematici e statistici sottostanti.

Capacità di applicare conoscenza e comprensione: Gli studenti saranno in grado di individuare, di fronte a problemi applicati in diversi contesti, la corretta tecnica di analisi. Inoltre, saranno in grado di valutare criticamente i risultati ottenuti tramite software statistico.

Autonomia di giudizio: Gli studenti dovranno acquisire consapevolezza delle potenzialità e dei limiti delle tecniche statistiche presentate, attraverso l’analisi di esempi e studio di casi.

Abilità comunicative: Gli studenti dovranno saper utilizzare il linguaggio tecnico-statistico corretto per la comunicazione dei risultati e per la descrizione delle tecniche utilizzate.

Capacità di apprendimento: Gli studenti svilupperanno adeguate capacità di apprendimento che consentano loro di continuare ad approfondire in modo autonomo altri aspetti della materia e diversi campi di applicazione rispetto a quelli illustrati. Inoltre, dovranno poter utilizzare anche autonomamente il software R.

 

PREREQUISITI

I contenuti tipici dei corsi introduttivi di Matematica Generale e di Statistica per lauree triennali.

 

Modalità didattiche

Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio.

PROGRAMMA/CONTENUTO

0. Introduzione e richiami su stima e verifica di ipotesi.

1. Le principali famiglie di distribuzioni discrete e continue.

2. Distribuzioni multivariate.

3. Simulazione. Simulazione distribution-based e agent-based.

4. Verosimiglianza e sufficienza. Stima per massima verosimiglianza. Informazione. La famiglia esponenziale.

5. Regressione lineare multipla e tecniche k-NN.

6. Teoria dei modelli lineari generalizzati.

7. Regressione logistica e per conteggi.

8. Metodi di selezione del modello e regolarizzazione.

TESTI/BIBLIOGRAFIA

Evans, Rosenthal, Probability and Statistics. The Science of Uncertainty, Second edition.

James G, Witten D, Hastie T and Tibshirani R, An Introduction to Statistical Learning. With Applications in R. Springer (disponibile sulla webpage degli autori).

Letture complementari e approfondimenti saranno tratte da:

Casella G and Berger RL, Statistical Inference. Duxbury

Efron B and Hastie T, Computer Age Statistical Inference. Algorithms, Evidence, and Data Science. Stanford University (disponibile sulla webpage degli autori).

Materiali aggiuntivi (sia in Italiano che in Inglese) saranno resi disponibili su Aulaweb a cura del docente.

DOCENTI E COMMISSIONI

Ricevimento: Ricevimento studenti primo semestre 2021-2022: Lunedi ore 14-16 su prenotazione tramite email. Il ricevimento è in presenza ma è possibile concordare nello stesso orario anche un ricevimento su Teams. Office hours first semester 2021-2022: Monday 2pm-4pm upon reservation via email. The office hours are in-person, but it is possible to arrange a Teams call in the same hours.

LEZIONI

Modalità didattiche

Lezioni teoriche e laboratorio informatico con R. Discussione di casi di studio.

INIZIO LEZIONI

Il corso segue il calendario di Dipartimento per il secondo semestre.

ORARI

L'orario di tutti gli insegnamenti è consultabile su EasyAcademy.

ESAMI

Modalità d'esame

Qualora l'andamento dell'epidemia COVID consenta gli esami in presenza, l’esame consisterà in una prova scritta, che potrà essere sostituita – per i frequentanti – da due prove intermedie da svolgersi durante il corso.

In caso sia necessario svolgere esami in remoto, gli studenti saranno avvertiti appena possibile della variazione delle modalità d'esame. L'esame in remoto sarà strutturato per quanto possibile come l'esame in presenza.

Il regolamento completo d’esame sarà pubblicato sulla pagina del corso su Aulaweb e tenuto aggiornato in base alle disposizioni normative e regolamentari che via via dovranno esser rispettate.

Modalità di accertamento

L'esame scritto si compone di tre parti:

1) una domanda di carattere generale a risposta aperta

2) una o più domande specifiche a risposta aperta

3) un output da commentare

Le domande sono scelte in modo da coprire, per quanto possibile, tutti gli argomenti del programma d'esame. La domanda generale ha lo scopo di valutare il grado di conoscenza della materia e l’acquisizione del linguaggio tecnico corretto, le domande specifiche sono tese a valutare la capacità critica dello studente, mentre il commento all’output serve a valutarne le capacità di applicazione.