Quando la dimensione dei dati strutturati e non supera la capacità dei sistemi di gestione dati tradizionali, sono necessari nuovi strumenti e metodi per l'acquisizione, l'archiviazione e la gestione degli stessi. Tali enormi quantità di dati sono in genere memorizzati in ambienti distribuiti su larga scala, elaborate utilizzando specifici ambienti, possono essere già disponibili o arrivare come un flusso continuo in fase di elaborazione, e richiedere strumenti specifici per la loro gestione.

  • Obiettivi e contenuti
    • OBIETTIVI FORMATIVI

      Students will be provided with a sound grounding on theoretical, methodological, and technological fundamentals concerning data management for advanced data processing architectures, with a specific reference to large-scale distributed environments. Students will learn key elements of NoSQL and stream-based systems as well as basic issues in parallel and distributed query processing, multi-query processing, and high-throughput transactional systems. Students will be involved in project activities.

      PROGRAMMA/CONTENUTO

      Introduzione alla gestione dati in ambienti distribuiti
      Introduzione ai Big Data
      Introduzione alle architetture distribuite
      Principi di gestione dei dati su larga scala
      Approcci architetturali alla gestione dati su larga scala

      Ambienti per elaborazioni di dati su larga scala (data-intensive computing)

      Batch processing e il paradigma Map-Reduce
      Da (Hadoop) Map-reduce a Spark
      Linguaggi di alto livello per elaborazioni di dati su larga scala

      Sistemi per la gestione dati su larga scala
      Introduzione ai sistemi NoSQL
      I modelli NoSQL
      I sistemi column-family
      I sistemi basati sui grafi

      Gestioni di flussi di dati
      Introduzione alla gestione di flussi di dati
      Modelli e linguaggi per la gestione di flussi di dati
      Gestione di flussi di dati su larga scala
       

      TESTI/BIBLIOGRAFIA

      Serge Abiteboul, Ioana Manolescu, Philippe Rigaux, Marie-Christine Rousset, Pierre Senellart. Web Data Management. Cambridge University Press, 2011.
      Martin Kleppmann. Designing Data-Intensive Applications. O'Reilly, 2017.
      +
      Materiale e riferimenti aggiuntivi forniti dai docenti.

       

      URL Aula web
      ADVANCED DATA MANAGEMENT
      https://dibris.aulaweb.unige.it/
      URL Orario lezioni
      ADVANCED DATA MANAGEMENT
      http://computerscience.dibris.unige.it/timetable
  • Chi
  • Come
    • MODALITA' DIDATTICHE

      Lezioni, progetto e studio a casa

      MODALITA' D'ESAME

      Esame scritto e orale (include discussione progetto)

      MODALITA' DI ACCERTAMENTO

      I dettagli sulle modalità di preparazione per l’esame e sul grado di approfondimento di ogni argomento verranno forniti nel corso delle lezioni. 

      Durante il semestre, verranno proposte alcune prove in itinere (teoriche e pratiche) che gli studenti dovranno svolgere a piccoli gruppi, e un progetto, da svolgere e consegnare al momento della prova di esame scritta.

      Nel caso di valutazione positiva delle prove in itinere:

      • l’esame scritto consiste in un insieme di domande ed esercizi su argomenti di base del corso. L'obiettivo di questa prova è quello di accertare la comprensione delle problematiche principali affrontate durante le lezioni;
      • la prova orale consiste in: (i) discussione approfondita delle soluzioni elaborate dallo studente per il progetto assegnato, al fine di valutare non soltanto se lo studente ha raggiunto un livello adeguato di conoscenze, ma se ha acquisito la capacità di analizzare criticamente problemi relativi alla gestione di dati in ambienti su larga scala.

      Nel caso di valutazione negativa delle prove in itinere o nel caso in cui queste prove non vengano svolte:

      • l’esame scritto consiste in un insieme di domande ed esercizi esercizi su argomenti di base del corso. L'obiettivo di questa prova è quello di accertare la comprensione delle problematiche principali affrontate durante le lezioni;
      • la prova orale consisterà in: (i) discussione approfondita delle soluzioni elaborate dallo studente per il progetto assegnato, al fine di valutare non soltanto se lo studente ha raggiunto un livello adeguato di conoscenze, ma se ha acquisito la capacità di analizzare criticamente problemi relativi alla gestione di dati in ambienti su larga scala; (ii) domande teoriche e/o pratiche su argomenti svolti nell'ambito dell'insegnamento, con particolare riferimento agli argomenti sui quali sono state evidenziate carenze nella prova scritta o nello svolgimento del progetto.
  • Dove e quando
  • Contatti