Insegnamento DEEP LEARNING AND ROBOT PERCEPTION

Nome del corso di laurea	Ingegneria informatica e robotica
Codice insegnamento	A003170
Curriculum	Data science e data engineering
Docente responsabile	Gabriele Costante
Docenti	Gabriele Costante
Ore	72 Ore - Gabriele Costante
CFU	6
Regolamento	Coorte 2023
Erogato	Erogato nel 2024/25
Attività	Caratterizzante
Ambito	Ingegneria informatica
Settore	ING-INF/04
Anno	2
Periodo	Primo Semestre
Tipo insegnamento	Opzionale (Optional)
Tipo attività	Attività formativa monodisciplinare
Lingua insegnamento	ITALIANO
Contenuti	Operazioni di filtraggio, estrazione di punti di interesse e di descrittori di immagine. Matching e Trasformazioni di immagine. Geometria epipolare e ricostruzione stereo. Visual odometry, graph-based SLAM e Visual SLAM. Deep Learning e reti neurali convoluzionali. Deep Reinforcement Learning. Esercitazioni guidate su Pytorch per la progettazione di reti neurali convoluzionali e di applicazioni basate su deep reinforcement learning.
Testi di riferimento	Richard Szeliski. “Computer Vision: Algorithms and Applications”, Springer - Ian Goodfellow, Yoshua Bengio, Aaron Courville. “Deep Learning”, MIT Press - Christopher Bishop. “Pattern Recognition and Machine Learning”, Springer; Richard Hartley, Andrew Zisserman. “Multiple view geometry”, Cambridge University Press – Ramesh Jain, Rangachar Kasturi, Brian G. Schunk. “Machine Vision”, McGraw-Hill – Richard S. Sutton, Andrew G. Barto. “Reinforcement Learning: an Introduction”, MIT Press. Dispense a cura del docente disponibili su UNISTUDIUM - PIATTAFORMA DI E-LEARNING DELL'UNIVERSITÀ DEGLI STUDI DI PERUGIA (https://www.unistudium.unipg.it/unistudium/ )
Obiettivi formativi	- Conoscenza di base di: problematiche connesse all’estrazione di informazioni di vario livello semantico da immagini; tecniche di estrazione di features e di descrittori di immagine; tecniche per la stima della trasformazione tra coppie di immagini; strategie per la ricostruzione 3D a partire da immagini in configurazione stereo; principi alla base della Visual odometry e del Visual SLAM; caratteristiche, vantaggi e soluzioni basate su reti neurali convoluzionali; tecniche e soluzioni basate su reinforcement learning e deep reinforcement learning. - Abilità: nella scelta di tecnologie e blocchi funzionali di sistemi di analisi di immagine per varie applicazioni; nell’utilizzo di reti neurali convoluzionali e nella progettazione di architetture di deep learning e di deep reinforcement learning (in particolare con il framework Pytorch) - L'insegnamento, inoltre, contribuisce al conseguimento dei seguenti risultati di apprendimento: elaborare e/o applicare idee originali in applicazioni diverse; risolvere problemi in ambienti nuovi e/o interdisciplinari; motivare le scelte progettuali compiute evidenziando possibili criticità; integrare le conoscenze e gestire la complessità.
Prerequisiti	Al fine di comprendere i contenuti presentati e conseguire gli obiettivi di apprendimento è utile possedere una conoscenza di base di Algebra Lineare e una buona conoscenza di Machine Learning e di programmazione. Insegnamento suggerito: “Machine Learning and Data Mining”.
Metodi didattici	L’insegnamento è organizzato come segue: - lezioni frontali in aula; - lezioni frontali a carattere seminariale - esercitazioni guidate presso il Laboratorio di Informatica sulla progettazione di soluzioni per problem di deep learning e deep reinforcement learning con framework Pytorch. Strumenti di supporto alla didattica: lavagna e PC+proiettore, PC.
Altre informazioni	I Semestre (maggiori dettagli vengono riportati al link http: //www.ing.unipg.it/it/didattica/studiare-nei-nostri-corsi/orario-delle-lezioni ).
Modalità di verifica dell'apprendimento	Le conoscenze relative all’insegnamento vengono accertate attraverso una Prova orale e una prova pratica (tesina). La prova orale prevede la discussione del progetto presentato e due domande su argomenti scelti dal docente, e dura circa 45 minuti. La prova è volta ad accertare la compresione, da parte dello studente, degli strumenti teorici fondamentali forniti dall'insegnamento, nonchè le relazioni tra tali strumenti e le tematiche generali dell'ingegneria informatica. Il progetto presentato viene utilizzato per verificare le capacità di progettazione di soluzioni basate su deep learning e deep reinforcement learning per applicazioni di computer vision e robotica attraverso il framework Pytorch. La tesina deve essere inviata al docente il giorno prima della prova di esame. Le prenotazioni alle prove di esame avvengono tramite il portale SOL: https://www.segreterie.unipg.it/ Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa
Programma esteso	Introduzione alla Computer Vision. Filtraggio di immagine. Image Features. Descrittori di Immagine e matching tra descrittori. Trasformazioni di Immagine. Geometria Stereo. Visual odometry. Graph-based SLAM e Visual SLAM. Machine learning e Computer Vision: Introduzione. Deep Learning. Reti neurali convoluzionali (CNN). Architetture per le CNN. Reti neurali ricorrenti: RNN –LSTM –GRU. Applicazioni delle CNN. Modelli generativi (Generative adversarial network (GAN)) e applicazioni non supervisionate delle CNN. Reinforcement Learning: Introduzione, concetti generali e algoritmi. Deep Reinforcement Learning. Esercitazioni di laboratorio: Framework per il deep learning, design di architetture per le CNN, esempi di applicazioni delle CNN. Esempi di soluzioni basate su Deep Reinforcement Learning.
Obiettivi Agenda 2030 per lo sviluppo sostenibile