• Edizioni di altri A.A.:
  • 2026/2027

  • Lingua Insegnamento:
    Le lezioni saranno svolte in Italiano. Slides e libri di testo saranno principalmente il lingua Inglese 
  • Testi di riferimento:
    - Dispense del corso ed esercitazioni pratiche
    - Trevor Hastie, Robert Tibshirani and Jerome Friedman (2008) The Elements of Statistical Learning Springer-Verlag
    - Kevin Murphy (2012) Machine learning : a probabilistic perspective, The MIT Press, Cambridge, Massachusetts, London, England
     
  • Obiettivi formativi:
    L’insegnamento si inserisce nel generale obiettivo del corso di studio di fornire conoscenza riguardo all’analisi multivariata per dati complessi.
    L’insegnamento si propone di fornire allo studente gli strumenti per estrarre informazioni rilevanti da dati complessi, con particolare
    attenzione all'apprendimento statistico (statistical learning) sia in contesto predittivo che non
    RISULTATI DELL'APPRENDIMENTO ATTESI
    L'insegnamento prevede di completare la formazione dello studente con nozioni e strumenti utili ad approfondire gli aspetti dell’analisi statistica multivariata per dati complessi. La formazione sarà quindi completata e arricchita dalle seguenti competenze:

    Conoscenza e capacità di comprensione
    - Conoscenza di concetti statistici per l’analisi multivariata e relativa terminologia specializzata
    - Capacità di applicare i principi di ragionamento statistico nell'elaborazione e nell'interpretazione dei risultati derivanti da analisi di dati reali
    - Capacità di utilizzare i software R, Python e MATLAB per l’analisi statistica di dati a struttura complessa

    - Capacità di applicare conoscenza e comprensione
    Al termine del corso di insegnamento, lo studente anche con l’aiuto di casi di studi concreti, sarà in grado di analizzare dati complessi, anche di grandi dimensione, con le moderne tecniche statistiche. Le conoscenze acquisite gli consentiranno di trattare "oggetti" non strutturati e comprendere le complesse strutture relazionali e correlazioni insite nei dati

    Autonomia di giudizio
    - Apprendere i concetti logici e statistici che sono indispensabili per lavorare autonomamente nella ricerca,
    - Selezione, preparazione ed elaborazione di dati a struttura complessa

    Abilità comunicative
    - Imparare la terminologia e le tecniche statistiche di analisi multivariata per comunicare o discutere correttamente i risultati dell'analisi dei dati
     
  • Prerequisiti:
    Conoscenze di matematica generale, algebra lineare, matrici, statistica inferenziale
     
  • Metodi didattici:
    Lezione frontale ed esercitazioni in aula informatica con utilizzo del software R, Python e MATLAB
     
  • Modalità di verifica dell'apprendimento:
    Conoscenza e capacità di comprensione
    L’esame si articola in una prova orale volta a verificare la conoscenza della parte teorica degli argomenti trattati a lezione e in una discussione orale di un report redatto per l’analisi di data sets (sceltti dallo studente) mediante l’uso di un software (R, Python o Matlab). Nella determinazione del voto finale dell’esame, il peso della discussione del report è pari al 30%.
    Capacità di applicare conoscenza e comprensione

    Con la valutazione della presentazione di un report basato su casi di studio reali si verifica la capacità degli studenti di applicare le tecniche ed i modelli introdotti durante il corso, nonché la comprensione e la capacità di analisi critica degli argomenti trattati
     
  • Sostenibilità:
     
  • Altre Informazioni:
    E-mail: luigi.ippoliti@unich.it

    Giorni ed orari di ricevimento studenti: Lunedì e Mercoledì 15:00 – 16:00 e per appuntamento da concordarsi via e-mail.

     

Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: introduzione all'apprendimento statistico, Tecniche di visualizzazione dei dati, Tecniche di apprendimento supervisionato (classificazione) e non supervisionato (tecniche di riduzione di dimensionalità) con l’uso del linguaggio R, Python e MATLAB

Il corso si propone di introdurre metodi e modelli per estrarre informazioni rilevanti da dati complessi, con particolare attenzione
all'apprendimento statistico (statistical learning) sia in contesto predittivo che non.
Al fine di fornire lecompetenze per l'analisi e la modellazione di dati reali complessi, le lezioni saranno integrate da esercitazioni in R, Python o Matlab.
Programma dettagliato:
Overview of Supervised and Unsupervised Learning
Introduction
Variable Types and Terminology
Parametric vs non-parametric models
The curse of dimensionality
Two Simple Approaches to Prediction: Least Squares and Nearest Neighbors
Unsupervised learning: discovering clusters and latent factors

Unsupervised Learning
Introduction to learning in high dimensions
Singular Value Decomposition
Principal Component Analysis
Multidimensional Scaling
Non-negative Matrix Factorization
Deep auto-encoders
Cluster Analysis
Proximity Matrices
Dissimilarities based on attributes
Clustering Algorithms:
- Hierarchical Clustering
- K-means
- Gaussian Mixtures
Supervised Learning
Introduction to linear methods for classification
The Nearest Neighbour classifier
Linear Discriminant Analysis
Kernel density estimation and classification
The Naive Bayes Classifier
Model assessment and selection
Cross-Validation methods
ROC Curves

Avvisi

Nessun avviso in evidenza

Documenti

Nessun documento in evidenza

Scopri cosa vuol dire essere dell'Ud'A

SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551

SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371

email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693

icona Facebook   icona Twitter

icona Youtube   icona Instagram