• Edizioni di altri A.A.:
  • 2027/2028

  • Lingua Insegnamento:
    Le lezioni saranno svolte in italiano.
    Le slides sono in italiano. I libri di testo consigliati sono in inglese. 
  • Testi di riferimento:

    Il materiale didattico, comprendente slide, riferimenti e ulteriori risorse, sarà fornito durante le lezioni, presentato dal docente e reso disponibile tramite il sito del corso per il download.

    Testi consigliati:
    Ignatow, G., & Mihalcea, R. (2018). An introduction to text mining. SAGE Publications
    Jockers, M. L., & Thalken, R. (2020). Text analysis with R. Springer International Publishing.
     
  • Obiettivi formativi:

    Il modulo di Text Mining fornisce le competenze teoriche e pratiche per analizzare contenuti testuali con particolare attenzione ai dati provenienti dai social media attraverso l’estrazione, modellizzazione e visualizzazione dei contenuti. L’analisi riguarderà principalmente post e commenti online, con la capacità di estrarre e analizzare autonomamente dati dai principali social media e piattaforme digitali. Il modulo è dunque intrinsecamente sinergico con il precedente modulo di Social Network Analysis garantendo allo studente la possibilità di analizzare criticamente grandi moli di dati provenienti dai Social Network, offrendo la possibilità di essere esposti alle diverse fasi di un’analisi (individuazione del dato, estrazione, pulizia, analisi, sintesi, interpretazione ed esposizione)
    Obiettivi di Apprendimento
    1. Comprendere i fondamenti del Text Mining per i Social Media
    Estrarre e preprocessare dati testuali da principali social media e fonti online.
    Apprendere le principali tecniche di text mining, tra cui tokenizzazione, stemming e lemmatizzazione.
    Esplorare diverse trasformazioni di vettorizzazione per analizzare token e documenti.
    2. Applicare tecniche statistiche e di machine learning ai dati testuali
    Eseguire analisi del sentiment, topic modeling e classificazione dei testi.
    Utilizzare word embeddings e tecniche di vettorizzazione (ad esempio, TF-IDF, Word2Vec).
    Implementare metodi di clustering e riduzione dimensionale per l'analisi dei testi.
    3. Estrarre intuizioni dai contenuti testuali dei social media
    Elaborare e analizzare i dati testuali provenienti da post, commenti e discussioni online sui social media.
    Identificare tendenze, temi ricorrenti e narrazioni emergenti all'interno delle piattaforme digitali.
    4. Visualizzare e comunicare le intuizioni dal text mining
    Utilizzare strumenti adeguati per visualizzare i dati testuali.
    Interpretare e valutare criticamente i risultati per supportare il processo decisionale.
    5. Adottare un approccio critico e metodologico nell'analisi dei dati testuali digitali
    Progettare e condurre studi empirici utilizzando grandi set di dati testuali.
    Sviluppare un approccio strutturato per analizzare e interpretare i testi dei social media.
    Considerare ulteriori applicazioni del text mining e dell'analisi dei dati testuali tra cui: hate speech, social media listening, marketing, sociologia, analisi delle opinioni e monitoraggio delle informazioni online, salute e sanità.
     
  • Prerequisiti:

    Conoscenze di : programmazione, metodi quantitativi per le scienze sociali, modelli statistici per l'apprendimento automatico e la previsione
     
  • Metodi didattici:

    ll corso sarà articolato in lezioni teoriche ed esercitazioni pratiche svolte utilizzando il linguaggio di programmazione R. Sarà inoltre introdotto il software Gephi per la visualizzazione e rappresentazione delle reti. La frequenza alle attività didattiche non è obbligatoria, ma fortemente consigliata.
    Gli studenti con disturbi specifici dell'apprendimento (DSA) o disabilità temporanee/permanenti sono tenuti a contattare l'ufficio competente dell'Università e concordare con la docente le strategie più efficaci per seguire le lezioni e prepararsi all'esame.
    Gli studenti impossibilitati a seguire le lezioni sono invitati a contattare la docente per concordare le strategie più efficaci per prepararsi all'esame.
     
  • Modalità di verifica dell'apprendimento:

    Svolgimento di un progetto che prevede la raccolta e l'analisi di dati testuali, integrato da un approfondimento orale sulle tematiche trattate nel corso.
     
  • Sostenibilità:
     
  • Altre Informazioni:

    E-mail: lara.fontanella@unich.it
    Giorni ed orari di ricevimento studenti: dopo le lezioni e per appuntamento da concordarsi via e-mail
     


Il corso prevede la trattazione dei seguenti argomenti: introduzione al Text Mining e alla sua applicazione nell'analisi dei dati testuali, acquisizione dei dati testuali dai social media e altre piattaforme online, preparazione dei testi con tecniche di standardizzazione, tokenizzazione, stopwords, stemming e lemmatizzazione. Saranno approfonditi i principali modelli di rappresentazione testuale, come Bag of Words, TF-IDF e Word Embeddings, e le tecniche di visualizzazione dei dati testuali. L'analisi statistica dei dati testuali provenienti dai social media sarà affrontata in combinazione con l'applicazione di algoritmi volti a diversi obiettivi, tra cui la classificazione supervisionata e non supervisionata dei testi, la valutazione del sentiment attraverso la sentiment analysis e l'identificazione di trend e pattern ricorrenti. Saranno esplorati metodi di Topic Modeling per la scoperta di argomenti nei testi, oltre a tecniche di Web Scraping per l'estrazione di dati da fonti online. Il corso affronterà anche l'analisi delle reti semantiche e delle relazioni tra concetti nei testi e farà cenni ad applicazioni pratiche in contesti come hate speech, social media listening, marketing, sociologia, analisi delle opinioni e monitoraggio delle informazioni online, salute e sanità.


1. Introduzione al Text Mining
2. Fonti e acquisizione di dati testuali da questionari, interviste in profondità e social media
3. Preparazione dei testi (Standardizzazione, tokenizzazione, stopwords, stemming, lemmatizzazione)
4. Modelli di rappresentazione testuale (Bag of Words, TF-IDF, Word Embeddings)
5. Visualizzazione dei dati testuali
6. Analisi statistica dei dati testuali
7. Classificazione automatica dei testi
8. Analisi della sentiment nei social media
9. Topic Modeling e scoperta di argomenti nei testi
10. Web Scraping per il reperimento di dati testuali
11. Reti semantiche e relazioni tra concetti nei testi
12. Riferimenti ad applicazioni pratiche: cenni a contesti come hate speech, social media listening, customer satisfaction, analisi delle opinioni e monitoraggio delle informazioni online.

Avvisi

Nessun avviso in evidenza

Documenti

Nessun documento in evidenza

Scopri cosa vuol dire essere dell'Ud'A

SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551

SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371

email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693

icona Facebook   icona Twitter

icona Youtube   icona Instagram