Il corso prevede la trattazione dei seguenti argomenti: introduzione al Text Mining e alla sua applicazione nell'analisi dei dati testuali, acquisizione dei dati testuali dai social media e altre piattaforme online, preparazione dei testi con tecniche di standardizzazione, tokenizzazione, stopwords, stemming e lemmatizzazione. Saranno approfonditi i principali modelli di rappresentazione testuale, come Bag of Words, TF-IDF e Word Embeddings, e le tecniche di visualizzazione dei dati testuali. L'analisi statistica dei dati testuali provenienti dai social media sarà affrontata in combinazione con l'applicazione di algoritmi volti a diversi obiettivi, tra cui la classificazione supervisionata e non supervisionata dei testi, la valutazione del sentiment attraverso la sentiment analysis e l'identificazione di trend e pattern ricorrenti. Saranno esplorati metodi di Topic Modeling per la scoperta di argomenti nei testi, oltre a tecniche di Web Scraping per l'estrazione di dati da fonti online. Il corso affronterà anche l'analisi delle reti semantiche e delle relazioni tra concetti nei testi e farà cenni ad applicazioni pratiche in contesti come hate speech, social media listening, marketing, sociologia, analisi delle opinioni e monitoraggio delle informazioni online, salute e sanità.
1. Introduzione al Text Mining
2. Fonti e acquisizione di dati testuali da questionari, interviste in profondità e social media
3. Preparazione dei testi (Standardizzazione, tokenizzazione, stopwords, stemming, lemmatizzazione)
4. Modelli di rappresentazione testuale (Bag of Words, TF-IDF, Word Embeddings)
5. Visualizzazione dei dati testuali
6. Analisi statistica dei dati testuali
7. Classificazione automatica dei testi
8. Analisi della sentiment nei social media
9. Topic Modeling e scoperta di argomenti nei testi
10. Web Scraping per il reperimento di dati testuali
11. Reti semantiche e relazioni tra concetti nei testi
12. Riferimenti ad applicazioni pratiche: cenni a contesti come hate speech, social media listening, customer satisfaction, analisi delle opinioni e monitoraggio delle informazioni online.
SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551
SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371
email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693