Seminario

Seminario introduttivo su classificazione del testo e NLP

Organizzato da UniCA all'interno del Cagliari DLab

Obiettivi e temi dell'evento

Questo corso di 20 ore offre un percorso completo sulla classificazione del testo e sul Natural Language Processing (NLP): dalle tecniche di base fino ai più avanzati Large Language Models, con dimostrazioni pratiche ed esercitazioni.

Il Natural Language Processing (NLP) è un campo dell'intelligenza artificiale dedicato all'interazione tra computer e linguaggio umano, attraverso metodi e algoritmi che consentono l'analisi, la comprensione e la generazione automatica di testo.

Il corso fornirà ai partecipanti una panoramica completa delle tecniche di NLP, dai metodi di base tradizionali fino ai più recenti sviluppi nel campo dei Large Language Models.

Le lezioni teoriche saranno costantemente affiancate da sessioni pratiche e laboratoriali. In particolare, il seminario permetterà di acquisire competenze concrete nell'ambito di: classificazione testuale, utilizzo di word embeddings e modelli transformer, implementazione di sistemi RAG (Retrieval-Augmented Generation) e ottimizzazione di Large Language Models per specifici casi d'uso.

Grazie a un approccio pratico-teorico, il percorso offrirà strumenti essenziali per acquisire le competenze necessarie a sviluppare soluzioni di NLP, a eseguire classificazioni testuali e utilizzare efficacemente i modelli linguistici più recenti.

Dove

Agenda

03 feb 25
10:00

12:00

Fundamentals of Text Classification

  • Course overview and objectives
  • Real-world text classification applications
  • Tokenization, stop words, stemming

Workshop: building a text classifier for sentiment analysis

  • Dataset exploration
  • Model implementation
04 feb 25
10:00

12:00

Modern Text Classification

  • From one-hot encoding to dense representations
  • BERT architecture
  • Contextual embeddings

Workshop: BERT hand-on

  • Using pre-trained BERT for classification
  • Comparing different approaches
05 feb 25
10:00

12:00

Large Language Models

  • LLM Theory
  • How LLMs acquire knowledge: training, instruction tuning, RAG integration
  • Strengths and limitations
  • Ethical considerations

Hands-on with LLMs

  • Zero-shot and few-shot learning
  • Chain-of-thought prompting
06 feb 25
10:00

12:00

Introduction to RAG

  • RAG Fundamentals (1h)
  • Architecture overview
  • Vector databases explained
  • When and why to use RAG

Practical RAG Implementation

  • Basic Walkthrough
  • Adding Search Capabilities
07 feb 25
10:00

12:00

Future Trends and Project Work

  • Future Applications (30min)
  • Emerging trends
  • Industry adoption patterns
  • Research directions

Mini-Project Development

Optional Final Assessment (max 15 min)

 

Il seminario sarà a numero aperto. È richiesta l’iscrizione tramite la compilazione del modulo accessibile attraverso questo link: clicca qui

Relatori

Altre informazioni

Il seminario è destinato a start-up, PMI, studenti e studentesse di dottorato, partner del CDL e in generale a coloro che possiedono un’adeguata conoscenza del linguaggio di programmazione Python. Inoltre, i/le partecipanti dovranno possedere conoscenze teoriche di base sul Machine Learning e Deep Learning.

Per partecipare è necessario disporre di un PC personale.