Elaborazione del linguaggio naturale
L'elaborazione del linguaggio naturale (NLP) è una branca dell'intelligenza artificiale che è alla base di numerose applicazioni di uso quotidiano, ad esempio gli assistenti digitali come Siri o Alexa, i sistemi GPS e il testo predittivo sugli smartphone.
Le versioni precedenti dell'NLP utilizzavano la linguistica computazionale basata su regole insieme a metodi statistici e apprendimento automatico per comprendere e raccogliere informazioni da messaggi social, recensioni e altri dati. Gli approcci più recenti sfruttano le reti neurali e i modelli linguistici di grandi dimensioni (Large-Language Models o LLM) per svolgere le seguenti attività
Per facilitare la NPL vengono spesso condotte una serie di attività secondarie, tra cui:
- Tokenizzazione: la suddivisione del testo in singole unità più piccole.
- Stemming: la riduzione delle parole alla loro radice. Ad esempio, libreria, libraio, librettista derivano dalla parola "libro".
- Lemmatizzazione: la riduzione di parole o gradi contestualmente simili alla parola da cui derivano (lemma). Ad esempio, meglio, migliore e ottimo sono ridotti a "buono".
- Stop word removal: la rimozione di parole come preposizioni e articoli.
- Part-of-speech-tagging: consiste nel contrassegnare nomi, verbi, aggettivi, avverbi, pronomi, ecc.
Per agevolare la comunicazione conversazionale con un essere umano, la NLP impiega altre due sottobranche chiamate comprensione del linguaggio naturale (Natural Language Understanding, NLU) e generazione del linguaggio naturale (Natural Language Generation, NLG). La NLU comprende algoritmi che analizzano il testo per comprendere le parole in modo contestuale, mentre la NLG aiuta a generare parole significative come farebbe un essere umano. Insieme, sono alla base di chatbot intelligenti come ChatGPT.
Le principali tecniche di NLP utilizzate in ambito aziendale e B2C sono:
- Sintesi del testo: gli algoritmi NLP esaminano grandi quantità di dati e condensano le informazioni per poi fornire un riassunto con punti chiave.
- Riconoscimento vocale: questa tecnica analizza i dati audio per tradurli in testo o mapparli a parole note. Si utilizza per sottotitolare le tracce audio ed è stata fondamentale per le persone con problemi di udito.
- Traduzioni automatiche: una tecnica che traduce automaticamente le parole in lingue diverse in modo che gli utenti possano trarre vantaggio da informazioni in lingua straniera con il minimo sforzo. Google Translate ne è un buon esempio.
- Sistemi di risposta alle domande: gli algoritmi NLP analizzano i dati e cercano informazioni pertinenti per fornire risposte all'utente. Questi sistemi possono essere basati su regole o su modelli generativi pre-addestrati, come ChatGPT, che ricavano informazioni accedendo a dati disponibili pubblicamente su Internet.
- Riconoscimento delle entità denominate: il riconoscimento delle entità denominate (Named Entity Recognition, NER) è una tecnica NLP che identifica ed estrae entità quali persone, luoghi, marchi, oggetti, valute e simili.
- Ricerca semantica: una tecnica di ricerca che consente a un utente di recuperare informazioni comprendendo l'intento della sua ricerca anziché utilizzando solo le parole chiave.
- Analisi del sentiment: si tratta di algoritmi NLP in grado di categorizzare le emozioni in un testo e indicare se sono positive, negative o neutre e in che misura.
- Sentiment basato sugli aspetti: questa tecnica avanzata analizza il sentiment sulla base di aspetti che sono stati estratti dagli argomenti di un testo. Questa visione dettagliata del sentiment del mercato indica ai brand esattamente in cosa devono migliorare e cosa invece sta andando bene.
Tutte le tecniche e le attività secondarie di NPL di cui sopra lavorano insieme per fornire la giusta analisi dei dati sul sentiment del cliente e del brand a partire dai dati social o di altro tipo.