Come far funzionare l’analisi del sentiment


Decisori e analisti poco informati pensano che il sentiment sia l’indicatore supremo, la misura definitiva di quanti sono a favore, quanti contro, e quanti neutrali rispetto a un dato argomento. In realtà il sentiment è un indicatore con forti limiti, ma nonostante queste debolezze con i giusti accorgimenti può ancora rivelarsi molto utile.


Riassunto della prima parte di questo post:

  • Definizione di analisi automatizzata del sentiment: quando un software tenta di valutare la “carica emotiva” di un contenuto testuale – articolo, post, tweet, commento etc. – tipicamente classificandolo come positivoneutrale o negativo.
  • Molte aziende si lanciano sul treno del sentiment senza essere consapevoli dei suoi limiti, indipendentemente dal software impiegato.
  • Ironie, contesti paralleli o multipli, punti di vista soggettivi e confronti diretti sono alcuni dei casi in cui una classificazione ha alte probabilità di fallire.

Questi limiti non rendono però i motori di analisi del sentiment inutili. Se vi assicurate che le condizioni seguenti sono soddisfatte il sentiment può fornire informazioni di valore per prendere decisioni efficaci in ambito strategico e di marketing.

Quando (e come) si può usare il sentiment

1) Legge dei grandi numeri

La Treccani descrive la legge dei grandi numeri come quel “Principio secondo il quale sotto condizioni molto generali l’azione simultanea di un grande numero di fattori casuali conduce a un effetto sostanzialmente deterministico (non casuale)”. Tale effetto deterministico è in particolare il valore che ci si aspetterebbe nella teoria. (Per approfondimenti: [http://it.wikipedia.org/wiki/Leggedeigrandi_numeri])

Chi ha studiato statistica non me ne voglia se affermo che, con un po’ di tolleranza scientifica basata sull’esperienza, possiamo estendere il principio alla base di questa legge anche al caso del sentiment. In altre parole possiamo aspettarci che, su grandi volumi, gli errori nella valutazione del sentiment tendano ad annullarsi a vicenda fornendo quindi un risultato più accurato. Badate però che per grandi volumi si intende l’ordine delle centinaia di migliaia (di post, tweet, articoli etc. analizzati)

2) Campione accuratamente selezionato

In alcune situazioni si può riuscire a ottenere i dati che non presentino, almeno in gran parte, le casistiche critiche di cui sopra. Ciò implica però un’esplorazione approfondita dell’argomento e delle discussioni in corso e richiede una certa abilità nell’impostare il software di analisi in maniera tale da limitare al minimo le anomalie. Tenete presente però che in alcuni casi non sarà comunque possibile garantire la “purezza” del campione, la quale dipende anche da fattori esterni al proprio controllo – il tema, il tono delle conversazioni, le caratteristiche degli utenti che vi partecipano e il rapporto che hanno con il prodotto o servizio o brand.

Se si presentano queste condizioni l’analisi del sentiment può aiutarci a scoprire informazioni interessanti, soprattutto se lo sfruttiamo per svelare relazioni fra le diverse tipologie di contenuti e le emozioni degli utenti. Per farlo non è tanto il “numero”, la percentuale di sentiment positivo o negativo, che conta. Più importanti sono le valutazioni qualitative che si possono trarre segmentando i dati in base al sentiment, e combinandolo con altre informazioni**.

Ad esempio si possono analizzare le parole chiave usate nelle conversazioni: le parole più ricorrenti nei post dal sentiment negativo possono svelare i prodotti che causano maggiori difficoltà ai clienti; oppure, analizzando di contro i post positivi, potremmo identificare i personaggi preferiti in una serie televisiva.

Un altro modo di sfruttare efficacemente il sentiment è di misurarne l’andamento nel tempo. Se si hanno a disposizione delle serie storiche sufficientemente ampie e tenendo conto di stagionalità e altre variabili prevedibili (vedi http://it.wikipedia.org/wiki/Analisi_delle_serie_storiche) allora è possibile stabilire una base su cui misurare le variazioni. A questo punto, indipendentemente dal valore assoluto iniziale, possiamo verificare la variazione che il sentiment subisce nel tempo in base ai contenuti pubblicati in quel periodo, o essere allertati se ci sono cambiamenti repentini e imprevisti rispetto al valore atteso.

Il risultato principale che il sentiment può così produrre è aiutarvi a conoscere meglio il vostro pubblico, a comprendere cosa lo muove e perché, e ad avvicinarsi ad esso con maggiore efficacia, rendendolo più soddisfatto del loro rapporto con il vostro brand.

3) Divergenze significative

Il terzo elemento “mitigatore” è forse l’unica eccezione in cui il valore assoluto del sentiment può darci un’informazione sufficientemente significativa: la condizione necessaria è che la differenza fra positivi e negativi sia molto ampia, un rapporto di almeno 2 a 1 è solitamente sufficiente per compensare gli errori di valutazione. Se poi l’analisi mostra che il sentiment è 50% positivo, 45% neutrale e 5% negativo, è concesso festeggiare.

Ora conoscete (quasi) tutto sull’analisi del sentiment, ma prima di chiudere è importante un ultimo chiarimento.

L’analisi semantica e l’analisi del sentiment non sono la stessa cosa

Abbiamo parlato dell’analisi automatica del sentiment, ovvero la stima, da parte di un software, dell’umore collegato ad un testo. Abbiamo anche menzionato all’inizio l’analisi semantica, che indica l’estrazione di significato da un testo. È importante precisare che l’una e l’altra non sono la stessa cosa. L’umore è solo uno dei possibili significati estraibili, di conseguenza l’analisi del sentiment è solo una delle varie branche dell’analisi semantica. Questo post non si vuole riferire a tutte le altre modalità di analisi semantica, come ad esempio quella relativa ai prodotti rivolti alla categorizzazione automatica di testi e documenti in base ai temi trattati, in cui vengono assegnate delle etichette (tag) per permettere una ricerca più veloce ed efficace all’interno di database molto grandi; questi prodotti hanno caratteristiche diverse e non necessariamente presentano gli stessi limiti o riguardano gli stessi casi d’uso descritti in questo articolo.

In sintesi

  • Molti considerano o propongono l’analisi del sentiment come la pietra filosofale dell’intelligence online, ma allo stato dell’arte è in generale un indicatore poco accurato e pressoché irrilevante, a prescindere dalla tecnologia utilizzata.
  • In alcuni casi specifici e sotto le giuste condizioni, il sentiment può comunque essere utile. Il valore assoluto è significativo nei momenti in cui la differenza fra sentiment positivo e negativo è molto ampia e più in generale come strumento di segmentazione dei dati per comprendere meglio gli interessi e le reazioni del proprio pubblico.

Per sapere se e come il sentiment può essere usato nel vostro caso specifico, contattateci per una valutazione preliminare gratuita.