Strumenti gratuiti per la misurazione del mood: Liquida

Liquida è il portale di user generated content lanciato da Banzai circa due anni fa; definirlo aggregatore sarebbe riduttivo perchè il sito implementa numerose funzioni per valorizzare i contenuti e facilitarne la diffusione e la ricerca.

Da aprile di quest’anno è stata aggiunta alle funzioni semantiche anche un’analisi del sentiment dei post. Nelle parole di Andrea Santagata, fondatore di Liquida, “il sistema messo a punto dal nostro team interno di ricerca e sviluppo, e attualmente non presente in nessun altro portale del mondo, estrae il sentiment degli articoli, analizzando il contesto aggettivale del post per derivarne il mood”.

Sono quindi gli aggettivi a connotare positivamente o negativamente i contenuti. Questo non è un limite trascurabile, perchè escludendo sostantivi, verbi e avverbi si perdono gran parte delle espressioni che veicolano uno stato d’animo. Basti pensare a questi due esempi: “E’ una vergogna…”, “Mi dispiace terribilmente…”. Non viene fatto inoltre nessun riferimento al problema della negazione che presumiamo quindi non essere affrontato.

Testiamo il servizio ricercando un brand italiano, ENI, rispetto a cui il mood in rete è fortemente polarizzato: agli apprezzamenti per gli sforzi nell’innovazione energetica si alternano critiche sui comportamenti dell’azienda in alcuni paesi in via di sviluppo.

Fig. 1 – I risultati

Nella pagina dei risultati si nota subito la barra del mood prevalente nel periodo scelto. In questo caso i post negativi superano di poco (52%) quelli positivi. Non ci sono informazioni sui post neutri che permettano di calcolare a quanti post sul totale è stato attribuito un sentiment.

A destra della barra un filtro permette di visualizzare solamente i risultati positivi o negativi. Ancora più a destra il filtro temporale permette di scegliere tra diversi intervalli: il giorno, la settimana, 1, 3 o 6 mesi. Interessante notare come il risultato di sostanziale parità per ENI si mantiene nei diversi intervalli.

Fig. 2 – Il box

Posizionando il cursore del mouse sull’emoticon è possibile vedere quali sono gli aggettivi riconosciuti dal sistema. Nello stesso box viene spiegato come l’analisi automatica non restituisce il giudizio dell’autore sul tema ricercato, ma “traccia il contesto emotivo che accompagna un argomento in un dato istante”.

La precisazione è importante, bisogna però verificare se è sufficiente. La scelta di usare solo gli aggettivi, di non considerare la negazione senza nemmeno parlare dei problemi posti dal sarcasmo legittima il sospetto che in molti casi si possa fraintendere il tono dell’intero messaggio.

Nel caso della figura 2 l’attribuzione del tono è corretta: l’articolo critica la figura dittatoriale del presidente turkmeno Gurbanguly Berdimukhammedov, con cui ENI si appresterebbe a siglare un accordo. Andando però nel dettaglio degli aggettivi notiamo diverse incongruenze: il sistema rileva tre aggettivi positivi confondendone del tutto l’uso. Innanzitutto è discutibile la scelta di connotare positivamente naturale, che in questo caso riguarda il gas dei giacimenti turkmeni. Gli altri due aggettivi, mirabolanti e insospettabile derivano dalla frase sarcastica che introduce la descrizione del dispotico predecessore del Presidente:

Ora, come promesso, vi citiamo da una fonte insospettabile (la Kliq di TuttoWrestling), le mirabolanti imprese (per non dire deliri) del defunto despota turkmeno Saparmurat Niyazov.

Sul versante negativo notiamo il riconoscimento di propagandistico ma non di repressivo. Fortunatamente nell’elenco delle nefandezze di Niyazov l’autore si lascia scappare un vile e due infami, che bastano a correggere il tiro dello strumento.

Non sempre però si è fortunati: in questo esempio viene taggato come positivo un articolo che invece critica la Regione Puglia per aver ignorato un bando di gara indetto da ENI.

Fig. 3 – Un caso di errore

Come nel caso precedente gli errori sono di varia natura e riguardano tutti gli aggettivi riconosciuti: autentico è usato più frequentemente (anche in questo caso) nel senso rafforzativo di “vero e proprio” che in quello positivo di “originale” o “spontaneo”. Eccellente in questo caso è usato ironicamente e meritevole al condizionale. Sarebbe invece bastato riconoscere sostantivi indiscutibilmente negativi come perplessità e malumori per attribuire il tono corretto al messaggio.

Per riassumere, la nuova funzione di Liquida è uno strumento innovativo ed utile specie perchè va ad integrarsi con le numerose funzionalità semantiche del servizio. Tuttavia i margini di errore sono molto ampi e dipendono dai limiti intrinseci al metodo bag of words (sacco di parole, come vengono ironicamente chiamati nel settore i dizionari), in questo caso ulteriormente ristretti dal fatto di considerare solamente la classe degli aggettivi e di non porsi il problema della negazione.

Scritto da Matteo Borsacchi

2 Commenti su Strumenti gratuiti per la misurazione del mood: Liquida

  1. Bella analisi. Concorda anche con le conclusioni

  2. Siamo sempre contenti di essere il “cattivo” esempio… :D
    Comunque bell’articolo, anche se avevo capito da tempo che il sistema “Mood” di Liquida era tutt’altro che perfetto e ha tuttora bisogno di qualche revisione.

Scrivi un commento

L'indirizzo email non sarà pubblicato.

*