Perfino l’analisi automatica del sentiment riuscirebbe ad accorgersi della pessima reputazione di cui gode… l’analisi automatica del sentiment.
A giugno Fresh Networks ha pubblicato uno studio in cui confronta i risultati dei principali servizi computerizzati e a pagamento di mood tracking con quelli di un analista umano. Il risultato è agghiacciante: i post classificati correttamente oscillano tra l’8 e il 47%. Nasce così il tormentone estivo secondo cui l’analisi automatica del sentiment avrebbe un’affidabilità pari o inferiore al lancio di una moneta.
Ma quali sono i limiti e gli errori che provocano tali insuccessi? Proviamo a rispondere passando in rassegna gli strumenti gratuiti e i vari esperimenti che si sono cimentati con il riconoscimento computerizzato del tono positivo o negativo di un testo.
Cominciamo con Twitter: la piattaforma di microblogging è il terreno su cui si concentrano la maggior parte degli sforzi, in parte perché nel mondo anglosassone si è già affermata come il canale privilegiato per le conversazioni su brand e prodotti, in parte perché le caratteristiche dei messaggi (testuali, sintetici, codificati, in real-time) la rendono un bersaglio più facile per l’analisi.
C’è da dire che lo stesso servizio di ricerca di Twitter offre un filtro per scegliere messaggi positivi e negativi: com’è nel suo stile però il sito lascia agli utenti il compito di assegnare un tono al messaggio attraverso un particolare codice, in questo caso le emoticon. E’ possibile che questa sia la soluzione più appropriata, ma esula dal problema teorico dell’analisi testuale e preferiamo quindi sorvolare (almeno per il momento).
Il primo tool viene dall’Università di Stanford e porta un nome poco fantasioso: Twitter Sentiment.
Leggi tutto »