Un algoritmo per misurare il sarcasmo

di Matteo Borsacchi

Il peggior nemico per l’analisi automatica del mood? Il sarcasmo. Qualcuno manifesta un sentimento intendendo l’esatto opposto e non fa nulla o quasi perché l’altro se ne accorga. È inevitabile che gli strumenti già goffi di opinion mining inciampino sui commenti ironici e finiscano per catalogarli in modo errato.

Anche il recente tentativo di tre studiosi della Hebrew University di Gerusalemme di formulare un “algoritmo per il riconoscimento del sarcasmo” (SASI) ha scatenato l’ilarità dei bloggers.

I commenti ironici si concentrano sull’utilità di uno studio simile (“ora Roomba coglie lo scherzo quando gli dici che fa schifo”), senza però scalfire l’originalità e l’eleganza delle soluzioni con cui gli autori affrontano le insidie del linguaggio naturale.

Astraendo dai contenuti specifici del discorso (e da un certo misticismo che ne vede altrove l’esistenza) i tre informatici si concentrano sugli aspetti più superficiali della scrittura,  come le high frequency words (HFW) che spesso vengono considerate vuote di significato e inutili, la punteggiatura e le maiuscole. Al contrario, tutti gli aspetti contestuali (il prodotto, il brand, l’opera  e l’autore) e occasionali (le parole meno frequenti) vengono declassati e messi da parte. È come concentrarsi sulle smorfie o il tono di voce di chi parla, solo che qui abbiamo espressioni scritte, ancora meglio se con i puntini o le emoticon del web 2.0.

Ne esce un dizionario di espressioni che suonano come le italiane  “ci manca solo che…”, “ECCEZIONALE finché non….”, “ahahah come no…”. I pattern ricavati funzionano così da indicatori di un tono sarcastico a prescindere dalla situazione e dall’oggetto dello scherno. Tutto il resto dello studio non è che la raffinazione dell’algoritmo per aumentarne la predittività e prove su prove di validazione.

I risultati presentati sono buoni: precisione del 77% e replicabilità dell’80% su un campione di 66.000 recensioni di Amazon. Convincono meno le conclusioni su cosa motiverebbe il sarcasmo: secondo gli autori l’aspirazione più che rispettabile a “salvare o illuminare la folla e fare da contrappeso ad attese ingiustificate”. Questo ci sembra lo spirito che guida in generale le opinioni condivise sul web 2.0.

Il sarcastico, nella definizione del Macmillan English Dictionary, da cui pure gli autori erano partiti, “si esprime in modo da far sentire l’altro stupido”: una presa di coscienza da parte dell’interlocutore non sempre possibile, soprattutto per dei software automatici di riconoscimento del mood.

1 Commento su Un algoritmo per misurare il sarcasmo

  1. I’d prefer reading in my native language, because my knowledge of your languange is no so well. But it was interesting

1 Trackback & Pingback

  1. Strumenti gratuiti per la misurazione del mood: Twitter Sentiment - Misurarelacomunicazione

Scrivi un commento

L'indirizzo email non sarà pubblicato.

*