Liquida: valorizzare i contenuti del web (reloaded)

Bubbles Non è la prima (e non sarà certo l’ultima volta) che mi trovo a scrivere di internet e del valore dei suoi contenuti, della rivoluzione che la produzione personale (i blog e quello che vi gira attorno) rappresenta. Per inquadrare il fenomeno, citiamo qualche dato: una stima indica che in Italia ci siano oltre un milione di blog, di cui 300.000 attivi. 1500 nuovi blog nascono ogni giorno (ed una certa quantità ne muore, ovviamente). I contenuti prodotti da questo nuovo media (testi, foto, video, musica) sono letteralmente un fiume in piena, in grado di travolgere senza possibilità di salvezza coloro che anche solo pensassero di poterne leggere una parte consistente.
Inutile dire che non tutto il contenuto prodotto è di valore, anzi. La stragrande maggioranza di ciò che viene quotidianamente scritto sul web è di valore infimo, praticamente nullo: si tratta di contenuti “ripresi da altre fonti” (quotati), si tratta di argomentazioni futili (“bella zio!”), non pertinenti, o semplici contenuti prettamente personali (“ieri sera sono andato al cinema e mi sono molto divertito. Bella zio.”). In mezzo a questo rumore, però, si cela contenuti interessanti, in alcuni casi anche di notevole artistico e culturale, il cui accesso è reso di più in più difficoltoso dalla massa di informazioni che ci sommerge.

Gli approcci per risolvere il problema (quello di far emergere dal rumore i contenuti di valore, e solo quelli) sono essenzialmente due: un approccio “algoritmico” ed un approccio “sociale”.

  • L’approccio algoritmico consiste nel collezionare e catalogare tutto il contenuto del web, utilizzando algoritmi automatici (tramite degli spider). Il compito di affinare la ricerca in mezzo alla massa di contenuti indicizzati, viene lasciata all’utente, che deve inserire una serie di parole chiave al fine di estrarre dal “flusso” i contenuti che l’algoritmo ritiene pertinenti. Il vantaggio di questo approccio sta nell’automatismo con il quale il lavoro “sporco” (l’indicizzazione) viene compiuto. Lo svantaggio sta in parte nella probabile imprecisione dell’algoritmo, ma soprattutto nella difficoltà di proporre all’utente dei contenuti che non cerca, di essere propositivo. Per di più, l’algoritmo non è in grado di discernere di per sé un contenuto di qualità, o originale da una citazione: non fa altro che “incasellare”, classificare, ordinare e riproporre a richiesta. Un classico esempio di questo genere di approccio sono i motori di ricerca.
  • L’approccio sociale, da questo punto di vista, funziona molto meglio: agli utenti viene chiesto di rendere “computazionalmente intellegibile” il proprio contenuto (tramite ad esempio l’uso di tag, in questo caso in grado anche di aiutare un eventuale algoritmo automatico) e/o di provvedere a catalogare “manualmente” il contenuto del web: non solo quello prodotto dagli utenti stessi, ma anche quello che non fosse stato eventualmente catalogato dall’autore. Il vantaggio principale di questo approccio sta nell’intelligenza umana, in grado di discernere tra contenuti di qualità differente, di marcarli adeguatamente (aggiungendo pertinentemente ai tag persino parole che non sono contenute all’interno del testo) ed infine di proporli propositivamente, magari tramite un sistema di votazione. Lo svantaggio, purtroppo, emerge sempre più chiaramente: se qualcosa costa fatica, saranno in pochi (pochissimi) a farla, mentre per catalogare l’enorme mole di informazioni che il web propone servirebbe una massa critica decisamente importante. Di sistemi che usano un approccio sociale all’organizzazione dei contenuti in rete ne troviamo molti, da Digg a Delicious, ma tutti si scontrano con il problema del necessario, ma “scarso”, intervento umano.

Come sappiamo però, la virtù sta nel mezzo ed ecco allora un interessante esperimento che cerca di trarre dai due approcci il meglio: Liquida.
Si tratta di un “valorizzatore di contenuti“, uno strumento che punta non solo a far emergere dal “mare magnum” della blogopalla (blogosfera, “blog” o “nuovi media” che dir si voglia) i contenuti di maggior valore, ma punta anche ad affermarsi come strumento facile da usare, in grado di essere utilizzato e sfruttato in tutte le sue potenzialità anche dagli utenti meno esperti (e qui è un po’ una lotta contro i mulini a vento, sigh).

Il funzionamento di Liquida è piuttosto semplice da descrivere (anche se tecnicamente è tutta un’altra cosa): utilizza una serie di spider che (tramite l’analisi semantica di una elaborata intelligenza artificiale) provvedono a “marcare” (applicare tag, parole chiave) i post presenti nei blog censiti. L’intelligenza artificiale stessa provvede ad una prima “scrematura” dei contenuti: vengono eliminati quelli troppo corti (come esprimere qualcosa di seriamente interessante in meno di 200 battute?) e quelli che presentano contenuti osceni o offensivi. Il servizio per il momento dovrebbe essere limitato ai post in lingua italiano, ma mi è capitato di trovarci dentro anche post in inglese, quindi su questo non metterei la mano sul fuoco.
Proprio questa parte di “scrematura” algoritmica è il cuore pulsante di Liquida: il motore semantico provvede in più passaggi ad analizzare vari fattori (dai classici “page rank” e “link in ingresso” all’analisi dei commenti ricevuti) in modo da valorizzare maggiormente i contenuti che rispecchiano tutti quegli aspetti tipici dei “post interessanti”. Inutile dire che qualcosa andrà inevitabilmente perso in questo processo di “macinazione”, ma il fatto che il motore sia stato appositamente tarato per questo compito (e non sia invece “adattato”, come accade per i più comuni motori di ricerca) rappresenta un punto di originalità.

E’ possibile navigare Liquida per tag, utilizzando il motore di ricerca integrato (ed in questo frangente si comporta sostanzialmente come un motore di ricerca), oppure appoggiandosi all’analisi dei “temi del giorno” che consente di proporre agli utenti gli articoli che affrontano gli argomenti di attualità.
La struttura a “portale” di Liquida, inoltre, dovrebbe consentire di guidare in modo intuitivo gli utenti che si avvicinano per la prima volta al mondo dei blog, composto al momento da oltre 6500 blog ed oltre 260.000 post, cifre di tutto rispetto.

Infine (ma non per importanza, anzi!), Liquida propone una versione originale e “redazionale” dei contenuti, il Magazine: i contenuti di maggior valore vengono quotidianamente raggruppati in articoli che ne riporta stralci ed opinioni, aggregati in un collage propositivo (eseguito da redattori in carne ed ossa, corretto e controllato come la tradizione giornalistica vuole). Il livello attuale del Magazine mi lascia onestamente ogni tanto perplesso, ma l’idea è buona e ci sono prospettive concrete di miglioramento.

Quello che a mio avviso manca ancora su Liquida è la parte “sociale” del sistema (anche se viene parzialmente introdotta in queste ore, purtroppo in una pagina dedicata e non direttamente in home page), che consenta di integrare gli algoritmi prettamente automatici (che soffrono, nonostante l’intelligenza artificiale, della classica “miopia da elettronica stupida”) aumentando così il valore dei contenuti proposti e/o suggeriti. D’altra parte proprio la mancanza (ma sarebbe forse lo stesso anche tramite l’assegnazione di un peso ridotto) è il fattore che consente di valorizzare anche i contenuti prodotti da autori meno “noti” dei soliti protagonisti…
Interessante e da sottolineare anche l’aspetto di “business” legato a Liquida, che nasce e si propone con un chiaro piano aziendale, forse uno dei primi legati all’analisi dei contenuti generati dagli utenti.

Nel complesso, Liquida è un progetto interessante (non dimentichiamo che è ancora in beta): nulla di innovativo (non sò ovviamente cosa ci sia “sotto la carrozzeria”), ma un utile strumento per districare ancora un po’ quella matassa che sono gli User Generated Contents, con buone prospettive per il futuro.

Advertisements

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...