Questa immagine che sembra un quadro astratto (concettuale, meglio) è in realtà la visualizzazione delle pagine di wikipedia editate dallo stesso bot. A colore diverso corrisponde una pagina diversa.
L’immagine è frutto delle elaborazioni di Fernanda B. Viégas, Martin Wattenberg, e Kate Hollenbach, il famoso gruppo di ricerca dell’IBM di software per la visualizzazione dei dati, autori del progetto Many Eyes (altro nome noto per chi bazzica tecnoetica).
L’immagine illustra lo special di Wired di luglio 2008 “The end of theory“, secondo cui la ricerca contemporanea, grazie a tecniche di datamining sofisticate si può permettere di non curarsi dell’uso di teorie scientifiche (avrò modo di tornarci con un post ad hoc).
La domanda metodologica è: perché un esperto di analisi quantitativa si interessa alle forme di rappresentazione di dati testuali?
Lo stesso Wattenberg risponde:
Language is one of the best data-compression mechanisms we have. The information contained in literature, or even email, encodes our identity as human beings. The entire literary canon may be smaller than what comes out of particle accelerators or models of the human brain, but the meaning coded into words can’t be measured in bytes. It’s deeply compressed. Twelve words from Voltaire can hold a lifetime of experience.
[infopusher: Wired webzine]
Più banalmente nel mio post sull'”affaire Anderson” ho utilizzato Wordle per la sintesi visuale. Cosa che ho notato va molto di moda nella blogosfera.
Ho letto il tuo post e sono rimasto colpito dalla tagcloud di wordle (ebbene si: anch’io ho usato/recensito il servizio).
Forse la questione della fine delle teorie che Anderson propugna è un po’ forzata, ma sicuramente la disponibilità di quantità impressionanti di dati e di potenze di calcolo sempre più spinte e sempre più a buon mercato, un effetto sulla ricerca scientifica ce l’hanno.
E’ per questo motivo che in questi mesi mi sto interessando al social media datamining (si dirà così poi?)