Wikidata, nuovo progetto della Wikimedia Foundation (WMF) – che gestisce tra gli altri Wikipedia, Wikitionary, Wikiquote –, è stato lanciato ufficialmente in questi giorni.
Sulla pagina introduttiva di Wikidata viene fornita questa descrizione, che è anche una dichiarazione d’intenti: “Wikidata è un database secondario libero, collaborativo e multilingua per la raccolta di dati strutturati, che ha lo scopo di fornire supporto a Wikipedia, Wikimedia Commons, gli altri progetti Wikimedia e molto altro”.
Elemento chiave per comprendere le principali differenze tra Wikidata e Wikipedia sono i “dati strutturati”: sul portale non si troveranno file multimediali o articoli (come accade su Wikipedia), ma pacchetti di dati contenenti informazioni da analizzare. Trattandosi di “dati strutturati” le informazioni potranno essere caricate automaticamente in un gran numero di lingue (agevolando notevolmente l’aggiunta o l’ampliamento di articoli multilingua su Wikipedia) e potranno essere lette e modificate da esseri umani e dalle macchine.
Dalla dichiarazione iniziale di Wikidata emergono alcuni principi chiave del progetto:
libero: i dati vengono pubblicati con licenza libera e sono dunque riutilizzabili;
collaborativo: i dati vengono inseriti e gestiti dagli utenti stessi di Wikidata, come accade per Wikipedia;
multilingua: i dati inseriti in una lingua saranno immediatamente disponibili in tutte le altre lingue ed è possibile contribuire in qualsiasi lingua;
un database secondario: oltre ai dati, Wikidata registrerà anche la loro fonte, per sostenere la nozione di verificabilità;
raccolta di dati strutturati: la raccolta di dati in forma strutturata, ne permetterà il facile riutilizzo da parte dei progetti Wikimedia e di terzi, così come consentirà alle macchine di leggerli, getirli e processarli.
Insomma, un grande contenitore di Big Data rilasciati in maniera Open. Il principale intento è quello di sostenere Wikipedia, “rendendo più facile la gestione dei collegamenti fra versioni e delgi infobox, riducendo il cairco di lavoro relativo su Wikipedia e migliorandone la qualità”. Ma è ovvio che un tale bacino di dati potrà avere numerose altre funzioni, non ultima quella di dare un ulteriore impulso al tema caldo dei Big Data.
Il progetto, avviato da un gruppo di ricercatori di Wikimedia Deutschland nell’ottobre 2012, è stato finanziato con una donazione concessa dall’Allen Institute for Artificial Intelligence , dalla Gordon and Betty Moore Foundation e da Google Inc. , pari a 1,3 milioni di euro. Dopo le prime due fasi (inserimento dei link delle diverse versioni linguistiche di Wikipedia, per dar vita a un unico sistema centralizzato di gestione degli interlink , e inserimento dei dati riutilizzabili), ha da pochi giorni preso il via la terza fase, che mira a sviluppare la possibilità di creare liste e grafici automatici, a partire dai dati contenuti si Wikipedia.
Attualmente la pagina Wikidata de La Stampa si presenta così: un insieme di interlink che collegano alle diverse versioni linguistiche di Wikipedia dedicate a La Stampa. Non resta che attendere lo sviluppo delal terza fase.
Infine una curiosità: il logo originario riportava esclusivamente la scritta “data”, sotto il variopinto codice a barre, che codice a barre non è: si tratta in realtà della codifica in codice Morse della parola Wiki.