Grazie al commento all’articolo “[SemanticWeb] DBpedia e il progetto Linked Data” lasciatomi da Michele Barbera (di SpazioDati.eu), sto approfondendo il discorso dei Linked Open Data, e ho letto tre validi e dettagliati riferimenti:
- Stato trasparente: Linked Open Data e cittadinanza attiva (di Francesca Di Donato)
- Libro bianco per il riutilizzo dell’informazione del settore pubblico (EVPSI.org)
- OpenData Handbook (Open Knowledge Foundation project)
” La trasparenza delle autorità è uno degli elementi essenziali della buona governance e un indicatore che consente di verificare se una società è realmente democratica e pluralista, pronta a contrastare ogni forma di corruzione, in grado di criticare chi la governa e aperta alla partecipazione informata dei cittadini all’esame delle questioni di pubblico interesse. Il diritto di accesso ai documenti ufficiali è altresì essenziale perché i cittadini possano esercitare la propria autonomia e i propri diritti umani fondamentali. Rafforza inoltre la legittimità delle autorità agli occhi della popolazione e la fiducia dei cittadini nei loro confronti.”
A cosa servono i dati pubblici? Si fa qui riferimento al sondaggio proposto a novembre 2010 dal sito datagov.it che chiedeva di indicare i settori in cui fosse più utile, a parere dei partecipanti, avere a disposizione dati del settore pubblico. Le risposte hanno indicato la seguente gerarchia:
- bilanci delle pubbliche amministrazioni;
- attività dei parlamentari e dei consiglieri regionali, provinciali e comunali;
- inquinamento ambientale;
- dichiarazioni dei redditi;
- trasporti pubblici urbani e interurbani;
- epidemiologie sanitarie;
- criminalità;
- elettorali;
- distribuzione studenti e dispersione scolastica;
- mercato immobiliare.
La raccolta dei dati delle PA, sottolineò Tim Berners-Lee, è finanziata con soldi che provengono dalle tasse dei cittadini. Per questa ragione, i cittadini hanno diritto a richiederne l’accesso e a poterne beneficiare direttamente. Più dati saranno liberamente disponibili, maggiori saranno gli effetti positivi per tutti, effetti che derivano dalla possibilità di confrontarli e combinarli.

“Vogliamo che l’intero spettro di informazioni prodotte dalle amministrazioni, da un progetto di legge ai dati di bilancio, siano per i cittadini facilmente accessibili, comprensibili, riutilizzabili e “remixabili” con altro materiale. Questo non perché si voglia sminuire il ruolo delle amministrazioni, ma perché una collaborazione aperta potrà rendere migliori i servizi pubblici e darà maggior qualità al processo decisionale”
Le amministrazioni hanno investito un sacco di soldi in progetti di e-government, li stanno ancora investendo in servizi interattivi di government 2.0: cambio di etichetta a parte, perché dovremmo entusiasmarci per l’open government e l’open data?. Probabilmente, la risposta più convincente è: per il cambiamento di prospettiva. L’e-government si proponeva di generare miglioramenti per i cittadini tramite l’introduzione di strumenti digitali, spesso informatizzando i tradizionali schemi di interazione tra amministrazioni e cittadini. Il government 2.0 innova questo schema sottolineando il ruolo centrale dell’interazione coi cittadini/utenti e degli strumenti di social networking. L’open government, invece, riguarda meno la tecnologia (meglio: una specifica tecnologia) e molto di più il rapporto tra governanti e governati, amministratori e cittadini. In particolare, anziché focalizzarsi sull’offerta di specifici servizi, si mettono i cittadini in grado di capire e partecipare, dotandosi essi stessi di nuovi strumenti. Focalizzandoci sul tema open (government) data (che non coincide con l’open government, ma che ne è un aspetto caratterizzante), la rivoluzione copernicana sta nel fornire al cittadino non un nuovo mezzo tecnologico per accedere ai servizi pubblici, ma i dati necessari a supportare, affiancare o criticare l’operato dell’amministrazione pubblica stessa.
Il primo e più importante requisito dei dati online è che siano pubblicati con una licenza aperta che ne consenta l’uso, il riuso, la distribuzione e la modifica. Un aspetto, questo, che il movimento Open Government Data antepone all’apertura del formato.
Ecco una panoramica sull’uso delle licenze Creative Commons da parte delle amministrazioni pubbliche nei diversi paesi: http://wiki.creativecommons.org/Government_use_of_Creative_Commons
Discende che i dati sono aperti solo se si applica una delle seguenti condizioni: sono automaticamente liberi da qualsiasi tipo di diritto di proprietà intellettuale (ovvero sono in “pubblico dominio” per legge); vengono messi a disposizione sotto licenze/liberatorie, che escludono qualsiasi limitazione (ovvero vengono posti contrattualmente in una situazione equivalente al pubblico dominio), come la licenza/liberatoria Creative Commons Zero (CC0); vengono licenziati a condizioni molto permissive, che richiedano solo l’attribuzione/citazione della fonte, per esempio tramite la licenza Creative Commons
Attribuzione (CC BY), la Italian Open Data License v. 2.0 (IOLD 2.0) o la licenza Open Data Commons Attribution (ODC BY); vengono licenziati sotto licenze permissive, ma con clausole share-alike, per esempio tramite la licenza Creative Commons Attribuzione Condividi-allo-stesso-modo (CC BY-SA) o Open Data Commons Open Database License (ODC OdbL). Le restrizioni di tipo “non-commerciale” non sono ammesse. Ovvero, se il riutilizzo commerciale è vietato, i dati non sono veramente aperti.
Negli USA, le informazioni e i contenuti generati del settore pubblico (a livello federale) ricadono automaticamente nel pubblico dominio e sono, dunque, liberamente riutilizzabili senza alcun vincolo e per legge. Questa è chiaramente la soluzione aperta per eccellenza, perché non richiede scelte ulteriori e si applica automaticamente a tutta la PSI.
Nel Regno Unito, è stata sviluppata una licenza ad hoc per l’informazione del settore pubblico, la Open Government Licence. Si tratta di una licenza che richiede la sola citazione dell’origine dei dati e che è esplicitamente compatibile con le licenze CC BY ed Open Data Commons Attribution (ODC BY). Con una scelta simile, in Nuova Zelanda, la licenza Creative Commons Attribuzione (CC BY) è stata scelta come soluzione di default. In pratica – in assenza di buone ragioni per fare altrimenti – la scelta ricade automaticamente su quella licenza.
In Italia, Regione Piemonte ha scelto CC0 (Creative Commons Zero) come propria licenza di default. Ad oggi, l’unica alternativa praticata è stata CC BY (Creative Commons Attribuzione), prescelta per alcuni dati cartografici
Sul Libro bianco per l’utilizzo dell’informazione pubblica (della EVPSI) si legge che lo scopo dei progetti open data è quello di “mettere a disposizione le informazioni relative al settore pubblico in modo trasparente, efficace e non discriminatorio, [come] fonte importante di crescita potenziale di servizi online innovativi”.
Un punto chiave, ad esempio, è che l’open data riguarda la messa a disposizione dei dati, perché altri possano riusarli. Open data, quindi, non significa spingere la pubblica amministrazione a sviluppare nuovi servizi a partire dai dati. Il servizio che la pubblica amministrazione deve sviluppare è “semplicemente” un modo pratico ed efficace per pubblicare i dati in proprio possesso (preceduto da un razionale processo per scegliere quali dati possano essere messi a disposizione di tutti e corredato da una chiara affermazione relativa al fatto che il riutilizzo dei dati è libero).
L’esperienza mostra che i cittadini riceveranno nuovi servizi, sia gratuiti che a pagamento; ma saranno i singoli sviluppatori, gli imprenditori, le aziende e la società civile a produrre questi servizi. E il processo di apertura dei dati avrà successo se la pubblica amministrazione potrà concentrarsi a far meglio le attività essenziali che è suo compito istituzionale svolgere.
Un aspetto da non trascurare riguarda anche la narrativa relativa ai dati: i dati non dovrebbero essere percepiti come una proprietà dell’ente, ma come un bene pubblico, un patrimonio dei cittadini. I dati sono veramente aperti se e solo se possono essere liberamente riutilizzati e ridistribuiti da chiunque, per qualunque fine. Il modo per garantire che essi restino un bene pubblico è renderli disponibili a tutti con le minime barriere possibili, in modo che chiunque abbia pari opportunità di riusarli. Se qualcuno fornirà un servizio che genera anche un profitto, meglio per lui, ma anche meglio per gli altri cittadini (che – se pagano il servizio – significa lo avranno trovato utile) e per lo Stato (che incamererà delle tasse su questo profitto e sull’indotto generato dal servizio).
E qualunque altro soggetto potrà accedere agli stessi dati per copiare il nuovo servizio, così creando una spinta competitiva verso ulteriori innovazioni (e/o costi più bassi per gli utenti). I dati devono essere disponibili in un formato comodo ed automaticamente leggibile e modificabile. E il riutilizzo non deve essere solo tecnicamente fattibile, ma anche chiaramente autorizzato dal punto di vista legale. Per questo, è bene associare ai dati delle licenze/liberatorie, che chiariscano in modo inequivocabile la libertà di riutilizzarli (e redistribuirli). Tra i vari errori da evitare, uno merita una (ulteriore) menzione speciale: no alle restrizioni “non-commerciali”. Se il riutilizzo commerciale è vietato, i dati non sono veramente aperti. Un divieto di riutilizzo commerciale, infatti, sterilizzerebbe la possibilità di molti tipi di riutilizzo creativo da parte di aziende e imprenditori e metterebbe in forse anche la maggior parte dei riusi (di per sé non commerciali) da parte delle community online (da Wikipedia a OpenStreetMap).
Un altro modo è rappresentato da una Application Programming Interface (API), che renda le informazioni disponibili a richiesta, in maniera più o meno elaborata (ad esempio, permettendo di scaricare solo un certo sottoinsieme dei dati, che interessano all’utente in quel momento, o solo gli aggiornamenti degli ultimi 5 minuti, ecc.). Rendere i dati disponibili tramite un’API, laddove possibile, è utile poiché può facilitare la vita a chi voglia realizzare delle apps o mashups di vario tipo (specie se girano su un telefono
cellulare).
Malgrado i possibili vantaggi di un’API, il rilascio dei dati (anche) in blocco, in modo che siano facili da scaricare con un semplice link è sempre fondamentale, poiché assicura che tutti possano facilmente ottenere una copia dei dati e redistribuirla; rende facile ad altri sviluppare i propri servizi (ed eventualmente le loro API specifiche, oppure rappresentazioni degli stessi dati in altro formato, ecc.).
- usare gli URI (Uniform Resourse Identifier) per identificare gli oggetti (things) della rete dei dati
- usare URI preceduti da HTTP (cioè URL – Uniform Resource Locator), in modo che si possa accedere agli oggetti con il protocollo HTTP
- per la ricerca di un oggetto, si utilizzano standard come RDF e SPARQL, in modo da impostare query di ricerca mirate che restituiscano i dati davvero desiderati
- includere link ad altri URI, così da poter scoprire ulteriori oggetti (things), in modo da creare effettivamente una rete di dati
- Design Issues: Linked Data (di Tim Berners-Lee)
- How to publish linked data on the Web
- Linked data: evolving the Web into a Global Data Space
Le sorgenti di dati “linked” sono moltissime, il loro numero aumenta di giorno in giorno e così la quantità di dati che contengono. I dati provengono da provider pubblici e privati, e abbracciano i settori e i campi del sapere più disparati, spaziando dai dati governativi e statistici a quelli di enciclopedie come Wikipedia, dalle notizie e dai dati giornalistici ai dati sanitari, dai dati scientifici ai contenuti geografici.
Gli archi tra i nodi della nuvola di Linked Data indicano che esistono dei collegamenti tra dati che appartengono ai diversi insiemi. A ottobre 2007 la “linked data cloud” consisteva di oltre due miliardi di elementi, che erano collegati tra loro da più di due milioni di link. A maggio 2009 il numero di item aveva superato i quattro miliardi per arrivare un anno dopo, a settembre 2010, a sfiorare i 20 miliardi.
Per navigare nei contenuti del linked open cloud vi sono vari programmi (Linked Data Browser, motori di ricerca, applicazioni per domini specifici). Esempi di browser Linked Data sono: Disco, Tabulator, Marbles. Un elenco di browser è disponibile alla pagina Linked Data di Wikipedia: http://en.wikipedia.org/wiki/Linked_Data#Browsers.
Un esempio di motore di ricerca Linked Data è il Semantic Web Search Engine (SWSE). Di recente, anche Google ha lanciato un progetto per navigare all’interno dei Linked Dataset: http://www.google.com/publicdata/home, e ultimamente il Google Knowledge Graph.
Altro progetto interessante è Where can I live: http://www.where-can-i-live.com/londonproperty
La privacy. La decisione di mettere a disposizione alcuni dati pubblici non deve (e non può, a norma di legge) mettere in discussione il diritto dei cittadini alla tutela dei loro dati personali: la normativa sul riutilizzo dei dati fa infatti completamente salva la normativa sui dati personali con particolare riferimento alle regole di sicurezza e misure minime previste dall’allegato B al Codice della Privacy a garanzia dei dati dei cittadini e delle imprese. Dunque, quando un data set contiene dei dati personali, è bene consultare un legale esperto di privacy per valutare, verificare e stabilire con apposito provvedimento interno quali dati presenti nelle banche dati siano conoscibili da chiunque e a quali condizioni, e quando si è in presenza di dati che rientrano tra i cosiddetti dati sensibili, l’ipotesi più plausibile è che l’accesso e il riutilizzo siano semplicemente possibilità da scartare. È quindi opportuno avere un’idea di quali dati siano considerati personali comuni e di quali, tra questi, siano considerati dati sensibili.
I dati sensibili sono quei dati personali che si riferiscono alla sfera più intima del soggetto, “idonei a rivelare l’origine razziale ed etnica, le convinzioni religiose, filosofiche o di altro genere, le opinioni politiche, l’adesione a partiti, sindacati, associazioni od organizzazioni a carattere religioso, filosofico, politico o sindacale, nonché i dati personali idonei a rivelare lo stato di salute e la vita sessuale”.
Una corretta informativa relativa alla privacy è un elemento essenziale del trattamento dei dati personali. Inoltre, la presenza di un’informativa chiara – e che prenda esplicitamente in considerazione il fatto che i dati saranno pubblicati su Internet e potenzialmente riutilizzati – può essere uno strumento prezioso per gli stessi riutilizzatori.
Interessanti progetti di Open Data. Mapumental è un’applicazione, in corso di sviluppo nel Regno Unito, che combina i dati, alcuni dei quali sono stati acquistati grazie a ingenti investimenti, provenienti da più fonti (dati catastali, servizio trasporto pubblico, geolocalizzazione, …) e che aiutano il cittadino a cercare casa, in base a diverse esigenze (posizione, servizi, tempi di percorrenza lavoro-casa, ecc.). Idem fa Mapnificent, nata in Germania ed estesa come servizio a tutto il mondo. OpenStreetMap fornisce le mappe del pianeta ad accesso aperto. Traveline è un servizio di trasporti pubblici nel Regno Unito.
Il caso italiano. Sul fac-simile di progetti promossi dai governi statunitense e brittanico, www.data.gov e www.data.gov.uk,anche l’Italia sta intraprendendo il medesimo percorso con la piattaforma www.dati.gov.it. Un altro catalogoistituzionale italiano esistente è dati.piemonte.it, il sito inaugurato dalla Regione Piemonte nel maggio del 2010: http://www.dati.piemonte.it/cose-il-riuso-dei-dati.html
Un elenco di data set italiani aggiornato è qui: http://it.ckan.net/
Il Centro NEXA su Internet e Società del Politecnico di Torino, oltre che per le sue attività accademiche, è attivo in questo campo come ente affiliato a Creative Commons internazionale. Open Knowledge Foundation Italia è un altro interlocutore potenziale, che tra l’altro gestisce, insieme con il Centro NEXA, CKAN Italia, il primo portale open data di community in Italia. A livello accademico, per il momento, i centri di competenza maggiori si trovano probabilmente in Piemonte (dove il progetto EVPSI coinvolge l’Università di Torino, il Centro NEXA, la Fondazione Rosselli e l’Università del Piemonte Orientale, mentre il Centro NEXA coordina LAPSI, in Toscana, dove la Scuola Superiore Sant’Anna e l’ITTIG del CNR hanno portato avanti ricerche e seminari sul tema e in Lombardia, dove sono attivi gruppi di lavoro su questi temi alle Università Bocconi e Bicocca. A livello di pubbliche amministrazioni, meritano specifica menzione il tavolo di lavoro regionale piemontese (formato da Regione Piemonte, CSI, Top-IX, Centro NEXA, CSP e Istituto Superiore Mario Boella) e i gruppi di lavoro che hanno dato vita ai portali open data dell’Emilia Romagna, del Veneto, della Provincia di Trento, della Lombardia e del Comune di Firenze, quest’ultimo anche in collaborazione con l’associazione Wikitalia.
Le già citate iniziative importanti avviate sul territorio piemontese nel campo della ricerca comprendono il progetto EVPSI (Extracting Value from PSI), che ha l’obiettivo di presentare linee guida che agevolino e incentivino l’accesso e il riuso della PSI, e il network tematico europeo LAPSI (Legal Aspects of PSI), che si occupa delle questioni legali legate all’accesso e al riuso della PSI in ambiente digitale.
Oltre ad Openparlamento (progetto di OpenPolis che dal 2008 monitora i lavori del parlamento europeo e le assenze dei parlamentari), un progetto grassroot nato su iniziativa di un gruppo di volontari è Linked Open Camera, che raccoglie i dati relativi ai contratti e alla previsione di spesa della Camera dei Deputati in formato Linked Data a partire dall’iniziativa della parlamentare Rita Bernardini, che ha raccolto e pubblicato i dati in formato aperto ma non “linked”. I promotori del progetto hanno “ripulito” i dati del bilancio della Camera pubblicati sul portale dei radicali e li hanno convertiti in formato Linked Data, che ne consente un uso automatico da parte di applicazioni software. I dati sono stati poi arricchiti di collegamenti.
Per maggiori informazioni, leggere: Anche in Italia il civil haking è possibile: Linked Open Camera (intervista a Michele Barberi)
Nel novembre 2010 è nato Spaghetti Open Data, un sito promosso e gestito da un gruppo di volontari per sensibilizzare e coinvolgere l’opinione pubblica italiana sul tema degli Open Data.
Ecco qui il Manifesto dell’OpenGovernment dell’Associazione italiana per l’OpenGovernment.
In altre Regioni sono in corso di approvazione, sotto forma di disegno o proposta di legge, prescrizioni normative sul tema degli open data: è il caso delle amministrazioni regionali di Lazio, Basilicata, Umbria, Lombardia, Sicilia, Puglia, Campania, e della Provincia di Trento. Una mappa aperta delle leggi regionali in materia di open data, a cura di Ernesto Belisario, è disponibile al seguente indirizzo: http://g.co/maps/xhz59
Questi sono soltanto alcuni dei progetti linked data di “casa nostra” e ci si sta muovendo nella direzione giusta, ovvero quella di incentivare iniziative di organismi statali. In merito a questa mia considerazione, vi rimando al sito http://www.datagov.it/ , dove si legge questo:
Sembrano passati secoli da quando abbiamo pensato al Manifesto, al Vademecum, e alle mille iniziative in giro per l’Italia a parlare di Open Data e di Open Government.
Ora le istituzioni si stanno muovendo e giocano alla pari con noi sul terreno del contest: http://www.appsforitaly.org/
Crescerà? Si fermerà? Maturerà? Non lo sappiamo, ma siamo certi che oggi è giusto dire che anche noi abbiamo contribuito, dentro e fuori le istituzioni, nei convegni, nei seminari, scrivendo e parlandone ovunque. Un po’ orgoglio non nuoce. […]
E’ una bella giornata e, forse, inizia la lenta road map verso il Governo 2.0. […]
Per quanto riguarda gli investimenti aziendali nell’ambito del big data in Italia, vi rimando all’articolo pubblicato sul Sole24Ore: Gli investimenti aziendali nei big data vengono ripagati. Ma in Italia il 93% ha ancora difficoltà nella gestione

This work by Francesco Ficetola is licensed under a Creative Commons Attribution 4.0 International License.
Based on a work at www.francescoficetola.it.
Permissions beyond the scope of this license may be available at http://www.francescoficetola.it/2012/06/23/opendatasemanticweb-cittadinanza-attiva-con-i-linked-open-data/.
Pur seguendo l’argomento dal alcuni anni ho trovato l’esposzione del tema degli open e liked data, dell’open governement molto ben fatta.
In merito alla convenzione del Consiglio d’Europa purtroppo lo stato delle ratifiche che ne permetterebbero l’adozione è quella indicata in
http://www.conventions.coe.int/Treaty/Commun/ChercheSig.asp?NT=205&CM=1&DF=&CL=ITA.
Grazie mille Roberto. Ho visto la tabella delle ratifiche e lo stato è alquanto sconfortante 🙁
Ciao, complimenti per l’articolo l’ho trovato molto interessante e ben strutturato. Sto preparando la tesi su “Indici per i linked open data” e volevo chiederti se potei darmi qualche dritta, poichè per quanto riguarda gli “indici” non riesco a trovare molto.
Grazie
Ciao Dario,
grazie mille. Purtroppo il tema “indici” nell’ambito dei linked Open data non è molto approfondito e trovi ben poco.
Prova a documentarti su SchemEX, consultando la bibliografia dei seguenti due articoli:
– http://challenge.semanticweb.org/submissions2011/swc2011_submission_5.pdf
– http://www.slideshare.net/ascherp/lod-introschem-exoslov3-13951803
Io personalmente non possiedo materiale utile su questo argomento.
In bocca al lupo per la tua tesi e complimenti per l’argomento.
Ti posso chiedere una copia elettronica quando hai finito?
Ti ringrazio 😉