[OpenData&SemanticWeb] Cittadinanza attiva con i Linked Open Data

Grazie al commento all’articolo “[SemanticWeb] DBpedia e il progetto Linked Data” lasciatomi da Michele Barbera (di SpazioDati.eu), sto approfondendo il discorso dei Linked Open Data, e ho letto tre validi e dettagliati riferimenti:

Ho estrapolato alcune informazioni utili per capire l’ambito di applicazione e gli obiettivi del riutilizzo delle informazioni del settore pubblico.

NOTA. I contenuti riportati di seguito vengono elaborati e presentati nel rispetto delle licenze dei riferimenti su citati (nella fattispecie Creative Commons Attribuzione-Non commerciale)

L’obiettivo dei Linked Data è quello di rendere i dati realmente comprensibili ai cittadini tramite applicazioni software sviluppate ad hoc e vedremo cosa vuol dire propriamente questa definizione. Ma è un processo che si attua soltanto se si seguono delle linee guida che permettono alle tecnologie dell’informazione di comprendere i dati e i loro collegamenti, ovvero l’informazione libera deve essere machine readable (che definiremo tecnicamente più avanti) in modo da poter creare una fitta rete di collegamenti e dare un significato al dato stesso (linked data).

 

Da dove nasce? Tutto ha origine dalla dottrina “Open Government” promossa dall’amministrazione Obama (anno 2009), arrivando a coniare la definizione diOpen Government Data, che si sta diffondendo nei paesi industrializzati con l’obiettivo di ottenere l’accesso libero e proattivo ai dati di un ambito specifico: istituzioni politiche e pubblica amministrazione. La dottrina prevede l’apertura di governi e PA verso nuove forme di trasparenza e partecipazione (e collaborazione) dei cittadini alla “cosa pubblica”.
Ma in realtà, la filosofia dell’accesso libero all’informazione nasce già prima, dal movimento Open Source, da termini come copyleft, Web2.0 (e, quindi, social software).
Nel Web tradizionale, la natura della relazione tra documenti è implicita perché l’HyperText Markup Language (HTML) non è in grado di esprimerne la semantica: i collegamenti (link) tra documenti non esprimono il tipo di relazione che li lega.
Tim Berners-Lee, nella sua prima proposta presentata al CERN nel 1989, espresse la necessità di creare un ipertesto globale, dove le informazioni fossero tutte collegate tra di loro, ma dove la ricerca dei contenuti avesse come risultato i documenti che davvero corrispondevano alla esigenze di chi fa la ricerca. Tale ipertesto globale (web semantico) si può creare con un sistema di gestione dell’informazione a grafo, i cui nodi sono collegati da link ipertestuali “etichettati”, ossia con la descrizione del tipo di relazione che si stabilisce tra due nodi. Si passa dal “World Wide Web” visto come una rete di documenti ad una “rete di dati” (Web of Data), dove i dati stessi sono inseriti in un contesto e, dunque, arricchiti di semantica. Cosa ancora più importante è che lo scopo del Web Semantico è quello di dare vita ad una “ragnatela” di dati elaborabili dalle macchine (machine readable, appunto). Il Web Semantico (o web dei dati) è l’obiettivo finale e i linked data offrono i mezzi per raggiungerlo.

 

Filosofia dell’accesso libero all’informazione. I dati devono essere liberi da limitazioni tecnologiche e legali che ne impediscano il riuso, la modifica e la combinazione con altri dati, così da far accedere alle informazioni in maniera diretta e trasparente, per renderci cittadini più consapevoli e, dunque, più liberi.
Il movimento Open Government Data si concentra su un sottoinsieme particolare di dati, ossia Public Sector Information (PSI), ossia i dati delle pubbliche amministrazioni (come dati cartografici o del catasto, informazioni meteorologiche, codice di avviamento postale, banca dati dei tempi di percorrenza medi dei mezzi pubblici, ecc.). Le PSI non si riferiscono a nessun singolo individuo e perciò, se rese accessibili, non hanno alcuna implicazione per la privacy.
Grazie ad Internet e al conseguente social networking, si è dato vita a forme di partecipazione “spontanea” capaci di rendere i cittadini più interessati e attivi alla vita politica e sociale delle Comunità. Si parla di network civici e di democrazia elettronica: i cittadini possono conoscere gli atti pubblici in modo da poter intervenire in modo preparato alle decisioni del governo locale e di esercitare forme di voto per esprimere le proprie preferenze.
Nel 2008 il Consiglio d’Europa ha emanato la Convenzione sull’accesso ai documenti, in cui si stabilisce un diritto di accesso ai documenti ufficiali. Ecco una citazione di tale convenzione:

” La trasparenza delle autorità è uno degli elementi essenziali della buona governance e un indicatore che consente di verificare se una società è realmente democratica e pluralista, pronta a contrastare ogni forma di corruzione, in grado di criticare chi la governa e aperta alla partecipazione informata dei cittadini all’esame delle questioni di pubblico interesse. Il diritto di accesso ai documenti ufficiali è altresì essenziale perché i cittadini possano esercitare la propria autonomia e i propri diritti umani fondamentali. Rafforza inoltre la legittimità delle autorità agli occhi della popolazione e la fiducia dei cittadini nei loro confronti.”

 

A cosa servono i dati pubblici? Si fa qui riferimento al sondaggio proposto a novembre 2010 dal sito datagov.it che chiedeva di indicare i settori in cui fosse più utile, a parere dei partecipanti, avere a disposizione dati del settore pubblico. Le risposte hanno indicato la seguente gerarchia:

  1. bilanci delle pubbliche amministrazioni;
  2. attività dei parlamentari e dei consiglieri regionali, provinciali e comunali;
  3. inquinamento ambientale;
  4. dichiarazioni dei redditi;
  5. trasporti pubblici urbani e interurbani;
  6. epidemiologie sanitarie;
  7. criminalità;
  8. elettorali;
  9. distribuzione studenti e dispersione scolastica;
  10. mercato immobiliare.

 

Internet: mezzo di comunicazione tra cittadini e istituzioni e fornitore di servizi. Internet ha aumentato le opportunità di partecipazione, tra cittadini e tra le istituzioni (comunicazione orizzontale) e tra amministrazioni e cittadini (comunicazione verticale), oltre che significare per le pubbliche amministrazioni un modo per ridurre i costi della gestione amministrativa (e-Government).

Ma un modello “infruttoso” di e-Government serve solo a utilizzare Internet come bacheca elettronica in cui pubblicare informazioni, senza un reale sforzo verso la fornitura di servizi utili al cittadino e la possibilità di farlo interagire con le amministrazioni.
Vista la crisi economica e politica in atto, occorre adottare programmi di e-Government più intelligenti e orientati al passaggio da ICT a ICC (Information and Communication Technology Culture).

Apertura delle informazioni anche alle aziende. L’accesso aperto alle informazioni e ai dati (non sensibili) del settore pubblico deve essere fornito sia ai cittadini che alle aziende: le imprese, in questo modo, potranno utilizzare le risorse pubbliche fino a quel momento nascoste a fini commerciali (cioè per dare vita a nuovi servizi commerciali).

La raccolta dei dati delle PA, sottolineò Tim Berners-Lee, è finanziata con soldi che provengono dalle tasse dei cittadini. Per questa ragione, i cittadini hanno diritto a richiederne l’accesso e a poterne beneficiare direttamente. Più dati saranno liberamente disponibili, maggiori saranno gli effetti positivi per tutti, effetti che derivano dalla possibilità di confrontarli e combinarli.

 

Open Data: concetto indissolubile da Open Government. La Filosofia, che al tempo stesso è una pratica, dell’Open Data implica che alcune tipologie di dati siano liberamente accessibili a tutti, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione.
La Dichiarazione aperta sui servizi pubblici europei (promossa da cittadini e organizzazioni non governative nel 2009) è tra i primi tentativi di “casa nostra” di richiesta ai governi e alla Commissione Europea (che la accoglie nella Dichiarazione di Malmo) di includere i principi di trasparenza, partecipazione e collaborazione nel piano di e-Government, per garantire che i cittadini europei beneficino quanto prima dei vantaggi provenienti dall’adozione di questo modello. Ecco cosa si legge nella dichiarazione:

“Vogliamo che l’intero spettro di informazioni prodotte dalle amministrazioni, da un progetto di legge ai dati di bilancio, siano per i cittadini facilmente accessibili, comprensibili, riutilizzabili e “remixabili” con altro materiale. Questo non perché si voglia sminuire il ruolo delle amministrazioni, ma perché una collaborazione aperta potrà rendere migliori i servizi pubblici e darà maggior qualità al processo decisionale”

 

Come si legge nel libro bianco, il prezzo che già oggi paghiamo per l’assenza di strategia e di iniziative in merito alle informazioni del settore pubblico è enorme e destinato a crescere ulteriormente.
Le amministrazioni hanno investito un sacco di soldi in progetti di e-government, li stanno ancora investendo in servizi interattivi di government 2.0: cambio di etichetta a parte, perché dovremmo entusiasmarci per l’open government e l’open data?. Probabilmente, la risposta più convincente è: per il cambiamento di prospettiva. L’e-government si proponeva di generare miglioramenti per i cittadini tramite l’introduzione di strumenti digitali, spesso informatizzando i tradizionali schemi di interazione tra amministrazioni e cittadini. Il government 2.0 innova questo schema sottolineando il ruolo centrale dell’interazione coi cittadini/utenti e degli strumenti di social networking. L’open government, invece, riguarda meno la tecnologia (meglio: una specifica tecnologia) e molto di più il rapporto tra governanti e governati, amministratori e cittadini. In particolare, anziché focalizzarsi sull’offerta di specifici servizi, si mettono i cittadini in grado di capire e partecipare, dotandosi essi stessi di nuovi strumenti. Focalizzandoci sul tema open (government) data (che non coincide con l’open government, ma che ne è un aspetto caratterizzante), la rivoluzione copernicana sta nel fornire al cittadino non un nuovo mezzo tecnologico per accedere ai servizi pubblici, ma i dati necessari a supportare, affiancare o criticare l’operato dell’amministrazione pubblica stessa.

Freedom of Information Act. Se ne parlava già nel 1966: “Una democrazia richiede responsabilità, e la responsabilità richiede trasparenza“. Il Freedom of Information Act (FOIA) è l’espressione più importante di un profondo impegno nazionale per assicurare un’amministrazione aperta (appunto è l’Open Government).
Apertura che le agenzie devono garantire per informare i cittadini su che cosa è conosciuto e quello che viene fatto dalla loro amministrazione, usando le moderne tecnologie di informazione.

L’articolo 19 della Dichiarazione dei diritti dell’uomo dice: “Ogni individuo ha diritto alla libertà di opinione e di espressione incluso il diritto di non essere molestato per la propria opinione e quello di cercare, ricevere e diffondere informazioni e idee attraverso ogni mezzo e senza riguardo a frontiere“.

Le licenze per la distribuzione dei dati aperti. Si ha la spinta a pubblicare i dati statali con licenze aperte, come la Creative Commons (CC) e Open Data Commons (ODC).

Il primo e più importante requisito dei dati online è che siano pubblicati con una licenza aperta che ne consenta l’uso, il riuso, la distribuzione e la modifica. Un aspetto, questo, che il movimento Open Government Data antepone all’apertura del formato.

Ecco una panoramica sull’uso delle licenze Creative Commons da parte delle amministrazioni pubbliche nei diversi paesi: http://wiki.creativecommons.org/Government_use_of_Creative_Commons

Discende che i dati sono aperti solo se si applica una delle seguenti condizioni: sono automaticamente liberi da qualsiasi tipo di diritto di proprietà intellettuale (ovvero sono in “pubblico dominio” per legge); vengono messi a disposizione sotto licenze/liberatorie, che escludono qualsiasi limitazione (ovvero vengono posti contrattualmente in una situazione equivalente al pubblico dominio), come la licenza/liberatoria Creative Commons Zero (CC0); vengono licenziati a condizioni molto permissive, che richiedano solo l’attribuzione/citazione della fonte, per esempio tramite la licenza Creative Commons
Attribuzione (CC BY), la Italian Open Data License v. 2.0 (IOLD 2.0) o la licenza Open Data Commons Attribution (ODC BY); vengono licenziati sotto licenze permissive, ma con clausole share-alike, per esempio tramite la licenza Creative Commons Attribuzione Condividi-allo-stesso-modo (CC BY-SA) o Open Data Commons Open Database License (ODC OdbL). Le restrizioni di tipo “non-commerciale” non sono ammesse. Ovvero, se il riutilizzo commerciale è vietato, i dati non sono veramente aperti.

Negli USA, le informazioni e i contenuti generati del settore pubblico (a livello federale) ricadono automaticamente nel pubblico dominio e sono, dunque, liberamente riutilizzabili senza alcun vincolo e per legge. Questa è chiaramente la soluzione aperta per eccellenza, perché non richiede scelte ulteriori e si applica automaticamente a tutta la PSI.
Nel Regno Unito, è stata sviluppata una licenza ad hoc per l’informazione del settore pubblico, la Open Government Licence. Si tratta di una licenza che richiede la sola citazione dell’origine dei dati e che è esplicitamente compatibile con le licenze CC BY ed Open Data Commons Attribution (ODC BY). Con una scelta simile, in Nuova Zelanda, la licenza Creative Commons Attribuzione (CC BY) è stata scelta come soluzione di default. In pratica – in assenza di buone ragioni per fare altrimenti – la scelta ricade automaticamente su quella licenza.
In Italia, Regione Piemonte ha scelto CC0 (Creative Commons Zero) come propria licenza di default. Ad oggi, l’unica alternativa praticata è stata CC BY (Creative Commons Attribuzione), prescelta per alcuni dati cartografici

Sul Libro bianco per l’utilizzo dell’informazione pubblica (della EVPSI) si legge che lo scopo dei progetti open data è quello di “mettere a disposizione le informazioni relative al settore pubblico in modo trasparente, efficace e non discriminatorio, [come] fonte importante di crescita potenziale di servizi online innovativi”.

Un punto chiave, ad esempio, è che l’open data riguarda la messa a disposizione dei dati, perché altri possano riusarli. Open data, quindi, non significa spingere la pubblica amministrazione a sviluppare nuovi servizi a partire dai dati. Il servizio che la pubblica amministrazione deve sviluppare è “semplicemente” un modo pratico ed efficace per pubblicare i dati in proprio possesso (preceduto da un razionale processo per scegliere quali dati possano essere messi a disposizione di tutti e corredato da una chiara affermazione relativa al fatto che il riutilizzo dei dati è libero).

L’esperienza mostra che i cittadini riceveranno nuovi servizi, sia gratuiti che a pagamento; ma saranno i singoli sviluppatori, gli imprenditori, le aziende e la società civile a produrre questi servizi. E il processo di apertura dei dati avrà successo se la pubblica amministrazione potrà concentrarsi a far meglio le attività essenziali che è suo compito istituzionale svolgere.

Un aspetto da non trascurare riguarda anche la narrativa relativa ai dati: i dati non dovrebbero essere percepiti come una proprietà dell’ente, ma come un bene pubblico, un patrimonio dei cittadini. I dati sono veramente aperti se e solo se possono essere liberamente riutilizzati e ridistribuiti da chiunque, per qualunque fine. Il modo per garantire che essi restino un bene pubblico è renderli disponibili a tutti con le minime barriere possibili, in modo che chiunque abbia pari opportunità di riusarli. Se qualcuno fornirà un servizio che genera anche un profitto, meglio per lui, ma anche meglio per gli altri cittadini (che – se pagano il servizio – significa lo avranno trovato utile) e per lo Stato (che incamererà delle tasse su questo profitto e sull’indotto generato dal servizio).

E qualunque altro soggetto potrà accedere agli stessi dati per copiare il nuovo servizio, così creando una spinta competitiva verso ulteriori innovazioni (e/o costi più bassi per gli utenti). I dati devono essere disponibili in un formato comodo ed automaticamente leggibile e modificabile. E il riutilizzo non deve essere solo tecnicamente fattibile, ma anche chiaramente autorizzato dal punto di vista legale. Per questo, è bene associare ai dati delle licenze/liberatorie, che chiariscano in modo inequivocabile la libertà di riutilizzarli (e redistribuirli). Tra i vari errori da evitare, uno merita una (ulteriore) menzione speciale: no alle restrizioni “non-commerciali”. Se il riutilizzo commerciale è vietato, i dati non sono veramente aperti. Un divieto di riutilizzo commerciale, infatti, sterilizzerebbe la possibilità di molti tipi di riutilizzo creativo da parte di aziende e imprenditori e metterebbe in forse anche la maggior parte dei riusi (di per sé non commerciali) da parte delle community online (da Wikipedia a OpenStreetMap).

Cosa sono i dati nell’ambito dell’Open Data? Per i sostenitori del movimento Open Government Data, i dati sono una tipologia particolare di informazione o parti di informazione (immagini, audio, mappe, testi, ecc.) che:
a) sono strettamente collegate a fatti e non soggette a copyright
b) sono riproducibili senza ambiguità
c) sono parte di una informazione più ampia o di un sistema di conoscenze
d) hanno più valore se collocati in un contesto tramite collegamenti e se arricchiti da metadati
e) Possono essere archiviati in formati digitali e processati da applicazioni software per costruire nuovi dati e, a partire da essi, nuova conoscenza
Un’altra definizione di dato aperto viene data dalla Open Knowledge Definition: i dati aperti possono essere pubblicati a condizione che se ne permettano il riuso e la redistribuzione, con una licenza che non discrimini nessuno. I dati devono essere costantemente aggiornati e completi, anche in formato “grezzo”, ovvero non aggregati o trasformati.
I dati, quindi, sono “aperti” se in formato elettronico, disponibili in rete, se sono indipendenti dalla piattaforma e machine-readable, ossia le informazioni possono essere processate in automatico da un computer (con tecniche di screen scraping o data scraping). A seconda delle caratteristiche su citate, si preferisce un formato anziché un altro, come si evidenzia nella seguente tabella dove si capisce che formati proprietari come quelli Office-like, non garantiscono l’apertura dei dati.
Formati aperti, secondo la legge italiana. Le informazioni sui formati aperti sono consultabili all’indirizzo: www.digitpa.gov.it/formati-aperti. Secondo le Linee guida per i siti web della PA 2010, previste ai sensi della Direttiva 8/2009 del Ministro per la pubblica amministrazione e l’innovazione, è raccomandato l’uso dei seguenti formati aperti e standardizzati: HTML/XHTML per la pubblicazione di informazioni pubbliche su internet; PDF con marcatura (secondo standard ISO/IEC 32000-1:2008); XML per la realizzazione di database di pubblico accesso ai dati; ODF e OOXML per documenti di testo; PNG per le immagini; OGG per file audio; Theora per file video.
Il dato “grezzo” (definizione che arriva dalla celebre frase detta da Berners-Lee, ossia “RAW DATA NOW!”) acquista un valore solo se si ha la possibilità di poterlo riutilizzare: si ha un “valore esterno” quando si utilizza il dato per fornire servizi, accrescendo l’innovazione e lo sviluppo; si ha un “valore interno” se il riutilizzo del dato comporta un risparmio per le pubbliche amministrazioni.
Il modo più banale, ma anche uno dei più efficaci, per mettere a disposizione dei dati nell’era di Internet, è la semplice pubblicazione online, su un sito Web, di un file statico (eventualmente sotto forma di archivio compresso), il cui link sia chiaramente disponibile secondo lo standard HTTP.
Un altro modo è rappresentato da una Application Programming Interface (API), che renda le informazioni disponibili a richiesta, in maniera più o meno elaborata (ad esempio, permettendo di scaricare solo un certo sottoinsieme dei dati, che interessano all’utente in quel momento, o solo gli aggiornamenti degli ultimi 5 minuti, ecc.). Rendere i dati disponibili tramite un’API, laddove possibile, è utile poiché può facilitare la vita a chi voglia realizzare delle apps o mashups di vario tipo (specie se girano su un telefono
cellulare).
Malgrado i possibili vantaggi di un’API, il rilascio dei dati (anche) in blocco, in modo che siano facili da scaricare con un semplice link è sempre fondamentale, poiché assicura che tutti possano facilmente ottenere una copia dei dati e redistribuirla; rende facile ad altri sviluppare i propri servizi (ed eventualmente le loro API specifiche, oppure rappresentazioni degli stessi dati in altro formato, ecc.).

 

I Linked Data e il Web Semantico. L’espressione Linked Data venne introdotta dallo stesso padre di Internet, Tim Berners-Lee, nel 2006 e si riferisce ad un insieme di best practices che si basano su quattro principi generici. Per poter parlare di linked data occorre:
  1. usare gli URI (Uniform Resourse Identifier) per identificare gli oggetti (things) della rete dei dati
  2. usare URI preceduti da HTTP (cioè URL – Uniform Resource Locator), in modo che si possa accedere agli oggetti con il protocollo HTTP
  3. per la ricerca di un oggetto, si utilizzano standard come RDF e SPARQL, in modo da impostare query di ricerca mirate che restituiscano i dati davvero desiderati
  4. includere link ad altri URI, così da poter scoprire ulteriori oggetti (things), in modo da creare effettivamente una rete di dati
Questi principi fungono da linee guida per la pubblicazione e la connessione di dati strutturati sul web. Ecco dei riferimenti utili:
I Linked Data vengono, per definizione, espressi tramite il formato RDF (Resource Description Framework), un data model che definisce un “formalismo” per rappresentare i dati nel web semantico. Grazie al concetto di “tripla” in cui è possibile descrivere una informazione nella forma “soggetto-predicato-oggetto”, si viene a creare un grafo, i cui nodi (o risorse) sono identificate da un URI e in cui i collegamenti-link tra i nodi indicano le relazioni. I significati delle risorse e dei link sono descritti in ontologie, che definiscono la conoscenza che abbiamo di un dominio particolare tramite classi, relazioni tra classi e individui appartenenti alle classi.
Collegando le cose tra di loro potremo fare molta strada verso la creazione di una “comprensione comune”. La rete semantica funzionerà quando ci saremo messi d’accordo sui termini.
Linked Data Cloud. L’apertura dei dati è una scommessa sulla serendipità, ossia sulla possibilità che un’informazione e chi sa come usarla possano incontrarsi. Far sì che i dati siano collegati in molti modi diversi, indicizzati dai motori di ricerca (generalisti e specializzati sui dati pubblici) è un modo per aumentare le chance di questo incontro fortuito!
L’interconnessione tra dataset diversi, nate da iniziative di carattere governativo ma anche indipendente, ha portato nel giro di pochissimi anni alla creazione di una grande “nuvola” di collegamenti tra sorgenti dati differenti.

Le sorgenti di dati “linked” sono moltissime, il loro numero aumenta di giorno in giorno e così la quantità di dati che contengono. I dati provengono da provider pubblici e privati, e abbracciano i settori e i campi del sapere più disparati, spaziando dai dati governativi e statistici a quelli di enciclopedie come Wikipedia, dalle notizie e dai dati giornalistici ai dati sanitari, dai dati scientifici ai contenuti geografici.

Gli archi tra i nodi della nuvola di Linked Data indicano che esistono dei collegamenti tra dati che appartengono ai diversi insiemi. A ottobre 2007 la “linked data cloud” consisteva di oltre due miliardi di elementi, che erano collegati tra loro da più di due milioni di link. A maggio 2009 il numero di item aveva superato i quattro miliardi per arrivare un anno dopo, a settembre 2010, a sfiorare i 20 miliardi.

Ecco di seguito il grafo dei linked data, detto anche linked data cloud (aggiornato a settembre 2010):
Il nucleo (o hub) della cosiddetta “linked data cloud” è formato da DBpedia, che estrae RDF dalle pagine di Wikipedia, offrendo così URI e dati RDF su argomenti di ogni dominio.

Per navigare nei contenuti del linked open cloud vi sono vari programmi (Linked Data Browser, motori di ricerca, applicazioni per domini specifici). Esempi di browser Linked Data sono: Disco, Tabulator, Marbles. Un elenco di browser è disponibile alla pagina Linked Data di Wikipedia: http://en.wikipedia.org/wiki/Linked_Data#Browsers.

Un esempio di motore di ricerca Linked Data è il Semantic Web Search Engine (SWSE). Di recente, anche Google ha lanciato un progetto per navigare all’interno dei Linked Dataset: http://www.google.com/publicdata/homee ultimamente il Google Knowledge Graph.

Altro progetto interessante è Where can I live: http://www.where-can-i-live.com/londonproperty

 

Diagramma “5 Stars”. Per promuovere l’adozione dell’approccio Linked Data da parte delle amministrazioni pubbliche, il W3C ha pubblicato linee guida pensate per incoraggiare la pubblicazione di dati pubblici e per suggerire buone pratiche che le autorità pubbliche sono incoraggiate a seguire. In aggiunta a queste linee guida, di natura prevalente tecnica, Berners-Lee ha inoltre pubblicato un documento, di natura più divulgativa, in cui spiega perché le tecnologie Linked Data sono il modo migliore per rispondere alle tre esigenze per le quali i dati delle amministrazioni pubbliche sono messi on-line: accrescere la consapevolezza dei cittadini circa le funzioni del governo per favorire una maggiore assunzione di responsabilità; aggiungere preziose informazioni sul mondo; consentire alle amministrazioni, agli stati e al mondo intero di funzionare in modo più efficiente. Infine, nel 2010 ha emendato il documento Linked Data del 2006 inserendo apposite specifiche, dedicate ai detentori di dati pubblici, per semplificare la pubblicazione di Open Government Data sul web. Queste indicazioni sono sintetizzate nel diagramma “5 star”.

 

Inoltre, sempre Berners-Lee propone: “Ogni data set aperto (o anche i data set che non sono aperti ma che dovrebbero esserlo) possono essere registrati su ckan.net. I data set delle amministrazioni pubbliche, del regno Unito e degli Stati Uniti, dovrebbero essere registrati, rispettivamente, su data.gov.uk o data.gov. Mi aspetto che altri paesi sviluppino i propri registri”.

 

La privacy. La decisione di mettere a disposizione alcuni dati pubblici non deve (e non può, a norma di legge) mettere in discussione il diritto dei cittadini alla tutela dei loro dati personali: la normativa sul riutilizzo dei dati fa infatti completamente salva la normativa sui dati personali con particolare riferimento alle regole di sicurezza e misure minime previste dall’allegato B al Codice della Privacy a garanzia dei dati dei cittadini e delle imprese. Dunque, quando un data set contiene dei dati personali, è bene consultare un legale esperto di privacy per valutare, verificare e stabilire con apposito provvedimento interno quali dati presenti nelle banche dati siano conoscibili da chiunque e a quali condizioni, e quando si è in presenza di dati che rientrano tra i cosiddetti dati sensibili, l’ipotesi più plausibile è che l’accesso e il riutilizzo siano semplicemente possibilità da scartare. È quindi opportuno avere un’idea di quali dati siano considerati personali comuni e di quali, tra questi, siano considerati dati sensibili.

I dati sensibili sono quei dati personali che si riferiscono alla sfera più intima del soggetto, “idonei a rivelare l’origine razziale ed etnica, le convinzioni religiose, filosofiche o di altro genere, le opinioni politiche, l’adesione a partiti, sindacati, associazioni od organizzazioni a carattere religioso, filosofico, politico o sindacale, nonché i dati personali idonei a rivelare lo stato di salute e la vita sessuale”.

Una corretta informativa relativa alla privacy è un elemento essenziale del trattamento dei dati personali. Inoltre, la presenza di un’informativa chiara – e che prenda esplicitamente in considerazione il fatto che i dati saranno pubblicati su Internet e potenzialmente riutilizzati – può essere uno strumento prezioso per gli stessi riutilizzatori.

Interessanti progetti di Open Data. Mapumental è un’applicazione, in corso di sviluppo nel Regno Unito, che combina i dati, alcuni dei quali sono stati acquistati grazie a ingenti investimenti, provenienti da più fonti (dati catastali, servizio trasporto pubblico, geolocalizzazione, …) e che aiutano il cittadino a cercare casa, in base a diverse esigenze (posizione, servizi, tempi di percorrenza lavoro-casa, ecc.). Idem fa Mapnificent, nata in Germania ed estesa come servizio a tutto il mondo. OpenStreetMap fornisce le mappe del pianeta ad accesso aperto. Traveline è un servizio di trasporti pubblici nel Regno Unito.

Il caso italiano. Sul fac-simile di progetti promossi dai governi statunitense e brittanico, www.data.gov e www.data.gov.uk,anche l’Italia sta intraprendendo il medesimo percorso con la piattaforma www.dati.gov.it. Un altro catalogoistituzionale italiano esistente è dati.piemonte.it, il sito inaugurato dalla Regione Piemonte nel maggio del 2010: http://www.dati.piemonte.it/cose-il-riuso-dei-dati.html

Un elenco di data set italiani aggiornato è qui: http://it.ckan.net/

Il Centro NEXA su Internet e Società del Politecnico di Torino, oltre che per le sue attività accademiche, è attivo in questo campo come ente affiliato a Creative Commons internazionale. Open Knowledge Foundation Italia è un altro interlocutore potenziale, che tra l’altro gestisce, insieme con il Centro NEXA, CKAN Italia, il primo portale open data di community in Italia. A livello accademico, per il momento, i centri di competenza maggiori si trovano probabilmente in Piemonte (dove il progetto EVPSI coinvolge l’Università di Torino, il Centro NEXA, la Fondazione Rosselli e l’Università del Piemonte Orientale, mentre il Centro NEXA coordina LAPSI, in Toscana, dove la Scuola Superiore Sant’Anna e l’ITTIG del CNR hanno portato avanti ricerche e seminari sul tema e in Lombardia, dove sono attivi gruppi di lavoro su questi temi alle Università Bocconi e Bicocca. A livello di pubbliche amministrazioni, meritano specifica menzione il tavolo di lavoro regionale piemontese (formato da Regione Piemonte, CSI, Top-IX, Centro NEXA, CSP e Istituto Superiore Mario Boella) e i gruppi di lavoro che hanno dato vita ai portali open data dell’Emilia Romagna, del Veneto, della Provincia di Trento, della Lombardia e del Comune di Firenze, quest’ultimo anche in collaborazione con l’associazione Wikitalia.

Le già citate iniziative importanti avviate sul territorio piemontese nel campo della ricerca comprendono il progetto EVPSI (Extracting Value from PSI), che ha l’obiettivo di presentare linee guida che agevolino e incentivino l’accesso e il riuso della PSI, e il network tematico europeo LAPSI (Legal Aspects of PSI), che si occupa delle questioni legali legate all’accesso e al riuso della PSI in ambiente digitale.

Oltre ad Openparlamento (progetto di OpenPolis che dal 2008 monitora i lavori del parlamento europeo e le assenze dei parlamentari), un progetto grassroot nato su iniziativa di un gruppo di volontari è Linked Open Camera, che raccoglie i dati relativi ai contratti e alla previsione di spesa della Camera dei Deputati in formato Linked Data a partire dall’iniziativa della parlamentare Rita Bernardini, che ha raccolto e pubblicato i dati in formato aperto ma non “linked”. I promotori del progetto hanno “ripulito” i dati del bilancio della Camera pubblicati sul portale dei radicali e li hanno convertiti in formato Linked Data, che ne consente un uso automatico da parte di applicazioni software. I dati sono stati poi arricchiti di collegamenti.

Per maggiori informazioni, leggere: Anche in Italia il civil haking è possibile: Linked Open Camera (intervista a Michele Barberi)

Nel novembre 2010 è nato Spaghetti Open Data, un sito promosso e gestito da un gruppo di volontari per sensibilizzare e coinvolgere l’opinione pubblica italiana sul tema degli Open Data.

Ecco qui il Manifesto dell’OpenGovernment dell’Associazione italiana per l’OpenGovernment.

In altre Regioni sono in corso di approvazione, sotto forma di disegno o proposta di legge, prescrizioni normative sul tema degli open data: è il caso delle amministrazioni regionali di Lazio, Basilicata, Umbria, Lombardia, Sicilia, Puglia, Campania, e della Provincia di Trento. Una mappa aperta delle leggi regionali in materia di open data, a cura di Ernesto Belisario, è disponibile al seguente indirizzo: http://g.co/maps/xhz59

Questi sono soltanto alcuni dei progetti linked data di “casa nostra” e ci si sta muovendo nella direzione giusta, ovvero quella di incentivare iniziative di organismi statali. In merito a questa mia considerazione, vi rimando al sito http://www.datagov.it/ , dove si legge questo:

Sembrano passati secoli da quando abbiamo pensato al Manifesto, al Vademecum, e alle mille iniziative in giro per l’Italia a parlare di Open Data e di Open Government.

Ora le istituzioni si stanno muovendo e giocano alla pari con noi sul terreno del contest: http://www.appsforitaly.org/

Crescerà? Si fermerà? Maturerà? Non lo sappiamo, ma siamo certi che oggi è giusto dire che anche noi abbiamo contribuito, dentro e fuori le istituzioni, nei convegni, nei seminari, scrivendo e parlandone ovunque. Un po’ orgoglio non nuoce. […]

E’ una bella giornata e, forse, inizia la lenta road map verso il Governo 2.0. […]

http://www.datagov.it/2011/10/18/dati-gov-it/

Per quanto riguarda gli investimenti aziendali nell’ambito del big data in Italia, vi rimando all’articolo pubblicato sul Sole24Ore: Gli investimenti aziendali nei big data vengono ripagati. Ma in Italia il 93% ha ancora difficoltà nella gestione

4 pensieri su “[OpenData&SemanticWeb] Cittadinanza attiva con i Linked Open Data

  1. Ciao, complimenti per l’articolo l’ho trovato molto interessante e ben strutturato. Sto preparando la tesi su “Indici per i linked open data” e volevo chiederti se potei darmi qualche dritta, poichè per quanto riguarda gli “indici” non riesco a trovare molto.
    Grazie

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

AlphaOmega Captcha Classica  –  Enter Security Code
     
 


1 × tre =