[LinkedOpenData&Graph] Il Linked Open Data Graph in tempo reale

Ho trovato un interessante progettino su GitHub che utilizza Protovis, libreria JavaScript ed SVG per la web-native visualizations (vedete anche questo interessante studio, A Scalability Study of Web-Native Information Visualization). Questo progetto permette di visualizzare su un grafo tutta la rete dei LOD (Linked Open Data) aggiornata direttamente dal portale CKAN, diventato il punto di riferimento per la registrazione dei datasets “LOD-compliant”.

Il progetto è stato scritto da Ed Summer ed è disponibile a questo link: https://github.com/edsu/lod-graph

Una anteprima dei LOD attualmente disponibili nella rete CKAN, visualizzati sul grafo Protovis di Ed Summer, la potete vedere anche qui: http://inkdroid.org/lod-graph/

Linked Open Data Graph

Se vi volete divertire a generare il grafo sui vostri pc, basta scaricare il progetto da GitHub e lanciare il comando da terminale:

./ckan.py

Lo script Python si connette alle API REST di CKAN, scarica i dati ed aggiorna un file locale ckan.log in cui potrete vedere lo stato di avanzamento delle operazioni (ci mette un po’…). Quando la procedura è ultimata (“finished ckan load” sul log), lo script vi genera un file lod.js in locale, con il JSON contenente tutte le informazioni sui dataset LOD aggiornati (titolo, url, rating, ecc.). Basta aprire la pagina index.html per visualizzare il Linked Open Data Graph su browser.

 

Altri riferimenti utili:

I webinar di Dati.gov.it: due nuovi seminari online sui dati aperti

I webinar di Dati.gov.it: due nuovi seminari online sui dati aperti

Pubblicato il: Ven, 07/12/2012 – 18:15 su DataGov.it – (LINK)

Chiudiamo questo primo anno solare di attività con due nuovi webinar dedicati, come sempre, ai temi dell’open government e i dati governativi aperti. Nelle prossime due settimane avremo modo di approfondire: i formati più evoluti con cui le PA possono rilanciare il loto patrimonio informativo aperto; e quali saranno gli obblighi normativi a cui gli enti pubblici dovranno rispondere dal 1 gennaio 2013 in tema di trasparenza e opendata.

Come di consueto i seminari si svolgeranno di giovedì dalle 12.00 alle 13.30, sono gratuiti e aperti a tutti (fino ad esaurimento posti) e –  a seguito di ogni webinar – i materiali e le registrazioni saranno rese disponibili su Innovatori PA – Gruppo Dati aperti. Di seguito il programma dei prossimi due webinar:

  • 13/12/2012 – Linked open data nella pubblica amministrazione. Uno degli aspetti più importanti della pubblicazione dei dati aperti da parte di una PA risiede proprio nella qualità del dati, finalizzata soprattutto a rendere quegli stessi “appetibili” per un riutilizzo creativo da parte degli sviluppatori. Nel corso del seminario online vedremo quali sono le caratteristiche principali dei LOD e come una ente pubblico può organizzarsi per esporre i propri dati in formato linked.  Relatori: Silvia Mazzini (Regesta.exe) Ginaluca Vannuccini (Comune di Firenze)
  • 20/12/2013 –  Nuovi obblighi per la PA in tema di trasparenza e open data. Seminario on line si concentra sui nuovi obblighi di trasparenza e di pubblicazione dei dati della PA in vista dell’approvazione del decreto Crescita2.0, delle modifiche introdotte sul CAD e, contestualmente, approfondisce da un punto di vista operativo come gli enti pubblici possano intervenire per adeguarsi. Relatori: Ernesto Bellisario (Associazione Italiana per l’Open Government ) e Roberto Scano (IWA)

Iscriversi ai webinar

L’iscrizione ad uno o più webinar può essere effettuata compilando questo modulo online. Trenta minuti prima dell’orario di inizio verrà inviata un’email a tutti gli iscritti con le istruzioni per accedere al Webinar.

Come si partecipa

I Webinar si svolgono su una piattaforma per la formazione a distanza che permette la comunicazione in modalità sincrona, l’interazione tramite chat, la condivisione di documenti, la visualizzazione di slide.
Per partecipare è necessario disporre di un collegamento a Internet, un browser (Internet Explorer, Firefox o altro), una versione aggiornata di Adobe Flash Player e una cuffia. Per verificare che il proprio computer sia correttamente configurato per il collegamento alla piattaforma di collaborazione a distanza, prima del Webinar è possibile eseguire un rapido test di connessione. In caso di esito negativo della verifica, vengono fornite delle semplici istruzioni per risolvere gli eventuali problemi riscontrati.

Per informazioni

È possibile richiedere maggiori informazioni riguardo ai webinar sull’open data attraverso il form Scrivi alla redazione.

[BigData] Il Big Data Forum 2012 a Roma: le soluzioni ICT per un vantaggio competitivo

Il 21 Novembre scorso si è tenuta a Roma la 2° edizione del Big Data Forum, dallo slogan “Big Data Forum 2012: per fare chiarezza sul fenomeno dell’esplosione dei dati e scoprire le soluzioni ICT che consentono di trasformarlo in vantaggio competitivo“.

L’evento, pubblicizzato da ICT4Executive, con partner di eccezione come Microsoft, Oracle e Informatica Software, è stato condotto da relatori di riguardo, particolarmente distinti sia nel campo della ricerca ICT (in particolare, nella Business Intelligence), che in quello strategico aziendale.

Ho partecipato all’evento e vi riporto un resoconto dettagliato delle tematiche affrontate ed estrapolate dagli interventi dei relatori presenti.

 

La Big Data Analysis

Il moderatore Carlo Vercellis, responsabile dell’Osservatorio di Business Intelligence & Big Data Analytics e professore alla School Management del Politecnico di Milano, ha sottolineato che il BigData è un tema di attualità molto in voga nell’ultimo periodo, come il cloud computing del resto, ma che da fenomeno del momento deve trasformarsi in innovazione tecnologica, in grado di cambiare gli attuali schemi e paradigmi del modo di trattare le informazioni su Internet.
Come non citare lo slogan di Tim Berners-LeeROW DATA, NOW!“. Dati grezzi da trattare, che sono diventati (e diventeranno ancora) troppi e dai cui è difficile poter estrarre informazione. Un fenomeno di cui si vocifera particolarmente nell’ultimo periodo, visti gli impegni delle varie iniziative di Open Data e eGov, che “impongono” ai detentori illegittimi di dati (ndr. come pubbliche amministrazioni) di distribuire informazioni di proprietà dei cittadini.

 

I dati diventano “interessanti” solo se siamo capaci di estrarre da essi un contenuto utile, da trasformare in servizio per gli utenti finali.

 

Continua la lettura

L’Italia e i principi fondamentali di Internet: la Rete come strumento di democrazia

Finalmente, anche una Italia propositiva sulla promulgazione della “carta” dei principi fondamentali di Internet. E’ partita dal 18 settembre la Consultazione pubblica a cui vi invito a partecipare. Affrettatevi perché si chiuderà il giorno 1 novembre 2012

Il Ministero per l’Università e la ricerca vuole “arricchire e migliorare il documento che riassume la posizione italiana sui principi fondamentali di Internet” da portare all’Internet Governance Forum (IGF) di Baku. Tutti i cittadini possono contribuire al dibattito sui cinque temi tradizionali del Forum ri-etichettati per l’occasione: principi generali, cittadinanza in rete, consumatori e utenti della rete, produzione e circolazione dei contenuti e sicurezza in rete.

Ecco i link degli articoli tratti da LaRepubblica.it:

Vi allego l’estratto del documento ufficiale del MIUR, che potete scaricare anche da qui:

La posizione italiana sui principi fondamentali di Internet
Continua la lettura

[Liferay&SemanticWeb] La semantica in Liferay con SKOS e Stanbol

Il giorno 11 Giugno 2012 si è tenuto all’Università di Tor Vergata il roadshow di Liferay e faccio qui una sintesi sugli argomenti trattati all’incontro, estratti dal materiale messo online sul portale della didattica di Tor Vergata:

[Materiale Didattico – Roadshow di Liferay – Università di Tor Vergata (Portale della Didattica)]

NOTA. Il materiale viene distribuito nel rispetto delle licenze Creative Commons e citando la fonte e gli autori.

Caratteristiche di Liferay Portal 6. Per quanto riguarda le caratteristiche di Liferay (versione 6), non volendo essere troppo prolissi, possiamo subito rispondere alla domanda sul perché conviene utilizzarlo. Innanzitutto perché è un progetto open-source, che consente un notevole risparmio in termini economici e tempi ristretti per l’installazione e la configurazione di una architettura Portal di tipo Enterprise.

Allo stato attuale, sono stati effettuati circa 6 milioni di download dei Liferay e il numero è destinato a crescere. Grazie ai connettori standard di cui Liferay è fornito, è possibile integrare il Portal con sorgenti esterne eterogenee, dai social network come (Facebook, Twitter e tanti altri che aderiscono allo standard Open Social) a sistemi legacy, repositories esterne e content store (tramite SOAP, Web Services, strumenti di Enterprise Integrations o servizi REST). Inoltre, può essere depiloyato sui maggior web containers diffusi nell’ambito J2EE (JBoss, Tomcat, ad esempio), si connette con i database più diffusi (come MySQL, PostGRESql, Oracle, ecc) e, grazie alla JVM, si può configurare su vari sistemi operativi.

Tra gli Enterprise Portal, secondo Gartner, Liferay si colloca al terzo posto con il 47%, dietro colossi commerciali come Oracle e Microsoft e collocato nel primo quadrante (Leaders e Visionaries) degli Horizontal Portal:  http://blogs.perficient.com/portals/2011/10/31/gartner-magic-quadrant-for-horizontal-portals-2011/

In Italia esistono già molti centri di competenza (localizzati prevalentemente al nord e qui a Roma), che creano quello che è detto Liferay Italian Partner Ecosystem.

Ma come meglio si adatta Liferay? Si può utilizzare per vari scopi:

  • piattaforma per la gestione di siti
  • sistema di gestione documentale
  • sistema per la gestione di contenuti web
  • piattaforma di produttività aziendale
  • piattaforma di sviluppo, integrazione e deploy

Inoltre, sono disponibili strumenti di social collaboration (per aumentare la produttività), che consentono ad un team di cooperare alla stesura di documenti condivisi, formare veri e proprio gruppi di progetto e condividere agevolmente documentazione e informazioni di lavoro.

Caratteristica importante è quella del supporto nativo migliorato per i dispositivi mobile, con un layout grafico che si adatta alle dimensioni dei dispositivi, tramite riconoscimento WURFL.

Altre caratteristiche avanzate di Liferay e nuove funzionalità introdutte nella versione 6, le potete leggere direttamente dalle slide del ROADSHOW. [ROADSHOW_LIFERAY_11062012 – Slides]

Continua la lettura

[OpenData&SemanticWeb] Cittadinanza attiva con i Linked Open Data

Grazie al commento all’articolo “[SemanticWeb] DBpedia e il progetto Linked Data” lasciatomi da Michele Barbera (di SpazioDati.eu), sto approfondendo il discorso dei Linked Open Data, e ho letto tre validi e dettagliati riferimenti:

Ho estrapolato alcune informazioni utili per capire l’ambito di applicazione e gli obiettivi del riutilizzo delle informazioni del settore pubblico.

NOTA. I contenuti riportati di seguito vengono elaborati e presentati nel rispetto delle licenze dei riferimenti su citati (nella fattispecie Creative Commons Attribuzione-Non commerciale)

L’obiettivo dei Linked Data è quello di rendere i dati realmente comprensibili ai cittadini tramite applicazioni software sviluppate ad hoc e vedremo cosa vuol dire propriamente questa definizione. Ma è un processo che si attua soltanto se si seguono delle linee guida che permettono alle tecnologie dell’informazione di comprendere i dati e i loro collegamenti, ovvero l’informazione libera deve essere machine readable (che definiremo tecnicamente più avanti) in modo da poter creare una fitta rete di collegamenti e dare un significato al dato stesso (linked data).

 

Da dove nasce? Tutto ha origine dalla dottrina “Open Government” promossa dall’amministrazione Obama (anno 2009), arrivando a coniare la definizione diOpen Government Data, che si sta diffondendo nei paesi industrializzati con l’obiettivo di ottenere l’accesso libero e proattivo ai dati di un ambito specifico: istituzioni politiche e pubblica amministrazione. La dottrina prevede l’apertura di governi e PA verso nuove forme di trasparenza e partecipazione (e collaborazione) dei cittadini alla “cosa pubblica”.
Ma in realtà, la filosofia dell’accesso libero all’informazione nasce già prima, dal movimento Open Source, da termini come copyleft, Web2.0 (e, quindi, social software).
Nel Web tradizionale, la natura della relazione tra documenti è implicita perché l’HyperText Markup Language (HTML) non è in grado di esprimerne la semantica: i collegamenti (link) tra documenti non esprimono il tipo di relazione che li lega.
Tim Berners-Lee, nella sua prima proposta presentata al CERN nel 1989, espresse la necessità di creare un ipertesto globale, dove le informazioni fossero tutte collegate tra di loro, ma dove la ricerca dei contenuti avesse come risultato i documenti che davvero corrispondevano alla esigenze di chi fa la ricerca. Tale ipertesto globale (web semantico) si può creare con un sistema di gestione dell’informazione a grafo, i cui nodi sono collegati da link ipertestuali “etichettati”, ossia con la descrizione del tipo di relazione che si stabilisce tra due nodi. Si passa dal “World Wide Web” visto come una rete di documenti ad una “rete di dati” (Web of Data), dove i dati stessi sono inseriti in un contesto e, dunque, arricchiti di semantica. Cosa ancora più importante è che lo scopo del Web Semantico è quello di dare vita ad una “ragnatela” di dati elaborabili dalle macchine (machine readable, appunto). Il Web Semantico (o web dei dati) è l’obiettivo finale e i linked data offrono i mezzi per raggiungerlo.

 

[SemanticWeb] DBpedia e il progetto Linked Data

Condivido con voi un articolo interessante su DBpedia, che potete leggere al seguente link: https://webwatching.eustema.it/dbpedia-il-cuore-del-web-semantico/

Su questo blog, ho già citato DBpedia all’interno dell’articolo:

————————–

[Articolo tratto da WebWatching Eustema]

DBpedia è attualmente uno dei più importanti progetti legati al Web semantico, di cui oggi parliamo proprio per capire come internet stia evolvendo verso una dimensione più intelligente, basata sui dati collegati tra loro in modo strutturato (“Linked Open Data“).

Il progetto DBpedia consiste nella trasposizione in dati strutturati di tutto l’enorme patrimonio di conoscenze di Wikipedia, in modo che tali dati siano collegabili ad altri insiemi di dati ed utilizzabili in modo automatico dalle applicazioni. DBpedia è considerata da Tim Berners Lee (l’inventore del Web) come una delle parti più importanti proprio del progetto Linked Data, basato su RDF, il formato standard del Web semantico.

In parole povere, il formato RDF permette di “dare senso” alle informazioni, suddividendole in unità minime (“statement”), dette “triple”, ciascuna definita da 3 elementi(soggetto – predicato – oggetto) che consentono di creare relazioni con altre informazioni. Il soggetto è una risorsa, il predicato è una proprietà e l’oggetto è un valore (e quindi anche il puntamento  ad un’altra risorsa). Un esempio di tripla è “Umberto_Eco” “è_autore_di” “Il_nome-della_rosa”.

Lo stato dell’arte di DBpedia è il seguente: a settembre 2011 (ultimi dati disponibili) comprendeva più di 3.64 milioni di elementi, 1.83 milioni dei quali classificati in un’ontologia consistente, incluse 416.,000 persone, 526.000 luoghi, 106.000 album musicali, 60.000 film, 17.500 videogiochi, 169.000 organizzazioni, 183.000 specie animali e 5.400 patologie. Il tutto in 97 lingue e con link a 6,2 milioni di link ad altri dataset. Questi ultimi comprendono, tra gli altri,  GeoNames (il database con oltre 10 milioni di nomi geografici), il Progetto Gutenberg (una biblioteca con i testi dei libri di pubblico dominio), Musicbrainz (enciclopedia della musica), il CIA World Fact Book, eccetera, oltre a numerosi dataset ontologici che consentono di creare correlazioni tra i vari domini di conoscenza. Tutto in licenza Creative Commons.

Anche in Italia, naturalmente, sta crescendo DBpedia, con oltre 1 milione di entità estratte da Wikipedia in lingua italiana e nell’ambito del progetto Linked Open Data Italia. Quest’ultimo comprende, per ora, qualche dataset di un certo rilievo, come Dati.camera.itMusei Italiani e Scuole Italiane.

Link utili su questo argomento

L’attuale “nuvola” dei Linked Open Data (clicca sul link per ingrandire)