[SemanticWeb] DBpedia e il progetto Linked Data

Condivido con voi un articolo interessante su DBpedia, che potete leggere al seguente link: https://webwatching.eustema.it/dbpedia-il-cuore-del-web-semantico/

Su questo blog, ho già citato DBpedia all’interno dell’articolo:

————————–

[Articolo tratto da WebWatching Eustema]

DBpedia è attualmente uno dei più importanti progetti legati al Web semantico, di cui oggi parliamo proprio per capire come internet stia evolvendo verso una dimensione più intelligente, basata sui dati collegati tra loro in modo strutturato (“Linked Open Data“).

Il progetto DBpedia consiste nella trasposizione in dati strutturati di tutto l’enorme patrimonio di conoscenze di Wikipedia, in modo che tali dati siano collegabili ad altri insiemi di dati ed utilizzabili in modo automatico dalle applicazioni. DBpedia è considerata da Tim Berners Lee (l’inventore del Web) come una delle parti più importanti proprio del progetto Linked Data, basato su RDF, il formato standard del Web semantico.

In parole povere, il formato RDF permette di “dare senso” alle informazioni, suddividendole in unità minime (“statement”), dette “triple”, ciascuna definita da 3 elementi(soggetto – predicato – oggetto) che consentono di creare relazioni con altre informazioni. Il soggetto è una risorsa, il predicato è una proprietà e l’oggetto è un valore (e quindi anche il puntamento  ad un’altra risorsa). Un esempio di tripla è “Umberto_Eco” “è_autore_di” “Il_nome-della_rosa”.

Lo stato dell’arte di DBpedia è il seguente: a settembre 2011 (ultimi dati disponibili) comprendeva più di 3.64 milioni di elementi, 1.83 milioni dei quali classificati in un’ontologia consistente, incluse 416.,000 persone, 526.000 luoghi, 106.000 album musicali, 60.000 film, 17.500 videogiochi, 169.000 organizzazioni, 183.000 specie animali e 5.400 patologie. Il tutto in 97 lingue e con link a 6,2 milioni di link ad altri dataset. Questi ultimi comprendono, tra gli altri,  GeoNames (il database con oltre 10 milioni di nomi geografici), il Progetto Gutenberg (una biblioteca con i testi dei libri di pubblico dominio), Musicbrainz (enciclopedia della musica), il CIA World Fact Book, eccetera, oltre a numerosi dataset ontologici che consentono di creare correlazioni tra i vari domini di conoscenza. Tutto in licenza Creative Commons.

Anche in Italia, naturalmente, sta crescendo DBpedia, con oltre 1 milione di entità estratte da Wikipedia in lingua italiana e nell’ambito del progetto Linked Open Data Italia. Quest’ultimo comprende, per ora, qualche dataset di un certo rilievo, come Dati.camera.itMusei Italiani e Scuole Italiane.

Link utili su questo argomento

L’attuale “nuvola” dei Linked Open Data (clicca sul link per ingrandire)

2 pensieri su “[SemanticWeb] DBpedia e il progetto Linked Data

  1. Ciao Francesco,
    innanzitutto grazie per il post su DBpedia. Mi fa davvero piacere che si cominci a parlare di Linked Data con competenza e professionalità anche in Italia!

    Volevo soltanto fare una piccola precisazione rispetto a quanto dici riguardo a DBpedia Italiana e Linkedopendata.it, dato che sono coinvolto in entrambi i progetti.

    Forse sarebbe più corretto dire che anche in Italia sta crescendo la Linked Open Data Cloud, di cui la DBpedia Italiana è uno degli ultimi dataset che si è aggiunto, grazie al lavoro congiunto di SpazioDati srl e della Fondazione Bruno Kessler.

    Gli altri dataset che hai citato, pubblicati dall’associazione no-profit Linked Open Data Italia, sono solo alcuni dei dataset disponibili. Sul sito dell’associazione trovi una lista di dataset linked data di provenienza Italiana, pubblicati anche da terze parti.

    Tra i vari dataset linked italiani non dimenticherei quello della Camera dei Deputati con il l’ottimo progetto dati.camera.it, il portale linked data del CNR dati.cnr.it, il progetto LOIUS, nonché le prime iniziative di pubblicazione di dataset linked da parte di pubbliche amministrazioni locali come i alcuni dataset di Regione Piemonte, il geoportale semantico della Provincia Autonoma di Trento, il portale della Provincia di Carbonia-Iglesias, alcuni dataset del Comune di Firenze.

    Speriamo che presto se ne aggiungano molti altri!

    • Ciao Michele,
      ti ringrazio per il commento e per l’ottima precisazione, da cui prenderò spunto per scrivere altri post e studiare bene la situazione italiana sui linked open data.
      Sono compiaciuto del fatto che dopo anni che si parla di semantica, ora siamo finalmente sul punto di investirci su, anche qui in casa nostra.
      Il grosso ostacolo è creare una fitta base della conoscenza, che si sta ottenendo grazie alla collaborazione di più organismi, in primis gli organi dello Stato. Sperando che continuino ad investire in questa direzione, per arrivare alla definizione di questa knowledge base condivisa.

      Ti ringrazio ancora e ti auguro un buon lavoro!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *


4 − = uno