[Liferay&SemanticWeb] La semantica in Liferay con SKOS e Stanbol

Il giorno 11 Giugno 2012 si è tenuto all’Università di Tor Vergata il roadshow di Liferay e faccio qui una sintesi sugli argomenti trattati all’incontro, estratti dal materiale messo online sul portale della didattica di Tor Vergata:

[Materiale Didattico – Roadshow di Liferay – Università di Tor Vergata (Portale della Didattica)]

NOTA. Il materiale viene distribuito nel rispetto delle licenze Creative Commons e citando la fonte e gli autori.

Caratteristiche di Liferay Portal 6. Per quanto riguarda le caratteristiche di Liferay (versione 6), non volendo essere troppo prolissi, possiamo subito rispondere alla domanda sul perché conviene utilizzarlo. Innanzitutto perché è un progetto open-source, che consente un notevole risparmio in termini economici e tempi ristretti per l’installazione e la configurazione di una architettura Portal di tipo Enterprise.

Allo stato attuale, sono stati effettuati circa 6 milioni di download dei Liferay e il numero è destinato a crescere. Grazie ai connettori standard di cui Liferay è fornito, è possibile integrare il Portal con sorgenti esterne eterogenee, dai social network come (Facebook, Twitter e tanti altri che aderiscono allo standard Open Social) a sistemi legacy, repositories esterne e content store (tramite SOAP, Web Services, strumenti di Enterprise Integrations o servizi REST). Inoltre, può essere depiloyato sui maggior web containers diffusi nell’ambito J2EE (JBoss, Tomcat, ad esempio), si connette con i database più diffusi (come MySQL, PostGRESql, Oracle, ecc) e, grazie alla JVM, si può configurare su vari sistemi operativi.

Tra gli Enterprise Portal, secondo Gartner, Liferay si colloca al terzo posto con il 47%, dietro colossi commerciali come Oracle e Microsoft e collocato nel primo quadrante (Leaders e Visionaries) degli Horizontal Portal:  http://blogs.perficient.com/portals/2011/10/31/gartner-magic-quadrant-for-horizontal-portals-2011/

In Italia esistono già molti centri di competenza (localizzati prevalentemente al nord e qui a Roma), che creano quello che è detto Liferay Italian Partner Ecosystem.

Ma come meglio si adatta Liferay? Si può utilizzare per vari scopi:

  • piattaforma per la gestione di siti
  • sistema di gestione documentale
  • sistema per la gestione di contenuti web
  • piattaforma di produttività aziendale
  • piattaforma di sviluppo, integrazione e deploy

Inoltre, sono disponibili strumenti di social collaboration (per aumentare la produttività), che consentono ad un team di cooperare alla stesura di documenti condivisi, formare veri e proprio gruppi di progetto e condividere agevolmente documentazione e informazioni di lavoro.

Caratteristica importante è quella del supporto nativo migliorato per i dispositivi mobile, con un layout grafico che si adatta alle dimensioni dei dispositivi, tramite riconoscimento WURFL.

Altre caratteristiche avanzate di Liferay e nuove funzionalità introdutte nella versione 6, le potete leggere direttamente dalle slide del ROADSHOW. [ROADSHOW_LIFERAY_11062012 – Slides]

Continua la lettura

[SemanticWeb] Microformats: le pagine web acquistano significato

I Microformats permettono di inserire nelle pagine web i cosiddetti “smarter data” (informazioni “intelligenti”). In poche parole, non sono altro che semplici convenzioni per includere dati strutturati nelle pagine web ed arricchirle di informazioni (semantiche). Sono solo alcuni dei possibili semantic markup che hanno, appunto, lo scopo di inserire “conoscenza semantica” nelle nostre pagine. Nel panorama dei microformati ne esistono diversi e alcuni li utilizziamo quotidianamente mentre navighiamo o scriviamo articoli o post online. Alcuni di questi permettono di  ricavare le relazioni tra le persone dai blogrools (link “amici” nei nostri blog), commenti, coordinate ed altre info aggiuntive.

L’utilizzo dei microformats si è diffuso a tal punto che Google stessa dichiara che il 50% delle pagine su Internet contiene questi “semantic markup” e incoraggia a supportare l’iniziativa poiché i microformats migliorano e semplificano la ricerca dei contenuti. Ad esempio, Google appoggia e supporta il microformats hRecipe con l’iniziativa Rich Snippets.

Articoli interessanti su tale iniziativa sono i seguenti:

Rich snippets (microdati, microformati e RDFa) . Da quanto si legge qui, gli snippet, le poche righe di testo visualizzate sotto ogni risultato di ricerca (nei motori come Google), hanno lo scopo di dare agli utenti un’idea dei contenuti della pagina e del motivo per cui sono pertinenti alla query impostata.

Se Google comprende i contenuti delle pagine può creare rich snippet, vale a dire informazioni dettagliate utili per gli utenti che impostano query specifiche. Cioè questi rich snippet consentono agli utenti di capire se il sito è pertinente alla loro ricerca. Si aiuta Google a presentare queste informazioni pertinenti aggiungendo ulteriore codice di markup HTML nelle pagine. Questo codice di markup consente a Google di riconoscere determinati tipi di dati e di visualizzarli nei rich snippet quando opportuno.

Google consiglia di utilizzare i microdati, ma sono supportati tutti i tre formati che seguono. Non occorre conoscere già questi formati, è sufficiente una conoscenza di base del linguaggio HTML.

Esiste anche lo strumento di test dei rich snippet per assicurarsi che Google possa leggere ed estrarre i dati dai markup inseriti su una pagina: Rich Snippets Testing Tool

Nella tabella seguente vengono mostrati i microformati più popolari e le relative iniziative:


Un webservice online molto potente che ci aiuta a rinvenire e interagire con i microformati nelle pagine è microform.at, il quale prende in pasto una URL e rintraccia tutti i microformats presenti sulla pagina con relativo formato.

Facciamo un esempio: se sul sito microform.at inserisco come URL http://it.wikipedia.org/wiki/Calabritto, il webservice mi estrae tutti i microformati presenti nella pagina. In particolare, se scarico il formato KML (Keyhole Markup Language), un linguaggio basato su XML creato per gestire dati geospaziali in tre dimensioni, e lo importo su Google Earth, mi fa vedere su mappa i dati geospaziali acquisiti dalla URL inserita.

Vediamo alcuni microformats:

Friend of a Friend

FOAF (Friend of a Friend ) è una ontologia che descrive le relazioni tra le persone, le loro attività, ecc. Il principio di FOAF viene sfruttato da XFN (XHTML Friends Network) che lo ritroviamo, per esempio, nel plugin “blogroll” di WordPress, e  serve a descrivere le relazioni tra i siti, e relativi autori/proprietari, creando le relazioni tra le persone:

<a href="http://jane-blog.example.org/" rel="sweetheart date met">Jane</a>
<a href="http://dave-blog.example.org/" rel="friend met">Dave</a>
<a href="http://darryl-blog.example.org/" rel="friend met">Darryl</a>
<a href="http://www.metafilter.com/">MetaFilter</a>
<a href="http://james-blog.example.com/" rel="met">James Expert</a>

Per maggiori informazioni su XFN vedi: http://gmpg.org/xfn/intro

Un altro microformats particolarmente usato per inserire informazioni di geolocalizzazione in una pagina web è detto GEO. Si ispira alla omonima proprietà presente nel microformats vCard. Siti popolari, come Wikipedia e Yahoo!, utilizzano geo e altri microformats per esporre informazioni di geolocalizzazione.

<!-- The multiple class approach -->
<span style="display: none" class="geo">
  <span class="latitude">36.166</span>
  <span class="longitude">-86.784</span>
</span>

<!-- When used as one class, the separator must be a semicolon -->
<span style="display: none" class="geo">36.166; -86.784</span>

Altri microformats molto usati (specie da Google) sono quelli che riguardano l’inserimento di commenti, opinioni e recensioni, ricette con ingredienti  e istruzioni, come hRecipe e hReview. Il sito http://www.foodnetwork.com/  utilizza hRecipe e hReview per catalogare le ricette e le recensioni degli utenti.

Info su hRecipe: http://microformats.org/wiki/hrecipe

Info su hReview: http://microformats.org/wiki/hreview

Tra i microformats più famosi non possiamo non citare OpenGraph di Facebook, protocollo che consente a qualsiasi pagina web di diventare un oggetto presente in un grafo sociale.

Il grafo sociale ha lo scopo di rappresentare i legami tra le persone e le azioni che questi hanno con le risorse presenti tra loro e in rete. Il protocollo si attua mettendo nella pagina determinati tag e accedendo alle informazioni e ai dati correlati attraverso le API di Facebook.

 

Concludendo, i microformati, insieme ad altri semantic markup, sono ovunque nelle nostre pagine e permettono di ricostruire relazioni e collegamenti tra persone, risorse, contenuti sparsi sulla rete. Siamo ancora lontani da un processo di standardizzazione, che si spera arrivi con l’HTML5. Al momento navighiamo in un mare di tag che impregnano le nostre pagine web e che cercano di dargli un significato, vitali per l’interpretazione da parte dei software e per attuare quello che è definito machine learning.