Fuentes de datos

Esta sección describe las fuentes de información utilizadas en la generación de El Viajero Linked Data. Hasta el momento, se consideran distintas fuentes de datos que pertenecen al Grupo Prisa, enriquecidas a partir de fuentes de datos externas.
Toda la información que se ha publicado es accesible a través de las plataformas de Prisa. No se ha publicado ningún tipo de información privada de los usuarios.

Información editorial

Las noticias se han facilitado de acuerdo a una variante del formato IPTC International Press Communications Council), llamado NITF (News Industry Text Format), y que también es usado por otras agencias creadoras de noticias como AFP , ANSA o AP Digital.
Los datos se separan de los metadatos en distintos tipos de ficheros: uno para la estructura de las noticias de la página, otro para el contenido de cada noticia, otro para los metadatos de las fuentes de la noticia (como imágenes o videos), y otro más para almacenar estadísticas varias acerca de la propia página (como número de visitas o fecha de la última visita).
En último lugar, algunas noticias tienen asociada la localización de la que hablan en un fichero aparte.

Blogs y Posts

Los blogs, posts y comentarios, por otra parte, son almacenados en tres bases de datos privadas, una con los metadatos acerca de los posts (como creador, número de comentarios, fecha de creación, etc.), otro con los metadatos sobre los blogs (título, cabecera, descripción, fecha, etc.) y otra con los comentarios de cada post.

Restaurantes y Hoteles

La información relativa a la Guía Santillana se almacena en una base de datos propia, en la que se guardan datos sobre restaurantes y hoteles españoles. Para cada uno de estos establecimientos se recogen datos sobre su identidad (nombre e identificación), localización (dirección postal, coordenadas geográficas y acceso), contacto (teléfono, fax, email y página Web), servicio (precios y días de cierre) y recomendaciones editoriales.

Enriquecimiento con fuentes externas

Hasta el momento se ha procedido a enriquecer las localizaciones disponibles con la geolocalización procedente de fuentes externas de la nube de Linked Data. Para la península, se ha usado GeoLinkedData(provincias, municipios y comunidades autónomas). En caso de que el recurso no hablara de la península o no se encontrase, se ha completado su posición con los datos de DBPedia.

Además, para enriquecer la información provista por la Guía Santillana, se ha obtenido información sobre otros restaurantes y hoteles, procedente del catálogo de datos publicado por la iniciativa Open Data Euskadi.

Proveedores


Grupo Prisa