Resumen Sobre Datos Abiertos
Resumen Sobre Datos Abiertos
Resumen Sobre Datos Abiertos
Esta información puede ser accedida en forma libre por los ciudadanos, sin
importar:
Para ser considerados “abiertos”, los datos deben ser reutilizables, lo que
significa que se pueden descargar en formatos abiertos y leer mediante software
(gratuito), y los usuarios tienen el derecho legal de reutilizarlos. Los beneficios
pueden ser significativos cuando los datos están ampliamente disponibles y fáciles
de usar, pueden ayudar a optimizar los servicios gubernamentales, estimular las
oportunidades económicas, fomentar la innovación, mejorar la seguridad pública y
reducir la pobreza.
Los datos abiertos son los componentes básicos del conocimiento abierto.
El conocimiento abierto es en lo que se convierten los datos abiertos cuando son
útiles, usables y utilizados.
1. Abrir por defecto: esto representa un cambio real en la forma en que opera
el gobierno y como interactúa con los ciudadanos. Por el momento, a menudo
tenemos que pedir a los funcionarios la información específica que queremos.
Open by default le da la vuelta a esto y dice que debería haber una presunción de
la publicación para todos. Los gobiernos deben justificar los datos que se
mantienen cerrados por ejemplo, por razones de seguridad o protección de datos.
Para que esto funcione, los ciudadanos también deben sentirse seguro de que los
datos abiertos no comprometerán su derecho a la privacidad.
2. Oportuno y completo: los datos abiertos solo son valiosos si siguen siendo
relevantes. Lograr que la información se publique de manera rápida y completa es
fundamental para su potencial de éxito. En la medida de lo posible, los gobiernos
deberían proporcionar datos en su forma original y sin modificar.
3. Accesible y utilizable: garantizar que los datos sean legibles por máquina y
fáciles de encontrar hará que los datos lleguen más lejos. Los portales son una
forma de lograr esto. Pero también es importante pensar en la experiencia de
usuario de quienes acceden a los datos, incluidos los formatos de archivo en los
que se proporciona la información. Los datos deben ser gratuitos, bajo una licencia
abierta, por ejemplo, las desarrolladas por Creative Commons.
4. Comparables e interoperables: los datos tienen un efecto multiplicador,
cuantos más conjuntos de datos de calidad tenga acceso y más fácil les resulte
comunicarse entre sí, más valor potencial podrá obtener de ellos. Los estándares
de datos comúnmente acordados juegan un papel crucial para que esto suceda.
5. Para mejorar la gobernanza y la participación ciudadana: los datos abiertos
tienen la capacidad de permitir que los ciudadanos (y otros en el gobierno) tengan
una mejor idea de lo que están haciendo los funcionarios y políticos. Esta
transparencia puede mejorar los servicios públicos y ayudar a que los gobiernos
rindan cuentas.
6. Por el desarrollo inclusivo y la innovación: finalmente, los datos abiertos
pueden ayudar a impulsar el desarrollo económico inclusivo. Por ejemplo, un
mayor acceso a los datos puede hacer que la agricultura sea más eficiente o
puede usarse para abordar el cambio climático. Por último, a menudo pensamos
en los datos abiertos solo para mejorar el desempeño del gobierno, pero existe
todo un universo de empresarios que ganan dinero gracias a los datos abiertos.
Paso 1: La forma más rápida y sencilla de hacer que los datos estén
disponibles en internet es publicar los datos en su forma original (por ejemplo, un
archivo XML de datos de encuestas de elecciones pasadas). Sin embargo, los
datos deben estar bien estructurados. La estructura permite que otros hagan un
uso automatizado de los datos con éxito. Los formatos o estructuras bien
conocidos incluyen XML, RDF, y CSV. Nota: Los formatos que solo permiten ver
los datos, en lugar de extraerlos (por ejemplo, imágenes de los datos), no son
útiles y deben evitarse.
Paso 2: Cree un catálogo en línea de los datos sin procesar (completo con
documentación) para que las personas puedan descubrir lo que se ha publicado.
Paso 3: Haga que los datos sean legibles tanto por humanos como por
maquinas:
Los datos abiertos dan poder real a las personas y deben ser legibles por
humanos y por máquinas.
1
Ejemplo: http://www.ine.gov.py/ Página inicio INE
Juan es funcionario del INE, entonces su URI sería: http://www.ine.gov.py/personas/juan
La página mencionada es un documento web. Cada documento web tiene su propia URI. Y un documento
web, no es lo mismo a un archivo.
b. Documento: Sin documentación, los datos no son muy útiles. Cuando sea
posible, debe usar estándares de la industria como los basados en XML 2/RDF3, ya
que tienden a autodocumentarse.
Cree una página web con una descripción en lenguaje sencillo del conjunto de
datos para ayudar a los motores de búsqueda a encontrar los datos, para que las
personas puedan usarlos. La descripción debe explicar cómo encontrar las
páginas y/o los archivos, y describir el contenido de los archivos. Como mínimo
documente el título, la descripción, la fecha de publicación y la fuente autorizada
de los datos. Use un lenguaje claro y enlace la información relacionada para
ayudar a poner los datos en contexto.
c. Enlace: el siguiente paso más allá de los datos sin procesar son los datos
totalmente vinculados. En otras palabras, los datos sin procesar solo se pueden
vincular, no hay vínculos de regreso, pero los datos vinculados contienen vínculos
a otros datos y documentación. Existe un espectro desde datos sin procesar hasta
datos completamente vinculados, y estándares como RDF que pueden ayudarlo a
vincular sus datos.
El uso de URI como se describe proporciona una red de datos rica y fácilmente
conectada que es más fácil de buscar y usar para el público. Sin embargo,
muchas bases de datos no crear URI, sino que utilizan identificadores únicos
derivados internamente. Para vincular estos datos a la web más grande,
5
eXtensible Stylesheet Language
Al realizar la publicación de un dato se debe tener en cuenta la audiencia a
quien va dirigida el dato o la información, éstas pueden ser:
1 Estrella: los datos están disponibles en internet bajo una licencia abierta
(open license). Aunque los datos sean de acceso público, en este nivel los
mismos no se encuentran en un formato estructurado, lo que dificulta su
uso, y, en particular, su procesamiento.
Estas publicaciones pueden ser imprimidas, almacenadas, modificadas y
los datos se pueden compartir de acuerdo a los términos de la licencia.
2 Estrellas: los datos están disponibles en un formato estructurado. Un
documento Excel es un ejemplo de conjunto de dato a este nivel. Aunque
los datos se encuentren publicados en un formato estructurado, la
dependencia fuerte de un formato propietario supone un obstáculo para su
uso.
Estas publicaciones son posibles de procesar los datos utilizando el
software propietario así como también exportarlos a otros formatos
estructurados.
3 Estrellas: los datos están disponibles en formatos no propietarios. Las
ventajas de los datos a este nivel van aumentando, ya que los datos son
posible procesarlas sin las limitaciones impuestas por el software
propietario.
Aunque la publicación sigue siendo relativamente simple, puede requerirse
el uso de plugins para la exportación a formatos abiertos.
4 Estrellas: los datos a este nivel están publicados en URI específicas, lo
cual permite hacer referencia a los mismos. Los datos pueden
referenciarse y guardarse como marcadores del navegador, y también
combinarse con otras fuentes, incluso utilizando herramientas ya
implementadas.
5 Estrellas: los datos a este nivel hacen referencia a datos pertenecientes
a otros conjuntos de datos a través de sus respectivas URI, brindando de
este modo contexto al conjunto de dato original. Con este nuevo nivel, es
posible aprender e incluso descubrir nuevos datos mediante la
combinación de conjunto de datos, los atributos y relaciones pueden
validarse automáticamente mediante la definición del esquema.
El descubrimiento de los datos es más simple, y los datos ganan valor
agregado al combinarse con otras fuentes.
6
SaaS: Software as a Service (Software como Servicio)
7. Swirrl (Remolino): es una plataforma de datos abiertos SaaS basada en la
nube construida sobre tecnologías de datos vinculados (como RDF y SPARQL )
diseñada para lograr el 100 % de cumplimiento con el modelo de datos abiertos de
5 estrellas . Swirrl, sin embargo, también hace que los datos estén disponibles a
través de estructuras más convencionales como CSV.
1. ArcGIS Open Data: es una plataforma SaaS basada en la nube donde los
usuarios pueden explorar datos espaciales y no espaciales en una interfaz
coherente, lo que permite la extracción de características específicas y la
descarga en múltiples formatos abiertos y API. Se incluye de forma gratuita con
ArcGIS Online, aprovecha los servicios de ArcGIS y se integra con cientos de
aplicaciones de código abierto para dispositivos móviles, web y de
escritorio. ArcGIS Open Data utiliza Koop , un motor ETL de código abierto que
transforma automáticamente los servicios web en formatos accesibles.
Plataformas: Características
Se puede instalar en cualquier servidor Linux.
Escrito en Python y JavaScript.
Diseñado para publicar y administrar datos.
Posee arquitectura modular.
CKAN
Componentes integrados como: Angular, NodeJS,
PostgreSQL, Solr.
Posee una valoración de los datos según el tipo de archivo y
publicación de la misma.
Está diseñada para ser compatible con características del
CKAN.
Sistema de administración basado en Drupal, escrito en PHP
en lugar de Python.
Drupal tiene su propia arquitectura modular.
DKAN
Posee módulos disponibles para descargar y también para
personalizarlas.
Existe una gran cantidad y comunidad de desarrolladores.
Cumple los requisitos de Open Data EE.UU.
Permite publicar formatos legibles por maquina incluyendo
JSON, XML, RDF y otros.
Gestión de usuarios, roles y privilegios a diferentes niveles.
Permite la importación de grandes conjunto de datos.
Incluye herramientas de visualización de datos de manera
gráfica y cartográfica.
Los usuarios finales pueden participar, comentar, calificar,
compartir o solicitar un conjunto de datos.
Fácil de personalizar la apariencia de la página web, colores,
estilos, logotipos, etc.
Se puede instalar en cualquier servidor Linux o Windows.
Sistema de catalogación de microdatos de código abierto
escrito en PHP.
Cumple los estándares de DDI y Dublin Core.
Presenta una interfaz más amigable al momento de registrar
los diccionarios en comparación a los anteriores, el ANDA
tiene la opción de cargar el diccionario sin necesidad de
realizar un alta o de refrescar la página con cada carga.
También puede importar grandes cantidades de conjunto de
ANDA
datos.
Se utiliza con el motor de Base de Datos MySQL.
Permite gestionar los usuarios, roles, privilegios y permisos
en diferentes niveles.
Permite publicar archivos de todo tipo legibles por maquina.
A diferencia de la CKAN, ésta no posee una valoración de
ningún tipo a los tipos de datos publicados.
Tampoco posee una visualización previa de los datos
publicados.