Internet MéxicoDatos abiertos, un mundo de posibilidades

Staff4 semanas atrás18916 min

¿Cuántas personas hay en cierta localidad? ¿Cuál es el ingreso per cápita en promedio? Las respuestas a preguntas como estas se pueden resolver con la ayuda de datos abiertos. 

¿Qué son los datos abiertos, quién puede acceder a ellos y para qué funcionan? La organización Social Tic elabora un texto sobre los datos abiertos con sus características e importancia en el ejercicio de la ciudadanía. 

Mucho se ha hablado de esta herramienta, ¿pero qué es? Los datos se consideran abiertos si pueden accederse, usarse, modificarse y compartirse libremente para cualquier propósito, estando sujetos a lo sumo a medidas que mantengan su autoría y apertura.

Para esto se requiere que los datos sean legalmente abiertos y técnicamente abiertos. Legalmente abiertos se refiere a que los datos estén en el dominio público o que tengan restricciones mínimas de uso. Técnicamente abiertos significa que los datos se publiquen en un formato que pueda ser leído por máquinas (machine readable) y de preferencia en un formato no propietario (formato abierto).

Además, existen 8 principios que deben tener: 

  • Los datos deben estar completos.

Deben reflejar la totalidad del tema y en el mayor detalle posible.

  • Los datos deben venir de la fuente primaria.

Deben obtenerse de la fuente primaria con el más alto nivel de detalle posible.

  • Los datos deben ser accesibles.

Deben estar disponibles para el mayor rango posible de usuarios y propósitos, sin que el usuario tenga que llenar formulario de registro para descargarlos.

  • Los datos deben ser oportunos y actualizados.

Deben de hacerse disponibles lo más pronto posible y mantener un ritmo de actualización que garantice su utilidad.

  • Los datos deben ser procesables por máquinas.

Deben de estar en un formato que permita ser procesados automáticamente.

  • Los datos no deben ser discriminatorios.

Deben estar disponibles para cualquier persona, sin requerir autenticaciones o registro de usuarios.

  • Los datos deben estar en un formato no propietario.

Deben de servirse en un formato en el que no haya ninguna entidad que tenga control exclusivo sobre el mismo. 

  • Los datos deben estar licenciados en forma abierta.

Deben de contar con términos de uso y licenciamiento abierto.

¿Cuál es la importancia de los datos abiertos? 

Al abrir datos, el gobierno garantiza la transparencia en las acciones que realiza, mejorando de esta manera la confianza de la ciudadanía, a través de diversos mecanismos de rendición de cuentas. Los datos, mediante el uso que le den los distintos grupos de usuarios (investigadores, desarrolladores y otros profesionales) logran tener un valor agregado al generar información que se puede apreciar de manera descriptiva o incluso generando información oculta que se puede revelar mediante el análisis estadístico. Un ejemplo de esto son las aplicaciones que se han desarrollado utilizando datos abiertos y que a la vez visualizan relaciones entre variables.

Los datos abiertos también ayudan a realizar una gestión con decisiones basadas en datos. Al tener que recopilar, organizar y distribuir los datos, las distintas instituciones involucradas deben de analizarlos tanto de forma retrospectiva como actual, haciendo posible la comparación y evaluación del efecto de distintas acciones realizadas. Estos también son una herramienta para la planificación, gestión y evaluación de políticas públicas y cualquier otra disposición de las autoridades.

Los estándares de datos abiertos 

Los estándares de datos abiertos son documentos que establecen requerimientos y especificaciones que deben de tener los conjuntos de datos para hacerse disponibles al público. Un objetivo importante de estos estándares es —a través de sentar bases comunes—, hacen compatibles los distintos conjuntos de datos y facilitar su identificación y análisis.

Comúnmente los estándares describen los datos de un tema en específico. Por ejemplo, existen estándares para datos de contrataciones públicas o para permisos de construcción, y cada uno posee definiciones y características específicas a su campo. Existen tres tipos de estándares abiertos: 

Estándares esquemáticos

Estos definen la estructura de los datos que se van a publicar. Incluyen, por ejemplo, nombres, descripciones, y tipos de datos de las columnas de las tablas. También pueden incluir relaciones entre distintas tablas.

Estándares semánticos

En este caso el estándar define la terminología y/o lenguaje de los datos que serán publicados. Un ejemplo de este tipo de estándar es el Data Catalog Vocabulary (DCAT), el cual es un vocabulario que tiene definiciones muy claras del significado de cada uno de sus componentes.

Estándares atómicos

Estos definen cómo se deben representar los elementos básicos de los datos en los casos en que haya confusión. Los estándares atómicos pueden definir valores específicos de los datos (cómo se deben de escribir las fechas, por ejemplo), así como también combinaciones de valores. Como muestra, según el estándar ISO8601, la fecha del 18 de octubre del 2018 a las 2 pm debería escribirse como: “2018-10-18T14:00”.1 En muchos casos los estándares para datos abiertos combinan distintos elementos de los tres tipos mencionados. Por ejemplo, el Open Data Standards Directory menciona que el Estándar de Permisos de Construcción (BLDS por sus siglas en inglés) recomienda publicar dentro del conjunto de datos un elemento llamado PermitClassMapped, este elemento debería de contener uno de dos valores: Residential o Non-Residential. Más adelante en el documento del estándar se define claramente qué significa cada uno de esos valores.

¿Cómo se evalúan los portales de datos abiertos?

Una metodología muy utilizada de cinco escalafones que evalúa y propone diferentes medidas que facilitan el acceso, distribución y análisis de los datos abiertos. La meta de las instituciones que publican datos abiertos es llegar a tener las cinco estrellas, pero en muchos casos, y dependiendo de las capacidades técnicas de las instituciones, esta meta se desarrollará través de un proceso que puede tomar tiempo.

Según este sistema, portales de datos abiertos se clasifican de la siguiente manera:

*Datos publicados en la web en cualquier formato y utilizando una licencia abierta.

**Datos publicados como datos estructurados (tabla de Excel, por ejemplo) en vez de archivos pdfs con tablas o documentos escaneados.

***Datos publicados en formatos no propietarios (csv en vez de Excel, por ejemplo). 

****Se utilizan identificadores de recursos uniformes (URIs – Uniform Resource Identifier) para los conjuntos de datos. De esta forma los usuarios pueden utilizar una ruta específica para acceder el set de datos requerido. 

*****Los datos están enlazados a otros datos, dándoles de esta manera mayor contexto.

El sitio de 5* Datos Abiertos ofrece un resumen de costos y beneficios de cada una de estas estrellas. 

 

Finalmente, los datos significan una manera de conocer respuestas sobre una administración gubernamental y son una manera de establecer conversaciones entre gobierno y gobernados. Esto se debe a que la apertura de datos equivale a una comunicación transparente que rompe el paradigma de un gobierno cerrado ante los ciudadanos. A la vez representa un aporte a la sociedad ya que ésta puede informarse y usar los datos como herramientas para juzgar y exigir. En el caso de México, se puede acceder a los datos abiertos provistos por el gobierno aquí. 

 

El texto completo se puede leer en Social Tic

Staff

¡Comenta!

Tu correo no será publicado. Los campos requeridos se encuentran marcados con un asterisco (*).

Artículos relacionados

Anycast para el DNS

Anycast para el DNS

6 días atrás
8 min 130
La música a través de la tecnología

La música a través de la tecnología

3 semanas atrás
15 min 167