Arquitectura Integrada de Gobierno

Wiki

Modelo de Referencia de Datos

Introducción

Los datos y la información generada a partir de ellos se reconocen como un activo empresarial de vital importancia. La información se convirtió en el principal generador de valor estratégico, siendo utilizada para responder a las necesidades de las organizaciones, ya sea para los procesos de negocio de las mismas como para la toma de decisiones.

Debido al gran crecimiento del volumen de datos que manejan las organizaciones, se hace cada vez más necesario una eficiente gestión de los mismos para poder dar respuesta a las necesidades del negocio.

El Modelo de Referencia de Datos (MRD), orienta a las entidades públicas a realizar una eficiente gestión de datos.

Principios específicos

Los principios específicos de datos se dividen en dos grandes conjuntos, por un lado los principios generales y por otro los asociados al ciclo de vida. Estos principios establecen las bases para una correcta gestión de datos.

Principios generales

Principio 1: Datos como activos

Los datos del sector público son un activo del Estado y deben ser exactos, consistentes, oportunos, accesibles, completos, auditables y trazables.

Principio 2: Responsabilidad de Datos

Los datos del sector público tendrán una entidad pública responsable de su gestión y custodia durante todo el ciclo de vida, el cual es asignado según sus cometidos.

Las entidades públicas que hagan uso de datos, deberán respetar el contenido, no alterar la integridad ni la consistencia e informar de cualquier anomalía detectada.

Principios asociados al ciclo de vida de los datos

Principio 3: Generación

Cada entidad pública genera (recolecta, produce, elabora) datos según sus cometidos. Los datos deberán ser generados atendiendo las definiciones de este documento, permitiendo su utilización por parte de otras entidades públicas.

Principio 4: Eficiencia

Cada entidad pública deberá recolectar y gestionar eficientemente los datos que estén bajo su responsabilidad; no debiendo recolectar datos que estén fuera de ella de acuerdo a lo establecido en el Principio 2: Responsabilidad de Datos.

Se deberá evitar la generación de datos producidos por otra entidad pública.

Principio 5: Calidad

La calidad de los datos es fundamental para el uso que se realice en una administración basada en datos. Los datos deberán ser exactos, oportunos y conformes con la realidad.

Las entidades públicas deberán implementar procedimientos de gestión de calidad de datos para asegurar su veracidad, integridad y consistencia.

Principio 6: Acceso a los datos

Los datos del sector público deberán estar disponibles para las personas salvo las restricciones que apliquen o se establezcan al respecto.

Las entidades públicas proveerán mecanismos que permitan a las personas físicas o jurídicas acceder a los datos que tiene referidos a su persona y los intercambios que se realicen sobre los mismos.

Principio 7: Compartir y Utilizar

Los datos deberán ser compartidos entre entidades públicas de forma tal que sean fáciles de (re)utilizar, entregar e intercambiar, cumpliendo con los estándares de datos, integración e intercambio que se establezcan para este fin.

Las entidades públicas no podrán poner condiciones financieras para el intercambio de datos entre ellas.

Los datos personales no podrán ser utilizados para finalidades distintas o incompatibles con aquellas que motivaron su recolección.

Se deberán explicitar las fuentes de los datos que se utilizan.

Principio 8: Datos abiertos

Los datos del sector público deberán ser abiertos por defecto.

Los principios vigentes de datos abiertos del Uruguay, se consideran parte integrante de este documento.

Principio 9: Protección de datos

Las entidades públicas deberán proteger los datos personales persiguiendo los siguientes principios:

  • Legalidad
  • Veracidad
  • Finalidad
  • Previo Consentimiento informado
  • Seguridad de los datos
  • Reserva
  • Responsabilidad

Los principios vigentes a la protección de datos personales del Uruguay, se consideran parte integrante de este documento.

Principio 10: Seguridad

Las entidades públicas deberán implementar procedimientos de gestión de datos, para proporcionar un nivel adecuado de confidencialidad, integridad, disponibilidad y autenticidad. Los lineamientos y normativa vigentes en relación a ciberseguridad del Uruguay que apliquen a la seguridad de los datos se consideran parte integrante de este documento.

Principio 11: Preservación

Los datos se deberán preservar y conservar adecuadamente para mantener su integridad y asegurar la continuidad de acceso (disponibilidad) durante el tiempo que sea necesario de acuerdo con la normativa vigente.

Cada entidad pública deberá preservar y conservar aquellos datos que estén bajo su responsabilidad de acuerdo a lo establecido en el Principio 2: Responsabilidad de Datos.

Modelo de Referencia

El Modelo de Referencia de Datos (MRD), identifica los componentes más relevantes para el desarrollo de una arquitectura de datos que permita una correcta gestión de éstos. El modelo se basa en los dominios definidos en el DMBOK (1) (Data Management Body of Knowledge) de DAMA Iternational, considerado referente en lo que respecta a la gestión de datos.

El modelo es aplicable tanto a nivel transversal del estado como en los distintos dominios que éste gobierna (conocidos como “verticales de negocio”), por ejemplo: Agro, Salud, Educación, etc.

Dentro del modelo se contemplan tres tipos de datos sobre los que se deben focalizar las entidades públicas para lograr una mayor eficiencia y control sobre los procesos y servicios que ofrecen. Estos datos son: los datos maestros, los datos referenciales (comúnmente llamados codigueras) y los datos personales.

Por otro lado, se incluye el componente de calidad de datos, que apunta a la medición, control y mantenimiento de procesos que aseguren los niveles de calidad establecidos según la finalidad, relevancia y los usuarios de los datos. En especial, para los tres tipos de datos mencionados.

Se incorpora el concepto de vocabularios, como un elemento semántico simplificado, reutilizable y extensible que define a una entidad de datos. Estos vocabularios se transforman en definiciones claves para la interoperabilidad y el análisis de datos tanto dentro de las verticales de negocio como entre ellas.

El componente de interoperabilidad abarca tanto la interoperabilidad técnica como la semántica, se debe trabajar en los mecanismos para que los diferentes sistemas accedan a los datos de las fuentes correctas y evitar así la duplicación de información.

Luego de tener un entendimiento común sobre los datos, característica que nos brinda la interoperabilidad semántica, se deben utilizar para realizar análisis que nos permitan obtener nueva información, mejorar los procesos internos y mejorar los servicios que se brindan a la sociedad. Con esta finalidad es que se incluye al MRD un componente de análisis de datos.

Alineados con el principio 8, se incluye el componente de Apertura de datos como forma de viabilizar el concepto de abierto por defecto y que cada organismo elabore los procesos necesarios para la apertura y publicación de datos abiertos.

Por último, se tiene de forma vertical en el modelo los componentes de Seguridad y Privacidad, Gobernanza y Principios. Estos componentes acompañan el ciclo de vida de los datos y son la base para una correcta gestión de datos.

La siguiente imagen ilustra el modelo de referencia de datos propuesto.

En los siguientes capítulos se describen los componentes del MRD.

Datos de Gobierno

Los datos de gobierno son todos los datos digitales que las entidades públicas tienen en su organización, ya sean generados y/o recolectados.

Se conforma el universo de datos de gobierno como los datos de las Empresas, datos de la Sociedad (o de las personas) y datos de gestión de Gobierno que el Estado posee.

En el MRD se destacan tres tipos de datos que por sus características son clave para obtener resultados en base a los datos. Estos datos son: los datos maestros, los datos referenciales y los datos personales. En las siguientes secciones se describen las principales características de cada uno.

Datos Maestros

Los datos maestros organizacionales son los datos que representan a las entidades claves del negocio, transversales a la organización, que brindan un contexto a las transacciones de negocio.

En base al DMBOK, generalmente se identifican datos maestros referentes a las siguientes áreas:

  • Datos maestros de las partes: Organizaciones, personas, ciudadanos, empleados, clientes, proveedores, etc. Dependiendo del contexto de la organización.
  • Datos maestros de finanzas: Presupuestos, balances, objetos de gasto, etc.
  • Datos maestros de producto: Información sobre el producto o servicio del negocio de la organización.
  • Datos maestros de ubicación: Establecen una relación entre datos geográficos y datos sociológicos que ayudan a una parte del proceso de negocio.

Además de la identificación de los datos maestros se debe realizar la traza de los mismos para identificar las bases de datos y archivos que contienen los datos originales así como determinar qué aplicaciones, unidades e incluso roles específicos crean y mantienen los datos. Es fundamental comprender las necesidades de las fuentes de datos origen y destino para poder especificar los criterios de calidad necesarios para estos datos.

Dentro del conjunto de entidades identificadas como datos maestros, se propone realizar la siguiente clasificación ya que cada uno requiere un tratamiento distinto:

Extensiones: Entidades que son extensiones o especializaciones de otras entidades más genéricas (por ejemplo: Paciente es una entidad especializada de la entidad Persona). En estos casos se deberán tomar como referencia los datos que tenga la organización responsable de la entidad genérica (Persona) y complementar con la información especializada que termina de definir la entidad del negocio de nuestra organización (Paciente).

De terceros: Entidades que si bien forman parte de los datos maestros de la organización no es su responsabilidad mantenerlos. En estos casos se deberá identificar la organización responsable de los datos y solicitar los servicios correspondientes para tener acceso a ellos.

Propios: Entidades que no son extensiones de ninguna otra entidad ni son de terceros. Son entidades de la organización y por lo tanto son los responsables de los datos y su mantenimiento. En este caso se deberán implementar servicios que permitan a otras entidades públicas tener acceso a ellos

En resumen, los datos maestros deben ser:

  • Identificados
  • Categorizados
  • Consolidados, para poder lograr una visión única.
  • Compartidos, mediante servicios disponibles tanto para los sistemas internos a la organización como para los externos.

Datos Referenciales (Codigueras)

Los datos referenciales comúnmente llamados codigueras definen un conjunto de valores posibles para un dominio. Estos datos son referenciados por otros dentro de los sistemas de la organización incluso por algunos datos maestros.

Existen distintos dominios en los que se definen datos referenciales, algunos más específicos e internos a la organización y otros más generales que pueden estar definidos por instituciones internacionales o gubernamentales.

Datos Personales

La ley 18.331 de protección de datos personales define a un dato personal como “información de cualquier tipo referida a personas físicas o jurídicas determinadas o determinables”.

El MRD destaca este tipo de datos para que las entidades públicas los identifiquen y así poder realizar una correcta gestión de ellos, en cumplimiento con la normativa vigente.

A su vez, se desea fortalecer la concepción de que los datos personales que son almacenados e intercambiados en el Estado son de las personas, por lo que las entidades públicas los deben tener identificados para permitir ejercer este  derecho.

Vocabularios

Los metadatos constituyen un elemento esencial para lograr un adecuado esquema de intercambio de información, ya que facilitan el entendimiento de la información al proporcionar la semántica adecuada para entender el dato.

Como parte de los metadatos de las entidades, se recomienda la definición de vocabularios que definen a la entidad. Estos vocabularios deben ser simples, reutilizables y extensibles.

Los vocabularios permiten unificar el significado de una entidad de datos y así lograr la interoperabilidad semántica entre sistemas.

Calidad de Datos

La calidad de datos toma un papel determinante tanto para el análisis como para el uso operativo de los mismos.

Cuando se habla en términos generales de la calidad de datos, comúnmente se  refiere a aspectos tales como adecuación al uso, que sean correctos o que sean exactos.

Sin embargo, la calidad de datos es un concepto multi-dimensiona y a que a su vez depende del contexto, de la finalidad del dato y del consumidor final de éstos.

Se deberán tener en cuenta estos aspectos a la hora de definir los niveles de calidad necesarios.

Interoperabilidad

Al establecer fuentes de datos únicas para los datos maestros y referenciales, es indispensable pensar en la interoperabilidad entre sistemas dentro y fuera de la organización. La interoperabilidad tanto técnica como semántica evita la duplicación de información y le permite a los sistemas (y organizaciones) contar con datos más confiables y exactos, por lo tanto, con datos de mayor calidad.

Se deben definir los modelos de datos (vocabularios) que utilizarán los sistemas para comunicarse para lograr la interoperabilidad semántica.

Apertura de Datos

Para lograr adoptar la cultura de “abierto por defecto”, los datos de las entidades públicas deberán considerarse como datos abiertos a no ser que apliquen restricciones normativas, tal como lo indica el principio 8 de datos abiertos.

La apertura de datos implica un cambio cultural en las organizaciones en cuanto a la transparencia de su gestión.

Se deben establecer procesos claros para la publicación y mantenimiento de estos conjuntos de datos.

Análisis de Datos

El MRD busca que las entidades públicas realicen la toma de decisiones, la formulación de políticas públicas y el diseño de servicios basados en datos. Para esto, es necesario realizar distintos tipos de análisis de datos, ya sea mediante métodos más tradicionales como la creación de datawarehouse, así como aplicando nuevas técnicas como el uso de inteligencia artificial (reconocimientos de voz, análisis de sentimientos, algoritmos predictivos, etc.).

El análisis es clave para identificar e interpretar los hechos ocurridos, las tendencias, las necesidades, los patrones y así poder tomar las decisiones correctas (basadas en evidencia) que permitan encausar los procesos, y en el mejor de los casos, predecir y anticiparse a los hechos.

Gobernanza

La gobernanza de datos debe poder definir:

  • ¿Quién puede leer, crear, actualizar y eliminar los datos?
  • ¿Qué validaciones se deben hacer sobre los datos?
  • ¿Qué aplicaciones son las preferidas o determinadas para el ingreso de los datos?
  • ¿Qué políticas de seguridad se aplican sobre los datos?
  • ¿Cómo se protegen los datos confidenciales?
  • ¿Qué prevenciones de recuperación de datos ante desastres son necesarias?

Estos son algunos de los puntos más importantes que se deben definir dentro de lo que se denomina gobernanza de datos.

Para poder contestar estas preguntas deben trabajar en conjunto líderes del área de TI y líderes del área de negocio para poder tener una visión de cada parte y lograr consensos en las políticas de gobernanza de datos.

Se recomienda la identificación y documentación de los procesos de gobernanza definidos para la gestión de los datos, principalmente de los datos maestros de la organización. La correcta difusión de los procesos y procedimientos definidos a los involucrados (p.e. comunicar procedimiento de cambio de contraseña de base de datos a el área operativa) es la clave para una exitosa gobernanza de datos.

La identificación de los flujos de datos (orígenes, destinos, etc.) es clave para garantizar los recursos de información, lo cual permite a las organizaciones la toma de decisiones en base a evidencias.

Principios

El componente de principios representa los 11 principios específicos propuestos en el MRD. Estos principios establecen las bases para la gestión de datos de las entidades públicas.

Seguridad  y Privacidad

Se tiene un marco normativo referente a la ciberseguridad y la protección de datos personales que se debe cumplir en las tareas de gestión de datos.

Las entidades públicas deben tomar los requerimientos de seguridad y privacidad desde el diseño. Esto implica, pensar de forma temprana las consideraciones necesarias para garantizarles a las personas que sus datos personales se encuentran bien custodiados, así como las necesidades de seguridad de los datos del negocio.

Pautas para el Desarrollo

En la siguiente sección podrá encontrar pautas para el desarrollo del modelo de referencia antes descrito:

Pautas para el desarrollo (MRD)

Glosario

Glosario (MRD)


NOTAS

(1) DAMA International es una Organización sin fines de lucro, cuya misión es fomentar la conciencia y la educación en lo que refiere a Gestión de Datos. DAMA elaboró una guía (DAMA-DMBOK) que cubre las funciones de gestión de datos, esta guía es actualizada mediante revisiones periódicas, en la medida que se desarrolla la industria y las nuevas perspectivas en la gestión de datos.

Child Pages (2)

  • Glosario (MRD)

    **Dato**: Es un conjunto de valores sobre algo concreto que pueden ser recolectados, medidos y analizados. **Información**: Es un conjunto de datos procesados y analizados en un determinado...

  • Pautas para el desarrollo (MRD)

    == Pautas para el Desarrollo (MRD ) == Las pautas para el desarrollo buscan aconsejar a las entidades públicas sobre cómo realizar algunas de las recomendaciones hechas en el modelo de referencia....