Arquitectura Integrada de Gobierno

Wiki

Modelo de Referencia de Datos

(Esta es una una versión archivada de esta página. (1.0), Ir a la última versión.)

Introducción

Los datos y la información generada a partir de ellos se reconocen como un activo empresarial de vital importancia.La información se convirtió en el principal generador de valor estratégico, siendo utilizada para responder a las necesidades de las organizaciones, ya sea para los procesos de negocio de las mismas como para la toma de decisiones.

Dado el crecimiento incremental del volumen de datos con que se cuenta, cada vez se hace más necesario la gestión de los mismos, para poder dar respuesta a las necesidades de negocio de las organizaciones.

El Modelo de Referencia de Datos (MRD), orienta a los Organismos de Gobierno, a realizar una eficiente Gestión de datos.

Principios específicos

  • Datos como activos: los datos del sector público son un activo publico. Los datos públicos recolectados deben ser exactos, consistentes, actuales, accesibles, completos y trazables.
  • Transparencia: la información es accesible a la ciudadanía dentro del marco legal vigente que establece que es un derecho de todas las personas, que se ejerce sin necesidad de justificar las razones por las que se solicita la información.
    Este principio específico está en consonancia con el Principio general de la Arquitectura de Gobierno PR3 “Acceso a la información”.
  • Intercambio: la información debería ser compartida de forma tal que sea fácil de(re)utilizarla, entregarla e intercambiarla y esto debería ser posible a través de múltiples canales.
    Este principio específico está en consonancia con el Principio general de la Arquitectura de Gobierno PR2 “Cooperación y cohesión”.
  • Datos abiertos: los datos abiertos del sector públicolos deben publicados bajo las pautas establecidas en la licencia de datos abiertos de Uruguay.

Modelo de Referencia

El modelo de referencia de Datos (MRD), identifica los componentes más relevantes para el desarrollo de una arquitectura de datos.

Categorización de los datos

La categorización de los datos consiste en la identificación de dominios de datos (Salud, Identificación, etc) y asignación de términos descriptivos a los datos registrados, dominios y términos le dan contexto al dato y lo transforman en información.

Para la categorización de los datos se puede utilizar la respuesta a las siguientes interrogantes:

  • ¿Cuáles son los datos (entidades) involucrados en los procesos de negocio de la organización y a que dominio o área corresponden?; y
  • ¿Qué organización(es) es(son) responsable(s) del mantenimiento de dichos datos?. ¿Corresponden al negocio de la organización?

La categorización cumple un rol fundamental en en el cumplimiento del principio de la Arquitectura de Gobierno “Cooperación y cohesión” [PR2] al permitir tanto el descubrimiento de datos como la identificación de la replicación de su registro.

El propósito de esta área de estandarización es incentivar a que los organismos clasifiquen sus datos. Una vez compartidos los registros de datos, estas categorizaciones se convierten en vehículos para el descubrimiento de los datos que ofrecen un valor para el intercambio de los mismos.

Gestión de Datos

En la gestión de datos se propone identificar algunas de las áreas de conocimiento para gestionar los datos. Estas áreas están basadas en el DMBOK (Data Management Body of Knowledge), considerado referente en lo que respecta a la Gestión de datos, que constituye un conjunto de procesos y buenas prácticas en la materia.

  • Gobernanza de Datos: Identifica el conocimiento que tiene la organización sobre sus datos/información, determinando de donde provienen los datos, qué se sabe de los mismos, están alineados con los objetivos de la organización?
  • Arquitectura de Datos: Identifica los procesos, sistemas y operativa necesaria para almacenar, acceder, mover y organizar los datos.
  • Seguridad de Datos: Identifica las políticas de protección de datos y autorización para utilizarlos. En general, aplica a aquellos que son considerados un activo que tiene un valor y que requiere una protección adecuada, por ejemplo, contra la pérdida de disponibilidad, confidencialidad e integridad.
  • Interoperabilidad e Integración de Datos: políticas y estándares para el intercambio de los datos y la información.
  • Master Data: Identifica los datos maestros, que son datos transversales a toda la organización, que describen las entidades de negocio, por lo general compartidos por los diferentes sistemas de información de la organización.
  • Analitica y Big Data: Procesos de analisis de datos de la organización e identificación de fuentes externas de datos.
  • Metadata: Formatos estructurados que existan en la organización para representación de los datos.
  • Calidad de Datos: grado en el que los datos satisfacen al negocio, integridad y cumplimiento de la normativa.

Pautas para el Desarrollo

Gobernanza de Datos

Se recomienda la identificación y documentación de los procesos de gobernanza definidos para la gestión de los datos, principalmente de los datos core de la organización. La correcta difusión de los procesos y procedimientos definidos a los involucrados (p.e. comunicar procedimiento de cambio de contraseña de base de datos a el área operativa) es la clave para una exitosa gobernanza de datos.

La identificación de los flujos de datos (orígenes, destinos, etc) es clave para garantizar los recursos de información, lo cual permite a las organizaciones la toma de decisiones en base a evidencias.

Arquitectura de Datos

Se recomienda para el desarrollo de la arquitectura de datos desarrollar los siguientes elementos:

  • Entidades y Vocabularios
  • Principios que rigen los datos en la organización
  • Mapa conceptual
  • Ciclo de vida de los datos
  • Diagrama logico de datos, etc

La arquitectura de datos puede comprender:

  • Entender las necesidades de información de la organización, para poder desarrollar y mantener el modelo de datos;
  • Definir y mantener la arquitectura de Base de Datos;
  • Definir y mantener la arquitectura de Integración de Datos;
  • Definir y mantener la arquitectura de Big Data y Analítica;
  • Definir y mantener la arquitectura de Metadatos.

Seguridad de Datos

Con el fin de obtener una eficaz Seguridad de Datos deben realizarse las siguientes actividades:

  • planificar y ejecutar políticas y procedimientos para garantizar la seguridad de los datos confidenciales y personales, mitigando los riesgos de la divulgación no autorizada de los mismos, de tal forma de cumplir con la normativa vigente a este respecto;
  • brindar la debida autenticación, autorización y auditoría de los datos y de la información.

Cumpliendo con dichas actividades las tareas que deben realizarse son:

  • Definir las políticas y los estándares de seguridad de datos;
  • Definir controles y procedimientos de seguridad de datos;
  • Hacer seguimiento a la autenticación de usuario y comportamiento de acceso;
  • Clasificar la confidencialidad de la información;
  • Auditar la seguridad de los datos.

Interoperabilidad e Integración de Datos

Se recomienda identificar, documentar y difundir los estándares y politicas asociadas al intercambio de datos.

Se recomienda definir los  modelos de datos intercambiables, definir modelos para la interoperabilidad entre sistemas, por ejemplo definiendo una plataforma de interoperabilidad en la organización que permita el intercambio seguro y confiable de los datos entre los distintos sistemas.

Se recomienda la alineación de estándares y políticas de intercambio a las definidas por AGESIC en su normativa vigente.

Se recomienda el uso de arquitecturas SOA, microservicios, y el uso de patrones de arquitectura estándar para la interoperabilidad de los sistemas.

Master Data

Se recomienda la identificación de los datos core y la generación de una base de datos corporativa para el matenimiento y la gestión de dichos datos.

Los datos maestros requieren:

  • ser consolidados, para poder lograr una única visión de los datos;
  • ser gobernados como cualquier otro dato;
  • ser compartidos como servicio para conectarse con las aplicaciones operativas, los procesos de la función pública, y los sistemas analíticos

Metadata

Constituyen un elemento esencial para lograr un adecuado esquema de intercambio de información. Facilitan el entendimiento de la información al proporcionar la semántica adecuada para entender el dato.

AGESIC ha desarrollado algunos metadatos referentes a entidades comunes, Modelo de Referencia de Metadatos Comunes (MRMC):

Modelo DescripciónReferencia
PersonaEste modelo busca normalizar la información de las personas, al permitir su identificación de forma inequívoca. En el mismo se definen y describen los datos básicos de uso general asociados con las personas, debido a que son los datos más importantes en la mayoría de los intercambios de información"Modelo de Referencia de Persona"
Direcciones Geográficas del Uruguay La especificación de este modelo permite implantar servicios de geocodificación a través de un esquema común, esto logrará un alto índice de interoperabilidad al actuar sobre objetos y conceptos comunes, además de poder localizar direcciones de forma inequívoca, reduciendo los costos y minimizando los errores. El modelo de Direcciones Geográficas del Uruguay se basa en las normas y especificaciones técnicas elaboradas por organismos internacionales reconocidos, así como en la experiencia nacional de diversas instituciones. "Información geográfica: Modelo de Direcciones Geográficas del Uruguay"
Empresa Este modelo define los datos que representan las propiedades básicas y de uso general, asociadas con una Empresa establecidos por las Leyes que las regulan y consensuados y aprobados por Organismos Públicos que intervienen en el ciclo de vida de una empresa"Modelo de Referencia de Metadatos Empresa"
Trazabilidad Este modelo define y describe los datos básicos asociados con el registro de trazabilidad de un proceso, para su uso en acuerdos de intercambio de información entre los Organismos de la Administración Pública (A2A) , de Organismos del Estado con Empresas (A2B) o de Organismos del Estado con Ciudadanos (A2C)."Modelo de Referencia de Trazabilidad"

Si en el contexto del desarrollo de la arquitectura se identifican nuevos modelos de datos globales al estado, verificar que no haya a disposición un MRMC que defina su estructura, y de no ser así proponer a AGESIC una linea de trabajo de un nuevo modelo de referencia.

AGESIC también ha desarrollado un documento conteniendo "Directrices para la definición y especificación de metadatos" .

Calidad de Datos

Se recomienda mejorar continuamente la calidad de los datos y la información, mediante el análisis de las siguientes características:

  • Exactitud: grado en el que datos tienen atributos que representan correctamente el valor verdadero de los atributos pretendidos de un concepto o evento en un contexto de uso específico;
  • Consistencia: grado en el que los datos tienen atributos que son libres de contradicción y son coherente con otros datos en un contexto de uso específico;
  • Actualización: grado en el que los datos son vigentes;
  • Accesibilidad: grado en el que las personas puede acceder al dato en un contexto de uso específico, en particular aquellas que necesitan tecnologías de apoyo o configuraciones especiales debido a alguna discapacidad;
  • Completitud: grado en el que el dato asociado con una entidad tienen valores de todos los atributos esperados e instancias de entidad relacionadas en un contexto de uso específico;
  • Trazabilidad: grado en el que el dato tiene atributos que proporcionan una pista de auditoría de acceso al dato y de cualquier cambio hecho al dato en un contexto de uso específico;
  • Disponibilidad: grado en el que el dato tiene atributos que permiten que sea recuperado por usuarios autorizados o aplicaciones en un contexto de uso específico.

NOTAS

(1) DAMA International es una Organización sin fines de lucro, cuya misión es fomentar la conciencia y la educación en lo que refiere a Gestión de Datos. DAMA elaboró una guía (DAMA-DMBOK) que cubre las funciones de gestión de datos, esta guía es actualizada mediante revisiones periódicas, en la medida que se desarrolla la industria y las nuevas perspectivas en la gestión de datos.

Páginas secundarias (2)

  • Glosario (MRD)

    Dato: Es un conjunto de valores sobre algo concreto que pueden ser recolectados, medidos y analizados. Información: Es un conjunto de datos procesados y analizados en un determinado contexto....

  • Pautas para el desarrollo (MRD)

    Pautas para el Desarrollo (MRD ) Las pautas para el desarrollo buscan aconsejar a las entidades públicas sobre cómo realizar algunas de las recomendaciones hechas en el modelo de referencia. Por lo...