Arquitectura Integrada de Gobierno

Wiki

Modelo de...

Pautas para el desarrollo (MRD)

(Esta es una una versión archivada de esta página. (1.9), Ir a la última versión.)

Pautas para el Desarrollo (MRD )

Partiendo del modelo de referencia sugerido por el DAMA, se define un modelo de referencia de datos de gobierno. La siguiente imagen ilustra un esquema de los componentes que conforman el modelo de referencia de datos.

A continuación se definen algunas pautas para la implementación del modelo de referencia de datos definido.

Categorización de Datos

La primer tarea es identificar los datos o entidades más relevantes de los procesos de negocio de la organización y agruparlos en categorias. Se debe responder la siguiente interrogante: ¿Cuáles son los datos o entidades involucrados en los procesos de negocio de la organización y a qué dominio o área corresponden?

Se brindan como referencia las siguientes 13 categorías definidas como verticales de negocio: Cultura, Deporte, Desarrollo Social, Educación, Economía, Industria, Infraestructura, Medio Ambiente, Salud, Trabajo, Transporte, Turismo y Vivienda

Una vez identificados los datos y categorizados se deben identificar los resposables de los datos. Se debe responder la siguiente interrogante: ¿Qué organización(es) es(son) responsable(s) del mantenimiento de dichos datos?. ¿Corresponden al negocio de la organización?

Es fundamental identificar aquellos datos que son de vital importancia, transversales y propios del negocio de la organización ya que serán considerados como datos maestros.

Datos Maestros

Los datos maestros organizacionales son los datos que representan a las entidades claves del negocio transversales a la organización que le brindan un contexto a las transacciones de negocio.

En base al DMBOK, generalmente se identifican datos maestros referentes a las siguientes áreas:

  • Datos maestros de las partes: Organizaciones, personas, ciudadanos, empleados, clientes, proveedores, etc. Dependiendo del contexto de la organización.
  • Datos maestros de finanzas: Presupuestos, balances, objetos de gasto, etc.
  • Datos maestros de producto: Información sobre el producto o servicio del negocio de la organización.
  • Datos maestros de ubicación: Establecen una relación entre datos geográficos y datos sociológicos que ayudan a una parte del proceso de negocio.

Luego de la identificación de los datos maestros se debe realizar la traza de los mismos para identificar las bases de datos y archivos que contienen los datos originales así como determinar qué aplicaciones, unidades e incluso roles específicos crean y mantienen los datos. Es fundamental comprender las necesidades de las fuentes de datos origen y destino para poder mantener una buena calidad de los datos.

Por definición los datos maestros son transversales a la organización, esto implica que son utilizados por distintos sistemas y/o áreas dentro de la organización. Por tal motivo, se recomienda la generación de una base de datos corporativa para almacenar de forma centralizada los datos maestros y poder realizar una correcta gestión de dichos datos.

El armado de una base corporativa de datos maestros es un proceso complejo que se recomienda realizar con una metodología iterativa incremental, tomando de a una tabla o entidad de datos maestros, para luego ir por las siguientes. En el proceso de armado se debe definir previamente un criterio de coincidencia de datos para poder definir cuando dos datos son el mismo. Una vez identificado que dos datos en realidad se corresponden a lo mismo, se debe definir si está duplicado o son inconsistentes, para tomar la decisión si eliminar el registro evitando la redundancia de datos o se analiza qué fuente es más confiable o cómo se puede lograr tener el dato más preciso entre los dos registros.

Dentro del conjunto de entidades identificadas como datos maestros, se pueden visualizar tres tipos de entidades que dependiendo del tipo será el tratamiento que deberá hacerse.

Extensiones: Entidades que son extensiones o especializaciones de otras entidades más genéricas (por ejemplo: Paciente es una entidad especializada de la entidad Persona). En estos casos se deberán tomar como referencia los datos que tenga la organización responsable de la entidad genérica (Persona) y complementar con la información especializada que termina de definir la entidad del negocio de nuestra organización (Paciente).

De terceros: Por otro lado existirán datos maestros que si bien forman parte de los datos core de la organización no es su responsabilidad mantenerlos. En estos casos se deberá identificar la organización responsable de los datos y solicitar los servicios correspondientes para tener acceso a ellos a través de la Plataforma De Interoperabilidad (PDI).

Propios: Son los datos maestros que representan a entidades que no son extensiones de ninguna otra entidad, le corresponde a la organización su mantenimiento y por lo tanto son los responsables de los datos. En este caso se deberán implementar servicios que permitan tener acceso a ellos a través de la PDI.

En resumen, los datos maestros deben ser:

  • Consolidados para poder lograr una visión única.
  • Gobernados como cualquier otro dato.
  • Compartidos mediante servicios disponibles tanto para los sistemas internos a la organización como para los externos.

Datos Referenciales (Codigueras)

Los datos referenciales comúnmente llamados codigueras definen un conjunto de valores posibles para un dominio. Estos datos son referenciados por otros dentro de los sistemas de la organización incluso por algunos datos maestros.

Existen distintos dominios en los que se definen datos referenciales, algunos más específicos e internos a la organización y otros más generales que pueden estar definidos por instituciones internacionales o gubernamentales.

AGESIC cuenta con un conjunto de datos referenciales sobre dominios como Organismos, Departamentos, Países, entre otros. Estos datos están publicados como datos abiertos en el catálgo de datos abiertos.

Para la definición y publicación de nuevos conjuntos de datos referenciales se deben especificar los metadatos definidos por AGESIC.

Se recomienda contar con tablas de datos referenciales en una base corporativa junto a los datos maestros de la organización. De esta forma es posible controlar y garantizar la unicidad, consistencia y calidad de los datos brindados a la organización.

Datos Abiertos

Se deberán identificar el conjunto de datos abiertos que la organización debe exponer o que actualmente expone a la ciudadanía siguiendo las guías para la publicación de datos abiertos y las directirces técnicas  establecidas por AGESIC.

Los datos abiertos podrán ser utilizados bajo las pautas establecidas en la licencia de datos abiertos de Uruguay.

Los datos abiertos de la organización formarán parte del core de datos junto a los datos maestros y los datos referenciales ya que deben ser gestionados y gobernados por criterios muy similares. También interesa mantener ciertos niveles de calidad sobre las mismas dimensiones que en el resto de los datos.

Interoperabilidad e Integración de Datos

Es indispensable pensar en la interoperabilidad entre sistemas dentro de la organización y entre sistemas internos y externos a la organización al comenzar a hablar en términos de datos maestros y bases de datos corporativas.

Se recomienda que las organizaciones definan sus propias PDI las cuales facilitan y permiten el intercambio de datos entre sistemas internos de forma segura y confiable. Esta plataforma brinda un contexto ideal para la publicación de los servicios necesarios para acceder a la base corporativa y así hacer uso de los datos maestros y referenciales de la organización.

Se recomienda la alineación de estándares y políticas de intercambio a las definidas por AGESIC en su normativa vigente.

Contar como primer paso con una PDI interna en la organización facilita luego el exponer los servicios en la PDI de AGESIC ya que seguramente sean un subconjunto de los servicios expuestos en la PDI interna.

Se deben definir los modelos de datos (vocabularios) que utilizarán los sistemas para comunicarse. AGESIC cuenta con vocabularios mínimos para algunas entidades identificadas como centrales para la Administración Central.

Se recomienda el uso de arquitecturas SOA, microservicios y el uso de patrones de arquitectura estándar para la interoperabilidad de los sistemas.

Vocabularios mínimos

Los metadatos constituyen un elemento esencial para lograr un adecuado esquema de intercambio de información, ya que facilitan el entendimiento de la información al proporcionar la semántica adecuada para entender el dato.

AGESIC ha desarrollado un documento conteniendo "Directrices para la definición y especificación de metadatos" .

Dentro de la definición de los metadatos de las entidades, se recomienda la definición de los vocabularios mínimos de éstas. Se entiende por vocabulario mínimo, como el mínimo vocabulario, simplificado, reutilizable y extensible que define una entidad.

Los vocabularios deberán ser utilizados en el intercambio de datos entre sistemas u Organismos de forma de unificar el significado de una determinada entidad.

AGESIC cuenta con un catálogo de datos en el cual se definen algunos tipos de datos y vocabularios mínimos de las entidades transversales al estado.

Estos vocabularios podrán ser extendidos en cada vertical de negocio con los atributos que definan a la nueva entidad a representar. Para la definición y publicación de nuevos vocabularios mínimos se deben especificar los metadatos definidos por AGESIC.

Arquitectura de Datos

La arquitectura de datos busca especificar tres grandes categorías:

  • Modelo de datos.
  • Análisis de la cadena de valor de información: define las relaciones entre los datos, los procesos y funciones de la organización.
  • Arquitectura de entrega de datos: flujo que realizan los datos entre la base de datos y las aplicaciones.

Para lograr definir una arquitectura de datos se recomienda desarrollar los siguientes elementos:

  • Entidades y Vocabularios (ver los definidos por AGESIC).
  • Principios que rigen a los datos en la organización
  • Mapa conceptual
  • Ciclo de vida de los datos
  • Diagrama lógico de datos, etc

La arquitectura de datos también comprende:

  • Entender las necesidades de información de la organización, para poder desarrollar y mantener el modelo de datos;
  • Definir y mantener la arquitectura de Base de Datos;
  • Definir y mantener la arquitectura de Integración de Datos;
  • Definir y mantener la arquitectura de Big Data y Analítica;
  • Definir y mantener la arquitectura de Metadatos.

Gobernanza de Datos

La gobernanza de datos debe poder definir:

  • ¿Quién puede leer, crear, actualizar y eliminar los datos?
  • ¿Qué validaciones se deben hacer sobre los datos?
  • ¿Qué aplicaciones son las preferidas o determinadas para el ingreso de los datos?
  • ¿Qué políticas de seguridad se aplican sobre los datos?
  • ¿Cómo se protegen los datos confidenciales?
  • ¿Qué prevenciones de recuperación de datos ante desastres son necesarias?

Estos son algunos de los puntos más importantes que se deben definir dentro de lo que se denomina gobernanza de datos. Para poder contestar estas preguntas deben trabajar en conjunto líderes del área de TI y líderes del área de negocio para poder tener una visión de cada parte y lograr consensos en las políticas de gobernanza de datos.

Se recomienda la identificación y documentación de los procesos de gobernanza definidos para la gestión de los datos, principalmente de los datos core de la organización. La correcta difusión de los procesos y procedimientos definidos a los involucrados (p.e. comunicar procedimiento de cambio de contraseña de base de datos a el área operativa) es la clave para una exitosa gobernanza de datos.

La identificación de los flujos de datos (orígenes, destinos, etc) es clave para garantizar los recursos de información, lo cual permite a las organizaciones la toma de decisiones en base a evidencias.

Se identifican dos roles que pueden tener los organismos respecto a los datos maestros del Estado exceptuando los datos sobre finanzas. Un rol es el de responsable o dueño de los datos y el otro rol es el de consumidor de dichos datos. Dependiendo el rol que tengan los organismos que interactúen con los datos maestros del gobierno tendrán un conjunto de responsabilidades y obligaciones que deben cumplir.

Responsable/Dueño:

  • Exponer servicios en la PDI: Deberá exponer servicios independientes para cada una de las operaciones que se puedan realizar sobre los datos. El único servicio que está obligado a publicar es el de consulta sobre los datos, el resto depende de si existen más organismos que puedan realizar alguna de las operaciones que no sea lectura.
  • Calidad de los datos: Deberá prestar especial atención sobre la calidad de los datos ya que serán potencialmente utilizados por toda la Administración Central. Para esto ser recomienda definir políticas de calidad y procesos que periódicamente hagan controles de la calidad de los datos.
  • Seguridad: Deberá estar alineado y seguir la política de seguridad definida por AGESIC.

Consumidor:

  • Consumir servicios desde la PDI: Deberá consumir los servicios expuestos en la PDI por el organismo responsable de los datos. Estos servicios serán los únicos válidos para obtener los datos.
  • No Divulgación: No podrá ofrecer servicios que brinden los mismos datos de los cuales no es responsable. Si algún organismo le solicitan dicha información deberá dirigirlo a consumir los datos directamente desde la PDI, está completamente prohibido realizar un "pasa manos" de datos fuera de la organización.
  • Seguridad: Deberá estar alineado y seguir la política de seguridad definida por AGESIC.

Para los datos o entidades definidas para las finanzas se tiene un comportamiento distinto a lo descripto anteriormente ya que cada organismo será responsable y dueño de sus propios datos de las entidades, pero deberán informar sobre sus datos mediante la PDI al organismo responsable.

Para cumplir con este requisito cada organismo deberá:

  • Publicar un servicio por el cual se pueda obtener la información deseada sobre los datos presupuestales con criterios previamente acordados.
  • Asegurar la veracidad de la información que está brindando.
  • Tener información actualizada según criterios previamente establecidos.

El organismo responsable deberá actua con el principio de Finalidad y utilizar la información únicamente para cumplir las funciones y obligaciones que le fueron encomendadas por Ley.

Seguridad de Datos

Con el fin de obtener una eficaz seguridad de datos deben realizarse las siguientes actividades:

  • planificar y ejecutar políticas y procedimientos para garantizar la seguridad de los datos confidenciales y personales, mitigando los riesgos de la divulgación no autorizada de los mismos, de tal forma de cumplir con la normativa vigente a este respecto;
  • brindar la debida autenticación, autorización y auditoría de los datos y de la información.

Cumpliendo con dichas actividades las tareas que deben realizarse son:

  • Definir las políticas y los estándares de seguridad de datos;
  • Definir controles y procedimientos de seguridad de datos;
  • Hacer seguimiento a la autenticación de usuario y comportamiento de acceso;
  • Clasificar la confidencialidad de la información;
  • Auditar la seguridad de los datos.

Calidad de Datos

Es recomendable contar con un proceso de mejora continua de calidad de datos y de la información. Se recomienda definir un procedimiento en el cual se identifiquen las dimensiones de calidad que se evaluarán en los datos, qué factores dentro de cada dimensión y con qué métrica serán obtenidos dichos valores de calidad. También se debe definir quienes serán los responsables de mantener los niveles de calidad fijados y con qué perioricidad se harán las mediciones.

A continuación se describen algunas de las dimensiones que se recomiendan medir para evaluar la calidad de los datos:

  • Exactitud: grado en el que datos tienen atributos que representan correctamente el valor verdadero de los atributos pretendidos de un concepto o evento en un contexto de uso específico;
  • Consistencia: grado en el que los datos tienen atributos que son libres de contradicción y son coherente con otros datos en un contexto de uso específico;
  • Frescura: grado en el que los datos son vigentes;
  • Accesibilidad: grado en el que las personas puede acceder al dato en un contexto de uso específico, en particular aquellas que necesitan tecnologías de apoyo o configuraciones especiales debido a alguna discapacidad;
  • Completitud: grado en el que el dato asociado con una entidad tienen valores de todos los atributos esperados e instancias de entidad relacionadas en un contexto de uso específico;
  • Trazabilidad: grado en el que el dato tiene atributos que proporcionan una pista de auditoría de acceso al dato y de cualquier cambio hecho al dato en un contexto de uso específico;
  • Disponibilidad: grado en el que el dato tiene atributos que permiten que sea recuperado por usuarios autorizados o aplicaciones en un contexto de uso específico.

Páginas secundarias (1)