Durante los últimos años, el concepto de «Espacios de Datos Compartidos» está ganando gran relevancia, especialmente en el contexto de la transformación digital tanto en Europa como a nivel mundial. En España, tal y como refleja el estudio de European Data Market, la “economía del dato” en 2019 tenía un valor equivalente al 2,5% del PIB nacional, y se calcula que para el 2025, este valor llegue a representar más del 4% del PIB español, lo que pone de manifiesto la importancia de este paradigma que reconoce que los datos son un recurso estratégico que puede ser explotado para generar beneficios económicos y ventajas competitivas.

A pesar de la importancia crítica de los datos para muchas empresas e individuos, localizarlos, publicarlos de manera segura y compartirlos resulta una tarea difícil de realizar. Asimismo, una vez dichos datos son compartidos, llevar a cabo una trazabilidad y control sobre los mismos se convierte en una tarea que no siempre es fácil de conseguir. Ante este y otros desafíos, que enfrentan tanto a los propietarios de los datos interesados en compartirlos como a los usuarios que buscan datos de calidad, la Comisión Europea ha identificado los “Espacios de Datos Compartidos” como una solución potencial sobre la que realizar este tipo de transacciones.

Qué son los “Espacios de Datos”

Pero antes de seguir avanzando resulta necesario entender qué son los “Espacios de Datos”. Los “Espacios de Datos” son infraestructuras digitales o plataformas diseñadas para facilitar la interoperabilidad de múltiples actores (empresas, instituciones públicas y/o entidades de investigación) y el acceso de estos a grandes volúmenes de datos bajo principios de seguridad, privacidad y control de los datos intercambiados. Los espacios de datos permiten dejar atrás lo que se conocen como “silos de datos”, sistemas de almacenamiento segregados entre sí e inaccesibles para otras empresas, para dar lugar a plataformas y entornos donde poder generar valor mediante la compartición voluntaria de datos dentro de un marco de soberanía, confianza y seguridad garantizando quién accede a qué datos y en qué condiciones. Esto permite, sobre un entorno abierto y heterogéneo de proveedores y consumidores, sin la presencia de actores dominantes, desarrollar escenarios o casos de uso que promuevan la innovación y el desarrollo tecnológico. De esta forma, los espacios de datos se configuran como el marco ideal en donde poder experimentar e implementar tecnologías avanzadas que partiendo de conjuntos de datos accesibles puedan ser transformados en información valiosa. Estos entornos de datos facilitan el uso de herramientas avanzadas de análisis (inteligencia empresarial, big data, machine learning, deep learning, etc.), de algoritmos generativos (LLM, GPT), de automatización de procesos (RPA) y/o de técnicas avanzadas de preservación de información (DLTs) aplicables a diferentes sectores y ámbitos de negocio.

Los espacios de datos, como entornos colaborativos de intercambio de información, comparten varias características comunes que los hacen eficaces y seguros para sus participantes. A continuación, se detallan las características específicas que definen a estos espacios de datos.

  • Garantizan que los participantes mantengan la confianza y el control sobre sus datos creando un ecosistema de intercambio de datos entre iguales.
  • Son independientes de la tecnología subyacente, lo que facilita una mayor portabilidad y simplicidad en el despliegue.
  • Los datos compartidos deben estar adecuadamente descritos, incluyendo las taxonomías utilizadas y las restricciones de uso aplicadas.
  • Permiten la implementación de diversos roles, tales como proveedores, consumidores y desarrolladores de componentes/servicios.
  • Posibilidad de aplicar diversas políticas de acceso y uso de la información, con los que poder determinar si los datos se comparten de forma gratuita por parte de sus titulares o no.
  • Garantizan la compatibilidad con otros espacios sectoriales de datos tanto en el ámbito nacional como europeo.

En la actualidad, encontramos actividad que está siendo desarrollada sobre espacios datos compartidos europeos abarcando catorce sectores o ámbitos:

  • Administración Pública (OOTS, PPDS)
  • Agricultura (AgriDataSpace, Divine, AgDataValue)
  • Energía (IntNET, OMEGA-X, EDDIE, Enershare, Synergies)
  • Fabricación (Data Space 4.0, SM4RTEANCE, UNDERPIN)
  • Finanzas
  • Medios de Comunicación (TEMS)
  • Movilidad (PrepDSpace4Mobility, deployEMDS)
  • Idiomas (European Language Data Space)
  • Investigación y Desarrollo
  • Pacto Verde (GREAT, AD4GD, B-Cubed, FAIRiCUBE, DS4SSCC)
  • Patrimonio Cultural (Europeana pro, Eureka3D, 5Dculture, DE-BIAS, AI4Europeana)
  • Salud (MyHealth@EU, HealthData@EU_PIlot, TEHDAS)S4Skills)
  • Turismo (DATES, DFST)

Cómo funcionan

En los espacios de datos, donde se realizan intercambios bilaterales de información, existen tanto entornos centralizados que agrupan la información para la creación de servicios de valor añadido, como entornos de compartición que siguen modelos federados y distribuidos. Es necesario entender que los primeros deben verse como piezas fundamentales para la construcción de los segundos, pero que ante todo, el objetivo último debe ser la interoperabilidad de las soluciones desplegadas y su escalabilidad. Precisamente, la siguiente imagen muestra la relación existente entre el grado del “valor añadido” generan por los diferentes servicios y la complejidad de las arquitecturas/entornos implementados:

Para que un espacio de datos pueda operar de manera funcional es necesario garantizar la presencia de una serie de actores que cubran tanto un conjunto de roles determinado como los diferentes componentes tecnológicos necesarios. Gracias a estos elementos (roles y componentes tecnológicos) se establece el marco común de gobernanza necesario que permita realizar las diferentes transacciones de datos de forma segura y garantizando la soberanía de los participantes.

Arquitectura y Roles

La arquitectura de un espacio de datos compartido está diseñada para facilitar un entorno seguro, interoperable y eficiente donde se produzca el intercambio de información entre múltiples entidades o actores participantes. Este diseño incluye varios componentes que resultan clave para garantizar una gobernanza adecuada aportando la seguridad necesaria y la funcionalidad del ecosistema. A continuación, se describen los principales elementos que componen esta arquitectura:

  1. Componentes para el acceso al espacio de datos: Uno de los principales elementos de los espacios de datos es el “conector”, mediante el cual los participantes acceden al espacio de datos y a los propios datos. Es el encargado de tratar los datos según las políticas de uso definidas por el dueño así como los derechos de acceso garantizando su soberanía.
  2. Componentes para la intermediación: Dentro de los servicios de este componente el más importante es el relacionado con el “catálogo de recursos” que además de ser un listado con la oferta disponible, también es la herramienta que permite localizar al proveedor del recurso, las características de este y sus condiciones de uso.
  3. Componentes para la gestión de identidades y el intercambio seguro de datos: Estos componentes permiten garantizar la identidad de los participantes y la seguridad de las transacciones. Para ello es habitual exigir que los participantes presenten las credenciales, por ejemplo, vía certificados X.509.
  4. Componentes para la gestión del espacio de datos: Se trata de herramientas que permiten que el espacio de datos opere con normalidad, facilitando las operaciones diarias, la gestión de los participantes (alta, baja, revocación, suspensión), la supervisión de la actividad, etc. Para que la conexión entre conectores pueda realizarse es necesario es necesario realizar una gestión de las credenciales de dichos conectores.

Con todo ello, a continuación se muestra una arquitectura a alto nivel de lo habitualmente se implementa a la hora de trabajar con espacios de datos compartidos en los que diferentes roles de participantes (proveedores o “Providers” y consumidores o “Consumers”) interactúan:

Tal y como indicábamos, cada participante (proveedor o consumidor) debe implementar un “Connector”, un componente software que posibilita a cada organismo implicado realizar la transacción correspondiente. De esta manera, dentro de los espacios de datos, se identifican principalmente cuatro tipos de participantes, cada uno de ellos enfocado en un ámbito de actuación concreto:

  • Proveedores y consumidores de recursos: Son las entidades que toman parte en el “Espacio de Datos” interactuando con los datos ofrecidos/consumidos a través de los servicios/productos definidos en el mismo. En el caso de los proveedores, son las encargadas de aportar datos al espacio compartido y son los responsables de asegurar que los datos sean de alta calidad, relevantes y actualizados. Los consumidores en cambio son las encargadas de acceder y utilizar los datos disponibles en el espacio compartido para análisis, desarrollo de productos, toma de decisiones, entre otros fines.
  • Proveedor tecnológico: Es el encargado de integrar y operar todos los recursos técnicos necesarios que conforman la solución técnica, permitiendo el despliegue de la infraestructura sobre la que se sustenta el “Espacio de Datos”. Entre sus responsabilidades está el desarrollo, configuración y parametrización de la infraestructura necesaria que sustenta la solución técnica sobre la que irán desplegados los productos/servicios definidos por el “Operador del conjunto de servicios”. En la práctica, los “Espacios de Datos” hacen accesibles los conjuntos de datos en formato de servicios/productos a través de un catálogo que generalmente es gestionado de acuerdo con las directrices establecidas por el promotor de dicho espacio.
  • Operador del espacio de datos: El rol del “operador de espacio de datos” tiene como objetivo impulsar el entorno de compartición y explotación siendo responsable de su gestión y gobierno. Es importante diferenciar las figuras del “Proveedor Tecnológico” y la del “Operador del espacio de datos” donde el primero se encarga del despliegue y operación de las tecnologías necesarias para dar forma al ecosistema del “Espacio de Datos” sobre el que operará el segundo a través de los servicios/productos que sean ofertados en el catálogo de soluciones.
  • Intermediarios: Son aquellas entidades dentro del “Espacio de Datos” que se encargan de ofrecer servicios/productos de acuerdo con las obligaciones y condiciones establecidas por el operador del espacio de datos. Algunos ejemplos de servicios que ofrecen los intermediarios son:
    • Vocabularios y ontologías, que permiten organizar, categorizar o etiquetar sistemáticamente la información, mejorando la interoperabilidad.
    • Tiendas de aplicaciones, donde figuran las herramientas ofrecidas por los proveedores de aplicaciones, garantizándose que han pasado un proceso de control de calidad.
    •  Servicios de bróker de metadatos para la publicación de un catálogo de ofertas de recursos (datos y aplicaciones) con la máxima información posible.
    • Registros de transacciones (clearing house), es el servicio para el control de las operaciones realizadas tanto a nivel de contracto pactado para el suministro de datos como de su consumo.

Iniciativas/Organizaciones de Espacios de Datos Colaborativos

Tal y como indicábamos al principio del artículo, el desarrollo y la implementación de espacios de datos compartidos ha captado la atención a nivel global, impulsando numerosas iniciativas que buscan fomentar la colaboración, la innovación y el crecimiento económico a través del intercambio seguro y eficiente de datos. Estas iniciativas, respaldadas por organismos internacionales, gobiernos y el sector privado, están diseñadas para establecer estándares comunes, promover la interoperabilidad y garantizar la protección de la privacidad y la seguridad de los datos. Entre las iniciativas que más relevancia están teniendo estos últimos años encontramos:

  • GAIA-X: Es una iniciativa europea del sector privado cuyo objetivo es la creación de una infraestructura de datos abierta y segura, cumpliendo con los más altos estándares de soberanía digital al tiempo que promueve la innovación. Gaia-X es un referente sobre cómo se concibe un ecosistema digital federado y transparente, donde los datos y servicios pueden estar disponibles, recopilados y compartidos en un entorno de confianza. También se está integrando SSI (Self-Sovereign Identity) como solución de identidad para su plataforma de interoperabilidad, ya que se entiende que una capa de identidad y confianza es necesaria para consumir servicios e interactuar entre sí de forma fiable.

Gaia-X tiene como objetivo desarrollar una federación de servicios de datos que facilite la cooperación y el intercambio de datos entre empresas y organizaciones en toda la Unión Europea, sin depender de proveedores específicos de infraestructura. Gaia-X establece los conceptos técnicos y las normas de gobernanza necesarias para la interoperabilidad de conjuntos de datos e infraestructuras, actuando como orquestador que medie entre proveedores y consumidores de datos a través de servicios federados.

  • IDSA (International Data Spaces Association): IDSA nace en 2016 como una coalición sin ánimo de lucro que se encuentra presente en 28 países. Su principal misión es la de unir empresas y organizaciones de todo el mundo que creen en la economía de los datos, su libre circulación y en la capacidad del propietario de datos para decidir las condiciones y las restricciones que considere oportunas para los datos que comparte (lo que se ha definido como soberanía sobre los datos), así como para participar del valor que generen esos datos. IDSA propone su propia arquitectura de referencia para la compartición de datos formada por cinco capas principales:
    • Capa de negocio,
    • Capa funcional,
    • Capa de procesos,
    • Capa de información,
    • Capa de sistema

IDSA dispone de una herramienta llamada «IDSA RADAR» que permite dar visibilidad a todas las iniciativas de espacios de datos existentes, transparencia sobre sus logros e identificar las más prometedoras: IDSA Radar

  • Data Spaces Business Alliance (DSBA): La DSBA fue fundada en 2021 y está compuesta por los principales actores en la definición de estándares y marcos tecnológicos para la construcción de espacios de datos. En concreto, la alianza está compuesta por la Big Data Value Association (BDVA), la Fundación FIWARE (Plataforma europea impulsora del Internet del Futuro) y las asociaciones GAIA-X y la International Data Spaces Association (IDSA) teniendo como propósito acordar un marco tecnológico común que evite la fragmentación tecnológica de la actividad. Para conseguir la convergencia técnica, la asociación acordó el desarrollo de un marco mínimo viable (MVF, minimal viable framework) basado en tres pilares:
    • Interoperabilidad en el intercambio de datos mediante la utilización del estándar de datos NGSI-LD (Next Generation Service Interfaces – Linked Data) y los modelos de smart data models definidos por FIWARE ampliados para la adopción del modelo de información definido por la arquitectura IDSA.
    • Soberanía y confianza de los datos mediante la adopción de un modelo de gestión de identidad descentralizado (Self-Sobereign Identity) como el propuesto por Gaia-X (Trust Framework) que empleará la DLT (Distributed Ledger Technology) impulsada por la Comisión Europea (EBSI – European Blockchain Services Infrastructure). El resultado será un entorno de confianza compatible con la normativa eIDAS (electronic IDentification, Authentication and trust Services) de la UE.
    • Servicios de creación de valor (intermediación) consistentes en un catálogo de datos centralizado y servicios de comercialización basados en estándares del TM Forum como los propuestos por FIWARE.

Los “Espacios de Datos” en el ámbito de la ciberseguridad

Tal y como hemos visto, los espacios de datos compartidos están emergiendo como una potente herramienta con la que poder abordar proyectos de transformación digital que tienen en los datos su principal elemento de valor. Y es por ello que toda economía digital que busque consolidarse y competir en un mercado global debe disponer una sólida estrategia en materia de “economía del dato” y apoyar la digitalización de sectores como los indicados anteriormente. Dentro de los sectores citados hay que sumar el de la Ciberseguridad, un campo que depende en gran medida de la información y la colaboración para detectar y mitigar amenazas, beneficiándose enormemente de las características de los espacios de datos. Esto abre la posibilidad de explorar nuevas formas en que estos espacios pueden ser aplicados en el ámbito de la ciberseguridad, entre los que encontramos:

  • Intercambio de Información sobre Amenazas: Los Espacios de Datos Compartidos permiten a diferentes organizaciones, tanto del sector público como privado, compartir información sobre amenazas en tiempo real. Esto incluye datos sobre ataques recientes, vulnerabilidades descubiertas y métodos de mitigación efectivos. La colaboración a través de estos espacios permite una respuesta más rápida y coordinada a las amenazas emergentes, reduciendo el tiempo de reacción y mejorando la capacidad de defensa colectiva.
  • Análisis Colaborativo de Datos: Los analistas de ciberseguridad pueden utilizar los espacios de datos compartidos para colaborar en el análisis de grandes volúmenes de datos relacionados con la ciberseguridad. Utilizando herramientas avanzadas de análisis y algoritmos de machine Learning o procesado de lenguaje natural (PLN), se pueden identificar patrones y tendencias que no serían evidentes a partir de datos aislados. Gracias a esta colaboración se consigue mejorar la precisión de las detecciones y permite una mejor comprensión de las tácticas, técnicas y procedimientos utilizados por los atacantes.
  • Automatización de la Respuesta a Incidentes: Gracias al uso de entornos de datos compartidos, las organizaciones pueden desarrollar y automatizar procesos de respuesta a incidentes donde se incluye desde la identificación automática de amenazas, la evaluación de su impacto potencial y la implementación de medidas de mitigación. Estos procesos automatizados reducen la carga de trabajo de los equipos de seguridad y permite una respuesta más rápida y consistente a las amenazas.

En resumen, la aplicación de los Espacios de Datos Compartidos en la ciberseguridad no solo mejora la capacidad de las organizaciones para detectar y responder a las amenazas, sino que también promueve una cultura de colaboración y confianza. Estas plataformas proporcionan los recursos y la infraestructura necesarios para un enfoque más proactivo y coordinado en la protección contra ciberataques.

En Perseus Ciberseguridad estamos orgullosos de liderar el proyecto HAZITEK Estratégico “BCSSD – Basque Cyber Security Shared Data (BCSSD)”, un proyecto que tiene como objetivo crear un espacio digital seguro para que las organizaciones compartan datos relacionados con la ciberseguridad industrial con el cual se desarrollarán soluciones y/o servicios que permitan afrontar las amenazas de ciberseguridad y así garantizar una industria cibersegura en el futuro.

Asimismo, el próximo martes 4 de junio, dentro del programa “Digital Talks” organizado en el marco del BeDigital que se celebrará en el BEC, nuestro compañero Etxahun Sanchez participará en el panel que lleva por título “Espacios de Datos de Ciberseguridad” donde se hablará sobre cómo la compartición de información y datos de ciberseguridad son un tema que suscita un especial interés tanto de empresas como de estados para combatir las amenazas cibernéticas y mejorar su resiliencia.