Descripción del proyecto

Plataforma CCMM – Programa de ciencias marinas de Galicia. Plataforma Integrada de Datos Marinos

En la plataforma integrada de datos marinos se pretende demostrar la mejora en la gestión de los datos marinos usando tecnologías de supercomputación (High Performance Computing, HPC). La utilización de las tecnologías HPC y el acceso y utilización de los datos que se integrarán en la plataforma suele requerir de conocimientos informáticos avanzados, por tratarse de tecnologías nuevas, poco probadas, con interfaces de usuario basados en línea de comandos, y formatos de datos complejos y difíciles de gestionar. Los participantes en esta iniciativa tienen dos perfiles principales: especialistas en tecnología computacional y de gestión de datos (CESGA, UDC, USC); y especialistas en ciencias marinas con orientación a la gestión de datos (IEO y IIM en el CSIC, INTECMAR, CETMAR). El pasado día 5 de octubre se celebró en el CESGA una reunión de inicio del paquete de trabajo con todos los socios.

La primera actividad de la plataforma, coordinada por CITIUS-USC, será la determinación de las fuentes de datos para integrar en la plataforma. Se localizarán las fuentes de datos que tengan ya hecho un trabajo previo de homogeneización y estandarización, así como de interoperabilidad. Estos datos se incluirán en la plataforma de integración y serán usados en la primera versión denominada Producto Mínimo Viable (PMV).

Una actividad determinante para que los datos que entren en la plataforma de integración sean fácilmente utilizables e intercambiables es el diseño de un modelo de datos. Se realizará un estudio detallado del conjunto de iniciativas (virtual labs, blockchain, datalakes, etc) y estándares relacionados con el modelado de datos medioambientales (y marinos en concreto) y con los catálogos y vocabularios utilizados para las fuentes de datos en iniciativas internacionales (SeaDataNet, EMODNET, CMEMS y otras).

El CESGA desarrollará en una segunda actividad una plataforma de integración que tendrá como objetivo demostrar la mejora en la gestión de los datos marinos usando tecnologías avanzadas incluyendo HPC. En esta línea, las tecnologías disponibles de supercomputación incluyendo las del área de big fecha deberán usarse en este proyecto para facilitar el uso de diferentes datos marinos, con distintas estructuras, de manera que se puedan desarrollar diferentes servicios de una manera ágil y el más fácil posible.

En la tercera actividad del paquete de trabajo, el Laboratorio de Bases de Datos del CITIC-UDC coordinará la puesta en marcha de un laboratorio virtual que permita realizar diferentes tareas relacionando datos de distinta naturaleza en una plataforma integrada. Asimismo, se dará soporte con los conjuntos de datos en la plataforma integrada a los servicios marinos.
El objetivo último de la Plataforma integrada de datos será permitir que los investigadores del ámbito de las ciencias marinas del sistema de I+D gallego hagan mejor ciencia al proveerles de recursos computacionales, ejemplos prácticos y acceso a conjuntos de datos de una forma estandarizada, rápida y sencilla.

Socios:

Instituto Español de Oceanografía (A Coruña e Vigo) IEO-CSIC
Instituto de Investigacións Mariñas IIM-CSIC
Instituto de Ciencias del Patrimonio INCIPIT-CSIC
Universidade da Coruña UDC
Universidade de Santiago de Compostela USC
Universidade de Vigo UVIGO
Centro de Supercomputación de Galicia CESGA
Centro Tecnolóxico do Mar Fundación CETMAR
Centro de Investigacións Mariñas CIMA
Instituto Galego de Formación en Acuicultura IGAFA
Instituto Tecnolóxico para o Control do Medio Mariño de Galicia INTECMAR
Unidade de Observación e Predición Meteorolóxica – Dirección Xeral de Calidade Ambiental, Sostibilidade e Cambio Climático MeteoGalicia Consellería do Mar CMAR-Xunta.

Financiación: Ministerio de Ciencia e Innovación (MICIN), Consellería do Mar Xunta de Galicia

Convocatoria: Next Generation EU

Fecha inicio: 2022/10/14

Fecha fin: 2025/09/30

Presupuesto global: 10.000.000 €

Presupuesto CESGA: 274.927 €