Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
Fecha
2019Autor
Zárate, Marcos Daniel
Director
Fillottrani, Pablo RubénPalabras clave
Inteligencia artificial; Ciencias de la computación; Ontologías (Recuperación de la información); Biogeografía; Biodiversidad; Biogeografía marina; Semantic web; Linked dataMetadatos
Mostrar el registro completo del ítemResumen
El objetivo principal de esta tesis es analizar los problemas que existen actualmente con el manejo integrado de información en las ciencias de la vida
en general, y particularmente analizar que sucede con la Biodiversidad y
la Oceanografía. La actual crisis mundial de la biodiversidad, debida, entre
otras cosas, al calentamiento global, genera un profundo impacto en la distribución geográfica de las especies y las comunidades ecológicas. Esto provoca
un creciente interés entre los científicos para coordinar el uso compartido de
conjuntos de datos que ayuden a entender esta problemática global. En este
contexto, el paradigma de los Datos Vinculados (Linked Data en inglés)
ha emergido como un conjunto de buenas prácticas para conectar, compartir
y exponer datos y conocimiento, una parte central de este paradigma
son las ontologías, que permiten la definición de vocabularios compartidos y
modelos conceptuales que ayuden a integrar esta información. Estas consideraciones
proporcionan una fuerte motivación para formular un sistema que
tenga en cuenta las características geoespaciales que pueden brindar respuestas
a preguntas como las siguientes: (i) >Cómo podemos definir las regiones
espaciales para nuestros estudios? (ii) >Cómo se distribuyen las especies en
una determinada región? (iii) Dada una georeferencia particular, >a qué re-
gión geográfica pertenece? (iv) >Cómo relacionar las ocurrencias de especies
con variables ambientales dentro de una región especifica?.
En esta tesis se presenta el desarrollo de un sistema basado en ontologías
denominado BiGe-Onto [ZBF+19] para administrar información de los dominios
de Biodiversidad y Biogeografía marina. Este sistema está compuesto
por (i) Arquitectura; (ii) Modelo conceptual; (iii) Versión operacional OWL
2; y (iv) Conjunto de datos vinculados para su explotación a través de un
punto final SPARQL.
La evaluación de BiGe-Onto se realizo desde dos enfoques, el primero
de ellos consiste en validar la ontologíaa utilizando datos reales extraídos de
repositorios de Biodiversidad y Biogeografía marina para luego validar el
modelo conceptual propuesto utilizando preguntas de competencia. El segundo
enfoque tiene que ver con la validación mediante casos de estudio
definidos en conjunto con investigadores del Centro Científico Tecnológico
(CENPAT-CONICET) que trabajan realizando análisis de distribución
de especies. Finalmente la documentación de BiGe-Onto esta disponible
en línea en http://crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ y
el conjunto de datos enlazados es accesible públicamente a través de DOI
10.5281/zenodo.3235548. The main goal of this thesis is to analyze the existing issues currently related
to the integrated management of information in life sciences in general,
and particularly to analyze what happens with Biodiversity and Oceanography.
The current global biodiversity crisis, due, among other things, to
global warming, has a great impact on the geographical distribution of species
and ecological communities. This motivates a growing interest among
scientists to coordinate the sharing of datasets that help to understand this
global problem. In this context, Linked Data paradigm has emerged as a set
of good practices to connect, share and expose data and knowledge. A central
part of this paradigm are the ontologies, which allow the de nition of shared
vocabularies and conceptual models that help integrate this information.
These considerations provide strong motivation to formulate an ontologybased
system considering geospatial features that may provide answers to
questions such as: (i) How can we define spatial regions for our studies? (ii)
How are the species distributed in a certain region? (iii) Given a particular
georeference, which geographic region does it belong to? (iv) How to relate
occurrences of species with environmental variables within a specific region?.
This thesis presents the development of an ontology-based system called
BiGe-Onto [ZBF+19] to manage information from Biodiversity and Marine
Biogeography domains. This system is composed of (i) Architecture;
(ii) Conceptual model; (iii) OWL 2 operational version; and (iv) Linked dataset
to exploit through a SPARQL endpoint. BiGe-Onto evaluation was
developed from two approaches, the first one is to validate the ontology
using real data extracted from Biodiversity and Marine Biogeography repositories
and then validate the proposed conceptual model using competence
questions. The second approach is based on validation through case
studies defined in conjunction with researchers from the Technological
Scientific Center (CENPAT-CONICET) who work on species distribution
analysis. Finally, BiGe-Onto documentation is available online at http:
//crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ and the linked dataset
is publicly accessible through DOI 10.5281/zenodo.3235548.
Colecciones
- Tesis de postgrado [1424]
El ítem tiene asociados los siguientes ficheros de licencia: