Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Tecnológico

Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Tese

Título: UMA ABORDAGEM PARA EXTRAÇÃO DE ESQUEMAS DE BANCOS DE DADOS NOSQL COM ÊNFASE EM DADOS GEOGRÁFICOS

Orientador
  • RONALDO DOS SANTOS MELLO
Aluno
  • ANGELO AUGUSTO FROZZA

Conteúdo

O advento dos big data fez com que novas tecnologias de banco de dados (bd) voltados ao gerenciamento de grandes quantidades de dados complexos e heterogêneos ganhassem importância na indústria, como é o caso dos bds nosql. eles surgem como principal sistema de gerência de bd para big data devido a várias características, como a ausência de esquemas (schemaless) ou o uso de esquemas flexíveis. entretanto, conhecer o esquema dos dados cada vez mais torna-se essencial para diversos tipos de aplicações, como integração, interoperabilidade e validação de dados, processamento de consultas, bem como, ferramentas de administração de dados. esta tese apresenta uma abordagem para extração de esquemas de bds nosql, com ênfase em dados geográficos. diferente do estado da arte, demonstra-se que o padrão json pode ser usado como formato canônico para representar dados em qualquer um dos quatro principais modelos de dados nosql (orientado a documentos, chave-valor, colunar e orientado a grafos). assim, o json é a base para a abordagem, por consequência, propõe-se o uso do json schema como formato de representação dos esquemas extraídos. embora a especificação do json schema ainda esteja em desenvolvimento (versão draft-2020-12), ela mostrou-se eficiente nas implementações realizadas. ainda, json schema suporta um conjunto limitado de tipos de dados (string, integer, number, boolean, object, array), porém, ele permite que o usuário possa definir seus próprios tipos de dados e objetos. assim sendo, outra contribuição desta tese é uma biblioteca para a representação de tipos de dados geográficos em json schema denominada js4geo (json schema for geographic data). essa biblioteca também pode ser usada para criar esquemas de dados geográficos armazenados em outros formatos padrão de mercado, como geojson, kml e gml. esta tese propõe, também, a conversão dos json schemas em um formato preparado para uso por aplicações da web semântica. neste contexto, adotou-se a linguagem shacl (shapes constraint language) para definir ontologias de representação (shapesfile) a partir dos json schema. shacl é a mais recente recomendação do w3c e permite, além de descrever dados presentes em um bd nosql, realizar a validação de dados na web semântica, o que não é possível com as linguagens tradicionais para esquemas na web semântica (como owl ou rdf schema). a abordagem proposta nesta tese foi avaliada através de um conjunto de testes executados por meio de diversos protótipos implementados, demonstrando a sua viabilidade.

Pós-processamento: Índice de Shannon: 3.79875

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
5,80% 2,44% 6,38% 4,78% 5,55% 4,00% 4,44% 5,57% 19,90% 3,66% 8,47% 7,69% 3,83% 4,68% 7,19% 5,63%
ODS Predominates
ODS 9
ODS 1

5,80%

ODS 2

2,44%

ODS 3

6,38%

ODS 4

4,78%

ODS 5

5,55%

ODS 6

4,00%

ODS 7

4,44%

ODS 8

5,57%

ODS 9

19,90%

ODS 10

3,66%

ODS 11

8,47%

ODS 12

7,69%

ODS 13

3,83%

ODS 14

4,68%

ODS 15

7,19%

ODS 16

5,63%