Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Tecnológico

Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Dissertação

Título: DEEPEC: UMA ABORDAGEM PARA EXTRAÇÃO E CATALOGAÇÃO DE CONTEÚDO PRESENTE NA DEEP WEB

Orientador
  • RONALDO DOS SANTOS MELLO
Aluno
  • AUGUSTO FERREIRA DE SOUZA

Conteúdo

Esta dissertação apresenta uma solução chamada deepec (deep web extraction and cataloguing) para realizar a extração e catalogação de dados relevantes em bancos de dados na deep web, também denominados de bancos de dados escondidos. essas informações são extraídas a partir de um conjunto de páginas html geradas através de consultas sobre formulários web. a intenção é adquirir conhecimento sobre esses bancos de dados e, consequentemente, permitir buscas estruturadas sobre esse conteúdo escondido. experimentos comprovaram a eficácia da abordagem proposta. comparado com trabalhos relacionados, as contribuições desta dissertação são a realização simultânea do processo de extração e catalogação dos dados de bancos de dados escondidos, um processo de extração com melhor acurácia e um processo de catalogação que gera registros estruturados e é capaz de realizar a inferência de atributos cujos valores não estão presentes nos dados extraídos.

Pós-processamento: Índice de Shannon: 3.98657

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
4,89% 5,79% 7,31% 6,12% 6,32% 5,17% 6,16% 7,48% 7,08% 5,18% 7,24% 6,52% 7,11% 6,59% 4,89% 6,15%
ODS Predominates
ODS 8
ODS 1

4,89%

ODS 2

5,79%

ODS 3

7,31%

ODS 4

6,12%

ODS 5

6,32%

ODS 6

5,17%

ODS 7

6,16%

ODS 8

7,48%

ODS 9

7,08%

ODS 10

5,18%

ODS 11

7,24%

ODS 12

6,52%

ODS 13

7,11%

ODS 14

6,59%

ODS 15

4,89%

ODS 16

6,15%