Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Não Informado

Departamento: Não Informado

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Dissertação

Título: DEFINIÇÃO E AVALIAÇÃO DE MÉTODOS PARA A DETERMINAÇÃO DE SIMILARIDADE ENTRE TABELAS NA WEB

Orientador
  • RONALDO DOS SANTOS MELLO
Aluno
  • FILIPE ROBERTO SILVA

Conteúdo

A web é uma grande fonte de dados. grandes quantidades de dados são inseridos diariamente e muitos desses dados estão na forma de tabelas html. alguns trabalhos têm proposto formas de extrair e integrar o conteúdo dessas tabelas para torná-los mais acessíveis para o consumo humano. porém, essa é uma tarefa complexa e um problema ainda em aberto visto que tabelas web não possuem um padrão de representação. além disso, o uso de sinônimos e abreviações torna difícil a comparação dos conteúdos dessas tabelas. assim sendo, este trabalho propõe uma nova abordagem para determinar a similaridade entre tabelas web capaz de lidar com suas diferentes estruturas e termos sinônimos. trabalhos relacionados não lidam, ao mesmo tempo, com essas duas problemáticas. experimentos preliminares mostram que a abordagem é promissora.

Índice de Shannon: 3.98399

Índice de Gini: 0.936105

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
4,98% 6,07% 7,61% 6,22% 6,53% 5,38% 6,19% 7,84% 7,38% 5,46% 7,53% 5,52% 4,89% 6,73% 5,30% 6,37%
ODS Predominates
ODS 8
ODS 1

4,98%

ODS 2

6,07%

ODS 3

7,61%

ODS 4

6,22%

ODS 5

6,53%

ODS 6

5,38%

ODS 7

6,19%

ODS 8

7,84%

ODS 9

7,38%

ODS 10

5,46%

ODS 11

7,53%

ODS 12

5,52%

ODS 13

4,89%

ODS 14

6,73%

ODS 15

5,30%

ODS 16

6,37%