
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Não Informado
Departamento: Não Informado
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Econômica
Tipo do Documento: Dissertação
Título: DEFINIÇÃO E AVALIAÇÃO DE MÉTODOS PARA A DETERMINAÇÃO DE SIMILARIDADE ENTRE TABELAS NA WEB
Orientador
- RONALDO DOS SANTOS MELLO
Aluno
- FILIPE ROBERTO SILVA
Conteúdo
A web é uma grande fonte de dados. grandes quantidades de dados são inseridos diariamente e muitos desses dados estão na forma de tabelas html. alguns trabalhos têm proposto formas de extrair e integrar o conteúdo dessas tabelas para torná-los mais acessíveis para o consumo humano. porém, essa é uma tarefa complexa e um problema ainda em aberto visto que tabelas web não possuem um padrão de representação. além disso, o uso de sinônimos e abreviações torna difícil a comparação dos conteúdos dessas tabelas. assim sendo, este trabalho propõe uma nova abordagem para determinar a similaridade entre tabelas web capaz de lidar com suas diferentes estruturas e termos sinônimos. trabalhos relacionados não lidam, ao mesmo tempo, com essas duas problemáticas. experimentos preliminares mostram que a abordagem é promissora.
Índice de Shannon: 3.98399
Índice de Gini: 0.936105
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4,98% | 6,07% | 7,61% | 6,22% | 6,53% | 5,38% | 6,19% | 7,84% | 7,38% | 5,46% | 7,53% | 5,52% | 4,89% | 6,73% | 5,30% | 6,37% |
ODS Predominates


4,98%

6,07%

7,61%

6,22%

6,53%

5,38%

6,19%

7,84%

7,38%

5,46%

7,53%

5,52%

4,89%

6,73%

5,30%

6,37%