Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Tecnológico
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Econômica
Tipo do Documento: Dissertação
Título: DEFINIÇÃO E AVALIAÇÃO DE MÉTODOS PARA A DETERMINAÇÃO DE SIMILARIDADE ENTRE TABELAS NA WEB
Orientador
- RONALDO DOS SANTOS MELLO
Aluno
- FILIPE ROBERTO SILVA
Conteúdo
A web é uma grande fonte de dados. grandes quantidades de dados são inseridos diariamente e muitos desses dados estão na forma de tabelas html. alguns trabalhos têm proposto formas de extrair e integrar o conteúdo dessas tabelas para torná-los mais acessíveis para o consumo humano. porém, essa é uma tarefa complexa e um problema ainda em aberto visto que tabelas web não possuem um padrão de representação. além disso, o uso de sinônimos e abreviações torna difícil a comparação dos conteúdos dessas tabelas. assim sendo, este trabalho propõe uma nova abordagem para determinar a similaridade entre tabelas web capaz de lidar com suas diferentes estruturas e termos sinônimos. trabalhos relacionados não lidam, ao mesmo tempo, com essas duas problemáticas. experimentos preliminares mostram que a abordagem é promissora.
Pós-processamento: Índice de Shannon: 3.98399
| ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4,98% | 6,07% | 7,61% | 6,22% | 6,53% | 5,38% | 6,19% | 7,84% | 7,38% | 5,46% | 7,53% | 5,52% | 4,89% | 6,73% | 5,30% | 6,37% |
ODS Predominates
4,98%
6,07%
7,61%
6,22%
6,53%
5,38%
6,19%
7,84%
7,38%
5,46%
7,53%
5,52%
4,89%
6,73%
5,30%
6,37%