Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Tecnológico

Departamento: Não Informado

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Tese

Título: IMPACTOS DA REPRESENTAÇÃO E DA SUMARIZAÇÃO DE GRAFOS DE CONHECIMENTO EM SISTEMAS DE RECOMENDAÇÃO

Orientador
  • ROBERTO WILLRICH
Aluno
  • JUAREZ ANGELO PIAZZA SACENTI

Conteúdo

Um problema clássico que frequentemente compromete a qualidade de sistemas de recomendação (srs) é a esparsidade de dados sobre as interações dos usuários com os itens a serem recomendados. a representação de conhecimento acerca dos usuários e dos itens (p.ex., no domínio do filmes, atores, diretores e gêneros), também chamado de informações laterais, por meio de ontologias e grafos de conhecimento (gc) se mostrou eficaz para contornar esse problema. no entanto, o crescimento do gc em termos de tamanho e complexidade dá origem a muitos desafios, incluindo a demanda por algoritmos de alto custo para lidar com grandes quantidades de dados parcialmente irrelevantes e ruidosos. enquanto isso, embora a sumarização de grafo (sg) tenha se tornado popular para dar suporte às tarefas de visualização e consulta de gc, seu uso ainda é relativamente inexplorado no domínio de sr baseado em gc. esta tese investiga os impactos da representação e sumarização do conhecimento em sistemas de recomendação, tanto a nível de eficiência como de eficácia. a eficácia neste contexto está relacionada à qualidade da recomendações geradas, e eficiência, por sua vez, está relacionado ao custo computacional. para isto, esta tese realiza um estudo que analisa variações desta representação baseadas em ontologias e outro que analisa a sumarização desta representação baseada em gcs. primeiro, esta tese propõe um arcabouço conceitual para construção de srs baseados em ontologia, que permite especificar os diferentes aspectos (características) dos itens e as hierarquias de entidades que ordenam estes aspectos. além disso, este arcabouço contribui para a independência de domínio do sr, separando o conhecimento em ontologias de diferentes níveis de abstração. experimentos iniciais demonstram que a especificação de múltiplos aspectos e múltiplas hierarquias tem o potencial de melhorar a eficácia de srs e motivaram uma nova proposta. segundo, esta tese propõe um método de sg que combina emph{embeddings} de gc com clusterização de nodos, que é adotado como uma etapa do pré-processamento de srs para condensar a informação lateral representação como gc. este método adota duas abordagens: a única-visão, que sumariza o gc como um todo, e multi-visão, que separa o gc em múltiplas visões, sumariza cada visão e, então, unifica-as em um único sumário de gc. estas visões são subgrafos do gc contendo entidades relacionadas a um determinado aspecto de item. experimentos avaliam o impacto de ambas as abordagens de sumarização na eficiência de treinamento e eficácia de quatro srs baseados em gcs, adotando dois conjuntos de dados baseados em movielens 1m contendo informação lateral coletada em imdb e dbpedia. os resultados mostram que a sumarização do gc pode acelerar o processo de recomendação sem mudanças significativas na eficácia da recomendação, que varia de acordo com a abordagem, a taxa de sumarização e o sr.

Índice de Shannon: 3.94003

Índice de Gini: 0.932371

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
4,07% 6,52% 6,92% 8,40% 4,35% 6,96% 6,38% 5,54% 10,22% 3,09% 6,72% 8,30% 7,14% 5,11% 4,12% 6,18%
ODS Predominates
ODS 9
ODS 1

4,07%

ODS 2

6,52%

ODS 3

6,92%

ODS 4

8,40%

ODS 5

4,35%

ODS 6

6,96%

ODS 7

6,38%

ODS 8

5,54%

ODS 9

10,22%

ODS 10

3,09%

ODS 11

6,72%

ODS 12

8,30%

ODS 13

7,14%

ODS 14

5,11%

ODS 15

4,12%

ODS 16

6,18%