
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Tecnológico
Departamento: Não Informado
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Econômica
Tipo do Documento: Tese
Título: IMPACTOS DA REPRESENTAÇÃO E DA SUMARIZAÇÃO DE GRAFOS DE CONHECIMENTO EM SISTEMAS DE RECOMENDAÇÃO
Orientador
- ROBERTO WILLRICH
Aluno
- JUAREZ ANGELO PIAZZA SACENTI
Conteúdo
Um problema clássico que frequentemente compromete a qualidade de sistemas de recomendação (srs) é a esparsidade de dados sobre as interações dos usuários com os itens a serem recomendados. a representação de conhecimento acerca dos usuários e dos itens (p.ex., no domínio do filmes, atores, diretores e gêneros), também chamado de informações laterais, por meio de ontologias e grafos de conhecimento (gc) se mostrou eficaz para contornar esse problema. no entanto, o crescimento do gc em termos de tamanho e complexidade dá origem a muitos desafios, incluindo a demanda por algoritmos de alto custo para lidar com grandes quantidades de dados parcialmente irrelevantes e ruidosos. enquanto isso, embora a sumarização de grafo (sg) tenha se tornado popular para dar suporte às tarefas de visualização e consulta de gc, seu uso ainda é relativamente inexplorado no domínio de sr baseado em gc. esta tese investiga os impactos da representação e sumarização do conhecimento em sistemas de recomendação, tanto a nível de eficiência como de eficácia. a eficácia neste contexto está relacionada à qualidade da recomendações geradas, e eficiência, por sua vez, está relacionado ao custo computacional. para isto, esta tese realiza um estudo que analisa variações desta representação baseadas em ontologias e outro que analisa a sumarização desta representação baseada em gcs. primeiro, esta tese propõe um arcabouço conceitual para construção de srs baseados em ontologia, que permite especificar os diferentes aspectos (características) dos itens e as hierarquias de entidades que ordenam estes aspectos. além disso, este arcabouço contribui para a independência de domínio do sr, separando o conhecimento em ontologias de diferentes níveis de abstração. experimentos iniciais demonstram que a especificação de múltiplos aspectos e múltiplas hierarquias tem o potencial de melhorar a eficácia de srs e motivaram uma nova proposta. segundo, esta tese propõe um método de sg que combina emph{embeddings} de gc com clusterização de nodos, que é adotado como uma etapa do pré-processamento de srs para condensar a informação lateral representação como gc. este método adota duas abordagens: a única-visão, que sumariza o gc como um todo, e multi-visão, que separa o gc em múltiplas visões, sumariza cada visão e, então, unifica-as em um único sumário de gc. estas visões são subgrafos do gc contendo entidades relacionadas a um determinado aspecto de item. experimentos avaliam o impacto de ambas as abordagens de sumarização na eficiência de treinamento e eficácia de quatro srs baseados em gcs, adotando dois conjuntos de dados baseados em movielens 1m contendo informação lateral coletada em imdb e dbpedia. os resultados mostram que a sumarização do gc pode acelerar o processo de recomendação sem mudanças significativas na eficácia da recomendação, que varia de acordo com a abordagem, a taxa de sumarização e o sr.
Índice de Shannon: 3.94003
Índice de Gini: 0.932371
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4,07% | 6,52% | 6,92% | 8,40% | 4,35% | 6,96% | 6,38% | 5,54% | 10,22% | 3,09% | 6,72% | 8,30% | 7,14% | 5,11% | 4,12% | 6,18% |
ODS Predominates


4,07%

6,52%

6,92%

8,40%

4,35%

6,96%

6,38%

5,54%

10,22%

3,09%

6,72%

8,30%

7,14%

5,11%

4,12%

6,18%