
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Ciências da Educação
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Informação
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Institucional
Tipo do Documento: Dissertação
Título: DESCOBERTA DE CONHECIMENTO EM PEÇAS DE INQUÉRITO POLICIAL RELATADO FLORIANÓPOLIS 2021
Orientador
- ANGEL FREDDY GODOY VIERA
Aluno
- MARCIO PONCIANO DA SILVA
Conteúdo
Esta pesquisa utiliza técnicas de mineração de textos aplicadas em documentos textuais da investigação policial brasileira para a descoberta de conhecimento não trivial, que importe em melhoria da investigação policial. o processo de descoberta de conhecimento é empregado para encontrar informações ou padrões de informação, com técnicas, análise e extração de dados. as técnicas são empregadas em uma amostra de documentos textuais do inquérito policial, sendo este um procedimento administrativo utilizado nas investigações realizadas pelas polícias brasileiras. as técnicas são empregadas com a finalidade de descobrir padrões não observáveis quando analisados por manipulação humana de grande volume de documentos. é aplicado um processo de anonimização, com vistas a cumprir a lei geral de proteção de dados. a pesquisa busca estudos relevantes a respeito do tema proposto, elaborando uma revisão de literatura. no estudo são abordadas as fases do processo de descoberta de conhecimento e analisa a conceituação de recuperação de informação. o uso dos métodos e técnicas utilizados pela área de recuperação de informação para a descoberta de conhecimento em base de dados textual é apresentado como possível ferramenta de promover essa melhoria. a pesquisa analisa técnicas como case folding, tokenização, remoção de stopwords, stemming, bag of words, tf-idf, n-grams, word cloud e clusterização com o método k-means para agrupar conjunto de dados dos n-grams extraídos. o estudo utiliza o elbow method para determinar o número de clusters e o indicador silhouette para análise da distância de cada cluster. este estudo aborda o conceito de inquérito policial e contextualiza sua função na investigação criminal brasileira. dados os embasamentos teóricos da descoberta de conhecimento em base de dados textual e do inquérito policial, o estudo apresenta como o inquérito policial pode tirar proveito da mineração de textos como ferramenta de melhoria da investigação policial. é apresentado um breve relato do sistema criminal adotado no brasil, com suas principais características. é analisado o volume de peças em inquéritos policiais e também as características desses documentos textuais. o estudo adota como procedimentos metodológicos a caracterização da pesquisa, as suas etapas e a caracterização do universo e amostra, e ainda os critérios de exclusão de estudos da revisão de literatura e seleção de técnicas. são apresentados dois experimentos que permitem comparar os resultados. é verificado no resultado que a ponderação de termos do tf-idf valoriza a identificação de entidades, tanto nomes como conexões. o resultado dessa técnica também permite descobrir termos mais representativos dos textos. o resultado do agrupamento com clusterização k-means permite analisar os termos mais representativos em cada cluster, utilizando-se dos trigramas extraídos do tf-idf, possibilitando identificar categorias do agrupamento. concluiu-se que a partir do conjunto de técnicas utilizadas é possível descobrir os termos mais relevantes dos documentos, bem como os termos mais representativos. também é possível descobrir categorias de temas de atuação da área policial. concluiu-se com o uso da técnica de tf-idf em conjunto com n-grams constitui uma ferramenta para identificar de nomes de entidades e suas conexões.
Pós-processamento: Índice de Shannon: 3.73541
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
3,71% | 6,05% | 6,06% | 6,78% | 5,31% | 3,55% | 3,50% | 4,35% | 6,72% | 2,81% | 8,21% | 4,99% | 4,10% | 4,13% | 6,57% | 23,16% |
ODS Predominates


3,71%

6,05%

6,06%

6,78%

5,31%

3,55%

3,50%

4,35%

6,72%

2,81%

8,21%

4,99%

4,10%

4,13%

6,57%

23,16%