Perfil ODS

Universidade Federal de Santa catarina (UFSC)

Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)

Detalhes do Documento Analisado

Centro: Não Informado

Departamento: Não Informado

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Tese

Título: PROPOSTA DE ORDEM SEQUENCIAL E CRIAÇÃO DE SISTEMAS INFORMÁTICOS PARA EXTRAÇÃO TERMINOLÓGICA BILÍNGUE EM CORPORA PARALELOS INGLÊS/PORTUGUÊS COM VISTAS À TRADUÇÃO DE TEXTOS DAS CIÊNCIAS MÉDICAS

Orientador

RONALDO LIMA

Aluno

LAUTENAI ANTONIO BARTHOLAMEI JUNIOR

Conteúdo

A extração terminológica bilíngue cada vez mais se firma como um campo de pesquisa explorado por pesquisadores no âmbito dos estudos da tradução. parte considerável das investigações atualmente desenvolvidas volta-se à operacionalização das tarefas de extração terminológica por meio de ferramentas computacionais, produzindo glossários para servirem como ferramenta de apoio aos tradutores. esta pesquisa de doutoramento desenvolve uma proposta sequencial para a extração terminológica na área das ciências médicas, centrando-se principalmente em uma lacuna detectada em estudos anteriores, a saber: a busca por correspondentes tradutórios dos candidatos a termos, geralmente realizada, de forma manual. nesta perspectiva, o estudo emprega ferramentas fornecidas pelo processamento da linguagem natural (pln), evocando principalmente as seguintes disciplinas: linguística de corpus, corpora nos estudos da tradução, terminologia e extração terminológica, com o intuito de oferecer um processo sistemático que contemple o processo de extração terminológica. na presente proposta, os dados obtidos evidenciam altos níveis de precisão, que levam a supor que por meio da referida abordagem a recuperação de candidatos a termos e a busca por seus correspondentes tradutórios pode efetivamente ser otimizadas, revelando-se tão eficiente quanto a extração terminológica realizada analogicamente por especialistas. em uma escala numérica de 0 (zero) a 1 (um), a probabilidade de 0,822645962, 0.969518 e, em alguns casos, 1 (um), explicita a precisão dos correspondentes tradutórios. os resultados ainda demonstraram que, embora os corpora utilizados para análise estejam expostos em português europeu, e circunscritos uma área especifica do conhecimento, os valores semânticos dos correspondentes tradutórios foram mantido. na proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos, a ordem sequencial proposta, tal como os sistemas informáticos desenvolvidos para o processamento dos dados tratam do par de idiomas inglês-português, no entanto, poderão ser utilizados outros pares de línguas e corpora de outros campos do conhecimento

Índice de Shannon: 3.95158

Índice de Gini: 0.933224