Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Não Informado

Departamento: Não Informado

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Tese

Título: PROPOSTA DE ORDEM SEQUENCIAL E CRIAÇÃO DE SISTEMAS INFORMÁTICOS PARA EXTRAÇÃO TERMINOLÓGICA BILÍNGUE EM CORPORA PARALELOS INGLÊS/PORTUGUÊS COM VISTAS À TRADUÇÃO DE TEXTOS DAS CIÊNCIAS MÉDICAS

Orientador
  • RONALDO LIMA
Aluno
  • LAUTENAI ANTONIO BARTHOLAMEI JUNIOR

Conteúdo

A extração terminológica bilíngue cada vez mais se firma como um campo de pesquisa explorado por pesquisadores no âmbito dos estudos da tradução. parte considerável das investigações atualmente desenvolvidas volta-se à operacionalização das tarefas de extração terminológica por meio de ferramentas computacionais, produzindo glossários para servirem como ferramenta de apoio aos tradutores. esta pesquisa de doutoramento desenvolve uma proposta sequencial para a extração terminológica na área das ciências médicas, centrando-se principalmente em uma lacuna detectada em estudos anteriores, a saber: a busca por correspondentes tradutórios dos candidatos a termos, geralmente realizada, de forma manual. nesta perspectiva, o estudo emprega ferramentas fornecidas pelo processamento da linguagem natural (pln), evocando principalmente as seguintes disciplinas: linguística de corpus, corpora nos estudos da tradução, terminologia e extração terminológica, com o intuito de oferecer um processo sistemático que contemple o processo de extração terminológica. na presente proposta, os dados obtidos evidenciam altos níveis de precisão, que levam a supor que por meio da referida abordagem a recuperação de candidatos a termos e a busca por seus correspondentes tradutórios pode efetivamente ser otimizadas, revelando-se tão eficiente quanto a extração terminológica realizada analogicamente por especialistas. em uma escala numérica de 0 (zero) a 1 (um), a probabilidade de 0,822645962, 0.969518 e, em alguns casos, 1 (um), explicita a precisão dos correspondentes tradutórios. os resultados ainda demonstraram que, embora os corpora utilizados para análise estejam expostos em português europeu, e circunscritos uma área especifica do conhecimento, os valores semânticos dos correspondentes tradutórios foram mantido. na proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos, a ordem sequencial proposta, tal como os sistemas informáticos desenvolvidos para o processamento dos dados tratam do par de idiomas inglês-português, no entanto, poderão ser utilizados outros pares de línguas e corpora de outros campos do conhecimento

Índice de Shannon: 3.95158

Índice de Gini: 0.933224

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
4,03% 5,64% 6,29% 7,20% 5,71% 4,41% 5,76% 6,65% 10,02% 3,91% 7,35% 8,77% 4,44% 5,84% 6,38% 7,60%
ODS Predominates
ODS 9
ODS 1

4,03%

ODS 2

5,64%

ODS 3

6,29%

ODS 4

7,20%

ODS 5

5,71%

ODS 6

4,41%

ODS 7

5,76%

ODS 8

6,65%

ODS 9

10,02%

ODS 10

3,91%

ODS 11

7,35%

ODS 12

8,77%

ODS 13

4,44%

ODS 14

5,84%

ODS 15

6,38%

ODS 16

7,60%