
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Não Informado
Departamento: Não Informado
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Econômica
Tipo do Documento: Tese
Título: PROPOSTA DE ORDEM SEQUENCIAL E CRIAÇÃO DE SISTEMAS INFORMÁTICOS PARA EXTRAÇÃO TERMINOLÓGICA BILÍNGUE EM CORPORA PARALELOS INGLÊS/PORTUGUÊS COM VISTAS À TRADUÇÃO DE TEXTOS DAS CIÊNCIAS MÉDICAS
Orientador
- RONALDO LIMA
Aluno
- LAUTENAI ANTONIO BARTHOLAMEI JUNIOR
Conteúdo
A extração terminológica bilíngue cada vez mais se firma como um campo de pesquisa explorado por pesquisadores no âmbito dos estudos da tradução. parte considerável das investigações atualmente desenvolvidas volta-se à operacionalização das tarefas de extração terminológica por meio de ferramentas computacionais, produzindo glossários para servirem como ferramenta de apoio aos tradutores. esta pesquisa de doutoramento desenvolve uma proposta sequencial para a extração terminológica na área das ciências médicas, centrando-se principalmente em uma lacuna detectada em estudos anteriores, a saber: a busca por correspondentes tradutórios dos candidatos a termos, geralmente realizada, de forma manual. nesta perspectiva, o estudo emprega ferramentas fornecidas pelo processamento da linguagem natural (pln), evocando principalmente as seguintes disciplinas: linguística de corpus, corpora nos estudos da tradução, terminologia e extração terminológica, com o intuito de oferecer um processo sistemático que contemple o processo de extração terminológica. na presente proposta, os dados obtidos evidenciam altos níveis de precisão, que levam a supor que por meio da referida abordagem a recuperação de candidatos a termos e a busca por seus correspondentes tradutórios pode efetivamente ser otimizadas, revelando-se tão eficiente quanto a extração terminológica realizada analogicamente por especialistas. em uma escala numérica de 0 (zero) a 1 (um), a probabilidade de 0,822645962, 0.969518 e, em alguns casos, 1 (um), explicita a precisão dos correspondentes tradutórios. os resultados ainda demonstraram que, embora os corpora utilizados para análise estejam expostos em português europeu, e circunscritos uma área especifica do conhecimento, os valores semânticos dos correspondentes tradutórios foram mantido. na proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos, a ordem sequencial proposta, tal como os sistemas informáticos desenvolvidos para o processamento dos dados tratam do par de idiomas inglês-português, no entanto, poderão ser utilizados outros pares de línguas e corpora de outros campos do conhecimento
Índice de Shannon: 3.95158
Índice de Gini: 0.933224
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4,03% | 5,64% | 6,29% | 7,20% | 5,71% | 4,41% | 5,76% | 6,65% | 10,02% | 3,91% | 7,35% | 8,77% | 4,44% | 5,84% | 6,38% | 7,60% |
ODS Predominates


4,03%

5,64%

6,29%

7,20%

5,71%

4,41%

5,76%

6,65%

10,02%

3,91%

7,35%

8,77%

4,44%

5,84%

6,38%

7,60%