Responsive image
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado

Centro: Não Informado

Departamento: Não Informado

Dimensão Institucional: Pós-Graduação

Dimensão ODS: Econômica

Tipo do Documento: Dissertação

Título: EXTENSÃO ARTIFICIAL DE LARGURA DE BANDA PARA SINAIS DE FALA EM TELEFONIA USANDO CLASSIFICAÇÃO FONÉTICA

Orientador
  • RUI SEARA
Aluno
  • ENIO DOS SANTOS SILVA

Conteúdo

Este trabalho de pesquisa apresenta uma nova estratégia para implementar sistemas de extensão artificial de largura de banda (artificial bandwidth extension - abwe) para sinais de fala aplicados à rede pública (convencional) de telefonia (public switched telephone network - pstn). especificamente, aqui é proposta uma estratégia baseada em classificação fonética visando representar satisfatoriamente segmentos de fala com energia concentrada em altas frequências, superando outros resultados apresentados na literatura. para tal, técnicas de seleção de atributos aplicadas a sinais de fala de banda limitada são investigadas, aprimorando a classificação em grupos fonéticos abrangentes (broad group phonetic - bgp) com ênfase na discriminação de fonemas pertencentes ao grupo fonético fricativo. adicionalmente, neste trabalho é discutida a integração do sistema de abwe proposto em sistemas de reconhecimento automático de fala (automatic speech recognition - asr) para o português brasileiro aplicados à pstn. particularmente, visando o aprimoramento de asr em pstn, as etapas de extração de atributos do sinal da fala e a etapa de construção do modelo acústico são desenvolvidas baseadas em sinais sintéticos de banda larga (wideband - wb) estimados a partir do realce de sinais de banda estreita (narrowband - nb) usando abwe. os resultados obtidos apresentam realce na qualidade subjetiva dos sinais de fala reconstruí- dos e ganho no desempenho do asr, confirmando a eficácia das estratégias propostas neste trabalho de pesquisa.

Índice de Shannon: 3.92985

Índice de Gini: 0.930982

ODS 1 ODS 2 ODS 3 ODS 4 ODS 5 ODS 6 ODS 7 ODS 8 ODS 9 ODS 10 ODS 11 ODS 12 ODS 13 ODS 14 ODS 15 ODS 16
4,18% 5,00% 6,97% 7,10% 6,22% 4,57% 6,37% 9,31% 10,72% 4,63% 6,64% 4,60% 4,67% 4,76% 4,48% 9,80%
ODS Predominates
ODS 9
ODS 1

4,18%

ODS 2

5,00%

ODS 3

6,97%

ODS 4

7,10%

ODS 5

6,22%

ODS 6

4,57%

ODS 7

6,37%

ODS 8

9,31%

ODS 9

10,72%

ODS 10

4,63%

ODS 11

6,64%

ODS 12

4,60%

ODS 13

4,67%

ODS 14

4,76%

ODS 15

4,48%

ODS 16

9,80%