
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Não Informado
Departamento: Não Informado
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Econômica
Tipo do Documento: Dissertação
Título: EXTENSÃO ARTIFICIAL DE LARGURA DE BANDA PARA SINAIS DE FALA EM TELEFONIA USANDO CLASSIFICAÇÃO FONÉTICA
Orientador
- RUI SEARA
Aluno
- ENIO DOS SANTOS SILVA
Conteúdo
Este trabalho de pesquisa apresenta uma nova estratégia para implementar sistemas de extensão artificial de largura de banda (artificial bandwidth extension - abwe) para sinais de fala aplicados à rede pública (convencional) de telefonia (public switched telephone network - pstn). especificamente, aqui é proposta uma estratégia baseada em classificação fonética visando representar satisfatoriamente segmentos de fala com energia concentrada em altas frequências, superando outros resultados apresentados na literatura. para tal, técnicas de seleção de atributos aplicadas a sinais de fala de banda limitada são investigadas, aprimorando a classificação em grupos fonéticos abrangentes (broad group phonetic - bgp) com ênfase na discriminação de fonemas pertencentes ao grupo fonético fricativo. adicionalmente, neste trabalho é discutida a integração do sistema de abwe proposto em sistemas de reconhecimento automático de fala (automatic speech recognition - asr) para o português brasileiro aplicados à pstn. particularmente, visando o aprimoramento de asr em pstn, as etapas de extração de atributos do sinal da fala e a etapa de construção do modelo acústico são desenvolvidas baseadas em sinais sintéticos de banda larga (wideband - wb) estimados a partir do realce de sinais de banda estreita (narrowband - nb) usando abwe. os resultados obtidos apresentam realce na qualidade subjetiva dos sinais de fala reconstruí- dos e ganho no desempenho do asr, confirmando a eficácia das estratégias propostas neste trabalho de pesquisa.
Índice de Shannon: 3.92985
Índice de Gini: 0.930982
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4,18% | 5,00% | 6,97% | 7,10% | 6,22% | 4,57% | 6,37% | 9,31% | 10,72% | 4,63% | 6,64% | 4,60% | 4,67% | 4,76% | 4,48% | 9,80% |
ODS Predominates


4,18%

5,00%

6,97%

7,10%

6,22%

4,57%

6,37%

9,31%

10,72%

4,63%

6,64%

4,60%

4,67%

4,76%

4,48%

9,80%