Resumo 2 páginas.docx - PUC-Rio

Propaganda
Departamento de Engenharia Elétrica
TRALP - TRADUTOR LIBRAS-PORTUGUÊS: ANÁLISE E
ESPECIFICAÇÃO DAS FUNCIONALIDADES
Alunos: Leandro Morgado, Caroline Rosa Redlich e Victor Yves Crispim
Orientadores: Ana M. Beltran Pavani e Marcelo Krieger
Introdução
Esse documento descreve a primeira fase do projeto, cuja pesquisa envolveu o
entendimento e a modelagem do problema, bem como a escolha de ferramentas. Em linhas
gerais, o aplicativo TRALP é capaz de traduzir português para Libras e Libras para português
nas plataformas Android, iOS e Windows Phone.
Neste projeto, a equipe foi dividida em dois grupos, dos quais este foi encarregado da
análise e especificação das funcionalidades para realização deste projeto, desenvolvido na
Pontifícia Universidade Católica do Rio de Janeiro com recursos do CNPq, oriundos da
chamada MCTI-SECIS/CNPq No 84/2013 - Tecnologia Assistiva.
Para isso, o sistema utilizará a câmera do dispositivo para captar sinais de Libras,
traduzindo-os para português escrito ou falado. No caminho inverso, uma sentença em
português falado ou escrito ao ser convertida para sua forma equivalente em Libras é exibida
na tela do aparelho por um avatar tridimensional.
Na pesquisa, foram investigados métodos de tradução, de reconhecimento e síntese de
voz e de animação. Para a tradução, definiu-se um conjunto de etapas necessárias à conversão
dos idiomas, delimitadas pelos seguintes módulos: analisador morfológico, analisador
sintático, transformador, contextualizador e dicionário. Já no caso do reconhecimento e
síntese de voz, os processos TTS (Text-To-Speech) e STT (Speech-To-Text) estudados
levaram a escolha de funções nativas presentes nas diversas plataformas. Por fim, na área de
animação, dentre os softwares gráficos possíveis, o Blender foi selecionado para a criação do
avatar, cuja movimentação se dará em tempo de execução, por meio de uma linguagem que
parametriza os sinais de Libras.
Objetivos
Desenvolver um aplicativo móvel para as plataformas mais expressivas do mercado,
capaz de traduzir conversações básicas de português para Libras e de Libras para português,
utilizando sistemas de reconhecimento de voz e imagem, além de um avatar animado para
exibir a saída da tradução em Libras.
Metodologia
Foram considerados todos os tipos de processos TTS e STT - software completo, API's
(Application Programming Interface) e SDK's (Software Development Kit) - na definição das
técnicas de reconhecimento e síntese de voz. Tendo-se em vista o período de desenvolvimento
do TRALP, verificou-se que as funções TTS e STT nativas de cada plataforma serão
suficientes ao intuito do projeto.
No que se refere à animação, a linha de pesquisa seguiu a abordagem da tese “The Use
of Mobile Phones as Service-Delivery Devices in a Sign Language Machine Translation
System”, cuja proposta é similar a do projeto TRALP. Nesse aspecto, diversas técnicas de
modelagem em 3D foram consideradas – interativa, paramétrica, procedural, morphing,
skeletal subspace deformation – e avaliadas de acordo com seu nível de complexidade e
liberdade de criação. Para a escolha da ferramenta de modelagem, características como preço,
Departamento de Engenharia Elétrica
tamanho da comunidade, qualidade da documentação e curva de aprendizado pesaram na
decisão entre os softwares Maya, 3DS Max, Blender e MakeHuman.
No sentido português-Libras, a tradução é realizada de um texto em português para um
texto em Libras transcrito, que é o correspondente textual a uma sequência de sinais, o qual
seguirá a estrutura sintática e semântica de Libras. No sentido Libras-português, o caminho
inverso é adotado.
A tradução será feita levando-se em conta a construção sintática de ambos os idiomas.
Para atingir a finalidade proposta, o sistema deverá realizar as seguintes atividades: análise
morfológica, que identifica a classe gramatical de cada palavra; análise sintática, que
decompõe a frase em sujeito, verbo e objeto; transformação, que modifica a frase para que
esta seja traduzida por inteira, respeitando a gramática de ambas as línguas; contextualização,
que realiza a desambiguação das sentenças, aumentando a precisão da tradução; tradução
palavra a palavra, que através de um dicionário, relaciona palavras em ambas as línguas.
Conclusões
Devido à simulação do esqueleto humano, Skeletal Subspace Deformation é a técnica de
animação que apresenta os resultados mais satisfatórios para a movimentação do avatar. Para
a criação do avatar, o Blender se mostra uma ótima opção. Além de ser gratuito e receber
constante suporte de sua comunidade, possui uma ampla documentação e oferece suporte para
a maioria das extensões conhecidas.
Depois de diferentes testes com os processos nativos de reconhecimento e síntese de
voz, esse será o caminho seguido ao longo do projeto por atender os requisitos do projeto.
Com respeito à tradução todos os módulos deverão ser desenvolvidos, já que não
existem ferramentas próprias a esse fim que possam ser reutilizadas.
Referências
1 - CHBANE, D.T. Desenvolvimento de Sistema Para Conversão de Textos em Fonemas.
Novembro, 1994. Dissertação de Mestrado. Escola Politécnica da Universidade de São Paulo
(USP).
2 - CASTRO, A.J. ; ALFENAS, D.A; SHIBATA, D.P; SOEJIMA, H.T. Sintetizador TextoVoz com Autômatos Adaptativos. 2004. Projeto Apresentado à Disciplina PCS 2050 –
Laboratório de Projeto de Formatura II. Escola Politécnica da Universidade de São Paulo.
3 - LATSCH, V.L. Desenvolvimento de um Sistema de Conversão Texto – Fala com
Modelagem de Prosódia. Junho, 2011. Tese de Doutorado. Universidade Federal do Rio de
Janeiro.
4 - LECHETA, RICARDO R. Google Android: aprenda a criar aplicações para
dispositivos móveis com o Android SDK. 3.ed. São Paulo: Novatec Editora, 2013.
5 - GHAZIASGAR, M. The Use of Mobile Phones as Service-Delivery Devices in a Sign
Language Machine Translation System. África do Sul, 2010. 136p. Tese de Mestrado University of The Western Cape.
Download