Departamento de Engenharia Elétrica TRALP - TRADUTOR LIBRAS-PORTUGUÊS: ANÁLISE E ESPECIFICAÇÃO DAS FUNCIONALIDADES Alunos: Leandro Morgado, Caroline Rosa Redlich e Victor Yves Crispim Orientadores: Ana M. Beltran Pavani e Marcelo Krieger Introdução Esse documento descreve a primeira fase do projeto, cuja pesquisa envolveu o entendimento e a modelagem do problema, bem como a escolha de ferramentas. Em linhas gerais, o aplicativo TRALP é capaz de traduzir português para Libras e Libras para português nas plataformas Android, iOS e Windows Phone. Neste projeto, a equipe foi dividida em dois grupos, dos quais este foi encarregado da análise e especificação das funcionalidades para realização deste projeto, desenvolvido na Pontifícia Universidade Católica do Rio de Janeiro com recursos do CNPq, oriundos da chamada MCTI-SECIS/CNPq No 84/2013 - Tecnologia Assistiva. Para isso, o sistema utilizará a câmera do dispositivo para captar sinais de Libras, traduzindo-os para português escrito ou falado. No caminho inverso, uma sentença em português falado ou escrito ao ser convertida para sua forma equivalente em Libras é exibida na tela do aparelho por um avatar tridimensional. Na pesquisa, foram investigados métodos de tradução, de reconhecimento e síntese de voz e de animação. Para a tradução, definiu-se um conjunto de etapas necessárias à conversão dos idiomas, delimitadas pelos seguintes módulos: analisador morfológico, analisador sintático, transformador, contextualizador e dicionário. Já no caso do reconhecimento e síntese de voz, os processos TTS (Text-To-Speech) e STT (Speech-To-Text) estudados levaram a escolha de funções nativas presentes nas diversas plataformas. Por fim, na área de animação, dentre os softwares gráficos possíveis, o Blender foi selecionado para a criação do avatar, cuja movimentação se dará em tempo de execução, por meio de uma linguagem que parametriza os sinais de Libras. Objetivos Desenvolver um aplicativo móvel para as plataformas mais expressivas do mercado, capaz de traduzir conversações básicas de português para Libras e de Libras para português, utilizando sistemas de reconhecimento de voz e imagem, além de um avatar animado para exibir a saída da tradução em Libras. Metodologia Foram considerados todos os tipos de processos TTS e STT - software completo, API's (Application Programming Interface) e SDK's (Software Development Kit) - na definição das técnicas de reconhecimento e síntese de voz. Tendo-se em vista o período de desenvolvimento do TRALP, verificou-se que as funções TTS e STT nativas de cada plataforma serão suficientes ao intuito do projeto. No que se refere à animação, a linha de pesquisa seguiu a abordagem da tese “The Use of Mobile Phones as Service-Delivery Devices in a Sign Language Machine Translation System”, cuja proposta é similar a do projeto TRALP. Nesse aspecto, diversas técnicas de modelagem em 3D foram consideradas – interativa, paramétrica, procedural, morphing, skeletal subspace deformation – e avaliadas de acordo com seu nível de complexidade e liberdade de criação. Para a escolha da ferramenta de modelagem, características como preço, Departamento de Engenharia Elétrica tamanho da comunidade, qualidade da documentação e curva de aprendizado pesaram na decisão entre os softwares Maya, 3DS Max, Blender e MakeHuman. No sentido português-Libras, a tradução é realizada de um texto em português para um texto em Libras transcrito, que é o correspondente textual a uma sequência de sinais, o qual seguirá a estrutura sintática e semântica de Libras. No sentido Libras-português, o caminho inverso é adotado. A tradução será feita levando-se em conta a construção sintática de ambos os idiomas. Para atingir a finalidade proposta, o sistema deverá realizar as seguintes atividades: análise morfológica, que identifica a classe gramatical de cada palavra; análise sintática, que decompõe a frase em sujeito, verbo e objeto; transformação, que modifica a frase para que esta seja traduzida por inteira, respeitando a gramática de ambas as línguas; contextualização, que realiza a desambiguação das sentenças, aumentando a precisão da tradução; tradução palavra a palavra, que através de um dicionário, relaciona palavras em ambas as línguas. Conclusões Devido à simulação do esqueleto humano, Skeletal Subspace Deformation é a técnica de animação que apresenta os resultados mais satisfatórios para a movimentação do avatar. Para a criação do avatar, o Blender se mostra uma ótima opção. Além de ser gratuito e receber constante suporte de sua comunidade, possui uma ampla documentação e oferece suporte para a maioria das extensões conhecidas. Depois de diferentes testes com os processos nativos de reconhecimento e síntese de voz, esse será o caminho seguido ao longo do projeto por atender os requisitos do projeto. Com respeito à tradução todos os módulos deverão ser desenvolvidos, já que não existem ferramentas próprias a esse fim que possam ser reutilizadas. Referências 1 - CHBANE, D.T. Desenvolvimento de Sistema Para Conversão de Textos em Fonemas. Novembro, 1994. Dissertação de Mestrado. Escola Politécnica da Universidade de São Paulo (USP). 2 - CASTRO, A.J. ; ALFENAS, D.A; SHIBATA, D.P; SOEJIMA, H.T. Sintetizador TextoVoz com Autômatos Adaptativos. 2004. Projeto Apresentado à Disciplina PCS 2050 – Laboratório de Projeto de Formatura II. Escola Politécnica da Universidade de São Paulo. 3 - LATSCH, V.L. Desenvolvimento de um Sistema de Conversão Texto – Fala com Modelagem de Prosódia. Junho, 2011. Tese de Doutorado. Universidade Federal do Rio de Janeiro. 4 - LECHETA, RICARDO R. Google Android: aprenda a criar aplicações para dispositivos móveis com o Android SDK. 3.ed. São Paulo: Novatec Editora, 2013. 5 - GHAZIASGAR, M. The Use of Mobile Phones as Service-Delivery Devices in a Sign Language Machine Translation System. África do Sul, 2010. 136p. Tese de Mestrado University of The Western Cape.