Gramática dos Nomes de Doença: Uma Proposta Inicial Maria Beatriz Escanhuela Sajovic 1, Oto Araújo Vale1 1 Departamento de Letras – Universidade Federal de São Carlos (UFSCar) [email protected], [email protected] 1. Introdução A identificação dos substantivos predicativos é um dos temas desafiadores na descrição linguística. Esses nomes que exprimem noção de estado, processo e ação, chamados de nomes predicativos por Gross (1981), se distanciam dos nomes concretos que nomeiam pessoas, objetos, plantas entre outros. Como os nomes predicativos (Npred) não possuem marcas de flexão de tempo, modo, pessoa ou aspecto, estes são auxiliados pelos verbos-suporte (Vsup), que possuem como função suportar essas marcas flexionais da construção nominal. As estruturas formadas por verbo-suporte e nome predicativo têm sido alvo de estudos recentes no português do Brasil (PB) que objetivam a descrição exaustiva da língua. Como exemplo, podem-se citar três trabalhos que vêm sendo desenvolvidos em nível de doutorado que objetivam a descrição das estruturas Vsup fazer+Npred, Vsup ter+Npred e Vsup dar+Npred (Barros, 2013; Santos-Turati 2013; Rassi; 2013). Dentre as constatações dessas três pesquisas, tem-se observado que alguns nomes predicativos acompanhados de verbo-suporte constituem classes semânticas relativamente homogêneas: fazer acompanhado de nomes predicativos que designam esportes ou exames médicos; ter acompanhado de nomes predicativos que designam sentimentos; ter acompanhado de nomes predicativos que designam doenças (ex. gripe, medo, vitória, virose). A proposta deste trabalho é estudar as estruturas que ocorrem com uma classe semântica específica – os nomes de doenças – e verificar quais são as variantes dos Vsup que acompanham esses nomes, a exemplo do que fez Labelle (1986) para o francês em “Grammaire des noms de maladie”. Acredita-se que resultados desta pesquisa poderão contribuir para a criação de uma base de dados similar à base de dados já criada para o inglês, Nombank (Meyers, A. et al, 2004), que possua a estrutura argumental de nomes predicativos do português do Brasil. 2. Metodologia e Análise dos Dados A realização da análise sintática dos nomes de doenças no português exige uma metodologia que seja capaz de abranger todas as doenças analisadas. Para esta pesquisa, a metodologia tem como objetivo o esclarecimento dos seguintes tópicos: - Nomes de doença de admitem outros Vsup, além do Vsup ter; - As propriedades dos verbos ter, estar com, pegar e sarar quando anteriores a um nome de doença. 40 Anais do III Workshop de Iniciação Cientı́fica em Tecnologia da Informação e da Linguagem Humana, páginas c 40–42, Fortaleza, CE, Brasil, Outubro 21–23, 2013. 2013 Sociedade Brasileira de Computação Desta forma, a metodologia do projeto será realizada em 3 etapas: Etapa 1: Composição do corpus de estudo - lista com nomes de doença (etapa concluída) Nesta etapa realizou-se a busca pelos nomes de doenças na internet, especificamente em sites especializados na área da medicina e da saúde, para a composição do corpus. Este conta com pouco mais de 400 nomes de doenças de diversas áreas da medicina e não apenas de um ramo em especial; Estes nomes foram listados para a realização da etapa seguinte. Etapa 2: Verificação e estabelecimento das propriedades das construções nominais com os Vsup ter, estar com, pegar e sarar + nomes de doenças (etapa atual) Nesta etapa, com o corpus já constituído na Etapa 1, tem-se verificado e estabelecido as propriedades das estruturas em que ocorrem os Vsup ter, estar com, pegar e sarar. Estes verbos foram escolhidos para serem classificados por serem os mais comumente recorrentes relacionados a nomes de doenças no português brasileiro. Dentre eles, apenas o verbo sarar não é Vsup, é um verbo com significado pleno e de grande importância para o estudo em questão. Inicialmente, tem-se verificado quais desses verbos que ocorrem com cada um dos nomes de doenças (tabela 1): Tabela 1: excerto da tabela de classificação dos nomes de doenças Nomes de doenças ter estar com pegar sarar de Autismo + - - - Bicho geográfico + + + + Bronquite + + + + Bulimia Nervosa + + - + Caspa + + - + Catapora - + + + Caxumba - + + + Celulite + + + + Chagas + + + - Após o término desta etapa, será verificada qual a natureza dos argumentos selecionados pelo predicador Vsup+ Npred nomes de doenças e em quais casos o Npred admite um determinante (ex.: Ana teve um bicho geográfico no pé). Etapa 3: Classificação dos Vsup + nomes de doença de acordo com sua estrutura nas tabelas do Léxico-Gramática. Nesta etapa será realizado o preenchimento e a classificação dos nomes de doença de acordo com sua estrutura nas tabelas do Léxico-Grámatica. Na tabela binária os nomes de doenças estarão listados à esquerda e os verbos usados para a classificação das doenças ficarão à direita separados em quatro colunas individuais em que cada uma representará um Vsup (estar, ter, pegar, sarar). Serão listados, também, os argumentos essenciais de cada estrutura e os casos que admitem determinantes. Quando a ocorrência 41 de determinada doença for possível com determinado verbo será marcado um “+” e quando não for possível será marcado um “-”. 4. Considerações Finais Neste trabalho apresentou-se uma proposta de classificação da estrutura argumental dos nomes de doença. A análise está sendo realizada em tabelas binárias do LéxicoGramática, modelo teórico-metodológico que serviu de apoio para a execução da descrição proposta. Acredita-se que este estudo poderá contribuir para a identificação das estruturas Vsup+Npred por Sistemas de Processamento de Língua Natural, uma vez que a descrição proposta pode fazer parte dos dicionários de um programa de computador que visa o tratamento da língua. Os resultados também poderão integrar uma base de dados que contenha a estrutura argumental de nomes predicativos do português do Brasil, similar à base de dados já criada para o inglês: Nombank (Meyers et al, 2004). Referências Barros, C. D. (2013) “Estudo sobre a estrutura argumental dos predicados nominais com o verbo-suporte fazer”. Projeto de Pesquisa. Universidade Federal de São Carlos, Programa de Pós-graduação em linguística, São Carlos. Gross, M. (1975) “Méthodes en syntaxe”. Hermann, Paris. Gross, M. (1981) “Les bases empiriques de la notion de prédicat sémantique”. Langages, n.63, p.7-52. Labelle, J. (1986) “Grammaire des noms de maladie”. Langue Française, n.69, p. 108125. Meyers, A. et al. (2004) “The NomBank Project: An Interim Report”. Workshop: Frontiers in Corpus Annotation, Association for Computational Linguistics, p. 24-31. Rassi, A. P. (2013) “Descrição dos predicados nominais relacionados ao verbo "dar" em PB”. Projeto de Pesquisa. Universidade Federal de São Carlos, Programa de Pósgraduação em linguística, São Carlos. Santos-Turati, M. C. A. (2013). “Descrição dos predicados nominais com o verbosuporte „ter‟”. Projeto de Pesquisa. Universidade Federal de São Carlos, Programa de Pós-graduação em linguística, São Carlos. 42