VERBOS IRREGULARES OU VERBOS COM FORMAS IRREGULARES? REFLEXÃO SUSCITADA PELO PROCESSAMENTO COMPUTACIONAL DO PORTUGUÊS Vera Vasilévski1 (UFSC) Resumo: A partir de pesquisa para automatizar a morfologia flexional dos verbos do português do Brasil, construiu-se um analisador morfológico, recurso computacional que contém algoritmos com as regras gramaticais do sistema de verbos do português. Constatou-se que todos os verbos são fiéis aos paradigmas conjugacionais regulares, em boa medida, mesmo os mais complexos, que são também os mais usados. Ainda, evidenciou-se que verbos sujeitos à harmonia vocálica são regulares, assim como verbos sujeitos a adaptação ortográfica no radical. Propõe-se que a escola faça distinção entre formas verbais regulares e irregulares, a fim de facilitar o aprendizado e torná-lo mais coerente. Palavras-chave: morfologia flexional verbal, recursos computacionais, ensino. Abstract: As a result of a research to automate the inflectional verb morphology of Brazilian Portuguese, we built a morphological analyzer, that is, a computer resource that contains algorithms with the grammar rules of the Portuguese verb system. The research found that all verbs largely fit the regular conjugation paradigms, even the more complex ones, which are also the most used. Besides, it made overt that verbs subjected to vowel harmony phenomenon are regular, as well as the ones subjected to orthographic adjustment in the radical. We propose that the school makes distinction between regular and irregular verb forms, in order to support learning, and make it more coherent. Keywords: inflectional verb morphology, computational resources, teaching. Introdução Este artigo relata resultados de uma fase de um projeto cujo objetivo é desenvolver um recurso computacional para automatizar o sistema de verbos do português escrito do Brasil, a partir de suas regras morfológicas. Tal ferramenta é Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -1- um analisador morfológico, que contém algoritmos com as regras flexionais dos verbos do português. Faz-se cabível discutir os procedimentos gramaticais e computacionais empregados nessa tarefa, bem como alguns resultados práticos. O analisador morfológico de verbos mencionado é uma ferramenta desenvolvida como parte de um projeto maior, chamado Análise morfológica Automática do Português (SCLIAR-CABRAL, 2009). Seu principal objetivo é depreender uma gramática automática do português brasileiro, mediante análise de córpus. Desenvolve-se esse projeto em parceria com o projeto Childes (MACWHINNEY, 2011). Etapas concluídas relativas à depreensão da morfologia dos verbos foram documentadas, como regras do comportamento da vogal temática e dos sufixos modo-temporais e número-pessoais dos verbos regulares (SCLIARCABRAL e VASILÉVSKI, 2011a), a automatização da vogal temática e de seus alomorfes (VASILÉVSKI, SCLIAR-CABRAL, ARAÚJO, 2012), a automatização dos morfemas modo-temporais, os casos ambíguos dela decorrentes e sua desambiguação (VASILÉVSKI e ARAÚJO, 2011). Também se expuseram resultados pertinentes à aquisição da linguagem (COSTA e SCLIAR-CABRAL, 2011; VASILÉVSKI, 2011b) e ao uso do programa em pesquisa linguística (SCLIAR-CABRAL e VASILÉVSKI, 2011b; VASILÉVSKI 2011a e 2010). Ora se expõe um aspecto do projeto, cujo teor extrapola a sistematização das regras e adentra o meio escolar, em forma de sugestão, que, quiçá, auxilie o aprendizado dos alunos, no que se refere ao sistema de verbos do português. Antes de iniciar, cabe lembrar a nomenclatura utilizada no programa e, consequentemente, aqui. Cada um dos tempos verbais do português, em seus respectivos modos, recebeu um código único, que foi inserido no programa (VASILÉVSKI, SCLIAR-CABRAL e ARAÚJO, 2012): PI – Presente do Indicativo, PII – Pretérito Imperfeito do Indicativo, PPI – Pretérito Perfeito do Indicativo, PMI – Pretérito Mais-que-perfeito do Indicativo, FPI – Futuro do Presente do Indicativo, FPPI – Futuro do Pretérito do Indicativo, PS – Presente do Subjuntivo, PIS – Pretérito Imperfeito do Subjuntivo, FS – Futuro do Subjuntivo, IMA – Imperativo Afirmativo, Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -2- IMN – Imperativo Negativo, INF – Infinitivo, GER – Gerúndio, PAR – Particípio. Da mesma forma, as três pessoas gramaticais do singular e do plural são assim designadas: 1S, 2S, 3S, 1P, 2P e 3P. Este artigo está organizado da seguinte maneira: resgata e discute parte do funcionamento do sistema de verbos do português (regularidade, irregularidade, harmonia vocálica e irregularidade aparente); relaciona-o ao desenvolvimento do analisador morfológico; e expõe as considerações finais. O sistema de verbos do português Verbo é a criação linguística destinada a expressar a noção predicativa. Denota ação ou estado e, em muitas línguas, possui sufixos próprios, com que se distingue a pessoa do discurso e o respectivo número (singular ou plural), o tempo (atual, vindouro, pretérito) e o modo da ação (real, possível etc.) (SAID ALI, 1964). Chamam-se formas finitas do verbo todas aquelas que vêm sempre referidas a uma das três pessoas do discurso e têm a respectiva desinência, ou seja, são as formas conjugadas. A par delas, gera-se em todos os verbos um pequeno grupo de formas com aparência e função de substantivo (infinitivo), adjetivo (particípio) e advérbio (gerúndio). São essas as formas infinitas do verbo, assim chamadas por constituírem vocábulos sem referência especial a quaisquer pessoas do discurso. De muitas maneiras se pode imaginar uma ação ou estado, mas as formas verbais simples de que a língua portuguesa dispõe não permitem considerar mais de três modos verbais: indicativo para ações reais; subjuntivo para fatos duvidosos, prováveis, potenciais ou optativos; e o imperativo, por meio do qual se expressa ordem, pedido, convite, súplica etc. (SAID ALI, 1964), sem se considerar o aspecto. Certamente, o uso da língua encarrega-se de privilegiar certos tempos e modos, bem como de empregá-los em condições divergentes das canônicas e ampliar as possibilidades. Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -3- A exposição sistemática de todas as formas de um verbo, finitas e infinitas (nominais), constitui a conjugação desse verbo (SAID ALI, 1964). A conjugação dos verbos portugueses segue o padrão regular ou padrões especiais. O paradigma regular ou o padrão geral O sistema de verbos do português compreende três conjugações, que são assinaladas pela vogal temática (VT). Há três vogais temáticas, conforme a notação escrita usual: “a” para a primeira conjugação (1.ªC), “e” para a segunda conjugação (2.ªC) e “i” para a terceira conjugação (3.ªC). Compõem esse sistema verbos ditos regulares – que seguem o paradigma fixo da conjugação a que pertencem e são maioria em português – e os ditos irregulares – que se desviam do paradigma regular. O tema (RAD+VT) do infinitivo é a forma básica do verbo regular. Assim, dado um verbo regular em sua forma infinitiva, é possível conjugálo com facilidade, nas seis pessoas gramaticais, sobretudo nos tempos do modo indicativo. Em contrapartida, tomar uma forma verbal conjugada e dela extrair os morfemas que a compõem, a fim de desvendar tempo, modo, pessoa e número em que está flexionada, não é tão fácil (VASILÉVSKI e ARAÚJO, 2011). Em português, há três modos verbais finitos, com seus tempos simples (indicativo (seis tempos), subjuntivo (três tempos) e imperativo (afirmativo e negativo)), além do infinitivo pessoal e das formas nominais (infinitivo, gerúndio e particípio). Cabe destacar que o pretérito mais-que-perfeito é pouco usado no Brasil. Na fala coloquial, ele restringe-se a frases feitas, e é raramente usado na língua escrita. No entanto, ele é preservado, sobretudo, na literatura, em músicas, textos jurídicos e aparece esporadicamente no falar jornalístico, por exemplo, em editoriais. Assim, o PMI tem seu lugar em gêneros textuais específicos, mas pode figurar em outros, conforme juízo do usuário da língua. Quanto às formas nominais, o infinitivo é a forma mais genérica do verbo, que de maneira mais ampla e vaga Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -4- resume sua significação, sem noções de tempo, modo e aspecto. Por isso, ele é usado para designar o nome do verbo. As segundas pessoas gramaticais canônicas “tu” e “vós” – e formas delas derivadas (“teu”, “vossa”) – também passam a ocorrer em gêneros textuais específicos orais e escritos (como religioso, literário, musical). Isso é especialmente verdade em relação a “vós”, pois “tu” é usada na fala coloquial – portanto, em gêneros textuais primários (BAKHTIN, 2006) – em algumas regiões do Brasil, como em Florianópolis, Santa Catarina, inclusive com as flexões tradicionais (“tu sabes”, “tu foste”, “se tu fizeres”). Então, não cabe aos professores, muito menos aos pesquisadores, excluí-las do paradigma verbal, sob risco do usuário da língua deparar-se com elas ao trocar o canal da televisão, ler uma carta comercial, ouvir música, pesquisar na rede mundial, conversar com alguém de outra região. As novas tecnologias impedem que formas clássicas sejam ignoradas pela escola. A conjugação dos verbos portugueses organiza-se em formas primitivas e derivadas, em que as segundas, em seu paradigma, seguem as primeiras. Os temas das formas primitivas do português (1S-PI, PPI e INF) e derivadas (todos os demais tempos e pessoas) constituem os sistemas de conjugação. Assim, em português, há o Sistema do Presente, o Sistema do Perfeito e o Sistema do Infinitivo, com suas regras específicas, que regem os outros tempos verbais. De acordo com o sistema do presente, de 1S-PI derivam todo o PS, por consequência, todo o IMN e o IMA, menos 2S e 2P (ver Quadro 1, p.14). Por exemplo, o verbo “trazer” é “trago” em 1S-PI, portanto, trag- será o radical do PS (“traga”, “tragas”...), do IMN (não “traga”... não “tragamos”...) e de 3S com valor de 2S (você), 1P e 3P do IMA (“traga” você, “tragamos” nós, “tragam” vocês). As demais pessoas, tanto do PI (2S, 3S, 1P, 2P e 3P) como do IMA (2S e 2P clássicas), derivam do radical do infinitivo (“trazemos”, “traz” etc.). Assim, substituindo-se a terminação -o de 1S-PI por -e, nos verbos da 1.ªC, e por -a, nos verbos da 2.ªC e Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -5- 3.ªC, obtêm-se as pessoas do PS: “amo” (1S-PI), “ame”... (PS); “faço” (1S-PI), “faça”... (PS); “sumo” (1S-PI), “suma”... (PS). Segundo o sistema do perfeito, o tema do PPI dá origem ao PMI (acrescentando-se o morfema -ra) e ao PIS (acrescentando-se o morfema -sse) e FS (acrescentando-se o morfema -r). Nos paradigmas regulares, o tema do perfeito é idêntico ao do infinitivo, e toda a derivação é regular (com alterações apenas em 1S e 3S-PPI de alguns verbos), mesmo nos verbos com mais formas irregulares (SCLIAR-CABRAL, 2003). Os demais tempos (PII, FPI, FPPI) e pessoas excluídas do sistema do presente e do perfeito, como dito, derivam do radical do infinitivo do verbo: esse é o sistema do infinitivo. A esses radicais, então, acrescem-se a vogal temática do verbo (com suas alomorfias) e as desinências modo-temporais e número-pessoais (ambas com suas alomorfias) e se obtêm os paradigmas correspondentes da conjugação verbal do português. O PII é formado mediante acréscimo da desinência –va ao tema dos verbos da 1.ªC e de -ia ao radical dos verbos da 2.ªC e 3.ªC: “dar”, “dava”; “caber”, “cabia”; “ir”, “ia”, mas há de se considerar os alomorfes, como se verá. As línguas românicas ficaram privadas das formas de futuro do indicativo que tinha o sistema latino. Essa falta supriu-se com a união do presente do verbo “haver” ao infinitivo, para o futuro do presente: hei + vencer = vencerei, bem como, analogamente, criou-se o futuro do pretérito com a junção de “havia” (contraído em hia) do PII ao infinitivo: havia (hia) + vencer = venceria, para todos os verbos (SAID ALI, 1964). Aprofundam-se agora questões estruturais. O verbo é, em português, o vocábulo flexional por excelência, dada a complexidade e a multiplicidade de suas flexões. As noções gramaticais de tempo e modo e de pessoa e número que a forma verbal indica correspondem a duas desinências (sufixos flexionais) chamadas de sufixo modo-temporal (SMT) e sufixo número-pessoal (SNP), que se aglutinam e se ligam ao tema. O tema constitui-se do radical seguido da vogal temática da Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -6- conjugação correspondente. No padrão geral, o radical é invariável e dá a significação lexical do verbo. Assim, a fórmula da estrutura do vocábulo verbal português – na qual RAD indica radical do verbo; VT, vogal temática; e SF, sufixos flexionais – é (CÂMARA JR., 1986): TEMA (RAD+VT) + SF (SMT + SNP) Levando-se em conta a alomorfia de cada um dos sufixos flexionais e a possibilidade de ser zero (Ø) para um deles ou ambos, essa fórmula dá a regra geral da constituição morfológica do verbo em português, além de indicar a ordem obrigatória dos morfemas. A aglutinação em um único morfema das noções de tempo e modo determina 13 morfemas modo-temporais, nos quais só esporadicamente ocorre alomorfia, isto é, a variação de um morfema condicionada pelo contexto onde ele ocorre. A complexidade para a interpretação do morfema flexional propriamente verbal, em português, ou seja, o modo-temporal, decorre, em primeiro lugar, justamente da cumulação dessas duas noções, além da noção suplementar de aspecto, que às vezes se inclui na noção de tempo (CÂMARA JR., 1986). De maneira muito resumida, pois o assunto é complexo, o tempo verbal refere-se ao momento de ocorrência do processo, visto do momento da comunicação; já o modo refere-se a um julgamento implícito do falante a respeito da natureza, subjetiva ou não, da comunicação que faz. No entanto, é comum em português, assim como em outras línguas, o emprego modal dos tempos verbais, que já foi chamado de metafórico. Não obstante, a apreciação do modo em português tem de se firmar, inicialmente, nas formas modais propriamente ditas, deixando à margem o emprego metafórico dos tempos (CÂMARA JR., 1986). Ainda, há seis sufixos número-pessoais, como mencionado, para indicar os falantes (1.ª pessoa do discurso), os ouvintes (2.ª pessoa do discurso) e as entidades sobre quem se fala (3.ª pessoa do discurso) (CÂMARA JR., 1986). No português do Brasil (PB), aliás, não só no do Brasil, a segunda pessoa do discurso vale-se da terceira pessoa gramatical. As pessoas gramaticais são designadas por 1, 2 e 3 do Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -7- singular (S) e do plural (P), assim, gramaticalmente, tem-se: 1S (eu), 2S (tu), 3S (ele, ela, você), 1P (nós), 2P (vós) e 3P (eles, elas, vocês). Como visto, no PB, usam-se conjugadas como 3S e 3P “você” e “vocês”, respectivamente, o que aumenta o nível de ambiguidade do sistema de verbos, pois, apesar das flexões da terceira pessoa, essas formas referem-se à segunda pessoa do discurso. Ainda, 1P (nós) pode ser substituída por “a gente”, quando então assume as flexões de 3S ou, muito mais raramente, 1P. Os últimos casos são tão potencialmente ambíguos, que as pessoas gramaticais sempre estão expressas, o que facilita a desambiguação pelo contexto, seja ele escrito ou oral. Há também o papel dos sufixos número-pessoais na conjugação verbal. O desaparecimento de certos sufixos pessoais determinou, em várias línguas modernas, a necessidade de se antepor ao verbo o pronome pessoal da 1.ª e 2.ª pessoas, bem como da 3.ª, quando não vem enunciado o sujeito. Em português, o uso do pronome pessoal é obrigatório na 1.ª e 3.ª pessoas do singular de certas formas verbais idênticas, quando o exigir a clareza do pensamento (SAID ALI, 1964), assim como nas segundas pessoas e primeira pessoa conjugadas como terceiras (“você”, “vocês” e “a gente”) (VASILÉVSKI e ARAÚJO, 2011). Nos demais casos, o pronome serve apenas para reforço enfático (SAID ALI, 1964). Estudo recente (SCLIAR-CABRAL, 2008) propõe o refinamento da fórmula anterior para: TEMA (RAD+VT) + SF (SMTA + SNP + SPF), com a inclusão do acento ou suprafixo (SPF) e da categoria de aspecto (A). Essa inclusão do acento de intensidade com a função de assinalar diferenças aspectuais tem sido negligenciada na literatura sobre aquisição da linguagem, o que causa problemas para a codificação automatizada ainda não tratados, como a queda do morfema -r do infinitivo na pronúncia. Estima-se abordar essa questão com apoio da fonologia, em outra fase do projeto, tarefa para a qual se contará com apoio do conversor automático grafema-fonema Nhenhém (VASILÉVSKI, 2008, 2012b e 2012c). Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -8- Padrões especiais Os verbos ditos irregulares, embora constituam uma pequena minoria em relação a todos os verbos existentes na língua, ocorrem em frequência muito alta, o que lhes dá importância significativa. Os cinco verbos mais utilizados no português atual, segundo pesquisa baseada em córpus, são, na seguinte ordem: “ir”, “ser”, “estar”, “ter” e “ver” (WILKENS e VILLAVICENCIO, 2012). Todos eles têm formas irregulares em seus paradigmas. Nesse momento, cabe questionar: Afinal, o que define se uma forma é regular ou irregular? Ora, regras estabelecidas a partir do que é comum e do que é incomum ou exceção dentro de um sistema. É válido lembrar que, por irregulares, entendem-se os verbos cujos temas das formas primitivas são distintos entre si – essa é a principal característica de sua irregularidade. Apesar de as gramáticas dividirem os verbos em regulares e irregulares, todos os verbos ditos irregulares são regulares em vários tempos e pessoas gramaticais. Assim, não há verbo que seja irregular em todos os tempos e pessoas. Nos tempos futuros (do presente e do pretérito) do modo indicativo, há pouquíssima irregularidade. Nesses tempos, verbos como “ser”, “estar”, “vir” conjugam-se pelo paradigma regular. A exceção fica por conta dos verbos “fazer”, “dizer” e “trazer”, cujas formas, nesses tempos, para serem regulares, deveriam ser, por exemplo, em 3S: “fazerá”, “dizerá”, “trazerá” e “fazeria”, “dizeria” e “trazeria”, as quais não são consideradas padrão, no português atual. Desse modo, é necessário o refinamento de regularidade. No caso dos infinitivos, a regra é que os verbos do português, nessa forma, terminam com a respectiva vogal temática – que pode ser “a”, “e” ou “i” – à qual se segue o morfema de infinitivo verbal, que é sempre “r”. Assim, “pôr” - que já foi “poer” e vem do latim ponere - é o único verbo cuja forma infinitiva é irregular. Nem os Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação -9- verbos com formas irregulares mais complexas para a automatização, que a pesquisa mostrou serem “ir” e “ser”, são irregulares no infinitivo. A dificuldade de automatização das conjugações dos verbos com formas irregulares vai de um nível simples (“trazer”, “dizer” e “fazer” nos futuros do presente e do pretérito), passando por um nível intermediário e chegando ao máximo (verbos “vir”, “ir” e “ser”, como dito, em vários tempos e pessoas). O verbo “ser” ilustra a irregularidade no sistema do presente. Em 1S-PI, ele é “sou”, enquanto, no PS e no IMA, ele conjuga-se “seja”, portanto, trata-se de forma irregular, pois o tema deveria ser o mesmo. Assim, além das formas primitivas distintas, o verbo “ser” apresenta irregularidades nas derivações. Do mesmo modo, “haver”, “estar”, “querer” e “saber” desviam-se desse sistema: “hei” (1S-PI), “haja”... (PS), “estou” (1S-PI), “esteja”... (PS), “quero” (1S-PI), “queira”... (PS), “sei” (1S-PI), “saiba”... (PS); e “ir” e “dar” o obscurecem, por seu radical ser tão pequeno: “vá”... (PS), “dou” (1S-PI), “dê”... (PS). Cabe exemplificar a irregularidade no sistema do perfeito. Em relação ao verbo “estar”, há, respectivamente, do radical estive- (PPI de “estar”): “estivera”, “estivesse” e “estiver”, bem como do tema coube- (PPI de “caber”) há: “coubera”, “coubesse” e “couber”. O tema puro que dá lugar a essas derivações aparece obscurecido na 1S e 3S, mas se revela nas demais formas pessoais: “houveste”, “houvera”, “houvesse”, “houver”; “tiveste”, “tivera”, “tivesse”, “tiver”; “vieste”, “viemos”, “viera”, “vier”; “vimos”, “vira”, “visse”, “vir”; “fizemos”, “fizera”, “fizesse”, “fizer”; etc. (SAID ALI, 1964). Note-se que o PPI de “estar” é modelado segundo o de certos verbos da 2.ªC (“estive”, “estiveste” – “tive”, “tiveste”), bem como “dar”, cuja 1S é “dei”, mas as demais pessoas se formam pelo paradigma regular da 2.ªC (“deste”, “deu” – “temeste”, “temeu”). Nos verbos da 3.ªC, a primeira vogal dessas terminações torna-se “i”, obedecendo à vogal temática dessa conjugação: “senti”, “sentiste”... “sentiram”. Excetua-se o verbo “vir”, com algumas terminações do tipo geral da 2.ªC (“vieste”). O tipo geral de formação do PPI da 2.ªC é: “bati”, “bateste”, “bateu”... “bateram”. O verbo “vir” faz “vim” Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 10 - para 1S-PPI, retendo nasalização antiga. Em português antigo, havia: vẽeste, vẽo, vẽeron. O verbo teer produziu “teve”, por desnasalização de tẽui. O verbo “estar” deu “esteve” de ste(t)ui por steti. Para 1S, em português antigo, havia “tive”, “estive”, e as demais formas eram teveste, teve, tevemos, esteveste, estevemos, as quais hoje se grafam com “i” (SAID ALI, 1964). O complexo verbo “ser” faz o PII em “era”, filiado ao radical es- do verbo latino esse. Do modelo em -ia também se afastam, aparentemente, as formas do português atual “tinha”, “punha” e “vinha”. Tais formas do PII conservam a nasal dos radicais latinos ten-, pon- e ven- (tenere, ponere e venere), para as quais se transplantou o acento tônico próprio da terminação, e se originaram as formas atuais a partir de tĩia, puía e vĩia (SAID ALI, 1964). A forma do PPI “fui” de 1S, que tanto serve para o verbo “ser” como para “ir”, é única, pois as demais pessoas conjugam-se “foste”, “foi”, “fomos”, “fostes”, “foram”. Há registros em português antigo de foi para 1S e fuste para 2S. O verbo “ver” constrói o PPI como se fosse da 3.ªC: “vi”, “viste”, “viu”... “viram”. A formação latina em ui é responsável não somente pela existência do PPI excepcional desses verbos, mas também pela produção de “houve”, “coube”, “soube”, “trouxe”, “prouve”. O ditongo “ou” resulta de au, por metátese. Por exemplo, sapui → sabui → saubi → “soube”; capui → “coube”; “trouxe” proviria de traucsi por tracsi (SAID ALI, 1964). O pretérito latino potui deu “pude” para 1S e poud(este) ou pod(este) para as demais, e hoje se escreve “pud(este)”. As formas verbais posui e posuit deram puse e pose para 1S, contudo, já no português antigo, manifestou-se a tendência de reduzir essas formas a “pus”, “pôs”. Desde os quinhentistas, essa vogal terminal está abolida, da mesma maneira que triunfou a tendência simplificadora de fize para “fiz”, feze para “fez”, quise para “quis” (SAID ALI, 1964). Do grupo dos verbos ditos irregulares fazem parte os verbos auxiliares, que figuram nas conjugações compostas – que são objeto específico de outro trabalho. Em uma cadeia podem entrar vários verbos auxiliares, sendo o último verbo o verbo Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 11 - principal, aquele que carrega a significação externa, sempre em uma forma nominal. Como verbo, o particípio entra na formação dos tempos compostos com os auxiliares “ter” e “haver” (quando permanece invariável em gênero e número) e com o auxiliar “ser”, na construção da voz passiva analítica, além de núcleo do predicado de orações reduzidas. Já o gerúndio é morfologicamente verbal, assim, não admite flexão de gênero e número (CÂMARA JR., 1986), e entra na formação das formas progressivas e também como núcleo do predicado de orações reduzidas. É o verbo principal quem dita a regência, por isso, o primeiro auxiliar da cadeia se flexionará em pessoa, número, tempo e modo, conforme tal verbo principal determinar. Por exemplo: “ia comer”, “pode estar havendo denúncias”, “devem-se temer retaliações” e “havia feito”. A irregularidade verbal é determinada pelo uso através do tempo, ou seja, nas preferências que triunfaram, na grande maioria das vezes, havendo pouquíssima interferência normativa. No entanto, repete-se, tal irregularidade não afeta todo o paradigma conjugacional do verbo. Harmonia vocálica e Mudanças aparentes no radical Alguns verbos portugueses estão sujeitos ao fenômeno chamado harmonia vocálica, que se refere à influência que o som de uma vogal, numa palavra, exerce sobre outros sons, vizinhos ou próximos, e que os torna mais semelhantes e simétricos (apud VASILÉVSKI, 2008). No sistema de verbos do português, tal influência ocorre com a vogal temática subjacente de 1S-PI na vogal anterior, ou seja, a última vogal do radical, se, no infinitivo, tal vogal da raiz for /e/ ou /o/. Por exemplo, o verbo “levar” pertence à primeira conjugação, então, sua vogal temática é “a”, baixa, e a última vogal do radical é /e/, média. Em 1S-PI, a vogal do radical copia o traço baixo da vogal temática: “levar”, “levo” → /le.ˈvaR/, /ˈlɛ.vu/; “gostar”, “gosto” → /goS.ˈtaR/, /ˈgɔS.tu/. O verbo “sofrer” Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 12 - pertence à segunda conjugação, então, sua vogal temática é /e/, isto é, média, e a última vogal do radical é /o/, também média. Assim, em 1S-PI, a vogal do radical permanece a mesma, pois não há necessidade de simetrização. O verbo “cobrir” pertence à terceira conjugação, de modo que sua vogal temática é /i/, alta, e a última vogal do radical é /o/, ou seja, média. Em 1S-PI, a vogal do radical copia o traço alto e se transforma em /u/: /ew 'ku.bru/ (eu cubro). Desse modo, todas as formas derivadas de 1S-PI (PS, IMN e IMA - exceto as segundas pessoas canônicas) preservam o traço copiado. Tendo em vista que o português escrito não marca a diferença entre vogais médias, ou seja, /e/ e /o/, e sua contraparte baixa, isto é, /ɛ/ e /ɔ/, no sistema verbal, sua leitura torna-se ambígua. O Quadro 1 a seguir ilustra a harmonia vocálica, em negrito, no paradigma do verbo “dormir”, no qual se podem perceber os tempos primitivos, que dão origem aos tempos derivados. Há ainda, em português, radicais regulares que sofrem transformações ditadas pelos valores grafêmicos, ou seja, para adaptar-se ao padrão ortográfico vigente. É o caso do fonema /g/, quando vem antes de /e/ e /i/, que é escrito “gu”, para preservar o valor de /g/, como “ligar” → “liguei”, “ligue” - /li.'gaR/ → /li.'gej/, /'li.gi/. Também isso ocorre com o fonema /k/, antes de /e/ e /i/, que é escrito “qu”, para preservar o valor de /k/, como “ficar” → “fiquei”, “fique” - /fi.'kaR/ → /fi.'kej/, /'fi.ki/; e /s/, antes de /a/, /o/ e /u/, que é escrito “ç”, para preservar o valor de /s/, como “esquecer” → “esqueço”, “esqueça” - /eS.ke.'seR/ → /eS.'ke.su/, /eS.'ke.sa/. Nesses casos, não há alteração fonológica no radical, apenas ortográfica. A partir dessa exposição, sustenta-se que não é adequado considerar irregulares as formas verbais sujeitas à harmonia vocálica, pois não há realmente alteração no radical, apenas simetrização. Da mesma maneira, alterações aparentes no radical, feitas para adequar as formas verbais às convenções ortográficas, também não configuram irregularidade. Com o emparelhamento entre morfologia e fonologia, auxiliado pela união entre o analisador morfológico e o conversor fonológico Nhenhém, esclareceram-se e resolveram-se tais questões. Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 13 - Quadro 1: Paradigma conjugacional do verbo “dormir” INDICATIVO Presente Pretérito perfeito Pretérito imperfeito eu durmo dormi dormia tu dormes dormiste dormias ele* dorme dormiu dormia nós dormimos dormimos dormíamos vós dormis dormistes dormíeis eles dormem dormiram dormiam Pret. mais-que-perfeito Futuro do presente Futuro do pretérito eu dormira dormirei dormiria tu dormiras dormirás dormirias ele dormira dormirá dormiria nós dormíramos dormiremos dormiríamos vós dormíreis dormiríeis dormiríeis eles dormiram dormiriam dormiriam SUBJUNTIVO Presente Pretérito imperfeito Futuro que eu durma se eu dormisse quando eu dormir que tu durmas se tu dormisses quando tu dormires que ele durma se ele dormisse quando ele dormir que nós durmamos se nós dormíssemos quando nós dormirmos que vós durmais se vós dormísseis quando vós dormirdes se eles dormissem quando eles dormirem que eles durmam IMPERATIVO INFINITIVO PESSOAL Afirmativo Negativo - - para eu dormir dorme tu não durmas tu para tu dormires durma você não durma você para ele dormir durmamos nós não durmamos nós para nós dormirmos dormi vós não durmais vós para vós dormirdes durmam vocês não durmam vocês para eles dormirem INFINITIVO: dormir GERÚNDIO: dormindo PARTICÍPIO: dormido * Nessa posição, entram “você” e “a gente”, pronomes atualmente utilizados para designar 2S e 1P, porém, conjugados como 3S. Da mesma forma, “vocês” encaixa-se em “eles”. Sempre que se indicar “ele” e “eles”, subentenda-se também “ela” e “elas”. Fonte: Montagem primária, baseada em Aurélio Século XXI (1999). Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 14 - Então, o analisador Levaram-se em conta todas essas considerações e transformaram-se essas regras – e outras não detalhadas aqui – em algoritmos. Para tanto, fizeram-se ajustes e complementações que o ambiente computacional exige. Depois, estudouse o comportamento do aplicativo, a fim de se observarem ambiguidades geradas e resolvê-las, bem como para criar um léxico verbal automático para o córpus de trabalho. A criação do léxico (VASILÉVSKI, SCLIAR-CABRAL e ARAÚJO, 2012) resolveu as ambiguidades geradas pela alomorfia da vogal temática, nas três conjugações, e pela harmonia vocálica que ocorre no radical de verbos da 3.ªC, /o/ → /u/, uma vez que a harmonia vocálica que ocorre no radical de verbos da 1.ªC e 2.ªC não é registrada no sistema escrito, assim, não é relevante para o programa. Ainda, esse léxico, associado a instruções computacionais, resgata radicais regulares que sofrem transformações requeridas pelo sistema ortográfico oficial. A organização interna do analisador já foi exposta (VASILÉVSKI, 2012a). O sistema de conjugação de verbos do português é considerado, de certa forma, simples e previsível, mesmo sua parte irregular (CÂMARA Jr., 1986), o que respalda a criação de uma ferramenta computacional baseada em suas regras. O analisador morfológico reproduz o sistema verbal escrito, então, leva em conta apenas os alomorfes desse sistema e não foca, por enquanto, a questão do acréscimo do suprafixo à formula de Câmara Jr. Com base nos dados advindos do levantamento teórico prévio à criação do analisador, exposto nas seções anteriores, bem como dado o comportamento das regras gramaticais no ambiente computacional, o programa considera que o que há são formas irregulares (que se desviam do paradigma regular) e formas regulares. Essa decisão tornou o trabalho mais coerente, facilitou e agilizou a descodificação automática, bem como fez jus à realidade do sistema de verbos do português. Além Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 15 - disso, o programa considera todas as possibilidades de pessoas gramaticais, inclusive as clássicas, pelos motivos expostos. Os verbos com padrões especiais foram os mais difíceis de sistematizar, pois suas regras perderam-se através do tempo, de modo que foram desenvolvidos algoritmos especiais para dar conta dos desvios em relação ao paradigma regular, e isso vale para os particípios irregulares – como “escrito”, “visto”. Muitas outras questões mereceram tratamento diferenciado, mas não são abordadas aqui, por falta de espaço e por não se referirem diretamente ao tema em questão. A Figura 1 mostra a tela funcional do analisador, com a análise morfológica automática da forma “dormiu”, da linha 293 do córpus de trabalho. O analisador decompõe o verbo em morfemas, depreende seu infinitivo, informa a conjugação à qual ele pertence, o tempo verbal e a pessoa gramatical em que está conjugado. Figura 1: Tela principal do analisador morfológico com análise da forma verbal finita “dormiu” Fonte: Programa Laça-palavras (VASILÉVSKI e ARAÚJO, 2012). Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 16 - Considerações finais e trabalho futuro Por fazer parte de um projeto maior, este artigo pode parecer superficial algumas vezes, por isso, sugere-se consultar os trabalhos publicados aqui citados, que detalham as etapas de construção do analisador morfológico, bem como aprofundam a teoria que o fundamenta. O analisador morfológico baseia-se totalmente em regras, e não em aprendizado de máquina, desse modo, insere-se no âmbito da inteligência artificial. Uma ferramenta como essa pode ser usada em pesquisas linguísticas, na recuperação de dados, em resumos automáticos, bem como em tradutores automáticos, além de apoiar outras áreas, como o ensino escolar. A construção do analisador morfológico mostrou que pode haver equívoco no ensino do sistema verbal do português na escola, uma vez que verbos são tratados como regulares e irregulares, sem se considerar que os últimos, na verdade, possuem formas conjugadas (uns mais outros menos) que se desviam do paradigma regular. No mínimo, pode-se dizer que não se ensina a realidade da língua, no que concerne a esse tema. Assim como o tratamento adequado dos verbos valorizou o paradigma verbal como predominantemente regular que é, e isso simplificou e agilizou a automatização das regras gramaticais do sistema de verbos, é plausível defender que essa nova visão, por assim dizer, que emergiu durante a automatização do sistema de verbos, é válida no ensino, mesmo porque a escola adota uma maneira pouco prática de ensinar verbos, e o resultado disso não é animador para o professor, nem para o aluno. Certamente, o que se expôs aqui é uma sugestão que merece ser verificada. Em trabalho futuro, é intenção desenvolver metodologia para o ensino do sistema de verbos, com base nos achados desta pesquisa e a partir de dados extraídos de situações reais de comunicação (córpus). Neste trabalho, o objetivo era divulgar Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 17 - esses achados e abrir caminho para a reflexão por parte dos leitores, bem como preparar possíveis desdobramentos. Considera-se que esse primeiro passo foi dado. Referências Bibliográficas AURÉLIO SÉCULO XXI. Dicionário da Língua Portuguesa. ver.3.0. Lexikon Inform./Nova Fronteira: Nov. 1999. CÂMARA JR., J. M. Estrutura da língua portuguesa. 16.ed. Petrópolis, RJ: Vozes, 1986. BAKHTIN, M. Estética da criação verbal. 4.ed. São Paulo: Martins Fontes, 2006. COSTA, R. F. S. e SCLIAR-CABRAL, L. Regularização do sistema verbal pela criança. In: SIMPÓSIO INTERNACIONAL LINGUAGENS E CULTURAS: HOMENAGEM AOS 40 ANOS DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM LINGÜÍSTICA, LITERATURA E INGLÊS DA UFSC (SILC). Anais... Florianópolis, 2011. Disponível em: <http://pos40anos.cce.ufsc.br/?page_id=958>. Acesso em: mar. 2012. MACWHINNEY, B. Child Language Data Exchange System. 2003-2012. Disponível em: <http://childes.psy.cmu.edu/>. Acesso em: ago. 2012. SAID ALI, M. Gramática secundária e Gramática histórica da língua portuguesa. Brasília: Editora da UnB, 1964. SCLIAR-CABRAL, L. Análise morfológica automática do português. Projeto. Florianópolis: CAPES-UFSC, 2009. ______. Codificação da morfologia do PB e análise da fala dirigida à criança. Fórum Lingüístico, Florianópolis, v.5, n.2, p.69-82, 2008. ______. Princípios do sistema alfabético do português do Brasil. São Paulo: Contexto, 2003. 263p. ______; VASILÉVSKI, V. Análise automática da morfologia verbal do PB: Plataforma CHILDES. Revista da ABRALIN, v.10 eletr. 1.ª parte, n. espec., p.431-444, 2011a. ______; ______. Descrição do português com auxílio de programa computacional de interface. In: II JORNADA DE DESCRIÇÃO DO PORTUGUÊS (JDP), Cuiabá, 2011. Anais... 2011b. VASILÉVSKI, V. Construção dos algoritmos para a depreensão da gramática automática do PB. In: X ENCONTRO DO CÍRCULO DE ESTUDOS LINGUÍSTICOS DO SUL (CELSUL), Unioeste, Cascavel-PR, 2012. Anais... 2012a. ______. Descodificación automática de la lengua escrita de Brasil, basada en reglas fonológicas. Saarbrücken, Alemanha: LAP LAMBERT Acad. Publ. GmbH & Co.KG, 2012b. 112p. ______. Phonologic Patterns of Brazilian Portuguese: a grapheme to phoneme converter based study. In: EACL – WORKSHOP ON COMPUTATIONAL MODELS OF LANGUAGE ACQUISITION AND LOSS. Association for Computational Linguistics. Avinhão, França, 24 abr. 2012. Proceedings... 2012c, p.51-60. Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 18 - ______. O hífen na separação silábica automática. Revista do Simpósio de Estudos Lingüísticos e Literários - SELL, Uberaba, v.1, n.3, p.657-676, 2011a. ______. Diferenças entre Input e Intake: evidências na aquisição de pronomes interrogativos. In: SIMPÓSIO INTERNACIONAL LINGUAGENS E CULTURAS: HOMENAGEM AOS 40 ANOS DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM LINGÜÍSTICA, LITERATURA E INGLÊS DA UFSC (SILC). Anais... Florianópolis, 2011b. Disponível em: <http://pos40anos.cce.ufsc.br/?page_id=958>. Acesso em: mar. 2012. ______. Divisão silábica automática de texto escrito baseada em princípios fonológicos. In: III ENCONTRO DE PÓS-GRADUAÇÃO EM LETRAS DA UFS (ENPOLE). Anais..., São Cristóvão, Sergipe, 2010. ______. Construção de um programa computacional para suporte à pesquisa em fonologia do português do Brasil. 2008. 165f. Tese (Doutorado em Lingüística) – Universidade Federal de Santa Catarina, Florianópolis. ______; ARAÚJO, M. J. Tratamento dos sufixos modo-temporais na depreensão automática da morfologia dos verbos do português. Linguamática, v.3, n.2, p.107118, dez. 2011. ______; ______ Laça-palavras: sistema eletrônico para descrição do português brasileiro. LAPLE-UFSC: Florianópolis, 2010-2012. Disponível em: <https://sites.google.com/site/sisnhenhem/>. Acesso em: nov. 2012. ______; SCLIAR-CABRAL, L.; ARAÚJO, M. J. Automatic Analysis of Portuguese Verb Morphology: solving ambiguities caused by thematic vowel allomorphs. In: THE 10TH INTERNATIONAL CONFERENCE ON THE COMPUTATIONAL PROCESSING OF PORTUGUESE (PROPOR), Coimbra, Portugal. Proceedings … 2012, p.12-23. 428p. WILKENS, R. e VILLAVICENCIO, A. I say have you say tem: profiling verbs in children data in English and Portuguese. In: EACL – WORKSHOP ON COMPUTATIONAL MODELS OF LANGUAGE ACQUISITION AND LOSS. Association for Computational Linguistics. Avinhão, França, 24 abr. 2012. Proceedings... 2012, p.38-42. 1 Vera VASILÉVSKI, Dra. Universidade Federal de Santa Catarina (UFSC) Pós-graduação em Linguística, PNPD-CAPES [email protected]. Este trabalho é desenvolvido com o apoio da CAPES. Universidade Federal de Pernambuco NEHTE / Programa de Pós-graduação em Letras CCTE / Programa de Pós-graduação em Ciências da Computação - 19 -