Anais Simpósio Hipertexto

Propaganda
VERBOS IRREGULARES OU VERBOS COM FORMAS
IRREGULARES? REFLEXÃO SUSCITADA PELO
PROCESSAMENTO COMPUTACIONAL DO PORTUGUÊS
Vera Vasilévski1 (UFSC)
Resumo:
A partir de pesquisa para automatizar a morfologia flexional dos verbos do
português do Brasil, construiu-se um analisador morfológico, recurso
computacional que contém algoritmos com as regras gramaticais do sistema
de verbos do português. Constatou-se que todos os verbos são fiéis aos
paradigmas conjugacionais regulares, em boa medida, mesmo os mais
complexos, que são também os mais usados. Ainda, evidenciou-se que
verbos sujeitos à harmonia vocálica são regulares, assim como verbos
sujeitos a adaptação ortográfica no radical. Propõe-se que a escola faça
distinção entre formas verbais regulares e irregulares, a fim de facilitar o
aprendizado e torná-lo mais coerente.
Palavras-chave: morfologia flexional verbal, recursos computacionais,
ensino.
Abstract:
As a result of a research to automate the inflectional verb morphology of
Brazilian Portuguese, we built a morphological analyzer, that is, a
computer resource that contains algorithms with the grammar rules of the
Portuguese verb system. The research found that all verbs largely fit the
regular conjugation paradigms, even the more complex ones, which are
also the most used. Besides, it made overt that verbs subjected to vowel
harmony phenomenon are regular, as well as the ones subjected to
orthographic adjustment in the radical. We propose that the school makes
distinction between regular and irregular verb forms, in order to support
learning, and make it more coherent.
Keywords: inflectional verb morphology, computational resources,
teaching.
Introdução
Este artigo relata resultados de uma fase de um projeto cujo objetivo é
desenvolver um recurso computacional para automatizar o sistema de verbos do
português escrito do Brasil, a partir de suas regras morfológicas. Tal ferramenta é
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-1-
um analisador morfológico, que contém algoritmos com as regras flexionais dos
verbos do português. Faz-se cabível discutir os procedimentos gramaticais e
computacionais empregados nessa tarefa, bem como alguns resultados práticos.
O
analisador
morfológico
de
verbos
mencionado
é
uma
ferramenta
desenvolvida como parte de um projeto maior, chamado Análise morfológica
Automática do Português (SCLIAR-CABRAL, 2009). Seu principal objetivo é
depreender uma gramática automática do português brasileiro, mediante análise
de córpus. Desenvolve-se esse projeto em parceria com o projeto Childes
(MACWHINNEY, 2011). Etapas concluídas relativas à depreensão da morfologia dos
verbos foram documentadas, como regras do comportamento da vogal temática e
dos sufixos modo-temporais e número-pessoais dos verbos regulares (SCLIARCABRAL e VASILÉVSKI, 2011a), a automatização da vogal temática e de seus
alomorfes (VASILÉVSKI, SCLIAR-CABRAL, ARAÚJO, 2012), a automatização dos
morfemas
modo-temporais,
os
casos
ambíguos
dela
decorrentes
e
sua
desambiguação (VASILÉVSKI e ARAÚJO, 2011). Também se expuseram resultados
pertinentes à aquisição da linguagem (COSTA e SCLIAR-CABRAL, 2011; VASILÉVSKI,
2011b) e ao uso do programa em pesquisa linguística (SCLIAR-CABRAL e VASILÉVSKI,
2011b; VASILÉVSKI 2011a e 2010). Ora se expõe um aspecto do projeto, cujo teor
extrapola a sistematização das regras e adentra o meio escolar, em forma de
sugestão, que, quiçá, auxilie o aprendizado dos alunos, no que se refere ao sistema
de verbos do português.
Antes de iniciar, cabe lembrar a nomenclatura utilizada no programa e,
consequentemente, aqui. Cada um dos tempos verbais do português, em seus
respectivos modos, recebeu um código único, que foi inserido no programa
(VASILÉVSKI, SCLIAR-CABRAL e ARAÚJO, 2012): PI – Presente do Indicativo, PII –
Pretérito Imperfeito do Indicativo, PPI – Pretérito Perfeito do Indicativo, PMI –
Pretérito Mais-que-perfeito do Indicativo, FPI – Futuro do Presente do Indicativo,
FPPI – Futuro do Pretérito do Indicativo, PS – Presente do Subjuntivo, PIS – Pretérito
Imperfeito do Subjuntivo, FS – Futuro do Subjuntivo, IMA – Imperativo Afirmativo,
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-2-
IMN – Imperativo Negativo, INF – Infinitivo, GER – Gerúndio, PAR – Particípio. Da
mesma forma, as três pessoas gramaticais do singular e do plural são assim
designadas: 1S, 2S, 3S, 1P, 2P e 3P.
Este artigo está organizado da seguinte maneira: resgata e discute parte do
funcionamento do sistema de verbos do português (regularidade, irregularidade,
harmonia vocálica e irregularidade aparente); relaciona-o ao desenvolvimento do
analisador morfológico; e expõe as considerações finais.
O sistema de verbos do português
Verbo é a criação linguística destinada a expressar a noção predicativa.
Denota ação ou estado e, em muitas línguas, possui sufixos próprios, com que se
distingue a pessoa do discurso e o respectivo número (singular ou plural), o tempo
(atual, vindouro, pretérito) e o modo da ação (real, possível etc.) (SAID ALI, 1964).
Chamam-se formas finitas do verbo todas aquelas que vêm sempre referidas a
uma das três pessoas do discurso e têm a respectiva desinência, ou seja, são as
formas conjugadas. A par delas, gera-se em todos os verbos um pequeno grupo de
formas com aparência e função de substantivo (infinitivo), adjetivo (particípio) e
advérbio (gerúndio). São essas as formas infinitas do verbo, assim chamadas por
constituírem vocábulos sem referência especial a quaisquer pessoas do discurso.
De muitas maneiras se pode imaginar uma ação ou estado, mas as formas
verbais simples de que a língua portuguesa dispõe não permitem considerar mais de
três modos verbais: indicativo para ações reais; subjuntivo para fatos duvidosos,
prováveis, potenciais ou optativos; e o imperativo, por meio do qual se expressa
ordem, pedido, convite, súplica etc. (SAID ALI, 1964), sem se considerar o aspecto.
Certamente, o uso da língua encarrega-se de privilegiar certos tempos e modos,
bem como de empregá-los em condições divergentes das canônicas e ampliar as
possibilidades.
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-3-
A exposição sistemática de todas as formas de um verbo, finitas e infinitas
(nominais), constitui a conjugação desse verbo (SAID ALI, 1964). A conjugação dos
verbos portugueses segue o padrão regular ou padrões especiais.
O paradigma regular ou o padrão geral
O sistema de verbos do português compreende três conjugações, que são
assinaladas pela vogal temática (VT). Há três vogais temáticas, conforme a notação
escrita usual: “a” para a primeira conjugação (1.ªC), “e” para a segunda
conjugação (2.ªC) e “i” para a terceira conjugação (3.ªC). Compõem esse sistema
verbos ditos regulares – que seguem o paradigma fixo da conjugação a que
pertencem e são maioria em português – e os ditos irregulares – que se desviam do
paradigma regular. O tema (RAD+VT) do infinitivo é a forma básica do verbo
regular. Assim, dado um verbo regular em sua forma infinitiva, é possível conjugálo com facilidade, nas seis pessoas gramaticais, sobretudo nos tempos do modo
indicativo. Em contrapartida, tomar uma forma verbal conjugada e dela extrair os
morfemas que a compõem, a fim de desvendar tempo, modo, pessoa e número em
que está flexionada, não é tão fácil (VASILÉVSKI e ARAÚJO, 2011).
Em português, há três modos verbais finitos, com seus tempos simples
(indicativo (seis tempos), subjuntivo (três tempos) e imperativo (afirmativo e
negativo)), além do infinitivo pessoal e das formas nominais (infinitivo, gerúndio e
particípio). Cabe destacar que o pretérito mais-que-perfeito é pouco usado no
Brasil. Na fala coloquial, ele restringe-se a frases feitas, e é raramente usado na
língua escrita. No entanto, ele é preservado, sobretudo, na literatura, em músicas,
textos jurídicos e aparece esporadicamente no falar jornalístico, por exemplo, em
editoriais. Assim, o PMI tem seu lugar em gêneros textuais específicos, mas pode
figurar em outros, conforme juízo do usuário da língua. Quanto às formas nominais,
o infinitivo é a forma mais genérica do verbo, que de maneira mais ampla e vaga
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-4-
resume sua significação, sem noções de tempo, modo e aspecto. Por isso, ele é
usado para designar o nome do verbo.
As segundas pessoas gramaticais canônicas “tu” e “vós” – e formas delas
derivadas (“teu”, “vossa”) – também passam a ocorrer em gêneros textuais
específicos
orais
e
escritos
(como
religioso,
literário,
musical).
Isso
é
especialmente verdade em relação a “vós”, pois “tu” é usada na fala coloquial –
portanto, em gêneros textuais primários (BAKHTIN, 2006) – em algumas regiões do
Brasil, como em Florianópolis, Santa Catarina, inclusive com as flexões tradicionais
(“tu sabes”, “tu foste”, “se tu fizeres”). Então, não cabe aos professores, muito
menos aos pesquisadores, excluí-las do paradigma verbal, sob risco do usuário da
língua deparar-se com elas ao trocar o canal da televisão, ler uma carta comercial,
ouvir música, pesquisar na rede mundial, conversar com alguém de outra região. As
novas tecnologias impedem que formas clássicas sejam ignoradas pela escola.
A conjugação dos verbos portugueses organiza-se em formas primitivas e
derivadas, em que as segundas, em seu paradigma, seguem as primeiras. Os temas
das formas primitivas do português (1S-PI, PPI e INF) e derivadas (todos os demais
tempos e pessoas) constituem os sistemas de conjugação. Assim, em português, há
o Sistema do Presente, o Sistema do Perfeito e o Sistema do Infinitivo, com suas
regras específicas, que regem os outros tempos verbais.
De acordo com o sistema do presente, de 1S-PI derivam todo o PS, por
consequência, todo o IMN e o IMA, menos 2S e 2P (ver Quadro 1, p.14). Por
exemplo, o verbo “trazer” é “trago” em 1S-PI, portanto, trag- será o radical do PS
(“traga”, “tragas”...), do IMN (não “traga”... não “tragamos”...) e de 3S com valor
de 2S (você), 1P e 3P do IMA (“traga” você, “tragamos” nós, “tragam” vocês). As
demais pessoas, tanto do PI (2S, 3S, 1P, 2P e 3P) como do IMA (2S e 2P clássicas),
derivam do radical do infinitivo (“trazemos”, “traz” etc.). Assim, substituindo-se a
terminação -o de 1S-PI por -e, nos verbos da 1.ªC, e por -a, nos verbos da 2.ªC e
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-5-
3.ªC, obtêm-se as pessoas do PS: “amo” (1S-PI), “ame”... (PS); “faço” (1S-PI),
“faça”... (PS); “sumo” (1S-PI), “suma”... (PS).
Segundo o sistema do perfeito, o tema do PPI dá origem ao PMI
(acrescentando-se o morfema -ra) e ao PIS (acrescentando-se o morfema -sse) e FS
(acrescentando-se o morfema -r). Nos paradigmas regulares, o tema do perfeito é
idêntico ao do infinitivo, e toda a derivação é regular (com alterações apenas em
1S e 3S-PPI de alguns verbos), mesmo nos verbos com mais formas irregulares
(SCLIAR-CABRAL, 2003).
Os demais tempos (PII, FPI, FPPI) e pessoas excluídas do sistema do presente e
do perfeito, como dito, derivam do radical do infinitivo do verbo: esse é o sistema
do infinitivo. A esses radicais, então, acrescem-se a vogal temática do verbo (com
suas alomorfias) e as desinências modo-temporais e número-pessoais (ambas com
suas alomorfias) e se obtêm os paradigmas correspondentes da conjugação verbal
do português. O PII é formado mediante acréscimo da desinência –va ao tema dos
verbos da 1.ªC e de -ia ao radical dos verbos da 2.ªC e 3.ªC: “dar”, “dava”;
“caber”, “cabia”; “ir”, “ia”, mas há de se considerar os alomorfes, como se verá.
As línguas românicas ficaram privadas das formas de futuro do indicativo que
tinha o sistema latino. Essa falta supriu-se com a união do presente do verbo
“haver” ao infinitivo, para o futuro do presente: hei + vencer = vencerei, bem
como, analogamente, criou-se o futuro do pretérito com a junção de “havia”
(contraído em hia) do PII ao infinitivo: havia (hia) + vencer = venceria, para todos
os verbos (SAID ALI, 1964).
Aprofundam-se agora questões estruturais. O verbo é, em português, o
vocábulo flexional por excelência, dada a complexidade e a multiplicidade de suas
flexões. As noções gramaticais de tempo e modo e de pessoa e número que a forma
verbal indica correspondem a duas desinências (sufixos flexionais) chamadas de
sufixo modo-temporal (SMT) e sufixo número-pessoal (SNP), que se aglutinam e se
ligam ao tema. O tema constitui-se do radical seguido da vogal temática da
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-6-
conjugação correspondente. No padrão geral, o radical é invariável e dá a
significação lexical do verbo. Assim, a fórmula da estrutura do vocábulo verbal
português – na qual RAD indica radical do verbo; VT, vogal temática; e SF, sufixos
flexionais – é (CÂMARA JR., 1986):
TEMA (RAD+VT) + SF (SMT + SNP)
Levando-se em conta a alomorfia de cada um dos sufixos flexionais e a
possibilidade de ser zero (Ø) para um deles ou ambos, essa fórmula dá a regra geral
da constituição morfológica do verbo em português, além de indicar a ordem
obrigatória dos morfemas. A aglutinação em um único morfema das noções de
tempo
e
modo
determina
13
morfemas
modo-temporais,
nos
quais
só
esporadicamente ocorre alomorfia, isto é, a variação de um morfema condicionada
pelo contexto onde ele ocorre. A complexidade para a interpretação do morfema
flexional propriamente verbal, em português, ou seja, o modo-temporal, decorre,
em primeiro lugar, justamente da cumulação dessas duas noções, além da noção
suplementar de aspecto, que às vezes se inclui na noção de tempo (CÂMARA JR.,
1986). De maneira muito resumida, pois o assunto é complexo, o tempo verbal
refere-se ao momento de ocorrência do processo, visto do momento da
comunicação; já o modo refere-se a um julgamento implícito do falante a respeito
da natureza, subjetiva ou não, da comunicação que faz. No entanto, é comum em
português, assim como em outras línguas, o emprego modal dos tempos verbais,
que já foi chamado de metafórico. Não obstante, a apreciação do modo em
português tem de se firmar, inicialmente, nas formas modais propriamente ditas,
deixando à margem o emprego metafórico dos tempos (CÂMARA JR., 1986).
Ainda, há seis sufixos número-pessoais, como mencionado, para indicar os
falantes (1.ª pessoa do discurso), os ouvintes (2.ª pessoa do discurso) e as entidades
sobre quem se fala (3.ª pessoa do discurso) (CÂMARA JR., 1986). No português do
Brasil (PB), aliás, não só no do Brasil, a segunda pessoa do discurso vale-se da
terceira pessoa gramatical. As pessoas gramaticais são designadas por 1, 2 e 3 do
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-7-
singular (S) e do plural (P), assim, gramaticalmente, tem-se: 1S (eu), 2S (tu), 3S
(ele, ela, você), 1P (nós), 2P (vós) e 3P (eles, elas, vocês). Como visto, no PB,
usam-se conjugadas como 3S e 3P “você” e “vocês”, respectivamente, o que
aumenta o nível de ambiguidade do sistema de verbos, pois, apesar das flexões da
terceira pessoa, essas formas referem-se à segunda pessoa do discurso. Ainda, 1P
(nós) pode ser substituída por “a gente”, quando então assume as flexões de 3S ou,
muito mais raramente, 1P. Os últimos casos são tão potencialmente ambíguos, que
as pessoas gramaticais sempre estão expressas, o que facilita a desambiguação pelo
contexto, seja ele escrito ou oral.
Há também o papel dos sufixos número-pessoais na conjugação verbal. O
desaparecimento de certos sufixos pessoais determinou, em várias línguas
modernas, a necessidade de se antepor ao verbo o pronome pessoal da 1.ª e 2.ª
pessoas, bem como da 3.ª, quando não vem enunciado o sujeito. Em português, o
uso do pronome pessoal é obrigatório na 1.ª e 3.ª pessoas do singular de certas
formas verbais idênticas, quando o exigir a clareza do pensamento (SAID ALI,
1964), assim como nas segundas pessoas e primeira pessoa conjugadas como
terceiras (“você”, “vocês” e “a gente”) (VASILÉVSKI e ARAÚJO, 2011). Nos demais
casos, o pronome serve apenas para reforço enfático (SAID ALI, 1964).
Estudo recente (SCLIAR-CABRAL, 2008) propõe o refinamento da fórmula
anterior para: TEMA (RAD+VT) + SF (SMTA + SNP + SPF), com a inclusão do acento
ou suprafixo (SPF) e da categoria de aspecto (A). Essa inclusão do acento de
intensidade com a função de assinalar diferenças aspectuais tem sido negligenciada
na literatura sobre aquisição da linguagem, o que causa problemas para a
codificação automatizada ainda não tratados, como a queda do morfema -r do
infinitivo na pronúncia. Estima-se abordar essa questão com apoio da fonologia, em
outra fase do projeto, tarefa para a qual se contará com apoio do conversor
automático grafema-fonema Nhenhém (VASILÉVSKI, 2008, 2012b e 2012c).
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-8-
Padrões especiais
Os verbos ditos irregulares, embora constituam uma pequena minoria em
relação a todos os verbos existentes na língua, ocorrem em frequência muito alta,
o que lhes dá importância significativa. Os cinco verbos mais utilizados no
português atual, segundo pesquisa baseada em córpus, são, na seguinte ordem:
“ir”, “ser”, “estar”, “ter” e “ver” (WILKENS e VILLAVICENCIO, 2012). Todos eles
têm formas irregulares em seus paradigmas.
Nesse momento, cabe questionar: Afinal, o que define se uma forma é regular
ou irregular? Ora, regras estabelecidas a partir do que é comum e do que é
incomum ou exceção dentro de um sistema. É válido lembrar que, por irregulares,
entendem-se os verbos cujos temas das formas primitivas são distintos entre si –
essa é a principal característica de sua irregularidade. Apesar de as gramáticas
dividirem os verbos em regulares e irregulares, todos os verbos ditos irregulares são
regulares em vários tempos e pessoas gramaticais. Assim, não há verbo que seja
irregular em todos os tempos e pessoas. Nos tempos futuros (do presente e do
pretérito) do modo indicativo, há pouquíssima irregularidade. Nesses tempos,
verbos como “ser”, “estar”, “vir” conjugam-se pelo paradigma regular. A exceção
fica por conta dos verbos “fazer”, “dizer” e “trazer”, cujas formas, nesses tempos,
para serem regulares, deveriam ser, por exemplo, em 3S: “fazerá”, “dizerá”,
“trazerá” e “fazeria”, “dizeria” e “trazeria”, as quais não são consideradas
padrão, no português atual.
Desse modo, é necessário o refinamento de regularidade. No caso dos
infinitivos, a regra é que os verbos do português, nessa forma, terminam com a
respectiva vogal temática – que pode ser “a”, “e” ou “i” – à qual se segue o
morfema de infinitivo verbal, que é sempre “r”. Assim, “pôr” - que já foi “poer” e
vem do latim ponere - é o único verbo cuja forma infinitiva é irregular. Nem os
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
-9-
verbos com formas irregulares mais complexas para a automatização, que a
pesquisa mostrou serem “ir” e “ser”, são irregulares no infinitivo.
A dificuldade de automatização das conjugações dos verbos com formas
irregulares vai de um nível simples (“trazer”, “dizer” e “fazer” nos futuros do
presente e do pretérito), passando por um nível intermediário e chegando ao
máximo (verbos “vir”, “ir” e “ser”, como dito, em vários tempos e pessoas).
O verbo “ser” ilustra a irregularidade no sistema do presente. Em 1S-PI, ele é
“sou”, enquanto, no PS e no IMA, ele conjuga-se “seja”, portanto, trata-se de
forma irregular, pois o tema deveria ser o mesmo. Assim, além das formas
primitivas distintas, o verbo “ser” apresenta irregularidades nas derivações. Do
mesmo modo, “haver”, “estar”, “querer” e “saber” desviam-se desse sistema:
“hei” (1S-PI), “haja”... (PS), “estou” (1S-PI), “esteja”... (PS), “quero” (1S-PI),
“queira”... (PS), “sei” (1S-PI), “saiba”... (PS); e “ir” e “dar” o obscurecem, por
seu radical ser tão pequeno: “vá”... (PS), “dou” (1S-PI), “dê”... (PS).
Cabe exemplificar a irregularidade no sistema do perfeito. Em relação ao
verbo “estar”, há, respectivamente, do radical estive- (PPI de “estar”): “estivera”,
“estivesse” e “estiver”, bem como do tema coube- (PPI de “caber”) há: “coubera”,
“coubesse” e “couber”. O tema puro que dá lugar a essas derivações aparece
obscurecido na 1S e 3S, mas se revela nas demais formas pessoais: “houveste”,
“houvera”, “houvesse”, “houver”; “tiveste”, “tivera”, “tivesse”, “tiver”; “vieste”,
“viemos”, “viera”, “vier”; “vimos”, “vira”, “visse”, “vir”; “fizemos”, “fizera”,
“fizesse”, “fizer”; etc. (SAID ALI, 1964). Note-se que o PPI de “estar” é modelado
segundo o de certos verbos da 2.ªC (“estive”, “estiveste” – “tive”, “tiveste”), bem
como “dar”, cuja 1S é “dei”, mas as demais pessoas se formam pelo paradigma
regular da 2.ªC (“deste”, “deu” – “temeste”, “temeu”). Nos verbos da 3.ªC, a
primeira vogal dessas terminações torna-se “i”, obedecendo à vogal temática dessa
conjugação: “senti”, “sentiste”... “sentiram”. Excetua-se o verbo “vir”, com
algumas terminações do tipo geral da 2.ªC (“vieste”). O tipo geral de formação do
PPI da 2.ªC é: “bati”, “bateste”, “bateu”... “bateram”. O verbo “vir” faz “vim”
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 10 -
para 1S-PPI, retendo nasalização antiga. Em português antigo, havia: vẽeste, vẽo,
vẽeron. O verbo teer produziu “teve”, por desnasalização de tẽui. O verbo “estar”
deu “esteve” de ste(t)ui por steti. Para 1S, em português antigo, havia “tive”,
“estive”, e as demais formas eram teveste, teve, tevemos, esteveste, estevemos,
as quais hoje se grafam com “i” (SAID ALI, 1964).
O complexo verbo “ser” faz o PII em “era”, filiado ao radical es- do verbo
latino esse. Do modelo em -ia também se afastam, aparentemente, as formas do
português atual “tinha”, “punha” e “vinha”. Tais formas do PII conservam a nasal
dos radicais latinos ten-, pon- e ven- (tenere, ponere e venere), para as quais se
transplantou o acento tônico próprio da terminação, e se originaram as formas
atuais a partir de tĩia, puía e vĩia (SAID ALI, 1964).
A forma do PPI “fui” de 1S, que tanto serve para o verbo “ser” como para “ir”,
é única, pois as demais pessoas conjugam-se “foste”, “foi”, “fomos”, “fostes”,
“foram”. Há registros em português antigo de foi para 1S e fuste para 2S. O verbo
“ver” constrói o PPI como se fosse da 3.ªC: “vi”, “viste”, “viu”... “viram”. A
formação latina em ui é responsável não somente pela existência do PPI
excepcional desses verbos, mas também pela produção de “houve”, “coube”,
“soube”, “trouxe”, “prouve”. O ditongo “ou” resulta de au, por metátese. Por
exemplo, sapui → sabui → saubi → “soube”; capui → “coube”; “trouxe” proviria
de traucsi por tracsi (SAID ALI, 1964).
O pretérito latino potui deu “pude” para 1S e poud(este) ou pod(este) para as
demais, e hoje se escreve “pud(este)”. As formas verbais posui e posuit deram
puse e pose para 1S, contudo, já no português antigo, manifestou-se a tendência
de reduzir essas formas a “pus”, “pôs”. Desde os quinhentistas, essa vogal terminal
está abolida, da mesma maneira que triunfou a tendência simplificadora de fize
para “fiz”, feze para “fez”, quise para “quis” (SAID ALI, 1964).
Do grupo dos verbos ditos irregulares fazem parte os verbos auxiliares, que
figuram nas conjugações compostas – que são objeto específico de outro trabalho.
Em uma cadeia podem entrar vários verbos auxiliares, sendo o último verbo o verbo
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 11 -
principal, aquele que carrega a significação externa, sempre em uma forma
nominal. Como verbo, o particípio entra na formação dos tempos compostos com os
auxiliares “ter” e “haver” (quando permanece invariável em gênero e número) e
com o auxiliar “ser”, na construção da voz passiva analítica, além de núcleo do
predicado de orações reduzidas. Já o gerúndio é morfologicamente verbal, assim,
não admite flexão de gênero e número (CÂMARA JR., 1986), e entra na formação
das formas progressivas e também como núcleo do predicado de orações reduzidas.
É o verbo principal quem dita a regência, por isso, o primeiro auxiliar da cadeia se
flexionará em pessoa, número, tempo e modo, conforme tal verbo principal
determinar. Por exemplo: “ia comer”, “pode estar havendo denúncias”, “devem-se
temer retaliações” e “havia feito”.
A irregularidade verbal é determinada pelo uso através do tempo, ou seja, nas
preferências que triunfaram, na grande maioria das vezes, havendo pouquíssima
interferência normativa. No entanto, repete-se, tal irregularidade não afeta todo o
paradigma conjugacional do verbo.
Harmonia vocálica e Mudanças aparentes no radical
Alguns verbos portugueses estão sujeitos ao fenômeno chamado harmonia
vocálica, que se refere à influência que o som de uma vogal, numa palavra, exerce
sobre outros sons, vizinhos ou próximos, e que os torna mais semelhantes e
simétricos (apud VASILÉVSKI, 2008). No sistema de verbos do português, tal
influência ocorre com a vogal temática subjacente de 1S-PI na vogal anterior, ou
seja, a última vogal do radical, se, no infinitivo, tal vogal da raiz for /e/ ou /o/.
Por exemplo, o verbo “levar” pertence à primeira conjugação, então, sua
vogal temática é “a”, baixa, e a última vogal do radical é /e/, média. Em 1S-PI, a
vogal do radical copia o traço baixo da vogal temática: “levar”, “levo” →
/le.ˈvaR/, /ˈlɛ.vu/; “gostar”, “gosto” → /goS.ˈtaR/, /ˈgɔS.tu/. O verbo “sofrer”
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 12 -
pertence à segunda conjugação, então, sua vogal temática é /e/, isto é, média, e
a última vogal do radical é /o/, também média. Assim, em 1S-PI, a vogal do radical
permanece a mesma, pois não há necessidade de simetrização. O verbo “cobrir”
pertence à terceira conjugação, de modo que sua vogal temática é /i/, alta, e a
última vogal do radical é /o/, ou seja, média. Em 1S-PI, a vogal do radical copia o
traço alto e se transforma em /u/: /ew 'ku.bru/ (eu cubro). Desse modo, todas as
formas derivadas de 1S-PI (PS, IMN e IMA - exceto as segundas pessoas canônicas)
preservam o traço copiado. Tendo em vista que o português escrito não marca a
diferença entre vogais médias, ou seja, /e/ e /o/, e sua contraparte baixa, isto é,
/ɛ/ e /ɔ/, no sistema verbal, sua leitura torna-se ambígua. O Quadro 1 a seguir
ilustra a harmonia vocálica, em negrito, no paradigma do verbo “dormir”, no qual
se podem perceber os tempos primitivos, que dão origem aos tempos derivados.
Há ainda, em português, radicais regulares que sofrem transformações ditadas
pelos valores grafêmicos, ou seja, para adaptar-se ao padrão ortográfico vigente. É
o caso do fonema /g/, quando vem antes de /e/ e /i/, que é escrito “gu”, para
preservar o valor de /g/, como “ligar” → “liguei”, “ligue” - /li.'gaR/ → /li.'gej/,
/'li.gi/. Também isso ocorre com o fonema /k/, antes de /e/ e /i/, que é escrito
“qu”, para preservar o valor de /k/, como “ficar” → “fiquei”, “fique” - /fi.'kaR/
→ /fi.'kej/, /'fi.ki/; e /s/, antes de /a/, /o/ e /u/, que é escrito “ç”, para
preservar o valor de /s/, como “esquecer” → “esqueço”, “esqueça” - /eS.ke.'seR/
→ /eS.'ke.su/, /eS.'ke.sa/. Nesses casos, não há alteração fonológica no radical,
apenas ortográfica.
A partir dessa exposição, sustenta-se que não é adequado considerar
irregulares as formas verbais sujeitas à harmonia vocálica, pois não há realmente
alteração no radical, apenas simetrização. Da mesma maneira, alterações
aparentes no radical, feitas para adequar as formas verbais às convenções
ortográficas, também não configuram irregularidade. Com o emparelhamento entre
morfologia e fonologia, auxiliado pela união entre o analisador morfológico e o
conversor fonológico Nhenhém, esclareceram-se e resolveram-se tais questões.
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 13 -
Quadro 1: Paradigma conjugacional do verbo “dormir”
INDICATIVO
Presente
Pretérito perfeito
Pretérito imperfeito
eu
durmo
dormi
dormia
tu
dormes
dormiste
dormias
ele*
dorme
dormiu
dormia
nós
dormimos
dormimos
dormíamos
vós
dormis
dormistes
dormíeis
eles
dormem
dormiram
dormiam
Pret. mais-que-perfeito
Futuro do presente
Futuro do pretérito
eu
dormira
dormirei
dormiria
tu
dormiras
dormirás
dormirias
ele
dormira
dormirá
dormiria
nós
dormíramos
dormiremos
dormiríamos
vós
dormíreis
dormiríeis
dormiríeis
eles
dormiram
dormiriam
dormiriam
SUBJUNTIVO
Presente
Pretérito imperfeito
Futuro
que eu durma
se eu dormisse
quando eu dormir
que tu durmas
se tu dormisses
quando tu dormires
que ele durma
se ele dormisse
quando ele dormir
que nós durmamos
se nós dormíssemos
quando nós dormirmos
que vós durmais
se vós dormísseis
quando vós dormirdes
se eles dormissem
quando eles dormirem
que eles durmam
IMPERATIVO
INFINITIVO PESSOAL
Afirmativo
Negativo
-
-
para eu dormir
dorme tu
não durmas tu
para tu dormires
durma você
não durma você
para ele dormir
durmamos nós
não durmamos nós
para nós dormirmos
dormi vós
não durmais vós
para vós dormirdes
durmam vocês
não durmam vocês
para eles dormirem
INFINITIVO: dormir
GERÚNDIO: dormindo
PARTICÍPIO: dormido
* Nessa posição, entram “você” e “a gente”, pronomes atualmente utilizados para designar 2S e 1P,
porém, conjugados como 3S. Da mesma forma, “vocês” encaixa-se em “eles”. Sempre que se indicar
“ele” e “eles”, subentenda-se também “ela” e “elas”.
Fonte: Montagem primária, baseada em Aurélio Século XXI (1999).
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 14 -
Então, o analisador
Levaram-se em conta todas essas considerações e transformaram-se essas
regras – e outras não detalhadas aqui – em algoritmos. Para tanto, fizeram-se
ajustes e complementações que o ambiente computacional exige. Depois, estudouse o comportamento do aplicativo, a fim de se observarem ambiguidades geradas e
resolvê-las, bem como para criar um léxico verbal automático para o córpus de
trabalho. A criação do léxico (VASILÉVSKI, SCLIAR-CABRAL e ARAÚJO, 2012)
resolveu as ambiguidades geradas pela alomorfia da vogal temática, nas três
conjugações, e pela harmonia vocálica que ocorre no radical de verbos da 3.ªC, /o/
→ /u/, uma vez que a harmonia vocálica que ocorre no radical de verbos da 1.ªC e
2.ªC não é registrada no sistema escrito, assim, não é relevante para o programa.
Ainda, esse léxico, associado a instruções computacionais, resgata radicais
regulares que sofrem transformações requeridas pelo sistema ortográfico oficial. A
organização interna do analisador já foi exposta (VASILÉVSKI, 2012a).
O sistema de conjugação de verbos do português é considerado, de certa
forma, simples e previsível, mesmo sua parte irregular (CÂMARA Jr., 1986), o que
respalda a criação de uma ferramenta computacional baseada em suas regras. O
analisador morfológico reproduz o sistema verbal escrito, então, leva em conta
apenas os alomorfes desse sistema e não foca, por enquanto, a questão do
acréscimo do suprafixo à formula de Câmara Jr.
Com base nos dados advindos do levantamento teórico prévio à criação do
analisador, exposto nas seções anteriores, bem como dado o comportamento das
regras gramaticais no ambiente computacional, o programa considera que o que há
são formas irregulares (que se desviam do paradigma regular) e formas regulares.
Essa decisão tornou o trabalho mais coerente, facilitou e agilizou a descodificação
automática, bem como fez jus à realidade do sistema de verbos do português. Além
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 15 -
disso, o programa considera todas as possibilidades de pessoas gramaticais,
inclusive as clássicas, pelos motivos expostos.
Os verbos com padrões especiais foram os mais difíceis de sistematizar, pois
suas regras perderam-se através do tempo, de modo que foram desenvolvidos
algoritmos especiais para dar conta dos desvios em relação ao paradigma regular, e
isso vale para os particípios irregulares – como “escrito”, “visto”. Muitas outras
questões mereceram tratamento diferenciado, mas não são abordadas aqui, por
falta de espaço e por não se referirem diretamente ao tema em questão.
A Figura 1 mostra a tela funcional do analisador, com a análise morfológica
automática da forma “dormiu”, da linha 293 do córpus de trabalho. O analisador
decompõe o verbo em morfemas, depreende seu infinitivo, informa a conjugação à
qual ele pertence, o tempo verbal e a pessoa gramatical em que está conjugado.
Figura 1: Tela principal do analisador morfológico com análise da forma verbal finita “dormiu”
Fonte: Programa Laça-palavras (VASILÉVSKI e ARAÚJO, 2012).
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 16 -
Considerações finais e trabalho futuro
Por fazer parte de um projeto maior, este artigo pode parecer superficial
algumas vezes, por isso, sugere-se consultar os trabalhos publicados aqui citados,
que detalham as etapas de construção do analisador morfológico, bem como
aprofundam a teoria que o fundamenta. O analisador morfológico baseia-se
totalmente em regras, e não em aprendizado de máquina, desse modo, insere-se
no âmbito da inteligência artificial. Uma ferramenta como essa pode ser usada em
pesquisas linguísticas, na recuperação de dados, em resumos automáticos, bem
como em tradutores automáticos, além de apoiar outras áreas, como o ensino
escolar.
A construção do analisador morfológico mostrou que pode haver equívoco no
ensino do sistema verbal do português na escola, uma vez que verbos são tratados
como regulares e irregulares, sem se considerar que os últimos, na verdade,
possuem formas conjugadas (uns mais outros menos) que se desviam do paradigma
regular. No mínimo, pode-se dizer que não se ensina a realidade da língua, no que
concerne a esse tema. Assim como o tratamento adequado dos verbos valorizou o
paradigma verbal como predominantemente regular que é, e isso simplificou e
agilizou a automatização das regras gramaticais do sistema de verbos, é plausível
defender que essa nova visão, por assim dizer, que emergiu durante a
automatização do sistema de verbos, é válida no ensino, mesmo porque a escola
adota uma maneira pouco prática de ensinar verbos, e o resultado disso não é
animador para o professor, nem para o aluno.
Certamente, o que se expôs aqui é uma sugestão que merece ser verificada.
Em trabalho futuro, é intenção desenvolver metodologia para o ensino do sistema
de verbos, com base nos achados desta pesquisa e a partir de dados extraídos de
situações reais de comunicação (córpus). Neste trabalho, o objetivo era divulgar
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 17 -
esses achados e abrir caminho para a reflexão por parte dos leitores, bem como
preparar possíveis desdobramentos. Considera-se que esse primeiro passo foi dado.
Referências Bibliográficas
AURÉLIO SÉCULO XXI. Dicionário da Língua Portuguesa. ver.3.0. Lexikon
Inform./Nova Fronteira: Nov. 1999.
CÂMARA JR., J. M. Estrutura da língua portuguesa. 16.ed. Petrópolis, RJ: Vozes,
1986.
BAKHTIN, M. Estética da criação verbal. 4.ed. São Paulo: Martins Fontes, 2006.
COSTA, R. F. S. e SCLIAR-CABRAL, L. Regularização do sistema verbal pela criança.
In: SIMPÓSIO INTERNACIONAL LINGUAGENS E CULTURAS: HOMENAGEM AOS 40 ANOS
DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM LINGÜÍSTICA, LITERATURA E INGLÊS DA
UFSC
(SILC).
Anais...
Florianópolis,
2011.
Disponível
em:
<http://pos40anos.cce.ufsc.br/?page_id=958>. Acesso em: mar. 2012.
MACWHINNEY, B. Child Language Data Exchange System. 2003-2012. Disponível
em: <http://childes.psy.cmu.edu/>. Acesso em: ago. 2012.
SAID ALI, M. Gramática secundária e Gramática histórica da língua portuguesa.
Brasília: Editora da UnB, 1964.
SCLIAR-CABRAL, L. Análise morfológica automática do português. Projeto.
Florianópolis: CAPES-UFSC, 2009.
______. Codificação da morfologia do PB e análise da fala dirigida à criança. Fórum
Lingüístico, Florianópolis, v.5, n.2, p.69-82, 2008.
______. Princípios do sistema alfabético do português do Brasil. São Paulo:
Contexto, 2003. 263p.
______; VASILÉVSKI, V. Análise automática da morfologia verbal do PB: Plataforma
CHILDES. Revista da ABRALIN, v.10 eletr. 1.ª parte, n. espec., p.431-444, 2011a.
______; ______. Descrição do português com auxílio de programa computacional de
interface. In: II JORNADA DE DESCRIÇÃO DO PORTUGUÊS (JDP), Cuiabá, 2011.
Anais... 2011b.
VASILÉVSKI, V. Construção dos algoritmos para a depreensão da gramática
automática do PB. In: X ENCONTRO DO CÍRCULO DE ESTUDOS LINGUÍSTICOS DO SUL
(CELSUL), Unioeste, Cascavel-PR, 2012. Anais... 2012a.
______. Descodificación automática de la lengua escrita de Brasil, basada en
reglas fonológicas. Saarbrücken, Alemanha: LAP LAMBERT Acad. Publ. GmbH &
Co.KG, 2012b. 112p.
______. Phonologic Patterns of Brazilian Portuguese: a grapheme to phoneme
converter based study. In: EACL – WORKSHOP ON COMPUTATIONAL MODELS OF
LANGUAGE ACQUISITION AND LOSS. Association for Computational Linguistics.
Avinhão, França, 24 abr. 2012. Proceedings... 2012c, p.51-60.
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 18 -
______. O hífen na separação silábica automática. Revista do Simpósio de Estudos
Lingüísticos e Literários - SELL, Uberaba, v.1, n.3, p.657-676, 2011a.
______. Diferenças entre Input e Intake: evidências na aquisição de pronomes
interrogativos. In: SIMPÓSIO INTERNACIONAL LINGUAGENS E CULTURAS:
HOMENAGEM AOS 40 ANOS DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM LINGÜÍSTICA,
LITERATURA E INGLÊS DA UFSC (SILC). Anais... Florianópolis, 2011b. Disponível em:
<http://pos40anos.cce.ufsc.br/?page_id=958>. Acesso em: mar. 2012.
______. Divisão silábica automática de texto escrito baseada em princípios
fonológicos. In: III ENCONTRO DE PÓS-GRADUAÇÃO EM LETRAS DA UFS (ENPOLE).
Anais..., São Cristóvão, Sergipe, 2010.
______. Construção de um programa computacional para suporte à pesquisa em
fonologia do português do Brasil. 2008. 165f. Tese (Doutorado em Lingüística) –
Universidade Federal de Santa Catarina, Florianópolis.
______; ARAÚJO, M. J. Tratamento dos sufixos modo-temporais na depreensão
automática da morfologia dos verbos do português. Linguamática, v.3, n.2, p.107118, dez. 2011.
______; ______ Laça-palavras: sistema eletrônico para descrição do português
brasileiro.
LAPLE-UFSC:
Florianópolis,
2010-2012.
Disponível
em:
<https://sites.google.com/site/sisnhenhem/>. Acesso em: nov. 2012.
______; SCLIAR-CABRAL, L.; ARAÚJO, M. J. Automatic Analysis of Portuguese Verb
Morphology: solving ambiguities caused by thematic vowel allomorphs. In: THE
10TH INTERNATIONAL CONFERENCE ON THE COMPUTATIONAL PROCESSING OF
PORTUGUESE (PROPOR), Coimbra, Portugal. Proceedings … 2012, p.12-23. 428p.
WILKENS, R. e VILLAVICENCIO, A. I say have you say tem: profiling verbs in children
data in English and Portuguese. In: EACL – WORKSHOP ON COMPUTATIONAL MODELS
OF LANGUAGE ACQUISITION AND LOSS. Association for Computational Linguistics.
Avinhão, França, 24 abr. 2012. Proceedings... 2012, p.38-42.
1
Vera VASILÉVSKI, Dra.
Universidade Federal de Santa Catarina (UFSC)
Pós-graduação em Linguística, PNPD-CAPES
[email protected]. Este trabalho é desenvolvido
com o apoio da CAPES.
Universidade Federal de Pernambuco
NEHTE / Programa de Pós-graduação em Letras
CCTE / Programa de Pós-graduação em Ciências da Computação
- 19 -
Download