A CONCORDÂNCIA NOMINAL E O REVISOR GRAMATICAL

HENRIETTE MARCEY ZANINI
A CONCORDÂNCIA NOMINAL E O
REVISOR GRAMATICAL ELETRÔNICO DO WORD
Cuiabá
2007
HENRIETTE MARCEY ZANINI
A CONCORDÂNCIA NOMINAL E O
REVISOR GRAMATICAL ELETRÔNICO DO WORD
Dissertação apresentada ao Programa de Mestrado
em Estudos de Linguagem da Universidade Federal
de Mato Grosso – UFMT, como requisito parcial para
obtenção do título de Mestre em Estudos de
Linguagem.
Área de concentração: Estudos Lingüísticos
Orientadora: Profª. Drª. Alice Maria Teixeira Saboia
Instituto de Linguagens da UFMT
Cuiabá
2007
Dedico e agradeço...
A Wendy e Tayná, amores e razões primeiras de todo meu viver.
A minha mãe, Marley, guerreira que, entre outras coisas, me ensinou a nunca desistir, por
mais árdua, longa e acidentada se mostrasse a minha trilha.
A meu pai, Toni, onde quer que ele se encontre depois de ter partido para os Campos
Elíseos. Demorou, mas hoje eu sei que ele realmente acreditava que eu podia realizar
qualquer coisa que me propusesse a fazer.
A minha irmã Andréa, que, uma semana antes da minha defesa, foi levada para trabalhar
no departamento dos anjos de Deus. Minha maior incentivadora, em tudo!
Aos meus irmãos, Luiz Francisco, Jeancarlo e Thiago (e suas famílias), por terem,
principalmente, “agüentado” minhas reclamações, meu cansaço, muitas vezes meu
desânimo, e porque sem eles, ao meu lado, sou menos gente.
Ao Toninho, que de um modo muito especial também me acompanhou nessa jornada.
A minha avó, Natalina Ellert, que aos 91 anos teima em dizer a todos com quem conversa
que, agora, eu sou “doutora”; a minha tia Sirley, que soube entender minhas angústias e
acalmar meu coração; a minha tia Leda, com quem aprendi a amar os livros e a música.
A minha amiga-irmã Vera Lúcia Eilert, por seu incentivo constante e fé absoluta no “meu
poder”, e pelos fichamentos que me ajudou a fazer.
Às minhas amigas do coração, Tereza Sartori, Terezinha Konopaktzi, Irene Cajal, Luzia
Guimarães, Vera Lúcia Lopes, Mariângela Sola López Díaz, Sônia Zaramella, Ana Maria
de Souza e Maura Guimarães. Cada uma, à sua maneira, me apoiou, me ajudou, me
“empurrou”, iluminando meu caminhar.
Aos amigos queridos, Lívio Wogel, Delarim Martins Gomes e Javier Eduardo López
Díaz, pelo “ombro” e pela ajuda incondicional sempre que precisei.
À minha turma do Mestrado, amigos inesquecíveis, meus Professores de Vida: Carmen
Hornick, Caroline Akie, Degmar dos Anjos, Edsônia Melo, Marcelo Silvestrim, Neusa
Phillipsen, Paula Jeorgea, Rodney Mendes de Arruda e Ruth Dourado.
A meus professores, formadores de mais um pouco de mim: Denise Dal’Bello, Lúcia
Helena Vendrúsculo Possari, Manoel Mourivaldo, Marcos Moura Vieira, Maria Inês
Pagliarini Cox, Maria Rosa Petroni e Marieta Prata.
À minha professora-orientadora Profª. Drª. Alice Maria Teixeira Sabóia que, sem me
conhecer e contra todas as probabilidades, acreditou firmemente que eu pudesse fazer um
trabalho de qualidade.
Agradeço, em especial, à banca de avaliação: Profª. Drª. Maria Inês Pagliarini Cox e Prof.
Dr. Cláudio Cezar Henriques, por tão generosamente despenderem seu tempo para
compartilharem comigo uma parte do seu imenso conhecimento.
Henriette Marcey Zanini
Os limites da minha
linguagem são os
limites do meu
mundo.
Wittgenstein
RESUMO
ZANINI, Henriette Marcey. A concordância nominal e o revisor gramatical eletrônico
do Word
Resumo: Esta dissertação aborda o revisor gramatical eletrônico do “Microsoft Office
Word” para o português. Recorta-se em especial a aplicação da regra de
concordância nominal, testada esta em exemplos extraídos de três gramáticas
diferenciadas entre si, pelo modelo teórico-metodológico utilizado no tratamento da
linguagem verbal, para detectar o modelo gramatical subjacente ao revisor estudado.
Neste trabalho busca-se entender como se comporta o revisor gramatical quanto às
regras de concordância nominal contidas em sua gramática, comparando-as às da
gramática normativa e às dos usos cotidianos do português brasileiro padrão. Os
resultados da análise do material permitem inferir que o modelo adotado pela
referida ferramenta computacional assenta-se, em parte, na gramática tradicional, no
que tange à regra geral, deixando, todavia, de observar as regras excepcionais
prescritas.
Palavras-chave: revisor gramatical eletrônico, concordância nominal, norma
lingüística
Abstract: This paper approaches the automatic grammar checker of the Microsoft
Office Word for Portuguese Language. It observes especially the use of the nominal
concordance rulers, tested themselves through examples from three diferent
grammar books, by a theoretical and methodological model used in the treatment of
verbal language, in order to detect the grammatical model that underlies the focused
checker. Here, we search to understand how the grammar checker behaves itself
facing nominal concordance rulers in its grammar, compare them with those into the
normative grammar and the daily uses of standard Brazilian Portuguese. The results
of the analysed material take us to grasp that the adopted model by the automatic
grammar checker settling is based partly on the traditional grammar, relating to
general rule, but it doesn’t observe the excepcional rules prescribed by that grammar.
Key-words: automatic grammar checker, nominal concordance, linguistic rule
SUMÁRIO
Dedicatória e agradecimentos................................................................................ iii
Epígrafe.................................................................................................................. iv
Resumo/Abstract.....................................................................................................v
INTRODUÇÃO ......................................................................................................07
Capítulo I – METODOLOGIA ................................................................................13
Capítulo II – O ADVENTO DO REVISOR GRAMATICAL ELETRÔNICO .............18
2.1 A Lingüística Computacional................................................................19
2.2 A Sintaxe Computacional .....................................................................24
2.3 O Revisor Gramatical Eletrônico ..........................................................30
2.3.1 Como “nasceu” o Revisor ......................................................41
2.3.2 Como funciona o revisor gramatical do Word........................49
Capítulo III – A CONCORDÂNCIA NOMINAL .......................................................55
3.1 Em Napoleão Mendes de Almeida.......................................................57
3.2 Em Evanildo Bechara...........................................................................66
3.3 Em Maria Helena Moura Neves ...........................................................78
Capítulo IV – O (DES)COMPASSO ENTRE AS NORMAS DE
CONCORDÃNCIA NOMINAL CONSTANTES NAS
TRÊS GRAMÁTICAS E NO REVISOR ELETRÔNICO ...................84
Capítulo V – CONCLUSÃO .................................................................................101
REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................108
ANEXO A - Informática: símbolos digitais e glossários.......................................111
ANEXO B - O ReGra: Revisor Gramatical do Word ............................................116
ANEXO C - Telas de Aconselhamento da gramática eletrônica do Word ...........120
Introdução
As línguas são de certo modo seres que nos rodeiam e nos iluminam como grandes arcanjos
viventes: é necessário lhes dar um espaço interior de acolhida e estar dispostos a escutá-los e a
lhes prestar atenção.
Ivonne Bordelois (1934-), lingüista argentina.
Desde o começo dos primeiros estudos lingüísticos a preocupação com a
norma, a preocupação no sentido de fixar o “bom uso” e a correção estão dentre as
motivações mais fortes que levaram os estudiosos a descrever as línguas,
resultando na seleção de uma determinada modalidade lingüística em detrimento de
outras consideradas vulgares, impuras, incorretas, ilegítimas. Apoiada nesse
pressuposto, toda a tradição lingüística ocidental atribuiu duas funções básicas ao
gramático: dizer o que a língua é, descrevendo-a, e, simultaneamente, dizer o que
ela deve ser.
Desta forma, não é de se estranhar a ênfase no fato de a linguagem ser
considerada um procedimento importantíssimo, que qualifica ou desqualifica, pela
forma utilizada, o que é dito e quem o diz.
Essa preocupação com o bom, com o adequado uso da linguagem
encontra-se vividamente dentro de empresas, de órgãos públicos, nas redações de
grandes jornais, para citar apenas alguns exemplos, e tem suscitado o
aparecimento de programas de aperfeiçoamento, fazendo surgir um número
considerável de manuais de cultura idiomática. Com a Internet, vários passaram a
ser disponibilizados para consulta on-line, na tentativa de agilizar a vida do usuário
que não dispõe, no momento em que precisa, de material impresso para tirar suas
dúvidas em relação ao uso considerado correto do seu idioma.
Hoje, usuários que necessitam redigir um texto, e que não são tão
proficientes na escrita da língua portuguesa, encontram à sua disposição alguns
softwares de correção gramatical desenvolvidos para auxiliá-los no momento de
escritura de seus textos.
Interessa-nos, aqui, particularmente, falar sobre o revisor gramatical
eletrônico do Microsoft Word, o programa de edição de textos mais utilizado no
mundo, e objeto de nossa pesquisa.
8
A idéia de trabalhar com este tema nasceu da observação de inadequações
sintáticas no que diz respeito às concordâncias verbal e/ou nominal, apresentadas,
principalmente, em textos de alunos de graduação. Inicialmente nos parecia que
eles não procediam a uma revisão gramatical de seus escritos, porém como
asseguravam que “pediam ajuda ao computador”, mais especificamente à tecla F7,
percebemos a necessidade de averiguar o que se passava.
Não costumávamos utilizar o recurso de clicar em Ferramentas: ortografia e
gramática (desconhecíamos, ainda, que o atalho era a tecla F7) por dois simples
motivos: primeiro, pelo conhecimento razoavelmente bom do idioma, e por
recorrermos constantemente ao dicionário e à gramática; segundo, a quase total
falta de intimidade com a maioria dos recursos computacionais, ou seja, a não
utilização nem de 1/3 dos recursos que o computador oferece, entre eles como
procurar a ajuda do revisor, quer ortográfico, quer gramatical.
Então, ao começarmos a expor ao revisor eletrônico do Word alguns
problemas lingüísticos apresentados pelos alunos, acabamos nos deparando com
outros problemas que ele nos apresentava. Parecia analisar e sugerir alterações
aleatoriamente, como se não houvesse um padrão que seguisse. Referimo-nos a
padrão, aqui, como regras ditadas pela gramática normativa da língua portuguesa. E
o mais preocupante é que para os usuários do revisor, ou seja, para as pessoas que
não têm um conhecimento maior de estruturas sintáticas e regras de concordância,
ele é tido como um instrumento confiável de colaboração para a correção gramatical
de seus escritos.
Vale uma ressalva, aqui: o termo “corretor” tem como sinônimos “revisor” e
“verificador”. Optamos por utilizar com maior freqüência o termo revisor, primeiro por
achá-lo, particularmente, mais adequado e, em segundo, porque é esse termo que
aparece na configuração do Microsoft Office Word, presente em cada PC, tanto para
Revisor Ortográfico quanto para Revisor Gramatical.
Assim, é natural que, em virtude das tentativas vãs em entender a lógica com
que o revisor operava, algumas interrogações começaram a nos atiçar a
curiosidade, tais como: por que a descrição gramatical do revisor eletrônico não diz
respeito à verificação de grande parte das estruturas usuais do português do Brasil
em relação às regras de Concordância Nominal? Que gramática subjaz ao revisor
gramatical eletrônico? Trata-se de uma gramática casuística, composta de um
9
elenco de frases, que considera caso a caso? Trata-se de uma gramática que vê a
língua como um conjunto de enunciados pré-estabelecidos?
Destes questionamentos originou-se a pergunta principal de nossa pesquisa:
quais normas constam da memória da gramática eletrônica em relação à
concordância nominal? Seguem o modelo tradicional ou não?
E, sem respostas imediatas a essas e outras questões, principalmente no
retorno das correções feitas nos textos dos alunos, surgiu, então, o desejo de
procurar essas respostas por meio de uma investigação científica que desse
respaldo às nossas discussões com os alunos quando eles se deparassem com as
correções feitas em seus textos e os pedidos para não confiarem tanto no revisor
eletrônico, mas, sim, nas velhas e boas regras encontradas nas gramáticas
impressas que, sabemos, a maioria não gosta de, ou não sabe como, pesquisar.
Aliás, essa confiança no revisor gramatical é um dos aspectos que precisa ser
debatido, pois realmente chama a atenção ver como usuários comuns se apóiam no
que lhes aconselha o revisor como correção. Confiança não compartilhada com os
homens de letras - aqui representados por pessoas com conhecimento maior das
normas gramaticais em relação àqueles -, como se pôde perceber, por exemplo,
nas opiniões de professores de português, dispostas no subcapítulo dedicado ao
funcionamento do revisor.
Desta forma, pensamos realizar um trabalho que pretende, por meio da
investigação científica, demonstrar qual o grau de (in)adequação da gramática
eletrônica, no que diz respeito às regras de Concordância Nominal apresentadas
pelo revisor do Word, com relação às regras da gramática normativa e aos usos
cotidianos da língua portuguesa.
Para saber mais e conseguir chegar a conclusões claras e consistentes para a
composição do texto, como um todo, optamos escolher traçar um caminho que, a
nosso ver, nos embasaria teoricamente e nos forneceria dados para a compreensão
buscada.
No primeiro capítulo encontra-se a metodologia, desenhada por nós, uma vez
que não conseguimos encontrar no gênero algo com o qual pudéssemos trabalhar.
Considerações sobre o revisor gramatical eletrônico estão dispostas no
segundo capítulo, bem como considerações acerca da lingüística computacional e
da sintaxe computacional. Acerca do revisor, dispusemos as informações que
conseguimos (a maioria pela Internet) e que consideramos ainda um pouco
10
inconsistentes para compreender bem a complexidade desta ferramenta de trabalho
de que dispõe um usuário de computador quando utiliza um editor de textos. Há
testes que fizemos com um anúncio de venda de um revisor gramatical, infelizmente
sem nome e sem datação, mas de grande ajuda para o início das reflexões acerca
de algo que não conhecíamos ainda. Informações de como proceder – apenas
algumas dentre as diversas orientações fornecidas pelo programa - para utilizar o
revisor estão no primeiro subcapítulo e, no segundo, quem esteve e está por trás da
criação, do desenvolvimento e do aprimoramento dos revisores ortográfico e
gramatical para a língua portuguesa utilizados pela Microsoft Word nos
computadores que se utilizam do sistema Office Word.
O terceiro capítulo é dedicado às noções de concordância – ênfase na
concordância nominal - prescritas para o uso do português culto, bem como os
capítulos destinados ao assunto pelos três gramáticos escolhidos por nós, com as
respectivas telas copiadas quando o revisor detectava um problema com alguma
regra.
No quarto capítulo, as análises contrastivas entre as normas de concordância
nominal constantes nas três gramáticas e no revisor gramatical. Também as
respostas para as perguntas iniciais de pesquisa, com as análises julgadas
pertinentes.
No quinto capítulo, as conclusões a que chegamos.
Como anexos, disponibilizamos algumas telas de aconselhamento ofertadas
pelo revisor gramatical eletrônico sobre outros tópicos gramaticais, que não apenas
a concordância nominal, com os quais nos deparamos, durante a digitação do texto
desta pesquisa, sublinhados com a linha ondulada verde. Servem a título de
ilustração e também de exemplificação de alguns dos aspectos que ainda precisam
ser melhorados pelos pesquisadores/idealizadores do revisor. Há, também, outros
dois anexos: do universo da informática retiramos informações sobre o que são
símbolos digitais e dois glossários de termos; e a transcrição de um artigo publicado
pelo NILC quando da apresentação da última versão do ReGra – Revisor
Gramatical.
Por ter trabalhado com Napoleão Mendes de Almeida, Evanildo Bechara e
Maria Helena Moura Neves, pensamos ser relevante a observação disposta no
próximo parágrafo, o que também já nos serve de fecho para esta apresentação.
11
No contraponto entre a gramática eletrônica e as gramáticas citadas acima há
um conhecimento que se faz necessário e, para obtê-lo, fizemos no segundo
capítulo deste trabalho uma breve incursão aos domínios da lingüística
computacional. Breve incursão porque sabemos não haver condições temporais e
cognitivas
para
um
aprofundamento
nesse
tema.
Pretendemos
apenas
compreender melhor como se processa a linguagem que o computador utiliza para
reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos,
como um programador consegue introduzir regras gramaticais para o uso efetivo do
revisor eletrônico.
Nesse quesito, trabalhamos principalmente com Othero e Menuzzi (2005) e
suas orientações na construção de um parser lingüístico, além de suas reflexões
acerca da gramática e das programações de máquinas para responder a comandos
de usuários em sua própria língua. Com relação ao trabalho do lingüista, dizem no
comentário de orelha do livro:
Por trás desse tipo de trabalho, deve estar o lingüista: ele é o
cientista que busca compreender coisas como as nuances
semânticas de uma expressão, as regras sintáticas de uma língua
ou os detalhes de funcionamento de seus sons. É preciso “ensinar”
essas coisas ao computador, se quisermos que essa máquina
venha a interagir conosco.
Pensamos que ensinar, ou reensinar, coisas ao computador depende de
estudos como o que pretendemos levar a cabo. Aí reside a importância social que
acreditamos ter uma pesquisa como a nossa. Alguns problemas com a gramática
eletrônica serão detectados, outros, provavelmente, ficarão “sem sugestões”, haja
vista a dificuldade que encontramos com o “humor” da tecla F7: às vezes, aparece a
sublinha verde sob uma estrutura frasal e, às vezes, quando a mesma sentença é
exposta novamente ao corretor, não aparece sublinhada em verde. Em outras,
ainda, o revisor sublinha o texto, mas na janela de ortografia e gramática surge a
expressão “(sem sugestão)”, ainda que seja oferecida uma explicação gramatical.
(Vide tela na página seguinte.)
De qualquer modo, temos a intenção de contribuir, mesmo que timidamente,
para que novos estudos sejam realizados no intuito de se melhorar o desempenho
da gramática eletrônica do Word, ao menos quanto às regras de concordância
nominal contidas nela.
12
Capítulo I - Metodologia
Em virtude de não conseguirmos encontrar um modelo metodológico o qual
servisse à nossa intenção de demonstrar a adequação ou a inadequação do revisor
gramatical eletrônico do Microsoft Office Word, houve a necessidade de desenhar
um método próprio, sem a mínima pretensão ou ilusão de que seja algo
inteiramente novo.
Para buscar e encontrar respostas às dúvidas suscitadas e relatadas na parte
introdutória deste trabalho, a pesquisa objetivou alcançar:
•
um inventário dos critérios utilizados para a organização do revisor
gramatical do Word;
•
as normas (ou pelo menos uma boa parte delas) de Concordância
Nominal constantes da memória gramatical eletrônica, verificando se
seguem ou não o modelo tradicional;
•
exemplos de quais sentenças, dentre as submetidas e consideradas
gramaticais, são reconhecidas pelo revisor, como também de sentenças
tidas como corretas gramaticalmente, usuais, e que não são
reconhecidas por ele;
•
e, ainda, a identificação de qual(is) nível(is) de linguagem é(são)
contemplado(s) pela gramática do revisor do Word e pelas gramáticas
utilizadas para retirada de exemplos para o corpus da pesquisa,
aproximando-os ou afastando-os, conforme resultados obtidos.
Alcançar estes objetivos nos auxiliará a encontrar resposta para a pergunta
principal de nossa pesquisa:
1. Que normas constam da memória da gramática eletrônica em relação à
Concordância Nominal? Seguem o modelo tradicional ou não?
E também para responder às questões auxiliares:
1. Por que a descrição gramatical do revisor eletrônico não diz respeito à
verificação de grande parte das estruturas usuais do português do Brasil em
relação às regras de Concordância Nominal?
14
2. Que gramática subjaz ao revisor gramatical eletrônico? Trata-se de uma
gramática casuística, composta de um elenco de frases, que considera
caso a caso? Trata-se de uma gramática que vê a língua como um conjunto
de enunciados pré-estabelecidos?
Nosso universo de pesquisa abrangeu a gramática eletrônica do Word e as
gramáticas de Napoleão Mendes de Almeida: Gramática metódica da língua
portuguesa, numa edição de 1975, a Moderna gramática portuguesa, edição 1999,
de Evanildo Bechara, e a Gramática de usos do português, publicada em 2000, de
Maria Helena Moura Neves.
Esses autores foram escolhidos por suas abordagens bem diversas no trabalho
com a gramática normativa da Língua Portuguesa, além da distância temporal
existente entre as publicações de seus estudos gramaticais, principalmente entre
Napoleão e Bechara. O primeiro, de cunho purista; o segundo, um gramático
tradicional de formação lingüística mais recente, tradutor de um dos maiores
pensadores da lingüística moderna, Coseriu; e Moura Neves, de tradição filosófica,
que distingue o que é prescrição e o que é uso na língua, servindo como
contraponto a Napoleão e Bechara.
O procedimento de coleta consistiu na verificação e extração de sentenças
fornecidas como exemplos das regras de concordância nominal encontradas nas
gramáticas dos autores citados no parágrafo anterior. Para isso, os capítulos, de
cada uma das gramáticas dedicados ao tema, foram redigitados por nós para que
as próprias regras de concordância fossem submetidas ao crivo do revisor
gramatical. Os textos redigitados encontram-se no capítulo III.
A cada vez que, na redigitação, aparecia a sublinha verde, o revisor era
consultado. As telas com a amostragem da marcação verde do revisor e as
sugestões e explicações gramaticais fornecidas por ele encontram-se nos corpos
dos capítulos escolhidos, imediatamente após a regra de concordância explicitada e
não reconhecida e/ou aceita pelo revisor.
O mesmo procedimento descrito acima foi feito durante a redação deste
trabalho, com as telas impressas servindo como “prova”. Alguns exemplos não são
especificamente de problemas de concordância nominal, porém achamos
interessante mostrá-los porque nos auxiliaram na análise do que chamamos de
15
“humores da F7”, a tecla de atalho para a janela de Ferramentas: Ortografia e
Gramática.
Para conseguirmos as telas impressas, aprendemos que devemos proceder
aos seguintes passos:
1º) selecionar a palavra/expressão/frase;
2º) apertar a tecla F7 (atalho, mais rápido);
3º) apertar a tecla Print Screen SysRq, à direita, superior, do teclado alfabético;
4º) posicionar o cursor em um documento do Word e, então, “colar” por meio
de CtrlC ou do botão direito do mouse. Depois, apenas redimensionar tamanhos, de
acordo com a necessidade.
O procedimento de análise consistiu em colher as sugestões fornecidas pelo
revisor gramatical eletrônico - ou não fornecidas, pois, às vezes, ele sublinha, mas
não tem sugestões a dar (vide exemplo na tela abaixo) -, além de colher as
explicações gramaticais (regras e “dicas”) que o revisor apresenta para, no final,
comparar quais concordâncias, exemplificadas nas gramáticas, o revisor reconhece
ou não como corretas.
16
Interessante explicar que algumas sentenças são detectadas pelo revisor,
outras não, conforme a configuração do computador no qual se está trabalhando.
Por isso, serão encontradas telas neste trabalho com cores diferentes, pois foram
copiadas de máquinas diferentes em configuração.
As telas que aparecem na cor cinza, como esta acima, e principalmente as que
se encontram nos capítulos redigitados de Napoleão Mendes de Almeida e Maria
Helena Moura Neves respectivamente, foram retiradas de uma máquina com a
seguinte configuração:
Microsoft Office Word 2000
Sistema Windows XP Home
Versão 2002 – Service Pack 2
Computador: Intel® Celeron ™ processador
1100 MHz, 128 MB de RAM
Itautec/Philco S.A., 2001.
Já as telas em cor azul, maioria, foram copiadas do nosso computador pessoal,
que traz as seguintes informações de configuração:
Microsoft Office Word 2003 Sistema Windows XP Professional Edição 2003
Versão 2002 – Service Pack 2
Computador: AMD Duron™ processador
950 MHz, 248 MB de RAM
Itautec/Philco S.A., 2001.
É importante a observação de que as duas máquinas trazem tanto o Revisor
Ortográfico quanto o Revisor Gramatical para Língua Portuguesa na sua versão 7.
Já foi lançado, pela Microsoft, para download inclusive, o Office 2007, porém não o
quisemos conhecê-lo ainda, nem analisá-lo, porque acreditamos que seriam
necessárias algumas reformulações neste texto, para o que não há mais tempo
hábil, além do que recebemos a informação de especialistas no assunto de que o
novo programa necessita, para funcionar bem, de um computador com mais
recursos, mais potência para suportar as novas ferramentas. O que também não é o
caso do computador com o qual estamos trabalhando.
Em resumo, nosso universo de pesquisa foi extraído das gramáticas dos
autores mencionados acima e da gramática encontrada no revisor eletrônico do
17
Word. Trabalhamos com um critério de análise que passou pelo método
comparativo para encontrar respostas às nossas questões de pesquisa, porém essa
pesquisa teve caráter predominantemente qualitativo.
Este, enfim, é um trabalho que requereu muito esforço, principalmente pela
ausência de similares no tema. Resta de bom o conhecimento adquirido e a
tentativa de abordagem inicial para futuros outros estudos.
No capítulo a seguir, considerações sobre lingüística e sintaxe computacionais
e, também, como foi criado e como funciona o revisor gramatical eletrônico do Word,
ou revisor gramatical automático, como o chamam seus criadores.
Capítulo II – O advento do revisor gramatical eletrônico
Escrita, leitura, visão, audição, criação, aprendizagem são capturados por uma
informática cada vez mais avançada. (...) Emerge, neste final do século XX, um conhecimento
por simulação que os epistemologistas ainda não inventariaram.
Pierre Lévy
A primeira impressão é sempre aquela que fica, como se costuma ouvir por
aí? Pensamos que não, pois cada um de nós já teve, certamente, oportunidade para
refazer uma primeira impressão. Se não naturalmente, pelo próprio repensar uma
opinião, ao menos forçosamente, pela contingência de algum fato cotidiano.
É estranho, para dizer o mínimo, para pessoas como nós – estudantes,
professores, escritores, letrados, cidadãos conscientes e participativos do/no atual
momento histórico, globalizado, por que passa o mundo moderno – pensar que
alguém ainda não saiba tudo, ou quase tudo, sobre computadores. Afinal, já fazem
parte do nosso viver, já não sabemos trabalhar sem eles. No entanto, quando
deixamos nossa prepotência de lado, vemos que muitos ainda não conseguem ter
um relacionamento harmonioso e satisfatório com esta ferramenta tecnológica. O
senso comum costuma afirmar que tudo que é novo provoca certo medo, até se
conhecer e dominar o novo.
A verdade é que se ouve, ainda hoje, alguém afirmando, saudosamente, que
com sua máquina de datilografia era feliz e não sabia. E muitas reclamações sobre
o PC são ouvidas: “É lento!”, “Trava sempre!”, “È caro para comprar e para
consertar.”, “Quero escrever de um jeito, ele muda automaticamente.”, É para
enlouquecer qualquer cristão!”.
Só que os computadores vieram para ficar, e a cada dia se aperfeiçoam,
ultrapassam todas as idéias pré-concebidas sobre si e nos fazem engolir em seco,
uma vez que somos nós a ter que nos adaptar a ele, e não o contrário, sonho de
todo usuário.
Para entendermos melhor como funciona um revisor, quer seja ele
ortográfico, quer seja ele gramatical, precisamos conhecer como é feito um
programa para a criação da gramática eletrônica que o subsidia. E, então, entramos
na seara da lingüística computacional, ciência que, se comparada a outras, é bem
jovenzinha ainda. E, ao entrarmos nesse campo, nos deparamos com a sintaxe
19
computacional e seus termos diferentes, como parser/parsing, Prolog etc. É o que
pretendemos mostrar nos próximos subcapítulos.
2.1 A Lingüística Computacional
De acordo com o pesquisador Ray Kurzweil, pioneiro em inteligência artificial, em 2029 um
computador com o preço de um PC de nossos dias (aproximadamente U$ 800) terá a capacidade
de computação equivalente à do cérebro humano. E, ainda segundo Kurzweil, em 2060 uma
máquina que custe em torno de U$ 1.000 terá a capacidade de todos os cérebros humanos
somados, o que nos levaria a atingir um progresso de vinte milênios em apenas cem anos!
(Othero e Menuzzi, 2005:16)
Pierre Levy (s/d), em um artigo publicado no site www.faced.ufba.br , afirma
que uma tecnologia intelectual não precisa ser efetivamente utilizada por uma
maioria estatística de indivíduos para ser considerada dominante. Diz ele que até o
começo do século XIX, a maior parte dos franceses não sabia ler, mas mesmo
assim a escrita era, havia muito, a tecnologia intelectual motriz no plano tanto
imaginário como religioso, científico ou estético. “Durante séculos a verdade foi
escrita, bem como o destino. O mundo desenrolava uma imensa página coberta de
sinais a serem interpretados.”.
Para Levy, assim como a escrita, a informática, por sua dimensão empírica,
deve ser analisada como tecnologia intelectual,
mas essas máquinas de calcular, essas telas, esses programas não
são apenas objetos de experiência. Enquanto tecnologia intelectual,
contribuem para determinar o modo de percepção e intelecção pelo
qual conhecemos os objetos. Fornecem modelos teóricos para as
nossas tentativas de conceber, racionalmente, a realidade.
Enquanto interfaces, por seu intermédio é que agimos, por eles é
que recebemos de retorno a informação sobre os resultados de
nossas ações. Os sistemas de informação efetuam a mediação
prática de nossas interações com o universo.
Este subcapítulo será dedicado a considerações acerca de um assunto
extremamente complexo ainda, muito mais desconhecido, para a maioria das
pessoas. A incursão aos domínios da lingüística computacional se dará de forma
bastante simples, até mesmo infantil, uma vez que não há espaço, neste trabalho,
para aprofundamento desse conhecimento. Porém, é necessária esta abordagem,
mesmo que deficitária, por estar esse conhecimento intrinsecamente relacionado às
perguntas que norteiam o nosso pensar e para as quais buscamos respostas.
20
A referida incursão será breve, porque sabemos não haver condições
temporais e cognitivas para um aprofundamento nesse tema. Pretendemos apenas
compreender melhor como se processa a linguagem que o computador utiliza para
reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos,
como um programador consegue introduzir regras gramaticais para o uso efetivo do
corretor eletrônico. Nesse quesito, trabalharemos principalmente com Othero &
Menuzzi (2005) e suas orientações na construção de um parser lingüístico, além de
suas reflexões acerca da gramática e das programações de máquinas para
responder a comandos de usuários em sua própria língua.
Comecemos, então, pela definição desta nova ciência, dada por Othero e
Menuzzi (2005):
Lingüística computacional é a área da ciência lingüística
preocupada com o tratamento computacional da linguagem e das
línguas naturais. Ela pode ser dividida em duas linhas de pesquisa
distintas: a Lingüística de Corpus e o Processamento da Linguagem
Natural.
A Lingüística de corpus é a parte que estuda diferentes fenômenos das
línguas com base em corpora eletrônicos. Conforme Berber Sardinha (2000c:2), ela
“se ocupa da coleta e exploração de corpora, ou conjunto da dados lingüísticos
textuais que foram coletados criteriosamente com o propósito de servirem para a
pesquisa de uma língua ou variedade lingüística”.
Já o Processamento de Linguagem Natural (PLN) é a área de estudo da
linguagem voltada diretamente para a construção de softwares e sistemas
computacionais específicos. Alguns resultados desse tipo de estudo são a criação e
desenvolvimento de programas de tradutores automáticos, chatterbots, parsers,
reconhecedores automáticos de voz, dentre outros.
Cabe à área de PLN desenvolver programas capazes de processar
(leia-se compreender e produzir) informações em LINGUAGEM
NATURAL. Esses programas podem envolver diferentes áreas da
lingüística, como a fonologia, a fonética, a semântica, a sintaxe, a
pragmática etc. (Othero & Menuzzi, 2005:124).
Ainda segundo Othero & Menuzzi (2005:11), as máquinas estão sendo
programadas, cada vez mais, para responder a comandos do usuário em sua língua
materna, qualquer que seja ela. Isto é resultado da busca por uma melhor interação
entre humanos e máquinas, o que está se dando através da linguagem natural, ou
seja, da linguagem do homem.
21
Por trás desse tipo de trabalho, deve estar o dedo do lingüista:
afinal, é ele o cientista da linguagem, o cientista que busca
compreender coisas como as nuances semânticas de uma
expressão, as regras sintáticas de uma língua ou os detalhes de
funcionamento de seus sons. E é preciso “ensinar” essas coisas a
um computador – ou melhor, programar esse conhecimento na
“máquina binária”, dos “zeros” e dos “uns”, isto é, do sim e do não se quisermos que essa máquina esteja pronta a interagir
naturalmente conosco. (Othero e Menuzzi, 2005:12)
É claro que desenvolver computadores com capacidade de interagir de forma
natural com humanos ainda está distante da realidade atual, mas é um dos objetivos
da lingüística computacional, que se ocupa do tratamento computacional da
linguagem para diversas finalidades práticas.
Os autores acima (2005:18) acreditam que, antes de tentar fazer com que
uma máquina interaja efetivamente com humanos e os compreenda, é
inevitavelmente necessário fazer com que ela aprenda a se comunicar com um ser
humano, e a maneira mais fácil de este tipo de comunicação ocorrer é através da
própria língua materna da pessoa usuária de um computador. E completam:
Por isso, muitos pesquisadores vêm trabalhando com o tratamento
computacional da linguagem humana (ou das línguas humanas),
isto é, com maneiras de simular, no computador, aquilo que
fazemos naturalmente quando conversamos com alguém. Isso
exige, no entanto, que se avance no estudo do funcionamento das
línguas naturais e na descrição formal dos sistemas lingüísticos, e é
aí que começamos a falar da lingüística computacional.
Uzskoreit (apud Othero & Menuzzi, 2005:18), pesquisador da área da
informática, afirma que:
Ainda que os sistemas existentes em TL [tecnologias lingüísticas]
estejam longe de alcançar a habilidade humana, eles têm diversas
aplicações possíveis. O objetivo é criar softwares que tenham
algum conhecimento da linguagem humana. (...) Há necessidade
urgente deles para que se possa melhorar a interação humanomáquina, já que o obstáculo principal na interação entre um
humano e um computador é simplesmente um problema de
comunicação. Os computadores de hoje não entendem nossa
língua, e as linguagens de computação, por outro lado, são difíceis
de se aprender e não correspondem à estrutura do pensamento
humano. (Uzskoreit, sd:2).
Percebe-se, agora, a dificuldade – talvez até o ceticismo de alguns – em se
encontrar respostas para questões como: O que se deve fazer para que o
computador “compreenda” uma língua natural? Como fazer para que uma máquina
consiga produzir textos ou falas em uma língua natural? Chegará o dia em que uma
22
máquina poderá ser capaz de dominar a sintaxe, o sistema fonológico, as nuanças
semânticas e o uso pragmático, entre outros conhecimentos, de uma língua natural?
Os autores com os quais estamos trabalhando neste capítulo (dentre inúmeros
outros) acreditam que, algum dia, os computadores serão capazes sim de dominar a
linguagem natural de maneira satisfatória e, assim, interagir de tal modo com os
humanos, em uma determinada língua natural, que não se conseguirá distinguir as
respostas da máquina das de um outro ser humano.
Porém, voltemos ao que realmente nos interessa: o estudo computacional da
sintaxe da língua portuguesa, ou seja, com o modo como as frases da nossa língua
se organizam e o modo como esta organização é reconhecida pelo computador.
Além da fonética e da fonologia, é indiscutível a importância dos estudos da
morfossintaxe e da semântica para o desenvolvimento de programas de PLN
[Processamento da Linguagem Natural], pois esses estudos são fundamentais para
sistemas que envolvam a compreensão ou a geração automática de frases de uma
língua. Este é o caso, por exemplo, dos chatterbots, programas desenvolvidos para
interagir com usuários humanos através de diálogos em linguagem natural, na
modalidade escrita. “O primeiro chatterbot desenvolvido foi ELIZA, criado pelo
pesquisador Joseph Weinzenbaum, no MIT, em 1966”. (Othero e Menuzzi,
2005:31).
ELIZA era um programa de conversação que se utilizava de um sistema
baseado em “moldes” (templates, em inglês) para construir suas frases, e que,
como todos os chatterbots baseados em moldes, tinha, como uma de suas
limitações, a repetição eventual de suas próprias frases e as de seu interlocutor,
apresentando, freqüentemente, contradição em suas “opiniões”.
Por isso, acreditamos que as próximas gerações de chatterbots
devem exigir dos programadores um profundo conhecimento da
sintaxe (que permitirá que desenvolvam no programa a capacidade
de gerar infinitas sentenças da língua combinando um número finito
de regras e elementos lexicais) e de semântica (o que tornará
possível fazer com que o programa seja capaz de interpretar o
significado do input lingüístico fornecido pelo usuário humano).
(Othero & Menuzzi, 2005:35).
Além dos chatterbots e dos tradutores automáticos, conhecimentos em
sintaxe e semântica são fundamentais, também, para outros aplicativos, como
parsers, geradores automáticos de resumos, corretores ortográficos e gramaticais,
classificadores automáticos de documentos digitais etc.
23
O termo parsing vem da expressão latina pars orationes (partes do discurso)
e tem suas raízes na tradição clássica. “De acordo com Mateus & Xavier
(1992:886), parsing pode ser entendido como o ‘processo de atribuição de uma
estrutura e de uma interpretação a uma seqüência lingüística’.”. (apud Othero &
Menuzzi, 2005: 39)
Um parser, no contexto da lingüística computacional, é um
analisador automático (ou semi-automático) de sentenças. Esse tipo
de programa é capaz de analisar uma sentença com base em uma
gramática preestabelecida de uma determinada língua, verificando
se as sentenças fazem parte ou não da língua, de acordo com o
que autoriza a sua gramática. (...) também analisa sintaticamente as
sentenças, decompondo-as em uma série de unidades menores,
primeiramente em nódulos não-terminais (os sintagmas), até chegar
a nódulos terminais (os itens lexicais) atribuindo-lhes uma estrutura
de constituintes. Essa estrutura de constituintes, que representa a
organização hierárquica e sintática da frase, é apresentada
comumente através de árvores sintáticas ou através de colchetes
rotulados. (Othero & Menuzzi, 2005:49).
E de acordo com Covington (1994:42, apud Othero & Menuzzi, 2005:40),
fazer o parsing de uma sentença é “determinar, por um processamento algorítmico,
se a sentença é gerada por determinada gramática, e se for, que estrutura a
gramática atribui a ela”.
Bons exemplos de um simples algoritmo que pode fazer uma medida
analítica da linguagem são os corretores ortográficos e gramaticais. Porém, uma
das armadilhas dos corretores ortográficos está na leitura de uma determinada
palavra dentro de um contexto.
O computador não pode encontrar um erro ortográfico se a palavra
estiver correta para um outro contexto (por exemplo, conserto e
concerto). A habilidade da mente humana em analisar e reconhecer
corretamente falas, estilos e gramática não é reproduzida
satisfatoriamente pelos computadores, porque mentes e
computadores
trabalham
diferentemente.
[http://labbi.uesc.br/apostila]
Mesmo assim, o poder dos computadores é inegável. Hoje, escrever um texto
utilizando um processador de textos, por exemplo, se tornou tão mais fácil e tão
popular, que, para milhões de usuários, é uma ferramenta considerada
indispensável.
24
2.2
A Sintaxe Computacional
Para compor o início deste subcapítulo serão utilizadas informações
disponibilizadas pelo programa de pós-graduação em computação do Instituto de
Informática da Universidade Federal do Rio Grande do Sul [www.inf.ufrgs.br],
especialmente de um trabalho feito para a disciplina de Arquiteturas Especiais de
Computadores,
assinado
por
Fábio
Abreu
Dias
de
Oliveira,
intitulado
“Processamento de linguagem natural: princípios básicos e a implementação de um
analisador sintático de sentenças da língua portuguesa”. A escolha recaiu nesses
dados em virtude de sua linguagem acessível, simples e clara. Porém, também
continuaremos atentos ao que Othero & Menuzzi (2005) ensinam sobre o assunto.
Para que um sistema computacional interprete uma sentença em linguagem
natural, é necessário manter informações morfológicas, sintáticas e semânticas,
armazenadas em um dicionário, juntamente com as palavras que o sistema
compreende.
A primeira etapa do processamento dessa linguagem natural passa,
obrigatoriamente, pelo analisador morfológico, que identifica palavras ou expressões
isoladas em uma sentença. Esse processo é auxiliado por delimitadores (pontuação
e espaços em branco). As palavras identificadas são classificadas de acordo com
seu tipo de uso, ou, em linguagem natural, categoria gramatical.
Assim, uma instância de uma palavra em uma sentença gramaticalmente
válida pode ser substituída por outra do mesmo tipo, configurando uma sentença
ainda válida (exemplo: substantivos, pronomes, verbos, etc.). Dentro de um mesmo
tipo de palavra, existem grupos de regras que caracterizam o comportamento de um
subconjunto de vocábulos da linguagem, como, por exemplo, a formação do plural
de substantivos terminados em “ão” e as flexões dos verbos regulares terminados
em “ar”, dentre outros. Assim, a morfologia cuida das palavras quanto a sua
estrutura, forma, flexão e classificação, no que se refere a cada um dos tipos de
palavras.
Para Rich & Knight (1993) o “emprego do analisador morfológico é
fundamental para a compreensão de uma frase, pois para formar uma estrutura
coerente de uma sentença, é necessário compreender o significado de cada uma
das palavras componentes.”
25
Já o analisador sintático, através da gramática da linguagem a ser analisada
e das informações do analisador morfológico, procura construir árvores de derivação
para cada sentença, mostrando como as palavras estão relacionadas entre si.
Durante a construção da árvore de derivação, é verificada a adequação das
seqüências de palavras às regras de construção impostas pela linguagem na
composição de frases, períodos ou orações. Dentre estas regras, a concordância e
a regência nominal e/ou verbal, assim como o posicionamento de termos na frase.
Um termo corresponde a um elemento de informação (palavra ou expressão), e é
tratado como unidade funcional da oração, participando da estrutura como um de
seus constituintes, denominados sintagmas.
Como sabemos, a análise sintática de uma oração em português deve levar
em conta os seguintes sintagmas: termos essenciais (sujeito e predicado), termos
integrantes (complementos verbal e nominal) e termos acessórios (adjuntos
adverbial e nominal, e aposto). A análise do período, por sua vez, deve considerar o
tipo de período (simples ou composto), sua composição (por coordenação ou
subordinação) e a classificação das orações (absoluta, principal, coordenada ou
subordinada).
Nos sistemas de processamento de linguagem natural, o maior problema é a
transformação de uma frase potencialmente ambígua em uma não-ambígua, a qual
será utilizada pelo sistema. Esta transformação é conhecida como parsing, termo já
explicado anteriormente.
As abordagens de linguagens formais são utilizadas com muito sucesso no
estudo da análise sintática em PLN. Dentre as principais, temos:
• Gramáticas Regulares: para o processamento sintático da linguagem
natural, estas gramáticas são bastante simples e facilmente reconhecidas, porém
apresentam um poder de expressão limitado (equivalente ao poder de expressão de
um autômato finito, reconhecedor utilizado para a análise morfológica).
• Gramáticas Livres de Contexto: são muito úteis no que tange à descrição
de gramáticas em linguagem natural e, em geral, são mais poderosas que as
regulares já que permitem a representação de linguagens com um certo grau de
complexidade. No entanto, a dificuldade em expressar dependências simples, como
por exemplo a concordância entre
verbo e sintagma nominal, constitui um dos
maiores problemas para sua utilização no tratamento da língua natural. O autor
mencionado como fonte principal dessas informações, afirma que abordagens
26
puramente livres de contexto não são suficientemente poderosas para captar a
descrição adequada deste gênero de linguagem. Mas que, ainda assim, é utilizada
uma notação denominada com Definite Clause Grammar (DCG), disponível em
Prolog, para definir gramáticas livres de contexto e analisar sentenças, ou seja,
realizar o parsing.
• Gramáticas Sensíveis ao Contexto: os problemas de dependência
expressos anteriormente são resolvidos nesta classe de gramática. Porém,
conforme Rich & Knight (1993), ainda assim as gramáticas sensíveis ao contexto
não abordam satisfatoriamente o tratamento de restrições gramaticais. O
impedimento para seu uso reside na questão do reconhecimento.
O problema de decidir se uma sentença pertence a uma gramática
sensível ao contexto é uma função exponencial sobre o tamanho da
sentença, o que torna a implementação do procedimento de
verificação uma questão complexa, do ponto de vista
computacional. (idem)
Vale lembrar a existência de gramáticas irrestritas, também presentes na
hierarquia de Chomsky, as quais não são utilizadas para a construção de interfaces
em linguagem natural.
O artigo-base desses dados informa que a maioria das pesquisas atuais
propõe trabalhar em modelos que se situem em um nível intermediário entre as
gramáticas livres de contexto e as sensíveis ao contexto, aliando boa capacidade de
representação, incluindo construções que permitam modelar dependências, e um
modelo computacional viável.
Com relação à gramática, ainda, Othero & Menuzzi (2005:44) alertam para
fato de que
a maioria das versões recentes do Prolog vem equipada com uma
extensão nocional conhecida como DCG, ou Gramática de Cláusula
Definida (do inglês Definite Clause Grammar), que facilita a
implementação de regras formais de parsing. A DCG é um
formalismo de representação de gramáticas livres de contexto.
Ela torna muito mais fácil implementar uma gramática e desenvolver um
parser em Prolog, já que “uma gramática descrita em uma DCG é diretamente
executada pelo Prolog com um analisador sintático” (Bratko, 1997:431, apud Othero
& Menuzzi, idem).
Prolog - PROgramming in LOGic - é uma linguagem de programação
baseada na lógica. Ao contrário da maioria das linguagens de programação, que
27
são de natureza “procedural”, o Prolog é uma linguagem “declarativa”, conforme
ensinam Othero & Menuzzi (2005:42).
(...) outras linguagens de programação, como o Basic e o Pascal,
apresentam ao computador uma solução para um problema na
forma de uma série de instruções para que a máquina as execute
estritamente na ordem em que foram especificadas.
Programar com Prolog (...) deve ser declarativo, um programa deve
simplesmente ser o enunciado do problema. A maneira como o
problema é solucionado e a seqüência de instruções por que o
computador deve passar para resolvê-lo são decididas pelo
sistema. (McDonald & Yazdani, 1990:ix, apud Othero & Menuzzi,
2005:44)
Porém, mesmo após todas essas informações do mundo computacional,
como entender o processo de criação de uma gramática eletrônica? A obra que nos
tem servido como base primeira, para este capítulo, escrita por Gabriel Othero e
Sérgio Menuzzi, trata justamente desse ponto. Eles ensinam como desenvolver um
aplicativo computacional para o tratamento da linguagem natural, com exemplo de
uma aplicação prática de conhecimentos da sintaxe no desenvolvimento de um
sistema de análise das frases do português – um “parser sintático” programado em
linguagem Prolog. (Vide definição de parser por Othero & Menuzzi disposta no final
do subcapítulo 2.1).
Othero & Menuzzi simulam a criação de um parser para o reconhecimento
automático de sentenças em língua portuguesa. Um parser que deverá reconhecer
as sentenças gramaticais – e somente elas – e atribuir-lhes uma estrutura de
constituintes.
Não é possível, aqui, naturalmente, reproduzir o passo-a-passo dos
procedimentos que os autores ensinam, pois envolvem teorias e metodologias
diversas, tornando-se inviável uma demonstração fiel. Contudo, decidimos resumir
algumas das várias etapas que constituem o trabalho, apenas para que se tenha
uma idéia, mesmo que distante, de como uma gramática “se forma no interior de
uma máquina”.
•
começa com o reconhecimento e distinção de frases consideradas
gramaticais/agramaticais;
•
faz representações delas em diagramas arbóreos (com divisão das
frases em “blocos”, ou sintagmas, até os itens lexicais);
28
•
pode
ter
que
realizar
diferentes
“testes”
para
identificar
um
constituinte/sintagma (testes de coordenação, interpolação, anáfora,
entre outros);
•
nas regras de reescrita (ou regras sintagmáticas) utiliza-se dos
símbolos usados por Chomsky (S,SN, SV, Det., N, V), e são elas que
validam as sentenças;
•
há, ainda, as regras de inserção lexical, as responsáveis por introduzir
as palavras abaixo de cada símbolo respectivo. Obs.: Essas regras (de
reescrever e de inserção) são chamadas de gerativas, pois elas geram
sentenças gramaticais a partir de instruções precisas e explícitas. Após
a aplicação dessas regras, obtém-se a estrutura de uma frase válida, ou
gramatical na língua definida pela gramática escolhida;
•
finalmente é estruturada a árvore sintática da frase a partir das regras,
trabalhando como um parser top-down (que constrói uma sentença a
partir de seu topo, até chegar ao nível das palavras);
Os autores ressalvam, porém, que “é sabido que a gramática sintagmática
apresenta uma série de limitações e precisa ser enriquecida com recursos
adicionais” (idem:64). Isso se deve ao fato de a gramática criada poder gerar
também sentenças claramente agramaticais, principalmente se algumas palavras
forem expandidas para outra categoria. Por isso, no exemplo que dão, eles
precisam adicionar alguns recursos às regras sintagmáticas e trabalhar com a
descrição e classificação do léxico para implementar o tipo de gramática na
linguagem Prolog.
Como, na maioria dos casos, o Prolog está tentando descobrir se uma
afirmação é verdadeira ou falsa, ou está tentando encontrar alguma combinação de
variáveis que torne uma afirmação verdadeira, para executar um programa em
Prolog é preciso fazer uma consulta à sua base de dados. “E uma consulta nada
mais é do que uma chamada de uma cláusula do programa, equivalendo a uma
solicitação para provar se o que pedimos é verdadeiro de acordo com a base de
dados do programa “ (ibid: 66).
Há basicamente dois tipos de perguntas que podemos fazer ao Prolog:
perguntas sim/não (envolvendo respostas sim ou não), e perguntas QU (wh-
29
questions en inglês, envolvendo pronomes interrogativos: quem, qual, quando, onde
etc.).
Voltando à criação do parser, começa, então, a etapa de escrever um
programa, que deve ser aberto em um editor de textos, como o bloco de notas,
presente em todas as versões do MS Windows disponíveis no mercado. É no editor
que serão desenvolvidos os programas que mais tarde serão rodados na plataforma
do Prolog. Tudo deve ser escrito em letras minúsculas e sempre haver um ponto
final no fim de cada linha. As letras maiúsculas serão usadas para as variáveis.
Como exemplo de um programa simples, Othero e Menuzzi (2005:67) dão o
seguinte:
Sócrates é homem.
O homem é mortal.
Em notação Prolog, deve-se escrever:
homem(socrates).
mortal(X) :- homem(X).
Em PROLOG
Em PORTUGUÊS
homem(socrates).
Sócrates é homem.
mortal(X) :- homem(X).
O homem é mortal.
Tradução – PROLOG x PORTUGUÊS
A primeira premissa (homem(socrates).) é chamada em Prolog de fato. Os
fatos são regras que, de certa forma, se auto-satisfazem, ou seja, são dados
sempre verdadeiros, nunca apresentando variáveis. A segunda premissa (mortal(X)
:- homem(X).) é uma regra em Prolog: ela apresenta uma variável e uma relação de
condicionalidade, expressa pelo operador “:-“ . Ao contrário dos fatos, as regras
consistem sempre de duas partes: a cabeça e o corpo:
mortal(X)
Cabeça
:-
homem(X)
Corpo
Para que a cabeça da regra seja verdadeira, as condições expressas em seu
corpo devem ser satisfeitas. A interpretação de uma regra desse estilo é bastante
simples:
a :- b.
a :- b, c, d.
“a” é verdadeiro se “b” é verdadeiro
“a” é verdadeiro se “b”, “c” e “d” forem verdadeiros
30
E, então, depois desse processo (extremamente resumido e simplificado,
aqui), o programador utiliza-se do recurso de DCG (já conceituado anteriormente).
Com esse recurso, as regras de reescrita podem ser convertidas de maneira
bastante simples e transparente para a notação em Prolog. “Grosso modo, a DCG
pode ser entendida como um recurso que torna mais fácil ao lingüista a
implementação de regras sintagmáticas em Prolog”. (Othero e Menuzzi, 2005:77)
Em resumo, para o desenvolvimento de uma gramática em Prolog, deve-se:
a) implementar regras sintagmáticas relativas à descrição sintática do português
(por exemplo, a regra: S
SN SV); b) a partir dessa regra, elaborar outras para o
SN e para o SV, ou conferir o que consta na literatura pertinente. (Exemplo:
SN
N
Det N; SV
V SN; c) implementar itens lexicais (Exemplo: Det
João, Maria; V
o,a:
ama; d) implementar na gramática do parser algumas
regras consagradas na literatura; e) a partir delas, pode-se usar exemplos
apresentados na literatura que servem para ilustrar ou testar a regra; f) por último,
trabalhar com as dificuldades encontradas para implementar uma regra em Prolog
da melhor maneira possível.
Os autores consultados deixam claro que há diferentes maneiras de se
trabalhar com parsers sintáticos, e diversas têm sido as alternativas de
desenvolvimento de ferramentas de linguagem natural que tratem da sintaxe de
uma língua.
Esperamos ter conseguido aclarar um pouco o que seja uma linguagem de
programação, principalmente no que concerne ao desenvolvimento de uma
gramática, que é um dos principais aspectos que nos interessam neste trabalho.
2.3 - O Revisor Gramatical Eletrônico
A maneira mais simples e rápida de escrever corretamente. Com o Revisor
Gramatical você revisa os seus textos corrigindo erros de concordância verbal e
nominal, erros de ortografia, acentuação, conjugação de verbos, colocação de
pronomes, dúvidas do dia-a-dia e muito mais! Também apresenta regras
gramaticais que esclarecem suas dúvidas, otimizando o seu trabalho.
O excerto acima faz parte de um texto on-line [www.amigomouse.com.br], na
seção de oferta de compra de produtos de informática. Achamos apropriado
31
utilizarmo-nos dessa propaganda para começar este capítulo, pois há informações
interessantes, muitas, talvez, não do conhecimento da maioria dos usuários de
computador. Deixando de lado o objetivo de publicidade que o texto tem, vamos
apresentar essas informações porque elas nos servirão, mais além, para provar
nossa tese de que os revisores ainda precisam ser melhorados, e muito, em vários
aspectos. Como principais características do Revisor Gramatical, aparecem:
•
Possui um dicionário ortográfico com mais de 2 milhões de palavras na
língua portuguesa;
•
Revisa a gramática e a ortografia;
•
Possui explicação gramatical dos erros encontrados (para todo erro
gramatical encontrado pelo Revisor, basta clicar no botão “Ajuda”, que o
mesmo apresenta as regras gramaticais.);
•
Acentuador automático (reconhece palavras de uma única grafia
acentuadas incorretamente e, automaticamente, corrige a acentuação,
facilitando e agilizando o processo de correção ortográfica.);
•
Informa a existência de palavras homógrafas (as palavras homógrafas
perfeitas se escrevem e se pronunciam da mesma forma. As
homógrafas imperfeitas diferenciam-se entre si por um detalhe apenas
(a acentuação, por exemplo). O Revisor Gramatical aponta as palavras
que têm homógrafas imperfeitas para que se possa conferir se seu uso
está correto.);
•
Corretor automático inteligente (durante a digitação, se o usuário
cometer o mesmo erro ortográfico por 03 (três) vezes num mesmo
documento, o Revisor Gramatical permite ao usuário inserir este erro no
Dicionário Inteligente. Depois de inserto, o Revisor irá corrigir o erro
automaticamente, agilizando a correção.);
•
Conjugador verbal (conjuga verbos em todos os tempos e modos da
língua portuguesa de modo simples e fácil. Reconhece inclusive verbos
impessoais como “chover”, “ventar”, etc., destacando as formas mais
usuais).
Este Revisor anunciado serve para aplicativos como Microsoft Word
Compatíveis, Microsoft Word 2000 (Português/Inglês) versão 9.0, Microsoft Word 97
(Português/Inglês) versão 8.0 e Microsoft Word 95 (Português/Inglês) versão 7.0.
32
Como requisitos mínimos de funcionamento precisa de um PC 486 ou superior, 16
MB de RAM, 2 MB de espaço livre no disco rígido, drive de CD-ROM, Windows 95
ou superior previamente instalado, rede: NT & Novell.
Decidimos testar partes dele, apenas para servir como exemplos de sua
funcionalidade efetiva.
A palavra “conjugador”, por exemplo, que aparece no último item das
características do Revisor, não faz parte dos 2 milhões do dicionário do mesmo, e
aparece sublinhada em vermelho. O mesmo ocorre com a palavra “acentuador”, no
4º item. A sugestão de ortografia correta para “conjugador” encontra-se na tela 1,
copiada na página seguinte.
Estas, então, são palavras que precisaríamos
acrescentar ao dicionário do nosso PC.
Com relação ao reconhecimento das homógrafas imperfeitas (da forma como
apresentado neste texto), como por exemplo, “Ela esta bem.” e “Ela está bem.” , o
revisor gramatical do computador que estamos utilizando não apontou nenhum
problema, tanto com uma como com a outra forma. Assim, se não soubermos que a
primeira frase torna-se inadequada, sem o acento em “esta”, também não teremos
como o saber, pois o revisor não nos avisa disso.
Em “Ele para, olha e fica
pensando...” e “Ele para mim é um anjo.” , também não há manifestação contrária
por parte do revisor quanto à acentuação que deveria existir no verbo “para” na
primeira frase. Em: “Fizeram boa viajem?”, pensamos que o revisor distinguiria o
verbo “viajem” do substantivo “viagem”. Isso não aconteceu. Ele sublinhou em verde
“fizeram boa” e sugeriu o que aparece na tela 2. Concluindo: o revisor NÂO aponta
as homógrafas imperfeitas para conferência de sua correção.
Quanto ao reconhecimento e correção automática, por parte do revisor, de
palavras de grafia única acentuadas incorretamente, em alguns casos isso se
mostra verdadeiro, em outros, não. Vejamos:
“Vocé”,
digitada
propositalmente
por
nós,
foi
realmente
corrigida
imediatamente, aparecendo “Você”. Se se utilizar a tecla F7 (ortografia e gramática),
a sugestão de grafia “Você” aparecerá. Mas quando digitamos a palavra “pêrola”,
ele apresentou 25 sugestões de escritura de diferentes palavras, mas não a grafia
“pérola” .(Vide tela 3.)
33
Tela 1
Tela 2
34
Tela 3
O teste agora é da conjugação de verbos em todos os tempos e modos,
inclusive os impessoais. Somente alguns exemplos:
“Chove chuva, chove sem parar...”
“Amaram-no mais que tudo neste mundo.”
“Fazer silêncio, por favor.”
Mas, em:
“(...) Se me ainda amas, por amor não ames:
Trairias-me comigo.”
(Já sobre a fronte – Poesia Completa. Ricardo Reis/Fernando Pessoa)
35
Tela 4
A ênclise na forma verbal “trairias-me” não foi reconhecida como correta pelo
revisor, que apresentou a sugestão de ortografia conforme tela acima.
Por pura curiosidade, decidimos reescrever o trecho não aceito antepondo o
pronome oblíquo ao verbo, e o revisor, após mostrar a sublinha verde, manifestouse assim:
Se me ainda amas, por amor não ames:
Me trairias comigo.
36
Tela 5
Como se pôde perceber até agora, o revisor gramatical tem lá seus humores.
Não são de admirar, então, as inúmeras reclamações dos mais diversos tipos de
usuários quando se utilizam do editor de textos do Word e pedem “ajuda” ao revisor
eletrônico para verificar a correção de seus textos. Algumas sugestões do revisor
tornam-se engraçadas, porque completamente ilógicas para qualquer falante
razoável da língua portuguesa.
Dílson Catarino, professor, em um de seus textos de dicas de gramática no
site do uol/vestibulares, quando mostra como se deve usar os pronomes
demonstrativos em textos, faz a seguinte advertência: Somente mais um
comentário, sem ligação alguma com os estudos de hoje: ao escrever um texto em
seu computador, nunca confie no corretor do Word, pois ele apresenta falhas
clamorosas.
E cita como exemplo, uma das frases do próprio texto que ele
escreveu naquele dia.:
Onde escrevi: Não se deve andar com os vidros do automóvel
abertos nas grandes cidades brasileiras, o sinistro Word diz: Não
se deve andar com os vidros do automóvel aberto nas grandes
cidades brasileira ou Não se deve andar com os vidros dos
automóveis abertos nas grandes cidades brasileiros. (grifos do
autor)
37
E termina com um desabafo revoltado:
Que é isso, meu santo protetor dos professores de Português?!
Como deixam acontecer isso? Será que nossa Língua é tão
desprezada assim? Será que nenhum dos nossos ilustres imortais
usa computador? Ou será que eles escrevem como o Word quer?
Quanto à “acusação” aos imortais não podemos nos pronunciar, uma vez que
não dispomos de informações confiáveis de que eles se comportem ou não como
supõe o autor acima.
Quanto à reclamação do referido professor, redigitamos a frase mencionada
e acionamos a tecla F7. O revisor nada acusou. Porém, este é um dado sobre o
qual já alertamos anteriormente: a configuração de cada computador pessoal
interfere quanto às manifestações do revisor eletrônico, seja o ortográfico, seja o
gramatical. Acreditamos que o PC de Catarino não dispunha, à época, da mesma
configuração deste que estamos utilizando agora.
Quanto à confiança cega que alguns usuários depositam no revisor
eletrônico, o Jornal do Brasil publicou matéria, em 27/09/2001, cujo título era
Viciados em F7. (Imediatamente o revisor sublinhou em verde o título. A tela com a
sugestão ortográfica e a explicação gramatical está mais à frente). O articulista
começa explicando o que é a tecla F7 e diz que
Para quem se garante nos quesitos ortografia e gramática, o
corretor automático é um chato que fica sublinhando, em verde ou
vermelho (conforme o caso), nomes de pessoas, palavras que não
estão no dicionário e erros que não existem – como segue regras
rígidas, muitas vezes ele aponta como erro formas que na verdade
são opcionais ou licenças poéticas.
Mais adiante, o texto fala sobre a tábua de salvação que é a tecla F7 para os
não “tão craques” em português, impedindo que não sejam entregues trabalhos
repletos de “erros ortográficos constrangedores”, uma vez que os possíveis erros
são apontados pelo revisor, que oferece soluções para os problemas. Afirma o JB,
Assim, formou-se uma verdadeira legião de viciados em F7.
Indiferentes à discussão sobre qual é o melhor dicionário, eles
dispensam cuidados ao digitar e não se preocupam com a
ortografia. O relaxamento pode chegar a tal ponto de a pessoa
repetir o mesmo erro diversas vezes, ignorando a possibilidade de
aprender a grafia correta.
O artigo termina com uma fala do exemplo citado pelo jornal, um “exdependente” nas palavras do articulista, e que hoje tira suas dúvidas no dicionário,
38
em vez de continuar confiando apenas no corretor eletrônico: O mercado de
trabalho exige que se escreva corretamente, e eu pretendo acompanhar o mercado.
Tela relativa à página anterior. O revisor considera inadequada a concordância feita no
título.
Como era de se esperar, o artigo no Jornal do Brasil suscitou respostas em
defesa do uso do revisor eletrônico. Duas leitoras de Belo Horizonte, Carla Viana
Coscarelli e Else Martins, enviaram carta ao jornal, intitulada Viciados em F7?
Nossa resposta ao JB (27/09/2001), que foi publicada em outubro de 2001. Assim
começa o texto:
A informática entrou em nossa vida – isso não tem retorno - e sua
influência na escrita é inevitável. De pouco adianta torcer o nariz ou
fechar os olhos para as conseqüências que o uso do teclado e dos
programas de texto provocam na escrita das pessoas. Necessário
se faz estudar essas modificações e, sem pré-conceitos, analisar
até onde isso é bom ou não. (...) A crítica que mais se faz ao uso
dos corretores de texto e das comunicações sincrônicas (chats) e
assincrônicas (e-mail) é o fato de que eles levam o indivíduo a
escrever errado. No primeiro caso, inclusive, dizem até que “vicia”!
As autoras da resposta ao JB defendem que é preciso entender que alguns
aspectos da escrita merecem mais atenção do que ortografia e separação de
sílabas, entre outras “questões menores”, na visão delas. Afirmam que língua não
39
se resume a ortografia. Há muito além disso, a sintaxe, a semântica, a textualidade,
os fatores pragmáticos, a discursividade, e ninguém discute isso na imprensa. A
ortografia é sempre a grande vedete. O que elas propõem é a desnecessidade de
perder tempo com questões ortográficas, e deixar sua resolução por conta do
corretor ortográfico. Acreditam que quanto menos tivermos de nos preocupar com
isso no momento da criação, melhor, pois sobrará tempo e recursos cognitivos para
as atividades de planejamento e organização das idéias no texto, para escolher
melhor os recursos lingüísticos a serem usados e as estratégias textuais que melhor
seduzirão o leitor. (sic)
Acrescentam ainda, as duas leitoras, que não há programa de computador
que consiga substituir as escolhas semânticas e estruturas frasais de cada produtor.
Além disso, pelo fato de seguir normas rígidas, o recurso de correção sintática e
ortográfica não exclui a participação do usuário: Apareceu o risquinho verde no texto
e, imediatamente, vai-se verificar o que está acontecendo, que tipo de correção é
sugerida. Apareceu o risquinho vermelho e vai-se verificar o erro ortográfico
cometido.
E concluem, em sua resposta:
Que diferença faz tirar dúvidas no dicionário de papel ou no
eletrônico? Muita. Enquanto o rapaz do nosso exemplo está a
consultar um dicionário, o colega ao lado já analisou e aceitou ou
não a correção proposta e produziu infinitamente mais. (...) o texto
produzido em computador vai aos poucos instalando um texto novo,
criativo, ágil e que exige um leitor que domine os recursos de
produção desse texto, para melhor entendê-lo.
À parte acusações ou defesas, o corretor eletrônico permanece impassível
diante de tudo isso. As considerações anteriores, sobre os textos publicados no
Jornal do Brasil, foram feitas no intuito de servirem de exemplos, dentre os tantos
encontrados por nós, principalmente na Internet, das opiniões favoráveis ou
contrárias ao uso do revisor eletrônico do Word.
Hélio
Consolaro,
professor
de
português
e
coordenador
do
site
www.portrasdasletras.com.br, num artigo intitulado “Revisor do Word”, afirma que
“Os limites do revisor são dois: a qualidade do conhecimento lingüístico de quem
abasteceu o seu léxico (o dicionário) e a limitação do programa”. E continua:
As nuanças de concordância, regência. Exemplo: Juliana era as
esperanças do time. O revisor aponta erro de concordância, porque
não distingue que Juliana se trata de nome de pessoa, nesse caso
o verbo SER concorda com ele.
40
Grifamos, em verde, o que estava sublinhado pelo corretor, na citação acima,
para comprovar a afirmação de Consolaro.
Tela 6
Mais uma surpresa: a sugestão vem na forma de “era as esperança”,
concordando “esperança”, provavelmente, com “do time”, termo subseqüente, mais
próximo. Quando digitada a frase “era as esperança”, o corretor permaneceu em
silêncio.
Consolaro, como tantos outros, não necessariamente professores de
português apenas, aconselha levar a sério os apontamentos que o Word apresenta,
verificando se há razão ou não dos mesmos estarem sendo feitos, não deixando de
pesquisar em gramáticas ou dicionários quando houver dúvidas. E termina o
conselho com uma advertência: “Erra mais quem tem muita certeza”.
41
2.3.1 Como “nasceu” o Revisor
Não nos foi fácil, nem rápido, conseguir informações sobre a criação e os
criadores do revisor gramatical do Word, mesmo tendo a Internet e o site da
Microsoft à nossa disposição. Os e-mails enviados, solicitando ajuda, ficaram sem
respostas.
Tínhamos, em mãos, um único texto - um artigo de divulgação - encontrado
num site e que falava sobre um revisor gramatical chamado ReGra, da Itautec.
Porém, como ignorávamos completamente o significado do ícone da Itautec-Philco,
que vem, conforme a configuração de algumas máquinas, na tela de iniciação do
computador, não conseguíamos aliar uma coisa à outra. Após inúmeras buscas,
conseguimos encontrar uma fonte fidedigna sobre a origem do revisor que temos
em nossas máquinas de sistema do Windows: um texto escrito pelos próprios
pesquisadores/criadores do ReGra, conseguido via Internet, e apresentado em São
Paulo, em 2002, num encontro de Estudos Lingüísticos.
Restou-nos, dessa forma, trabalhar com apenas duas fontes e a impressão de
que não há dados suficientes e satisfatórios para compor esse subcapítulo. No
entanto, disponibilizaremos o que conseguimos mesmo correndo o risco de serem
insuficientes as informações sobre como surgiu o revisor que utilizamos
rotineiramente.
No site http://inventabrasilnet.t5.com.br/revgram.htm há um artigo intitulado
Revisor Gramatical falando sobre a Itautec, empresa brasileira de computadores e
softwares, que precisou desenvolver, em 1993, um revisor ortográfico para um
processador de texto utilizado nos computadores fabricados por ela. A empresa
procurou o Núcleo Interinstitucional de Lingüística Computacional (NILC), formado
por pesquisadores dos Institutos de Ciências Matemáticas e de Computação e de
Física da USP de São Carlos e da Faculdade de Letras da Universidade Paulista
(Unesp), de Araraquara.
Esse grupo, composto de alunos e professores, pesquisava, à época, um
software de processamento da língua portuguesa. A Itautec-Philco, que já possuía
um revisor ortográfico de textos, interessou-se pela pesquisa, pois pretendia
aprimorar seu revisor ortográfico, incluindo um revisor gramatical capaz de detectar
e corrigir erros de concordância e de regência verbal e nominal, entre outros.
42
Em 1994, Maria das Graças Volpe Nunes, pesquisadora-responsável pelo
NILC, e seus colaboradores apresentaram o Revisor Gramatical Automático para o
Português. A princípio, o revisor deveria apenas se preocupar com os erros mais
comuns das secretárias, devido ao perfil corporativo dos clientes Itautec-Philco, mas
o produto acabou posteriormente incorporado ao Word da Microsoft.
O projeto foi aprovado no PITE, em 1996, e contou também com a
colaboração dos professores Cláudio Lucchesi, Tomas Kowaltowski e Jorge Stolfi,
do Instituto de Computação da Unicamp. Em São Carlos, sob a coordenação da
professora Maria das Graças Volpe Nunes, foram desenhados os algoritmos e
formado o banco de base de palavras e, em Campinas, desenvolveu-se a
compactação do sistema e a diminuição do tempo de resposta do programa.
Em 1997, a empresa começou a vender, no varejo, a primeira versão do
revisor gráfico e gramatical, em caixas próprias, como um produto de prateleira. No
final desse ano, a Microsoft procurou a empresa para incorporar o revisor no
programa Office, o mais vendido no Brasil e em todo o mundo. O antigo revisor
criado em Portugal para a língua portuguesa comportava 200 mil palavras; o da
Itautec já dispunha de 1,5 milhão de palavras. O revisor foi incorporado ao Office
2000. A empresa brasileira licenciou o produto por um período de três anos e, pelo
trabalho desenvolvido, o professor Lucchesi recebeu o Prêmio Santista de
Informática, em 1999.
Anunciava o artigo:
Com as funções de revisão licenciadas, o usuário de qualquer um
dos aplicativos que compõem o Microsoft Office poderá ter seus
erros gramaticais e ortográficos corrigidos automaticamente, desde
erros de concordância verbal, uso de crase, regência, colocação
pronominal até a grafia correta das palavras em português. Além de
todos esses recursos, o Microsoft Office contará também com um
dicionário de sinônimos e antônimos (thesaurus), como recurso
extra de consulta. As demais funções do Revisor Word não
licenciadas pela Microsoft continuarão a ser comercializadas
pela Itautec sob o nome de Revisor Plus. Constarão do Revisor
Plus os recursos de conjugação de verbos, consulta à gramática da
língua portuguesa, acentuação automática de documentos, consulta
a verbetes semelhantes, dicas sobre erros mais freqüentes,
consulta a brocardos jurídicos e dicionários português/português,
português/inglês e inglês/português. Também farão parte do
produto dicionários temáticos nas áreas de Medicina, Direito,
Administração e Informática. O Revisor Plus estará disponível para
comercialização simultaneamente com o lançamento da próxima
versão do Microsoft Office em português. (grifo nosso)
43
Afirma o artigo ainda que, apesar de as pesquisas em processamento de
linguagem natural (PLN) de português terem se iniciado muito antes da década de
1990, praticamente nada havia sido feito que visasse à criação de uma ferramenta
robusta e de uso genérico requerendo recursos lingüísticos e computacionais de
grande monta.
O PLN trata do processamento envolvendo análise, interpretação e produção
de uma linguagem humana por uma máquina, sendo uma área da inteligência
artificial voltada para os estudos e desenvolvimento de sistemas que permitam
interpretar e gerar linguagem natural.
“O processamento de linguagem natural
ainda é coisa nova. (...) Além das limitações do PLN, tínhamos o limite da falta de
experiência em produção de produtos comerciais”, afirma Maria das Graças Volpe
Nunes, no citado artigo.
O sistema de correção gramatical foi chamado de ReGra, não incluindo as
rotinas para detecção de erros ortográficos, embora a base lexical que suporta o
corretor ortográfico tenha sido compilada para o projeto de correção gramatical.
O ReGra é constituído por três módulos principais:
i) o módulo estatístico – realiza uma série de cálculos, fornecendo parâmetros
físicos de um texto sob análise, com o número total de parágrafos, de sentenças, de
palavras, de caracteres, etc.
O componente mais importante desse módulo, entretanto, é o que
fornece o “índice de legibilidade”, uma indicação do grau de
dificuldade da leitura do texto. O conceito de índice de legibilidade
surgiu a partir do trabalho de Flesch, de 1948, para a língua inglesa
e busca uma correlação entre tamanhos médios de palavras e
sentenças e a facilidade de leitura. Não inclui aspectos de
compreensão do texto, que requereriam tratamento de mecanismos
complexos de natureza lingüística, cognitiva e pragmática. O índice
Flesch, assim como outros similares, tem sido empregado para uma
grande variedade de línguas, mas o trabalho do NILC foi o primeiro
para o português. Através de um estudo comparativo de textos
originais em inglês e traduzidos para o português, verificou-se que a
equação que fornece o índice Flesch precisaria ter seus parâmetros
adaptados para o português, pois as palavras desta língua são em
média mais longas, em termos de número de sílabas, do que em
inglês. (artigo supra)
ii) o módulo mecânico – detecta erros facilmente identificáveis que não são
percebidos por um corretor ortográfico, como, por exemplo, palavras e símbolos de
pontuação repetidos; presença de símbolos de pontuação isolados; uso não
balanceado de símbolos delimitadores, como parênteses e aspas; capitalização
44
inadequada, como o início da sentença com letra minúscula; e ausência de
pontuação no final da sentença.
iii) o módulo gramatical – contém mais de dez mil regras de correção, realiza
inclusive a análise sintática automática das sentenças. As regras foram testadas em
textos reais não corrigidos, como cartas comerciais, redações de vestibulares e
teses, e em textos editados, como os de livros e revistas. O banco de textos
empregado nestes testes contém mais de 37 milhões de palavras. A última versão
(não se pode saber com certeza qual é, pois não há sua datação) conta ainda com
uma minigramática eletrônica, disponível ao usuário através de hipertexto, que
explica as principais regras gramaticais da língua portuguesa. Possui também um
dicionário de sinônimos e antônimos.
Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do
módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns
entre usuários de nível médio, como secretárias e profissionais de escritório em
geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo
“erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram
como forma desviante da norma culta.
Cita o artigo que
Nas primeiras versões do ReGra, os erros eram detectados através
de regras heurísticas implementadas na forma de redes de
transição estendidas (augmented transition networks), numa
abordagem que se poderia chamar de “error-driven”. As primeiras
versões do ReGra apresentavam vários benefícios do ponto de
vista da implementação computacional: agilidade, especificidade,
rapidez, portabilidade, e disponibilidade de memória. Entretanto,
seu escopo de atuação era muito limitado: problemas envolvendo
itens lexicais não contíguos e estruturas recursivas não podem ser
atingidos pelas estratégias heurísticas normalmente desenhadas
por abordagens error-driven. Para prover a essas insuficiências,
optou-se por analisar sintaticamente as sentenças do usuário, antes
de operar a revisão propriamente dita. Isso permite aplicar regras
que apontam desvios nas relações entre núcleos e adjuntos, entre
núcleos e modificadores, entre regentes e regidos. A realização de
análise sintática automática obviamente requer que todos os itens
lexicais estejam categorizados apropriadamente. Para tanto,
realizou-se em paralelo a construção do léxico, que envolveu a
compilação exaustiva das palavras da língua portuguesa e a
hierarquização das categorias dos itens lexicais morfologicamente
ambíguos. Uma vez que alguns erros em contextos lingüísticos
específicos ocorrem independentemente de desvios sintáticos, na
versão atual do ReGra convivem as duas abordagens mencionadas
acima. Ou seja, além de realizar análise sintática automática,
45
muitas das regras heurísticas da primeira versão foram mantidas,
como as de correção de erros de crase.
Mas a professora Maria das Graças Volpe Nunes faz questão de lembrar que,
devido às ambigüidades semânticas e sintáticas da língua portuguesa, o software
nunca estará completo: “Uma única palavra pode apresentar distintos significados,
pertencendo ou não à mesma classe gramatical. Para conhecer a função e posição
gramatical correta, é necessário saber o que determinada palavra significa em cada
situação”.
Até aqui, trabalhamos com os dados do material que mencionamos como o
primeiro em mãos. A partir de agora, completaremos esses dados com o trabalho
disponibilizado pelo NILC – Núcleo Interinstitucional de Lingüística Computacional
de São Carlos -, encontrado no site www.dc.ufscar.br. , que foi escrito pelos próprios
pesquisadores do ReGra e apresentado em um encontro de Estudos Lingüísticos
em São Paulo, 2002.
Segundo eles, a construção de revisores gramaticais automáticos, embora
seja uma área bem consolidada na Lingüística Computacional atualmente, é uma
tarefa complexa, “dependente de restrições severas de robustez (para contemplar
tarefas em tempo real) e abrangência (para servir a qualquer tipo de requisição)”. As
principais razões dessa complexidade provêm, na fala dos autores:
a) da necessidade de se representar eletronicamente grandes
repositórios de informações lingüísticas (léxicas, sintáticas,
semânticas e/ou pragmáticas) e b) da incorporação de processos
computacionais que dêem conta, sistemática e eficientemente, das
principais características do problema em foco. Considerando-se,
em particular, o contexto de processamento automático do
português, ela se reveste de importância maior, devido à escassez
de ferramentas computacionais.
Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais,
transcritas aqui:
a) seus usuários-alvo são indivíduos com suposta proficiência no português
em nível secundário ou superior;
b) seu objeto de análise são textos prosaicos com predomínio da função
referencial da linguagem; e
c) seu objetivo é a identificação de desvios à disciplina gramatical da língua
portuguesa, ainda que esses desvios possam vir a representar hipóteses
46
significativas do usuário em relação à linguagem e possam constituir, na
variedade lingüística do usuário, estruturas admissíveis.
Quanto à arquitetura do ReGra, atualmente (a. 2002 (?)) ele dispõe dos
seguintes recursos operacionais, conforme disponibilizado no artigo em questão:
1) um léxico, com mais de um milhão e meio de formas do português;
2) um conjunto de regras de desambigüização lexical;
3) um verificador mecânico, constituído de um conjunto de regras para
identificação de problemas de digitação (excesso de espaços em branco,
balanceamento de delimitadores, etc.) e de seu correspondente
aconselhador mecânico;
4) um verificador ortográfico, constituído dos correspondentes conjunto de
regras e aconselhador, o qual sugere as formas lexicalizadas próximas
daquelas não constantes do léxico;
5) um verificador gramatical, constituído de: a) uma gramática com mais de
600 regras de reescrita que contemplam a maior parte das possibilidades
sintáticas de períodos simples do português; b) um parser, ou analisador
sintático
automático,
capaz
de
derivar
representações
arbóreas(hierárquicas) a partir de listas de palavras do português,
segundo as estruturas previstas na gramática; c) um conjunto de regras
de verificação gramatical, subdivididas em distribucionais (com a
consideração dos contextos mínimos, à esquerda e à direita) e estruturais
(dependentes
da
identificação
das
funções
sintáticas);
d)
um
aconselhador gramatical, capaz de sugerir correspondentes corretos para
formas ou estruturas consideradas inadequadas e e) um conjunto de
mensagens de revisão, associada aos padrões derivados da verificação
gramatical;
6) uma minigramática, indexada como hipertexto às mensagens de revisão,
para consulta.
Relativamente ao léxico do ReGra, os pesquisadores dizem ser ele um
“repositório de formas lexicais válidas para o português contemporâneo, acrescidas
de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico
como “um recurso à revisão gramatical, servindo também de apoio ao módulo
ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”.
47
Em relação à sua estruturação, o aspecto organizacional para o acesso
automático é que recebe ênfase, não o aspecto morfológico.
Dizem os autores que isso implica o arquivamento exaustivo das formas do
português,
Sem considerar, p.ex., o aproveitamento de sufixos flexionáveis e
derivacionais da língua. Essa organização resultou também no
armazenamento das lexias simples, i.e., das formas de radical único
(p.ex., pé) ou das formas hifenizadas (p.ex., pé-de-moleque),
decisão determinada por questões de compactação do léxico,
operação que, ao menos, por enquanto, rejeita o tratamento de
lexias complexas, tais como as locuções (p.ex., ‘na medida em que’,
‘à distância’) ou palavras compostas (p.ex., ‘boca de urna’, ‘estado
civil’). (...) A definição lexical exaustiva tem, ainda, a desvantagem
de multiplicar as formas homônimas, resultando em extrema
redundância formal do sistema. (...) Por exemplo, informações
gramaticais distintas para uma mesma forma implicam entradas
lexicais diversas (canto¹ [verbo], canto ² [substantivo]).
É preocupação constante do NILC refinar a constituição do léxico do ReGra,
em virtude - para citar uma das razões dessa preocupação - do surgimento de
muitos problemas de registros lexicais serem gerados pela inserção automática de
palavras,
“cuja
resolução
exige
um
grande
esforço
humano,
altamente
especializado”. Outra razão relevante é o problema da ambigüidade lexical, pois
interfere na eficiência e robustez do ReGra.
As alterações de representação lexical citadas implicam profunda
alteração do modelo representacional adotado, principalmente se
considerarmos a necessidade de associar às palavras sua
caracterização semântica, por si só uma tarefa já altamente
complexa na lingüística computacional e, especialmente, no
contexto de revisão gramatical irrestrita, como é o caso do ReGra.
(...) a revisão do analisador sintático se faz obrigatória.
Quanto à gramática do ReGra, o processo de revisão gramatical se subdivide
em três etapas: a) o pré-processamento da cadeia de entrada, com a etiquetação
dos itens lexicais e a conseqüente desambigüização da informação lexical; b) o
processamento gramatical propriamente dito, com a verificação da correção das
escolhas gramaticais feitas pelo usuário; e c) o pós-processamento sintático, com a
aplicação de procedimentos de aconselhamento gramatical para readequação da
cadeia de entrada aos padrões perseguidos pela ferramenta.
Os resultados de testes comparativos de desempenho do ReGra obtidos pelo
NILC são, segundo os próprios pesquisadores, bastante animadores, haja vista que,
“numa avaliação global, testes de ambos os tipos demonstraram que qualquer
48
versão do ReGra apresenta um desempenho geral superior aos dos seus
concorrentes.
Conforme informações do NILC, para efeito de análise a atuação do ReGra
foi dividida em quatro categorias de intervenção: verdadeiros negativos (a
ferramenta não deveria intervir e não intervém), verdadeiros positivos (deveria
intervir e intervém), falsos negativos (deveria intervir e não intervém) e falsos
positivos (não deveria intervir mas intervém). Estes testes determinaram que:
a) a revisão gramatical e ortográfica automática é não apenas
possível, mas viável e útil, já que a ferramenta identifica 60,52% dos
problemas praticados pelo usuário (na situação de teste) e se omite
em apenas 17,84% dos casos; b) o preço pago para a identificação
de mais da metade das inadequações praticadas pelo usuário ainda
é alto (o número de falsos positivos ainda é maior do que o número
de verdadeiros positivos) e que as estratégias utilizadas para
reduzir o comportamento inadequado da ferramenta não têm
produzido os efeitos esperados, já que as diferenças entre as várias
versões são bem pouco significativas, se considerado o conjunto de
sentenças que compõem o corpus de teste. Estabelece-se,
portanto, como diretriz futura, mais do que a ampliação do escopo
de atuação da ferramenta (para o incremento de número de erros
identificados), uma revisão mais radical nas regras já existentes,
para que se reduza o número, ainda excessivo, de falsos
positivos. (grifo nosso)
Quanto
aos
textos,
eles
são
revisados
pelo
ReGra
à
taxa
de,
aproximadamente, 200 palavras por segundo, o que, segundo seus criadores,
comprova o eficiente desempenho de seu analisador sintático e seus recursos
lingüísticos, disponíveis eletronicamente e muito importantes para o processamento
do português de um modo geral. Contudo,
seu aprimoramento consiste num grande desafio, do ponto de vista
de modelagem, de manipulação automática de informações
lingüísticas e de auxílio a tarefas que o usuário realiza no ambiente
computacional. (...) Basta notar que, em suas últimas cinco versões,
o ReGra avançou apenas 1,04% na redução de intervenções
indevidas e apenas 3,27% na ampliação das intervenções devidas.
(...)o público-alvo do revisor, constituído por usuários do português
brasileiro com nível de escolaridade médio, tem-se revelado
insatisfeito com a restrição do escopo de intervenção do ReGra aos
problemas ortográfico-sintáticos, exigindo a consideração de
problemas de natureza semântico-pragmática, quase sempre
relacionados a níveis maiores do que a oração. É necessário, p.ex.,
que tratemos problemas de estilo, muito mais vinculados ao
propósito da eficácia comunicativa do que ao da adequação à
norma gramatical.
49
Para uma melhor compreensão de como foi pensado para funcionar o revisor
gramatical, e para complementar as informações disponibilizadas neste subcapítulo,
optamos por reproduzir parte do artigo do NILC que descreve a gramática do
ReGra, o qual dispomos na seção Anexos. Isso se deve ao receio que temos de, ao
tentar explicar o processo por nós mesmos, não conseguirmos fazê-lo corretamente,
visto ser conteúdo completamente novo e complexo para nós.
2.3.2 Como funciona o revisor gramatical do Word
O Word exibe linhas onduladas vermelhas abaixo das palavras que não
constam no dicionário do corretor ortográfico, e linhas verdes abaixo de sentenças
que o corretor considera fora de concordância gramatical ou que tenha duplo
sentido em uma frase. Este estudo somente trabalhará com as linhas onduladas
verdes, uma vez que pesquisará as regras de concordância nominal constantes do
programa.
Para verificar a gramática em um documento, quando se deparar com uma
estrutura frasal sublinhada em verde, o usuário deve selecionar a referida estrutura
e clicar em menu Ferramentas item “Ortografia e gramática” ou, mais rapidamente,
pressionar o atalho da tecla F7.
Exemplo: Os professor não querem dar aula hoje.
50
Ao se deparar com a tela acima, o usuário tem a oportunidade de verificar
onde ocorreu o erro apontado pelo revisor e proceder à correção sugerida por ele.
Caso haja dúvidas sobre a coerência da(s) sugestão(ões), ou o usuário queira
explicação gramatical para ela(s), deve clicar no botão “Explicar”, e o revisor
oferecerá dicas e regras de concordância consideradas corretas.
E a tela
apareceria assim:
Se o usuário clicar em “Alterar”, o programa automaticamente fará a correção
da estrutura frasal de acordo com a sugestão que estiver em destaque (na cor azul).
Por isso, é aconselhável que se preste atenção à qual forma, singular ou plural
(quando aparecerem as duas juntas), que se pretende efetivamente utilizar.
Gostaríamos de chamar a atenção aqui para a tela impressa acima. Apesar
de termos propositalmente concordado “Os professor”, o revisor nos mostra uma
tela não de concordância nominal, mas sim de concordância verbal, com as
explicações dadas para o verbo “querer”, não fazendo menção alguma sobre o
artigo “Os” estar no plural e o substantivo “professor”, no singular. Naturalmente que
alguém, a esta altura, poderia questionar: “E daí? A sugestão de correção está
correta, pouco importa, então, se vêm explicações de concordância verbal ou
51
nominal.”. Concordamos com a afirmação, porém isso nem sempre ocorre. A
sugestão correta, queremos dizer. Ademais, não podemos nos esquecer daqueles
que não são tão proficientes em gramática e sobre os quais falamos anteriormente.
Naturalmente que eles não perderão tempo com regras gramaticais exibidas por um
revisor gramatical eletrônico – e sabemos que eles não perderiam esse tempo muito
menos com uma gramática
impressa -, mas, como já falamos, nem sempre a
sugestão vem de forma correta, ou não vem, pois o corretor não detecta a
incorreção. Se o usuário simplesmente confiar no revisor, pode permanecer no erro,
o que poderá prejudicá-lo seriamente dependendo de para quem se destina seu
texto escrito.
Por exemplo, numa carta, o candidato a um cargo em uma empresa, pode
querer usar como um dos argumentos para ser aceito como funcionário, uma oração
do tipo: “Vim para esta cidade a dois anos e moro há cinco quadras da empresa.”. O
revisor aponta incorreção no primeiro período, e sugere a utilização de “há” no lugar
de “a”, mas não vê nada de errado com o segundo período. Pois bem, a gramática
prescreve que se deve utilizar, com referência a distância, a preposição “a”, e não
“há”. Caso quem vá ler a carta seja um tanto ou quanto rigoroso em relação à
ortografia, pode baixar alguns pontos na avaliação do candidato.
52
É claro que este exemplo é simplório, mas serve para mostrar que, como já
dito anteriormente, conhecer regras gramaticais básicas para dar conta de uma
situação lingüística é imprescindível. Por isso, é aconselhável não se tornar
totalmente dependente da ajuda nem sempre confiável do revisor.
Vejamos, ainda, o funcionamento do revisor gramatical quando se trata de
parágrafos.
Adoramos quando ele aponta nossos deslizes na escrita, mas ficamos
irritados quando insiste em substituir nossa digitação por outra palavra que não
desejamos, supostamente mais apropriada segundo sua lógica fria. Esse ritmo
calculista dos revisores automáticos também acaba criticado sob a alegação de que
não detectam uma série de problemas de texto que um revisor humano localizaria
facilmente. Antes de dar razão aos críticos, é preciso saber o alcance desses
programas.
(MANOSSO, Radamés. O Software que nos corrige. In: revista Discutindo Língua
Portuguesa. Ano 1, nº 3, 2006.)
A pontuação é algo apontado constantemente pelo revisor eletrônico. Na
maior parte das estruturas com que temos nos deparado, há uma porcentagem
53
relativamente alta de acertos do revisor, porém quando se trata de um caso como o
exposto na tela acima, a colocação de uma expressão apositiva, fica mais difícil ele
aconselhar corretamente.
Outro exemplo:
No século 19, a questão se tornou bastante popular, e multiplicaram-se
“soluções” que poderíamos chamar de ingênuas, para não dizer inverossímeis.
Todas elas propunham sempre uma origem muito simples para a linguagem
humana e, por nunca considerarem a sua alta complexidade, nada diziam sobre o
mais importante – isto é, como se deu o grande salto do muito simples para o
altamente complexo.
(FARACO, Carlos Alberto. No rastro da fala. In: revista revista Discutindo Língua
Portuguesa. Ano 1, nº 3, 2006.)
54
Esses exemplos, dentre inúmeros outros, são para demonstrar as limitações
que os revisores ainda carregam. Como dissemos anteriormente, para aqueles que
dominam melhor a escrita, a solução é simplesmente ignorar o revisor quando este
apresenta sugestões incongruentes, mas a preocupação é com aqueles que
confiam no que ele ordena. Uns, por mera insegurança no próprio conhecimento
das regras aprendidas na escola (ou fora dela) e um pouco de resistência em
pesquisar em gramáticas; outros, por ignorância mesmo dessas regras.
Pelo que vimos até agora por meio de testes simples, podemos arriscar,
então, duas hipóteses: primeira, a programação embutida nos revisores eletrônicos
se baseia na gramática normativa tradicional, uma vez que o que eles fazem é o
mesmo que um gramático normativo típico faria diante de um texto; segunda (em
decorrência da primeira), então, os revisores eletrônicos são úteis para revisar
textos escritos segundo a variante culta, mas não são completamente eficientes
para realizar esse trabalho. Muito ainda precisa ser melhorado quanto às regras
contidas nele. Sabemos que a Informática, apesar de seu dinamismo, não consegue
dar conta integralmente da vastidão e dinamismo das línguas naturais.
Capítulo III – A concordância nominal
Conhecer as regras de concordância do padrão culto serve, entre outros fins, como meio de
adequação e interação social.
Cereja & Magalhães
Em Português a concordância consiste em se adaptar a palavra determinante
ao gênero, número e pessoa da palavra determinada. (Bechara, 1999: 543).
A concordância pode ser nominal ou verbal. A concordância nominal é a que
se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o
numeral ou o particípio (palavras determinantes) e o substantivo ou pronome
(palavras determinadas) a que se referem. Já a concordância verbal é a que se
verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da
oração.
A concordância pode ser estabelecida de palavra para palavra ou de palavra
para sentido. A concordância de palavra para palavra será total ou parcial (também
chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das
palavras determinadas numa série de coordenação.
A concordância de palavra para sentido se diz ainda concordância “ad
sensum” ou silepse, ou mais modernamente, concordância ideológica.
No capítulo destinado às Concordâncias Nominal e Verbal, Bechara adverte o
falante para estar atento à liberdade de concordância que a língua portuguesa
muitas vezes oferece. Essa liberdade deve ser cuidadosamente aproveitada para
não prejudicar a clareza da mensagem e a harmonia do estilo.
Na língua oral, em que o fluxo do pensamento corre mais rápido
que a formulação e estruturação da oração, é muito comum
enunciar primeiro o verbo – elemento fulcral da atividade
comunicativa – para depois se seguirem os outros termos
oracionais. Nestas circunstâncias, o falante costuma enunciar o
verbo no singular, porque ainda não pensou no sujeito a quem
atribuirá a função predicativa contida no verbo ; se o sujeito, neste
momento, for pensado como pluralidade, os casos de discordância
serão aí freqüentes. O mesmo ocorre com a concordância nominal,
do particípio. (Bechara, 1999:544).
A língua escrita, formalmente mais elaborada, tem meios de evitar estas
discordâncias.
56
Cereja & Magalhães (1999:345) afirmam que a concordância nominal (assim
como a verbal) está relacionada com os princípios lógicos da língua e que concordar
adequadamente é demonstrar domínio dos mecanismos básicos de funcionamento
da língua, defendidos pelo padrão culto. Mas alertam que
Se não observamos esses mecanismos durante a interlocução,
ainda assim é possível haver comunicação. Porém, dependendo de
quem é nosso interlocutor, da expectativa que ele tem em relação a
nós ou da impressão que desejamos passar a ele, o desvio das
normas do padrão culto pode frustrar a finalidade da comunicação.
Em certas situações de interação verbal – por exemplo, numa
entrevista para se conseguir um emprego, no preenchimento de
uma ficha, numa carta ou num artigo enviados a um jornal, numa
palestra, etc. -, o desvio reiterado das regras de concordância pode
causar a impressão de baixo nível cultural, pouca leitura, desleixo
em relação à língua e até ser fonte de preconceito.
Conhecer as regras de concordância do padrão culto serve, entre
outros fins, como meio de adequação e interação social.
Segundo Lucchesi (2006:21), “O pecado mortal lingüístico é a falta de
concordância. E isso tem uma única razão: ela é a grande marca da linguagem
popular”.
Para o autor acima, a falta de concordância na fala popular tem razões
históricas, uma vez que, durante os primeiros séculos de sua colonização, o Brasil
foi um país rural, de pequenas cidades costeiras pouco influentes sobre o restante
do território. “Nesses incipientes núcleos urbanos, a elite procurava falar como se
fazia na metrópole portuguesa” (idem:22). Mesmo após a independência do país, o
Português teve que conviver com as variedades da língua tupi faladas pelos povos
indígenas do litoral brasileiro no século XVI. Como se sabe, o tupi, adotado pelos
colonos portugueses e pelos jesuítas na catequese, tornou-se o idioma mais falado
na província de São Paulo até o século 18.
Depois, vieram os escravos africanos, falando centenas de línguas. “Abria-se,
assim, um imenso fosso entre uma elite que se esmerava em reproduzir os padrões
conservadores de Portugal e a língua falada pelo povo: um Português mestiço e
alterado pelo contato entre diferentes línguas” (Lucchesi, 2006:22).
Mas um dos aspectos mais universais das situações de contato
maciço entre línguas é justamente o que mais causa preconceito: a
perda das regras da concordância. Em todas as regiões do planeta
onde ocorreram esses fenômenos (América, África, Ásia ou
Oceania), a língua européia imposta perdeu em algum nível as suas
regras de concordância. (idem)
57
A partir do final do século 19, com a vinda de aproximadamente 3 milhões de
imigrantes italianos, alemães e japoneses e, posteriormente, com a urbanização da
sociedade brasileira – conseqüência do processo de industrialização do país -, e
com o movimento modernista propondo um resgate radical da cultura popular
brasileira, passa a haver uma valorização da linguagem brasileira com suas
variantes coloquiais.
Apesar de a tradição gramatical brasileira continuar a impingir sobre a
sociedade o modelo do Português europeu, o que gera ainda um forte sentimento
de insegurança lingüística, principalmente nos segmentos escolarizados, “a fala
popular aos poucos vem incorporando – ao contrário do que acontecia – estruturas
da fala culta, em razão da crescente influência dos centros urbanos sobre as demais
regiões do país” (Lucchesi:23).
As opiniões de Lucchesi servem de apoio à análise que pretendemos efetivar
quando falarmos sobre que nível gramatical privilegia o revisor eletrônico do Word.
Ou seja, até que ponto o usuário/redator de um texto no computador encontra
dificuldades por não dominar as regras de concordância contidas na gramática
eletrônica.
Por ser o objeto de estudo deste trabalho, disponibilizamos, a seguir, as
regras de concordância nominal constantes das gramáticas de Napoleão Mendes de
Almeida, Evanildo Bechara e Maria Helena Moura Neves, que foram copiadas,
redigitadas, por nós com o intuito explicado na parte introdutória desta dissertação.
3.1 GRAMÁTICA METÓDICA DA LÍNGUA PORTUGUESA
Napoleão Mendes de Almeida
CONCORDÂNCIA NOMINAL
CONCORDÂNCIA DO ADJETIVO COM O SUBSTANTIVO
REGRA GERAL: O adjetivo, quer adjunto adnominal quer predicativo, quer
anteposto quer posposto, concorda em gênero e número com o substantivo a que
se refere.
Ex.: “Via recolhidas no santuário as tábuas de bronze”.
“Hei de fazer públicos os seus desaforos”.
58
REGRAS ESPECIAIS
* Se o adjetivo se refere a vários substantivos do singular e do mesmo gênero,
e vem:
1) Posposto – vai, indiferentemente, para o plural e para o gênero dos substantivos
ou fica no singular:
Ex.: “Nessa leitura e escrita tão arrepiadas de dificuldades”.
“Rugido, grito, gemido conglobados num só hiato”.
“... a consciência e a dignidade humanas”.
“Coragem e disciplina digna de granadeiros”
“... rudeza e pusilanimidade alheia”.
Nota – Será de obrigação o singular, quando o adjetivo só se referir ao último
substantivo:
Ex.: “O casaco e o chapéu redondo eram o meu alvará”.
2) Anteposto – concorda com o substantivo mais próximo:
Ex.: “... cujo trajo e gesto indicavam...”
“... notando o estrangeiro modo e uso”
“Chegada a hora e a ocasião”.
Notas: 1ª - Os exemplos de construção no plural não devem ser imitados:
Ex.: “ Desbotadas a cor e a frescura da infância ”
“ A mão cujos índice e polegar ”
2ª - Somente quando predicativo do objeto é que o adjetivo pode ir para o
plural:
Ex.:
“ Eu julgava satisfeitos o pai e o filho ”
“ ... entretinham vivas a idéia e a saudade “
3ª - Se aos substantivos precederem títulos ou pronomes de tratamento, a
concordância se efetuará no plural:
Ex.: “ Os apóstolos Barnabé e Paulo “
“ Os irmãos Joaquim e José ”
“ Os Sres. Silva e Cia ” (sic)
* Se o adjetivo se refere a vários substantivos no singular e de gênero diferente,
e vem:
1)
Ex.:
Posposto – vai para o plural masculino:
“Nariz, face e boca monstruosos”
“...comércio e navegação costeiros”
“Uma posse e um domínio incompletos”
Notas: 1ª - Pode também concordar com o substantivo mais próximo se o sentido o
exige, ou o queremos:
Ex.: “Manda-me livro e fruta madura”
“Talento e habilidade rara” (ou raros)
“Ali dei a tradução em língua e estilo moderno”
“... o retrato de Maria com túnica e escapulário branco”
2ª - Se os substantivos forem sinônimos, o adjetivo concordará com o mais
próximo:
Ex.: “As maldições se cumpriam no povo e gente hebréia”.
59
2)
Anteposto – concorda com o mais próximo ou, indiferentemente, vai para o
plural masculino:
Ex.: “Pasmado Diogo e a multidão”
“...atentos o juízo e generosidade”
“Demais disso, sua mãe e irmão eram ricos”
“Perdida a cor e o alento”
“...tinha tornado inúteis a inteligência e o braço”
“...declarou criminosa a ré e o réu”
“Verão os homens ensangüentados o sol e a lua”.
* O adjetivo que se refere a substantivo do plural e de gêneros diversos vai,
geralmente, para o plural e para o gênero do substantivo mais próximo:
Ex.:
“ As armas e os barões assinalados”
ou: Os barões e as
armas assinaladas
“ ... carícias e bens paternos “
“ ...mordomos e confrarias festeiras”
“...casas e corações abertos”
“...atos e fórmulas religiosas”
Nota: Há em bons escritores nossos o emprego exclusivo do plural masculino:
Ex.: “ Os recursos e as tropas desproporcionados”
“ Pais e mães carregados de família”
“...enviando os breves e cartas destinados a protegê-los”
“ Pagos as rendas, foros e impostos”.
* Se o adjetivo se refere a substantivo do mesmo gênero e de números
diferentes, e vem:
1) Anteposto – concorda com o substantivo mais próximo:
Ex.: “ Os seus filhos e marido são meus hóspedes”
“ Sua astúcia e tiranias”
“ Sua mulher e filhas”.
2) Posposto – vai para o plural de igual gênero dos substantivos:
Ex.: “ ...com as colônias e com a civilização romanas”
“ Se os recursos e o tempo absorvidos...”
“ Vês aqui as mãos e a língua delinqüentes”.
* Se os substantivos forem sinônimos ou formarem gradação nas idéias
enunciadas, a concordância do adjetivo se efetuará com o mais próximo, quer
venha antes quer depois:
Ex.: “ ...depreender-se de uma idéia e pensamento falso”.
“ ingratidão na fraqueza e temor natural”
“...para servirem ao interesse e gosto alheio”.
“...a fé e a amizade declarada”.
* Mais de um adjetivo qualifica ou determina o mesmo substantivo – Podem ser
dadas à frase várias formas:
Ex.: O primeiro batalhão e o segundo;
O primeiro e o segundo batalhão;
O primeiro e segundo batalhão.
Gramáticos há que permitem a construção: “O primeiro e o segundo
batalhões” – levando-se para o plural o substantivo ao qual se referem vários
60
adjetivos no singular. Aceitam essa concordância Constâncio, Pacheco Júnior,
Soares Barbosa, Rui Barbosa e Mário Barreto, aos quais apóiam exemplos dos
melhores manejadores do idioma. Conceitua Epifânio Dias que se pode dizer: “Os
dois poderes, temporal e espiritual”, “Os dois poderes, o temporal e o espiritual”
(Observe-se a vírgula no primeiro exemplo e a repetição do artigo no segundo).
Reconheço casos em que o plural do substantivo se impõe pelo uso (“Nos
dias 24 e 29 de junho”), mas o mais seguro é evitar, sempre que possível, a flexão
do substantivo, porque, seja como for, o adjetivo é que concorda com o substantivo
e não este com aquele.
EXEMPLOS DIVERSOS: “As expressões que se empregam na lei prussiana e na
francesa”
“ ...na terrível peleja do bom e do mau princípio”
“ As personagens são as do velho e do novo testamento”
“ A primeira e a segunda ameia”
* Se o substantivo vem antecedido de alguma coisa, qualquer coisa, vai para o
feminino se não intervém a preposição de (“Alguma coisa consoladora”) e para o
masculino com a presença dessa partícula (“Alguma coisa de consolador”).
* Em expressões como “pobre do homem”, “desgraçado de ti”, a interposição da
preposição de não impede a concordância do adjetivo: “Desgraçadas das mulheres”
– “Coitados dos que foram para a guerra”.
* O adjetivo antecedido de nada de, algo de, muito de, um quê de, um quid de, o
que quer que seja de, um não sei quê de concorda com o sujeito conforme pelo
sentido estiver em relação com ele ou com o nome de significação geral e indefinida
que aquelas palavras e expressões encerram:
Ex.: “ Este escritores têm o que quer que seja de ímpios e ateus”.
“ Têm muito de garridas e romeiras essas raparigas”.
“ Mostraram eles na linguagem muito de duro e áspero” (ou de
duros e ásperos)
“ Possuem elas um não se quê de esquisito”.
* O substantivo aposto concorda com seu fundamental em gênero e número
sempre que possível:
Ex.: “ O ódio, filho do orgulho”
“ A esperança, filha da fé”
“ Estes instrumentos, produtos de nossa fabricação”
CONCORDÂNCIA DO PREDICATIVO COM O SUJEITO
REGRA GERAL: O predicativo, quando constituído de adjetivo ou de pronome,
concorda com o sujeito em gênero e número:
Ex.: “ Pedro é generoso”
“ Maria parece bondosa”
“ É você o procurador da casa? - Sou-o” (O pronome está
concordando com procurador)
REGRAS ESPECIAIS
* Quando o predicativo é constituído de substantivo abstrato ou de substantivo
de uma só forma genérica, deixa de concordar com o sujeito, ficando invariável:
Ex.: “ As propriedades não são natureza”.
61
“ As lágrimas do aflito não são crime”.
“ As cores que no camaleão são gala, no polvo são malícia”.
“ Ele é a esperança da família”.
* Há casos curiosos de discordâncias do predicativo com o sujeito quando este, sem
nenhuma determinação, é expresso em sua generalidade abstrata:
Ex.:
“Cerveja não é bom para a saúde”.
“Pimenta é bom para estimular”.
“É necessário paciência”.
“É proibido entrada”.
“Não é necessário mulheres na fábrica”.
Os predicativos bom, necessário, proibido assumem a forma aparentemente
masculina, mas realmente neutra, visto que os substantivos a que se referem,
tomados em sua generalidade abstrata, assumem sentido vago, no qual como
que se oblitera o conceito genérico.
OUTROS EXEMPLOS: “É bom toda a cautela” - “É necessário prudência
nos negócios” – “É preciso mais areia” – “Não é preciso margem” – “É feio blusa em
criança” – “Uma caixa de sapato seria bom para guardar os brinquedos”.
É este um dos vestígios interessantes do gênero neutro em português. Logo,
porém, que esses sujeitos recebam uma determinação positiva, despojam-se do
caráter neutro, e o predicativo assume a flexão genérica correspondente:
Ex.: “Esta cerveja não é boa para a saúde”.
“Aquelas pimentas são boas para estimular”.
“É necessária a paciência”.
“É proibida a entrada”.
* Quanto à concordância do predicativo, devemos observar o seguinte:
62
1) Referindo-se a nome tomado em sentido determinado (antecedido de
artigo), varia em gênero e número: “Sois a mãe desta criança? Sou-a” – “Sois a
professora desta escola? Sou-a” (Este a é pronome articular, e não pronome
pessoal).
2) Referindo-se a nome tomado em sentido vago, indeterminado (não
antecedido de artigo, e equivalente, então, a isto, isso, aquilo) ou referindo-se a
adjetivo, fica invariável na sua forma masculina, ou antes, neutra: “Sois mãe? Souo” (=Sou isso) – “Sua mãe era vã como o são todas” – “Se Henrique fora ambicioso
não o era menos sua mulher” – “Se jamais houve condição para inveja, aquela o foi
sem nenhuma falta”.
CONCORDÂNCIA DO PRONOME
REGRA GERAL: Quando flexível, o pronome concorda em gênero e número com o
nome a que se refere:
Ex.: “Para isso é preciso mais esforço que para defrontar a morte, mas
tu o terás; inspirar- to-ão o meu exemplo e a santa memória de
nossos pais”.
“Quero tê-lo, Vasco, porque tu o desejas”.
REGRAS ESPECIAIS
* Os pronomes oblíquos o, a, os, as, referindo-se a substantivos de gêneros
diversos, tomam no plural a flexão masculina:
Ex.: Porque essas honras vãs, esse ouro puro
Verdadeiro valor não dão à gente:
Melhor é merecê-los sem os ter
Que possuí-los sem os merecer.
* Referindo-se a um substantivo modificado por outro regido da preposição de
companhia com, pode o pronome ir para o plural, como acontece com o verbo:
Ex.: “Passava um dia de inverno o arcebispo com sua comitiva a serra
de Gerez... salteou-os uma chuva fria e importuna”.
63
CONCORDÂNCIA IRREGULAR OU FIGURADA (p.416)
SILEPSE
Concordância irregular, também chamada concordância figurada, é a que opera não
com o termo expresso, mas com outro termo latente, isto é, oculto, mentalmente
subentendido.
Outros nomes tem* ainda semelhante concordância: semiótica, lógica,
latente, anormal, mental, nomes que denotam operar-se a concordância não com a
letra, mas com o espírito, com a idéia da frase.
Tal tipo de concordância se denomina silepse. Etimologicamente (do grego syn =
com, mais lépsis, do verbo lambánô = tomar, prender), silepse é sinônimo de
compreensão.
A silepse pode ser de gênero, de número e de pessoa.
A silepse de GÊNERO opera-se:
1 - Com os nomes próprios de rios e de cidades, concordando o adjetivo não com o
substantivo próprio em si, expresso na frase, mas com o apelativo dessas classes (
rio, cidade):
masc. fem.
“Cartago foi destruídA” (cidade).
“O Paraíba é tortuosO” (rio).
Nota – Sabemos já que constituem exceções alguns nomes de cidades: “O Porto
está cheiO de visitantes” – “O Rio de Janeiro é festivO”.
2 - Nas expressões de tratamento (vossa senhoria, vossa mercê, vossa alteza, sua
excelência, sua majestade, etc.), em que a concordância se opera não com o
gênero dessas expressões, mas com o sexo ou com a natureza do cargo da pessoa
a que essas expressões são dirigidas: “Vossa majestade é poderosO” (rei) – “Vossa
64
alteza é bondosO” (príncipe) – “Vossa senhoria foi indicadO” (homem) – “Você está
enganadA” (mulher).
3 – Com os artigos o e um, quando, em certas frases já consagradas, constituem
atributivos de nomes femininos que se referem a pessoa de sexo masculino:
“Pedro é um criança”
“O besta do Antônio”
“Antônio é um banana”
4 – Em outros casos em que o pronome concorda não com o gênero da palavra
expressa, mas com o sexo da pessoa a que a palavra se refere: “Conheci uma
criança... mimos e castigos podiam com ele; mas em lhe falando na mãe e no que
custara para lhe dar a vida, o infeliz, que nunca a vira, enternecia-se” - “Só nove
crianças de 6 até 8 anos e tais que é lástima vê-los”.
5 – Como preencher, numa ficha em que se discriminam os dados identificadores
de uma pessoa, o que pede a nacionalidade? Se homem, como escrever na frente
da palavra nacionalidade: brasileiro ou brasileira? Se de homem se tratar, brasileiro
é que se deverá consignar. Brasileira, tão só quando de mulher forem os dados.
Não haja nisso admiração. À pergunta “Qual o estado civil?” ninguém se
aventuraria a declarar “casado”, quando de mulher se tratasse. “Estado” está na
ficha, mas “casada” se põe, porque não o estado mas a mulher é que se qualifica.
A silepse de NÚMERO opera-se:
1 – Com o adjetivo no singular em função predicativa aos sujeitos nós (empregado
em lugar de eu), vós (quando empregado em lugar de tu): “Antes sejamos breve que
prolixo” – “Vós estais enganado” – “Amigo atento e obrigado somos” – “Estamos
persuadido disso”.
Nota: a) Ao emprego de nós com valor de eu, e de vós, com valor de tu já tivemos
ocasião de referir-nos no § 342, 1. Nós é empregado em lugar de eu pelos reis,
pelos papas e prelados (plural majestático). O verbo irá para o plural, mas o
adjetivo, como dissemos, concordará silepticamente.
b) Emprega-o ainda o escritor ou o orador, para efeito retórico, mas não
poderá empregar ora eu, ora nós; ou sempre uma, ou sempre outra forma, notando-
65
se ainda que as formas pronominais oblíquas e os possessivos devem ser
uniformes com a escolha: Nós julgamos... foi-nos relatado... nossa opinião.
c) Vós emprega-se em lugar de tu quando se trata o interlocutor com
deferência especial. Curioso é notar a não existência de tal emprego em latim: o
interlocutor, fosse quem fosse – superior jerárquico (sic), rei ou o próprio Deus – era
sempre tratado por tu. Vós, nesse idioma, só se empregava quando realmente
plural.
2 – Quando, sendo o sujeito coletivo de forma singular, vai, entretanto o verbo para
o plural, conformando-se com a pluralidade lógica do coletivo: “Estavam pegados*
com ele uma infinidade de homens” – “A máxima parte dos homens morrem antes
dos cinqüenta” – “Abalou o colégio quase todo em procissão pelas ruas de Coimbra,
capitaneados pelo seu reitor”.
Note-se, nesses casos, uma destas particularidades: 1 – a pluralidade lógica
contida no coletivo; 2 – a distância geralmente existente entre o sujeito e o verbo; 3
– a presença de um genitivo plural.
66
Nota – 90% dos homens viajaram
Discriminemos estes casos:
–
No plural ou no singular o verbo?
a)
Quando o predicado é constituído de verbo de ligação ou de locução verbal
passiva, o verbo e o predicativo (ou o particípio nas locuções passivas) deixam-se
influenciar pelo número e pelo gênero do partitivo: “90% das MULHERES SÃO
analfabetAS” – “30% da nossa PRODUÇÃO é exportadA” – “20% da POPULAÇÃO
ESTAVA acamadA” – “50% das PROFESSORAS DEVEM ser nomeadAS por
merecimento”.
b)
Quando o número porcentual vem antecedido ou seguido de adjunto no
plural, é melhor aceitar o plural: “BONS 30% DÃO conta das obrigações” – ESSES
5% da boiada MORRERAM” – “90% DOS HOMENS VIAJARAM”. E assim: “Duas
terças partes da população são aliadófilas” – “Duas terças partes do país foram
devastadas”.
c)
Afora esses casos o singular é empregado: “90% da imprensa DEFENDE” –
“80% do eleitorado COMPARECEU” – “90% da borracha latino-americana ainda
PROVÉM de árvores nativas” – exatamente como diz o inglês, cioso do s final da
terceira pessoa do singular do indicativo presente: “Ninety percent of Latin American
rubber still COMES from wild jungle trees”.
d)
Quanto a “parte de”, “metade de”, “a maior parte de” , “a maioria de”, veja o §
711.
e)
Quanto à idéia de quantidade, veja o § 713.
A silepse de PESSOA consiste em operar-se a concordância do verbo não com a
pessoa do aposto claro, mas com a pessoa do fundamental oculto: “Dizem que os
cariocas somos pouco dados a jardins públicos” – isto é: “...que nós, os cariocas,
somos...” (O verbo concorda com o fundamental oculto nós, e não com o aposto
claro “os cariocas”).
OUTROS EXEMPLOS: “Ali ficamos alguns amigos” – “Os dois íamos ali por visita” –
“Os portugueses fazemos este nome particular” – “Os quatro que escapamos, nos
lançamos ao mar” - “Todos os filhos de Adão padecemos nossas mutilações e
fealdades” – “Uns esperando andais noturnas horas, outros subis telhados e
paredes” – “Os outros saltamos para testemunhar a catástrofe”.
3.2 MODERNA GRAMÁTICA PORTUGUESA
Evanildo Bechara
CONCORDÂNCIA NOMINAL
Considerações gerais – Em Português a concordância consiste em se adaptar a
palavra determinante ao gênero, número e pessoa da palavra determinada.
A concordância pode ser nominal ou verbal – Diz-se concordância nominal a que
se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o
numeral ou o particípio (palavras determinantes) e o substantivo ou pronome
(palavras determinados (sic)) a que se referem. Diz-se concordância verbal a que se
67
verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da
oração.
A concordância pode ser estabelecida de palavra para palavra ou de palavra para
sentido. A concordância de palavra para palavra será total ou parcial (também
chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das
palavras determinadas numa série de coordenação:
“Repeli-a, porque se me ofereciam vida e honra a troco de perpétua infâmia”
[AH.1, 147].
“ porque entre ele e Suintila... está o céu e o inferno” [AH.2, 124].
“...via-se em todas as faces pintado o espantoso e o terror” [AH.2, 124].
“Quando a educação, os livros, e o sentir daqueles que nos odeiam, apagou
em nossa alma o selo da cruz” [AH.2, 143].
A concordância de palavra para sentido se diz ainda concordância “ad sensum” ou
silepse:
“ A plebe vociferava as mais afrontosas injúrias contra D. Leonor: e se
chegassem a entrar no paço, ela sem dúvida seria feita pedaços pelo tropel furioso”
[AH.2, 41].
É preciso estar atento a que a liberdade de concordância que a língua
portuguesa muitas vezes oferece, deve ser cuidadosamente aproveitada para não
prejudicar a clareza da mensagem e a harmonia do estilo.
Na língua oral, em que o fluxo do pensamento corre mais rápido que a
formulação e estruturação da oração, é muito comum enunciar primeiro o verbo –
elemento fulcral da atividade comunicativa – para depois se seguirem os outros
termos oracionais. Nestas circunstâncias, o falante costuma enunciar o verbo no
singular, porque ainda não pensou no sujeito a quem atribuirá a função predicativa
contida no verbo ; se o sujeito, neste momento, for pensado como pluralidade, os
casos de discordância serão aí freqüentes. O mesmo ocorre com a concordância
nominal, do particípio.
A língua escrita, formalmente mais elaborada, tem meios de evitar estas
discordâncias.
Concordância nominal
A – Concordância de palavra para palavra
1) Há uma só palavra determinada.
A palavra determinante irá para o gênero e número da palavra
determinada:
“Aflige-nos a glória alheia contestada com a nossa insignificância” [MM].
“Os bons exemplos dos pais são as melhores lições e a melhor herança
para os filhos” [MM].
“Eu amo a noite solitária e muda” [GD. 3, I, 314].
Eu estou quite. Nós estamos quites.
2) Há mais de uma palavra determinada.
Observar-se-ão os seguintes casos:
1º) Se as palavras determinadas forem do mesmo gênero, a palavra determinante
irá para o plural e para o gênero comum, ou poderá concordar, principalmente se
vier anteposta, em gênero e número com a mais próxima:
A língua e (a) literatura portuguesas ou A língua e (a) literatura portuguesa.
68
“Amava no estribeiro-mor as virtudes e a lealdade nunca desmentidas” [RS.1,
124].
“O tom e gesto caricioso, com que ela dizia isto, não moveu medianamente o
esposo” [CBr. 1, 158].
“e os nossos Basílio e Durão, bem assim o Sr. Magalhães...” [OM, 72].
OBSERVAÇÕES:
1º) Se as palavras determinadas se referirem a uma só pessoa ou coisa, impõe-se o
singular do determinante: seu fiel amigo e servidor
2º) É injusta a crítica do gramático E. Carlos Pereira aos seguintes exemplos: “ ...a
mão esquerda, entre cujos índice e polegar pendia o pergaminho...” [AH.5, II, 24] e
“...pelas exigências cada vez maiores destas devoradoras e insaciáveis fome e sede
de leitura” [AC.1, 315].
3º) Precedendo um substantivo (título ou prenome), ocorre o plural: os irmãos Pedro
e Paulo. Os apóstolos Barnabé e Paulo.
4º) Um determinante (adjetivo) no plural pode estar aposto a um sujeito no singular
que venha colocado depois, quando este sujeito é algum dos pronomes cada um,
cada qual, ninguém, nenhum, referidos a pessoas ou coisas já mencionadas:
sobressaltados com esta vista, procurava cada um pôr-se a salvo [ED].
2º) Se as palavras determinadas forem de gêneros diferentes, a palavra
determinante irá para o plural masculino ou concordará em gênero e número com a
mais próxima:
“Vinha todo coberto de negro: negros o elmo, a couraça e o saio” [AH.1, 107].
“como se um grande incêndio devorasse as brenhas e os carvalhais antigos”
[AH.1, 86].
“Calada a natureza, a terra e os homens” [GD.3, I, 315].
com boa coragem e zelo, com coragem e zelo bom (ou bons), com bons
coragem e zelo
toda sua luta e sacrifícios.
todos seus sacrifícios e luta.
OBSERVAÇÕES:
1º) Por uma questão de agrado auditivo (eufonia), prefere-se que numa série de
palavras determinadas de gêneros diferentes seguida de palavra determinante no
masculino plural, venha a determinada masculina em último lugar.
69
2º) Se, neste caso, se tratar de pronome possessivo posposto, a concordância deste
se fará com o último substantivo: “Este velho desterrado por gosto e eleição sua...”
[RS.1, 16].
3º) Quando há idéia de reciprocidade, torna-se obrigatório o emprego do plural: “Ele
entrou prazenteiro... e encontrou padrinho e afilhada empenhados em uma
discussão sobre autoridade” [LBa apud SS.1 § 257 obs.].
3º) Há uma só palavra determinada e mais de um determinante.
A palavra determinada irá para o plural ou ficará no singular, sendo, neste
último caso, facultativa a repetição do artigo. Em geral, isto ocorre com adjetivos de
nacionalidade: As literaturas brasileira e portuguesa ou A literatura brasileira e
portuguesa (maneira de dizer menos freqüente e, com exagero de lógica gramatical,
considerada errônea por muitos autores) ou A literatura brasileira e a portuguesa.
“e os cronistas tudense e toledano fazem a luta dos dous reis depois daquele
consórcio” [AH.6, III, 86].
“Li um anúncio, convidando mestra de línguas inglesa e francesa para o
colégio” [CBr. 1, 128].
“O pequeno reino sucessivamente perlustrou as costas ocidental e oriental da
África...” (C. de Laet, I, 211)
as séries quarta e quinta
a quarta e quinta série (ou séries)
B – Concordância de palavra para sentido
A palavra determinante pode deixar de concordar em gênero e número com a
forma da palavra determinada para levar em consideração, apenas, o sentido em
que esta se aplica: o (vinho) champanha, o (rio) Amazonas.
Entre os diversos casos desta concordância pelo sentido aparecem os
seguintes:
1) As expressões de tratamento do tipo de V. Exª., V. Sª., etc.:
atencioso (referindo-se a homem)
V. Exª. é
atenciosa (referindo-se a mulher)
OBSERVAÇÃO: Quando se junta um adjetivo a tais formas de tratamento, tal
adjetivo fica no gênero da forma de tratamento:
Sua Majestade fidelíssima foi contrariado pelos representantes diplomáticos.
70
2) A expressão a gente aplicada a uma ou mais pessoas com inclusão da que fala:
“Pergunta a gente a si próprio (refere-se a pessoa do sexo masculino) quanto
levaria o solicitador ao seu cliente por ter sonhado com o seu negócio” [PC apud
MBa. 2, 413]
3) O termo determinado é um coletivo seguido de determinante em gênero ou
número (ou ambos) diferentes:
“Acocorada em torno, nus, a negralhada miúda, de dois a oito anos” [HC.2, 84].
4) A palavra determinada aparece no singular e mais adiante o determinante no
plural em virtude de se subentender aquela no plural:
“Não compres livro somente pelo título: ainda que pareçam bons, são muitas
vezes péssimos” [JR.1, 321].
“Mas não nos constou em que ano começou nem quantos esteve com ele” [LS
apud JR.1]
C - Outros casos de concordância nominal
1) Um e outro, nem um nem outro – Com um e outro, põe-se no singular o
determinado (substantivo), e no singular ou no plural o verbo da oração, quando
estas expressões aparecem como sujeito:
“Alceu Amoroso Lima (...) teve a boa idéia de caracterizar e diferençar o
ensaio e a crônica, dizendo que um e outro gênero se afirmam pelo estilo”.
“Parou um momento e, olhando para um e outro lado, endireitou a carreira...”
[AH. 1, 107].
“Mas uma e outra cousa duraram apenas rápido instante” [AH.1, 218].
Com nem um nem outro é de rigor o singular para o substantivo e verbo:
Nem um nem outro livro merece ser lido.
Com um ou outro o substantivo também fica no singular e invariavelmente no
singular aparece o verbo de que a expressão serve de sujeito:
“Um ou outro soldado, indisciplinadamente, revidava, disparando à toa, a
arma para os ares” [EC, 2ªed., 428].
Se as expressões um e outro, nem um nem outro se aplicarem a nomes de gêneros
diferentes, é mais comum o emprego das formas masculinas:
“Tornou a vê-la, foi visto por ela, e acabaram namorados um do outro” [MA.
12, 1ª. ed., 39)
“Ali teve el-rei escondido algum tempo, e lá começaram os seus amores com a
rainha, que tão fatais foram para um e outro” [Ah.2, 35].
“Repousavam bem perto um do outro a matéria e o espírito” [AH.1, 44].
Não raro pode aparecer a concordância com o termo referido:
“...vivia o casal venturoso de um certo Izraim persa letrado e da sua esposa
Proftásia que um e outra cultivavam para deleite do espírito a filosofia grega” [JR.2,
15].
2) Mesmo, próprio, só – Concordam com a palavra determinada em gênero e
número:
Ele mesmo disse a verdade. Ela mesma disse a verdade.
Elas próprias foram ao local.
Nós não estamos sós.
71
“Eles sós se encaminham para essa parte...” [AH.1, 153].
Em língua literária ocorre o adjetivo só variável onde no colóquio se prefere usar do
advérbio só, portanto invariável:
“Com sós 27 anos de idade... já a palidez da morte se via lutar no seu rosto
com as rosas da mocidade [AC.10].
Mesmo, além de se empregar na idéia de identidade (= em pessoa), aparece ainda
como sinônimo de próprio, até:
“ao mesmo demônio se deve fazer justiça, quando ele a tiver [AV apud
Ed.2, §86,a].
Este último sentido e mais o emprego adverbial junto de aqui, já, agora (aqui
mesmo, já mesmo, agora mesmo) facilitaram o aparecimento moderno da palavra
como advérbio, modo de dizer que os puristas condenam, mas que vem ganhando a
simpatia geral:
“...vaidosos de seus apelidos, mas inofensivos, e virtuosos mesmo por
vaidade de imitarem seus avoengos” [CBr.6,219].
É preciso atenção para não fazer a concordância de menos com o substantivo
seguinte:
Mais amores e menos confiança (e não menas!).
Vale a mesma observação para somenos (= de menor valor):
“Há neles coisas boas e coisas más ou somenos” [MB.2, 239].
3) Leso – É adjetivo, e não forma do verbo lesar, em construções de tipo: crime de
lesa-pátria, crime de leso-patriotismo. Por isso há de concordar com o seu
determinado em gênero e número:
“Como se a substância não fosse já um crime de leso-gosto e lesa-seriedade, ainda
por cima as pernas saíam sobre as botas” [CBr.1, 83].
4) Anexo, apenso e incluso – Anexo, apenso e incluso, como adjetivo, concordam
com a palavra determinada em gênero e número:
Correm anexos (inclusos, apensos) aos processos vários documentos.
Vai anexa (inclusa, apensa) a declaração solicitada.
OBSERVAÇÃO: Usa-se invariável em anexo, em apenso: Vai em anexo (em
apenso) a declaração. Vão em anexo (em apenso) as declarações.
5) Dado e visto – Usados adjetivamente, concordam em gênero e número com o
substantivo determinado:
Dado (Visto) o problema que se nos apresentou, resolvemos desistir do
contrato.
Dadas (Vistas) as circunstâncias, foram-se embora.
6) Meio – Com o valor de “metade”, usado adjetivamente, concorda em gênero e
número com o termo determinado, claro ou oculto:
“Para aquilatar a importância do tropeiro, basta lembrar que o Brasil tem
cerca de oito e meio milhões de quilômetros quadrados de superfície...” [AAr.2, 102].
Era meio-dia e meia (i.é: e meia hora).
7) Pseudo e todo – Usados em termos compostos ficam invariáveis.
A pseudo-sabedoria dos tolos é bem grande.
72
A fé todo-poderosa que nos guia é nossa salvação.
8) Tal e qual – Tal, como todo determinante, concorda em gênero e número com o
determinado:
Tal opinião é absurda.
Tais razões não me movem.
Em correlação, tal qual também procedem à mesma concordância:
Ele não era tal quais seus primos.
Os filhos são tais qual o pai.
Os boatos são tais quais as notícias.
OBSERVAÇÕES:
1ª) em lugar de tal qual, podem aparecer: tal e qual, tal ou qual.
2ª) Não confundir tal qual flexionáveis com tal qual, tal qual como invariáveis que
valem “como”:
“Descerra uns sorrisos discretos, sem mostrar os dentes, tal qual como as inglesas
de primeiro sangue” [CBr apud CJ.1, 32].
73
9) Possível – Com o mais possível, o menos possível, o melhor possível, o pior
possível, quanto possível, o adjetivo possível fica invariável, ainda que se afaste da
palavra mais:
Paisagens o mais possível belas
Paisagens o mais belas possível
Paisagens quanto possível belas
Com o plural os mais, os menos, os piores, os melhores, o adjetivo possível vai para
o plural:
Paisagens as mais belas possíveis.
Estão erradas concordâncias como:
Paisagens as mais belas possível.
Fora destes giros, a concordância de possível se processa normalmente:
“As alturas e o abismo são as fronteiras dele: no meio estão todos os universos
possíveis” [AH.2, 160].
10) A olhos vistos – É tradicional o emprego da expressão a olhos vistos no
sentido de claramente, visivelmente, em referência a nomes femininos ou
masculinos:
“...padecia calada e definhava a olhos vistos” [MA.5, 13 apud
Tradições Clássicas, 370].
Mais rara, porém correta, é a concordância de visto com a pessoa ou coisa que se
vê:
“As minhas forças medravam a olhos vistas de dia para dia” [AC apud
CR.1, 554].
“O barão desmedrara a olhos visto” [CBr apud PDo.2, 32].
11) É necessário paciência – Com as expressões do tipo é necessário, é bom, é
preciso, significando ‘é necessário’, o adjetivo pode ficar invariável, qualquer que
seja o gênero e o número do termo determinado, quando se deseja fazer uma
referência de modo vago ou geral. Poder-se-á também se fazer normalmente a
concordância:
74
É necessário paciência.
É necessária muita paciência.
“O fato de ter sido precisa a explicação (...) [AP.1, 424, nº. 25].
“Eram precisos outros três homens” [AM.1 apud RBa.1,33].
É possível ainda, em tais casos, aparecer no singular o próprio verbo da oração:
“É doce ao velho
Sons d’argentina voz” [GD apud SS.1, 254].
Como acentua Barbadinho, a flexão de necessária(s) é mais freqüente que a de
precisa.
12) Adjetivo composto – Nos adjetivos compostos de dois ou mais elementos
referidos a nacionalidades, a concordância em gênero e número com o determinado
só ocorrerá no último adjetivo do composto:
Acordo luso-brasileiro
Amizade luso-brasileira
Lideranças luso-brasileiras
13) Alguma coisa boa ou alguma coisa de bom – Em alguma coisa boa o adjetivo
concorda com o termo determinado:
“Quem tivesse reparado em Fr. Vasco perceberia facilmente que na sua alma
se passava também alguma cousa extraordinária” [AH apud MBa.7, 144].
Em alguma coisa de bom, o adjetivo não concorda com coisa, sendo
empregado neutralmente (como algo de novo, nada de extraordinário, nada de
trágico, etc.).
Por atração pode-se fazer a concordância do adjetivo com o termo
determinado que funciona como sujeito da oração:
“Que tinha pois, Ricardina, de sedutora!” [CBr apud MBa.7, 146].
“Amor próprio do vilão; que a infâmia nada tinha de engenhosa” [Id., ibid.].
Se os homens não tivessem alguma coisa de loucos seriam incapazes de
heroísmo [MM]. (ver sugestão do corretor eletrônico, abaixo)
A vida nada tem de trágica.
75
14) Um pouco de luz e uma pouca de luz – Ao lado da construção normal um
pouco de luz pode ocorrer a concordância atrativa uma pouca de luz, por se
haverem fundido numa só expressão as duas seguintes maneiras de dizer: pouco
de luz + pouca luz (Dá-se ao fenômeno o nome de contaminação ou cruzamento
sintático. Cf. pág.596.).
“e aos pés deles os fiéis que obtinham para última jazida uma pouca
de terra...” [AH.1,154].
15) Concordância do pronome – O pronome, como palavra determinante,
concorda em gênero e número com a palavra determinada.
Emprega-se o pronome oblíquo os em referência a nomes de diferentes
gêneros:
“A generosidade, o esforço e o amor ensinaste-os tu em toda a sua
sublimidade” [AH.1, 25].
16) Nós por eu, vós por tu – Empregando-se vós em referência a uma só pessoa,
põe-se no singular o adjetivo:
“Sois injusto comigo” [AH apud ED.2, § 14,b].
Ao se empregar, em idênticas condições, o pronome nós, o adjetivo pode ficar no
singular ou ir para o plural:
Antes sejamos breve que prolixo.
“Entre o desejo de alimentar a curiosidade do leitor e o receio de faltar à
exação histórica, hesitávamos perplexos” [AH apud ED.2, §14,b].
17) Alternância entre adjetivo e advérbio – Há casos em que a língua permite
usar ora o advérbio (invariável) ora o adjetivo (variável):
“Vamos a falar sérios” [CBr apud MBa.1, 265].
Vamos a falar sério.
“Os momentos custam caros” [RS apud MBa.1, 265].
Os momentos custam caro.
A vida custa tão cara aos velhos quanto é barata para os moços [MM].
“Era esta a herança dos miseráveis, que ele sabia não escassearem na
quase solitária e meia arruinada Cartéia” [AH.1, 12].
A voz sumiu-se-lhe, toda trêmula [EQ.3, 647].
76
A distinção entre adjetivos e advérbios só se dá claramente quando a palavra
determinada está no feminino ou no plural caso em que a flexão nos leva a melhor
interpretar o termo como adjetivo. Na língua padrão atual, a tendência é para nestes
casos proceder dentro da estrita regra da gramática e usais tais termos sem flexão,
adverbialmente.
Entram nesta possibilidade de flexão as construções de tanto mais, quanto
menos, pouco mais, muito mais, em que o primeiro elemento pode concordar ou
não com o substantivo:
Com quanto mais razão, muito mais honra.
Com quanta mais razão, muita mais honra.
Poucas mais palavras trocamos [CBr apud MBa.4, 21].
Notemos, por fim, que alerta é rigorosamente um advérbio e, assim, não
aparece flexionado:
Estamos todos alerta.
Há uma tendência para se usar desta palavra como adjetivo, mas a língua
padrão recomenda se evite tal prática. Junto de substantivo alerta adquire
significado e função de adjetivo:
“A moça aguardava com inteligência curta, os sentidos alertas” [CLi apud RBa.2,
14].
Em sentido contrário, aparece o engano de não se flexionar o adjetivo quite.
Deve-se dizer:
Estou quite.
Estamos quites.
18) Particípios que passaram a preposição e advérbios – Alguns particípios
passaram a ter emprego equivalente a preposição e advérbio (como, por exemplo,
exceto, salvo, mediante, não obstante, tirante, etc.) e, como tais, normalmente
devem aparecer invariáveis. Entretanto, não se perdeu de todo a consciência de seu
antigo valor, e muitos escritores procedem à concordância necessária:
“Os tribunais, salvas exceções honrosas, reproduziam... todos os defeitos do
sistema” [RS2, IV, 67].
77
“A razão desta diferença é que a mulher (salva a hipótese do cap. CI e
outras) entrega-se por amor...” [MA.1, 327].
Como bem pondera Epifânio Dias, flexionar tais termos “é expressar-se na
verdade com correção gramatical, mas de modo desusado” [ED.2, §220, a].
Deste modo, a língua moderna dá preferência a dizer “salvo exceções”,
“salvo a hipótese”.
19) A concordância com numerais – Quando se empregam os cardinais pelos
ordinais, não ocorre a flexão:
Página um.
Figura vinte e um.
OBSERVAÇÕES:
1ª) Na linguagem jurídica diz-se: A folhas vinte e uma. A folhas quarenta e duas.
2ª) Embora se tenha usado o substantivo no singular precedido de numeral
combinado com um, uma, a preferência atual é pô-lo no plural: vinte e um dias, as
mil e uma noites, etc.
3ª) Milhar é masculino e portanto não admite seus adjuntos postos no feminino a
concordar com o núcleo substantivo feminino:
Os milhares de pessoas ( e não: as milhares de pessoas).
20) A concordância com os adjetivos designativos de nomes de cores –
Surgem as incertezas quando o nome de cor é constituído de dois adjetivos. Neste
caso, a prática mais comum é deixar o primeiro invariável na forma do masculino e
fazer a concordância do segundo com o substantivo determinado, embora não
deixem de aparecer exemplos em bons autores em que estejam flexionados os dois
adjetivos:
olhos verde-claros, ondas verde-azuladas.
78
3.3 GRAMÁTICA DE USOS DO PORTUGUÊS
Maria Helena Moura Neves
Concordância Nominal
5.2. Questões de concordância (p.117)
a) Quando um substantivo no plural é determinado ou qualificado
distributivamente por dois ou mais adjuntos coordenados, esses adjuntos são
usados no singular:
Se somarmos os pontos dos segundo e terceiro LUGARES, que não são
nossos concorrentes diretos, constataremos que ainda continuamos sendo
o primeiro lugar. (FSP)
Vitrúvio, nos seus seis princípios, dedicou-se praticamente à estética do projeto
arquitetônico, não se referindo a ela somente na primeira e na sexta
CATEGORIAS. (AQT)
Os bancos dão uma guinada nos rumos da política de financiamento, liberando
financiamento para projetos de desenvolvimento apenas quando
acompanhados de políticas sensíveis aos IMPACTOS social e ambiental.
(AMN)
b) Recomenda a gramática tradicional normativa que se use no singular o
substantivo determinado pela expressão um e outro:
João de Oliveira deixou-se ficar num botequim próximo a conversar com um e
outro INDIVÍDUO. (MP)
De uma e de outra MARGEM, o mato se mostrava tão fechado que só se podia
mesmo ir sempre em frente. (ALE)
Santo Tirso intercalava uma e outra FRASE de louvor para desviar-se do
ramerrão do texto. (PFV)
Entretanto, o plural é bastante usado:
Um e outro INSTRUMENTOS podem, isoladamente, praticá-la, como está
representado nas Figs. 13 & 14 e é o preceito dos tocólogos alemães. (OBS)
É sempre imprecisa a fronteira que separa um e outro DELITOS. (VEJ)
79
Grades artesanais de ferro torcido foram recortadas e adaptadas para portas,
janelas e CORRIMÃOS. (FSP)
Às 10h30m, começa a prova para JUNIORES, aspirantes e principais, com 70
quilômetros de percurso. (GAZ)
80
O curso é dirigido a operadores SENIORES, coordenadores, supervisores e
empresários. (FSP)
8.5 Nomes próprios de pessoas (tanto nomes como sobrenomes) se pluralizam
normalmente, como os substantivos comuns: (p.172)
E minha mãe era FERREIRA, dos FERREIRAS de Viana do Castelo. (VPB)
81
Os PEREIRAS constituíam numerosa e patriarcal família. (DEN)
Ah, que não suscitaram os MENESES em matéria de invenção! (CCA)
Somente não tocava nos RIBEIROS, porquanto o assunto devia constrangê-la.
(FR)
Aprecio sinceramente a coragem dos MELCHIORES e dos ROBÉRIOS que
talvez não saibam distinguir a realidade da miragem. (VP)
# Entretanto, é comum que, especialmente no caso dos sobrenomes, a pluralização
seja feita apenas pelo determinante:
Lembrei-me instantaneamente que os LAMBETH eram proprietários da
residência de Renata. (L)
Os BATTAGLIA e os MANFREDE desconversavam. (VN)
De algumas donas e donzelas gabava-se francamente a beleza, a distinção.
Dona Heloísa, Dona Berta, AS MOURA, AS FRANCO, AS OLIVEIRAS, AS
ROSSO. (CF)
82
i) Com substantivos concretos: os adjetivos indicam dimensão ou medida (p.190)
Agora já não éramos PEQUENO rebanho a escorregar num declive:
constituíamos boiada NUMEROSA. (MEC)
5.7
Um adjetivo pode referir-se a dois ou mais substantivos coordenados:
(p.218)
Se o adjetivo em função adnominal estiver posposto, o mais comum é que a
concordância de gênero se faça com a soma dos gêneros dos substantivos
(masculino + masculino = masculino; feminino + feminino = feminino; masculino +
feminino = masculino), embora ocorra também a concordância com o gênero e o
número do substantivo mais próximo:
[Paris Match] dedicara um número às favelas do Rio, com estatísticas e
fotografias CLAMOROSAS. (BH)
No rosto dela ainda a emoção e ansiedade GERADAS pelo sonho. (ARA)
Fontenelle é tido como o mais legítimo dos que governaram o Território, com a
conta de quarenta anos de convivência com a terra e o povo ACREANOS. (CRU)
Todos são homens e mulheres TRISTÍSSIMOS. (NOF)
- Impossível – disse o rei, com suco de véspera correndo pela pauta e o jargão
REAL. (AUB)
Durante as refeições, não sou mais a “presença” que rouba a naturalidade e o
bom humor GERAL. (A)
Se o adjetivo (em função adnominal ou predicativa) estiver anteposto, o mais
comum é que a concordância de gênero e número seja feita com o substantivo
mais próximo, mas também ocorre concordância com o conjuntivo dos
substantivos:
Fica bem CLARA a natureza e posição dos grupos e pessoas que encaram a
ordem. (DIR)
Acho muito BONITO o realismo e a precisão dos retratos daquela época.
(VEJ)
Tão PARECIDOS são o tom e o delírio. (VEJ)
83
No próximo capítulo, as normas de concordância nominal constantes na
gramática eletrônica do revisor do Word, acompanhadas dos resultados contrastivos
que obtivemos entre elas e as dos gramáticos acima.
Capítulo IV – O (des)compasso entre as normas de Concordância Nominal
constantes das três gramáticas e no revisor eletrônico.
Após a apresentação das regras de concordância nominal, encontradas nas
obras dos gramáticos com os quais trabalhamos, disponibilizamos, neste capítulo,
as regras de concordância nominal que conseguimos retirar do programa do revisor
gramatical do Word, para tentarmos responder à nossa principal pergunta de
pesquisa. Estão enumeradas apenas por praticidade didática.
Conseguimos elencar quinze regras apresentadas pelo revisor gramatical
quando da submissão de sentenças que ele sublinhava em verde. Muitas sentenças,
mais de quarenta pelos nossos cálculos, foram submetidas. Por isso, se houver
outras regras além das apresentadas aqui, acreditamos que as descobriremos por
puro golpe de sorte, pois não descobrimos outro meio de obtê-las a não ser expondo
sentenças e pedindo explicações sobre o apontamento em verde feito pelo revisor, o
que se caracteriza em um trabalho exaustivo e, muitas vezes, frustrante.
Quanto ao levantamento que fizemos, nos capítulos dedicados à Concordância
Nominal, em Napoleão Mendes de Almeida o computador detectou mais problemas
de concordância verbal. Dos 6 apontamentos feitos em verde pelo revisor, quando da
digitação do texto, 4 eram de concordância verbal, 1 sobre o uso do particípio
passado e apenas 1 de concordância nominal, apresentando a primeira regra
disposta aqui: O predicativo do sujeito concorda em número e gênero com o sujeito
da sentença. (Vide tela na página 61)
Em Bechara, de todos os exemplos de regras de concordância nominal
expostos ao revisor, apenas 7 foram apontados como erros, em sua maioria nas
concordâncias consideradas ‘especiais’. (Páginas 68, 69, 72, 74, 75, 76 e 77)
Já em Moura Neves não houve um capítulo digitado, uma vez que ela
apresenta tópicos gramaticais de uma maneira diferente da tradicionalmente
conhecida, elencada em partes separadas. Tentamos, porém, digitar e apresentar ao
revisor tudo o que considerávamos relevante para a concordância nominal e, dentro
do que apresentamos, 9 problemas foram detectados. Todos eles referentes também
aos casos de concordâncias especiais. (Páginas 78, 79, 80, 81 e 82)
Por não querermos repetir as telas, relativas a cada regra, já dispostas nos
capítulos de concordância nominal pertencentes a Napoleão, Bechara e Moura
85
Neves, decidimos, em vista do farto material coletado, dispor, nesta parte, algumas
com as quais nos deparamos durante a escritura do texto do nosso trabalho. Exceção
feita nos exemplos das regras de nº 3, 6 e 9 porque o computador com o qual
trabalhamos não detectou os mesmos problemas encontrados nos exemplos dos
autores citados acima e, por conseguinte, não nos foi possível obter as mesmas
regras.
4.1 Regras de Concordância Nominal da gramática eletrônica do Word
1.
O predicativo do sujeito concorda em número e gênero com o sujeito da
sentença.
Mas ele reconhece como concordâncias corretas as frases abaixo:
3. Chuva é necessário para a agricultura.
4. Aspirina é bom para dor de cabeça.
E para corretas, acima, sugere correto.
86
87
2.
Os apostos de natureza adjetiva devem concordar em gênero e número com
as palavras a que se apõem.
3.
Os adjetivos precedidos da preposição “de” constituem locuções adjetivas de
valor genérico e, por isso, conservam o gênero masculino e o número singular.
(Evanildo Bechara)
88
4.
No português, os modificadores de núcleos nominais (como o predicativo do
objeto direto ou os adjuntos adnominais) devem concordar em gênero e
número com as palavras que eles modificam.
89
90
5.
O artigo, o pronome, o numeral e o adjetivo, quando determinantes, devem
sempre concordar em gênero e número com o substantivo a que se referem.
91
6.
Adjetivos como “quite” devem concordar com o sujeito dos verbos de ligação
(ser, estar, permanecer, ficar, continuar, parecer, permanecer (sic), andar,
viver, tornar-se...) em gênero e número, mesmo que este sujeito esteja oculto.
(Moura Neves)
92
7.
O artigo nas contrações deve concordar em gênero e número com o
substantivo que o segue.
8.
O predicativo do objeto direto concorda em número e gênero com o objeto
direto.
93
9.
O pronome, o numeral e o adjetivo, quando adjuntos adnominais, devem
sempre concordar em gênero e número com o substantivo a que se referem.
(Moura Neves)
10. No português, os modificadores do substantivo devem concordar com o
substantivo que eles modificam.
94
11. O pronome, o adjetivo e o numeral, quando adjuntos adnominais a um núcleo
composto, devem sempre concordar com o substantivo mais próximo ou com o
gênero e o número comuns ao conjunto dos substantivos modificados.
95
13. O predicativo do sujeito concorda em número e gênero com o sujeito, mesmo
que posposto.
14. Os apostos devem concordar com as palavras a que se apõem.
96
15. O verbo “ser” e a palavra “necessário” devem concordar em gênero e número
com a palavra que aparece em seguida.
97
Mas, o revisor aponta concordância incorreta na própria regra que dita:
16. O substantivo e o adjetivo “meia” não devem ser confundidos com o advérbio
“meio”, que é invariável.
Achamos interessante, mais uma vez, mostrar o que, às vezes, vem
sublinhado em verde pelo revisor gramatical. Copiamos, redigitando, o que o próprio
revisor oferece como regra de concordância nominal, e ele mesmo não a reconhece
como escrita correta.
98
4.2 Respostas às perguntas de pesquisa
Comecemos relembrando as questões. Primeiro, as auxiliares: Por que a
descrição gramatical do revisor eletrônico não diz respeito à verificação de grande
parte das estruturas usuais do português do Brasil em relação às regras de
Concordância Nominal? Que gramática subjaz ao revisor gramatical eletrônico?
Trata-se de uma gramática casuística, composta de um elenco de frases, que
considera caso a caso? Trata-se de uma gramática que vê a língua como um
conjunto de enunciados pré-estabelecidos? E, depois, a principal: Que normas
constam da memória da gramática eletrônica em relação à Concordância Nominal?
Seguem o modelo tradicional ou não?
Quanto à principal questão, além de dispormos, no subcapítulo anterior, das
normas que conseguimos retirar da gramática eletrônica, da maneira como nos foram
ofertadas pelas telas de aconselhamento do revisor, quando acionado, temos a
complementar que, após contrastar as informações obtidas, percebemos que a
maioria das regras de concordância nominal inseridas no programa que criou o
revisor gramatical são regras das gramáticas normativas, tradicionais. O fato de os
problemas
que
foram
detectados
serem,
preferencialmente,
da
área
de
concordâncias especiais, leva-nos a (re)considerar os critérios para a formação do
parser do programa que desenvolve o revisor.
Acreditamos, então, que é por esse motivo – o de ter sido programada
seguindo um modelo tradicional - que a gramática eletrônica não dá conta de grande
parte das estruturas usuais do português do Brasil quando em situações lingüísticas
que apresentem uma escritura não tão culta quanto à da gramática que serviu de
base à inserção de regras gramaticais no momento da criação do ReGra. Pois, como
se pôde perceber, o revisor eletrônico contempla o nível de linguagem culto,
recomendado pela Academia de Letras e pelas gramáticas normativas, no qual a
linguagem se mantém estática, em que as ousadias, as inovações, as criações não
têm lugar.
As sentenças reconhecidas como gramaticalmente corretas, quando
submetidas ao revisor, são aquelas que têm suas regras contempladas no banco de
dados da gramática eletrônica que, como já dissemos, insere-se muito mais na
abordagem tradicional e parece se caracterizar como um feixe de sentenças finitas,
fechadas, sem muita liberdade de outras combinações nos seus elementos.
99
Ou seja, o não reconhecimento de sentenças tidas como gramaticalmente
corretas, usuais, é por conta da gramática programada para o revisor, com número
finito de regras e sem muita mobilidade para escrita em estilo diferente do que o
proposto por essa gramática eletrônica. O grupo do NILC - Núcleo Interinstitucional
de Lingüística Computacional - , que criou o ReGra, deixa claro as dificuldades
encontradas pela limitação do programa. “O parser apresenta uma única
possibilidade de estruturação sintática: a mais provável, segundo as escolhas
gramaticais realizadas também com base na prioridade de freqüência (de suas
regras)”.
Isso nos remete ao modelo de análise distribucional, criado por Z.S. Harris, o
qual tem como princípio básico a observação de que as partes de uma língua se
compõem e não se distribuem caoticamente, mas fazem parte de um sistema e, por
isso, se situam em posições bem determinadas, umas em relação às outras. Esses
elementos se deixam agrupar em classes e essas classes ocorrem em certas
posições dentro de um contexto, mas não ocorrem em outras posições dentro desse
mesmo contexto. Assim, a soma dos contextos em que dada classe de elementos
pode aparecer, contrastada com a soma dos contextos em que tal classe não pode
ocorrer, define a distribuição de quaisquer elementos da língua. Este tipo de
distribuição é limitado a fundamentar suas observações em contextos típicos, não
em qualquer contexto.
Para Greimas (s/d:132),
a análise distribucional, de caráter indutivo e descritivo, aplica-se
essencialmente em descobrir distribuições, ou seja, o conjunto dos
contextos nos quais uma dada unidade lingüística se pode
encontrar. Esse procedimento, que, em princípio, evita qualquer
recurso ao sentido como critério, está fundamentado na coocorrência que, discernindo relações de compatibilidade ou de
incompatibilidade no eixo sintagmático entre os elementos, permite
o estabelecimento de classes distribucionais, levadas em conta as
combinações e as restrições reconhecidas. Este tipo de abordagem,
de natureza taxonômica, conduz a uma segmentação da frase e vai
dar na análise em constituintes imediatos que serviu de ponto de
partida à gramática gerativa.
Assim, de acordo com alguns testes que fizemos, se há inversão de lugares
de termos essenciais ou integrantes, ou intercalação de termos acessórios, na
frase/oração, fatos bastante recorrentes na escrita do português brasileiro, em
muitos casos encontramos a limitação da gramática do revisor em reconhecer e
aceitar como corretos esses tipos de sentenças. Isto acontece, segundo o NILC,
100
porque “A atuação do revisor gramatical restringe-se à oração simples, isolando
para processamento, sempre que possível, as coordenações e subordinações”.
Cabe aqui, agora, uma observação que julgamos relevante. Quando nos
deparamos com o sublinhado verde e com a tela de concordância nominal, durante
a digitação deste trabalho e em outras situações, de todas as ocorrências a que se
repete com mais freqüência é a que contempla a regra de nº 4: No português, os
modificadores de núcleos nominais (como o predicativo do objeto direto ou os
adjuntos adnominais) devem concordar em gênero e número com as palavras que
eles modificam. Em seguida vêm as regras que numeramos em 5, 9 e 10 e as
relativas ao uso de apostos.
Outro ponto importante destacado pelos criadores do revisor eletrônico, e já
dito anteriormente, é que: “O formalismo gramatical, definido para reconhecer
sentenças bem-formadas, segue uma gramática livre de contexto”. Gramáticas
livres de contexto são muito úteis no que tange à descrição de gramáticas em
linguagem natural e, em geral, são mais poderosas que as regulares, já que
permitem a representação de linguagens com um certo grau de complexidade. No
entanto, a dificuldade em expressar dependências simples, como por exemplo a
concordância entre verbo e sintagma nominal, constitui um dos maiores problemas
para sua utilização no tratamento da língua natural. E, concluem, “(...) abordagens
puramente livres de contexto não são suficientemente poderosas para captar a
descrição adequada deste gênero de linguagem”.
No próximo capítulo, a conclusão deste trabalho.
Capítulo V - Conclusão
A escrita permite fixar o pensamento e fazê-lo atravessar o espaço e o tempo.
Francis Vanoye
Dentre as características incontestáveis da língua escrita, encontra-se a
importância que a mesma tem quando se percebe que é sobre a “conservação do
escrito que se funda nossa civilização, que, pouco a pouco, substitui a lei oral pela
lei escrita” (Vanoye, 1998:72).
Mas, continua Vanoye (idem:71), a escrita fixa a linguagem articulada, e, ao
fazê-lo, transforma essa linguagem, pela passagem da fonia à grafia, numa nova
linguagem, que possui uma existência independente da primeira. Por ser muito
menos móvel que a língua falada, as transformações da língua escrita são muito
lentas e muito pouco numerosas.
Por isso mesmo permite fixar o pensamento e fazê-lo atravessar o
espaço e o tempo. É graças à escrita que o homem pode efetuar
uma reflexão, uma análise de seu próprio pensamento. A linguagem
articulada possui uma função essencialmente concreta, utilitária;
serve primeiro para comunicar. A linguagem escrita vai além dessa
função de comunicação (idem).
Relativamente à concordância nominal no português escrito, esta possui
algumas particularidades interessantes – para alguns, de difícil aprendizado formal.
A regra geral, do acordo de gênero que ocorre entre o substantivo e o
adjetivo, é bem conhecida e parece não preocupar os nativos de língua portuguesa,
que se esforçam, quando a situação assim o exige, em lembrar-se de associar
masculino com masculino, feminino com feminino. A concordância de gênero, com
exceção de alguns dialetos, é uma regra categórica do português. O mesmo já não
ocorre com a de número, por isso vemos, em situações de fala corriqueiras, na
maioria orais, a não concordância considerada correta pela gramática normativa.
Mas, a escritura de um texto começa a se tornar complicada quando não se
têm interiorizadas, de maneira formal, as outras regras ditadas pela norma da
língua. Como concordar corretamente na escrita, por exemplo, seqüências de
substantivos adjetivadas por um só atributo? E os adjetivos compostos, hifenizados?
E nos casos de concordância em que a regra só é válida para adjetivos que
funcionam como adjuntos adnominais, mas não para os que funcionam como
predicativos? Se não se tiver uma gramática à mão, torna-se uma tarefa “dolorosa”,
102
impossível para alguns, que acabam por desistir. Afinal, “o que é mesmo adjunto
adnominal? E predicativo? Nem sei o que é isso, como vou distinguir um do outro?
O que tem a ver concordância atrativa com eles? E o que é concordância atrativa?”.
E isso é opinião corrente da maioria dos brasileiros que dizem não saber
português. Na verdade, entendemos que eles estão se referindo, mesmo que não
conscientemente, à própria insegurança, ou ignorância, na escrita desse português,
já que a fala “tudo aceita, desde que a mensagem seja entendida”. O
desconhecimento - por não aprendizagem efetiva - das normas prescritas pela
gramática tradicional sempre foi um problema para a maioria dos falantes do
português brasileiro.
Não cabem aqui discussões sobre a eficiência do ensino/não-ensino desse
tipo de gramática nas escolas. Os exemplos acima buscam mostrar algo de que
falamos anteriormente: a dificuldade de uma imensa parcela da população brasileira
na produção de textos escritos com um mínimo de correção gramatical.
Quanto à realidade atual, todos têm a percepção clara de que os
computadores invadiram o dia-a-dia de milhares de usuários, e isto se deu porque
sua velocidade e potência aumentaram, seu tamanho e preço diminuíram. Essa
revolução na computação começa a se dar ainda nas décadas de 1980 e 1990.
Microcomputadores surgem em escritórios, casas e escolas, com programas
acessíveis aos novos usuários. Poderosos bancos de dados possibilitaram às
organizações armazenar e processar imensas quantidades de informação, enquanto
as redes interligavam as máquinas, permitindo o compartilhamento de dados e
programas.
Então poderíamos pensar que, com a facilidade oriunda do uso cada vez
mais “popular” dos computadores, isto é, por um número crescente de pessoas se
valendo, hoje em dia, de computadores para escrever seus textos e desenvolver
seus trabalhos, o fato de haver um revisor ortográfico e um gramatical como
ferramenta de auxílio à correção desses textos, seria a “salvação da lavoura” para
os que não têm um domínio adequado da gramática da língua. E isso, em parte, é
verdadeiro, uma vez que os revisores mais atualizados demonstram um
desempenho já bastante satisfatório.
Todavia, continua preocupante o fato de que uma máquina não consegue
fazer escolhas porque simplesmente desconhece o contexto ou a intenção
lingüística/comunicativa de quem a está utilizando num dado momento. Explicamos
103
melhor: quando o revisor se manifesta com seu sublinhado vermelho e faz sugestão
de reescritura de grafia de uma palavra, ele oferece o que tem em seu dicionário. O
usuário, por sua vez, se não tiver um vocabulário bom, pode aceitar uma das
sugestões sem perceber que aquela palavra escolhida não cabe no contexto no
qual pretende inseri-la.
Portanto, uma das armadilhas dos corretores ortográficos está na leitura de
uma determinada palavra dentro de um contexto. O computador não pode encontrar
um erro ortográfico se a palavra estiver correta para um outro contexto (por
exemplo, viagem e viajem), principalmente porque o revisor tem dificuldades em
apontar as homógrafas imperfeitas para conferência de sua correção.
Relativamente ao léxico do ReGra, seus criadores dizem ser ele um
“repositório de formas lexicais válidas para o português contemporâneo, acrescidas
de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico
como “um recurso à revisão gramatical, servindo também de apoio ao módulo
ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”. (grifo
nosso)
Devido às ambigüidades semânticas e sintáticas da língua portuguesa, o
software nunca estará completo, afirmam os pesquisadores do NILC: “Uma única
palavra pode apresentar distintos significados, pertencendo ou não à mesma classe
gramatical. Para conhecer a função e posição gramatical correta, é necessário
saber o que determinada palavra significa em cada situação”.
O mesmo se dá com o sublinhado verde, mais complexo porque trabalha com
regras gramaticais, esquecidas ou desconhecidas por muitos dos usuários. Assim,
podemos voltar aos exemplos dispostos acima. Se eu, como usuário, tenho a
possibilidade de aceitar ou rejeitar as sugestões, somente poderei fazer isso se
entender o que o revisor está me dizendo. (grifo nosso)
Os próprios criadores do revisor gramatical eletrônico do Word admitem que
“o problema de decidir se uma sentença pertence a uma gramática sensível ao
contexto é uma função exponencial sobre o tamanho da sentença, o que torna a
implementação do procedimento de verificação uma questão complexa, do ponto de
vista computacional”. (grifo nosso)
Ainda há o fato de a gramática criada para um computador poder gerar
também sentenças claramente agramaticais, principalmente se algumas palavras
forem expandidas para outra categoria. Por isso, dizem os especialistas que é
104
preciso adicionar alguns recursos às regras sintagmáticas e trabalhar com a
descrição e classificação do léxico para implementar o tipo de gramática na
linguagem Prolog.
Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do
módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns
entre usuários de nível médio, como secretárias e profissionais de escritório em
geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo
“erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram
como forma desviante da norma culta. (grifo nosso)
Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais,
transcritas aqui:
a) seus usuários-alvo são indivíduos com suposta proficiência no português
em nível secundário ou superior;
b) seu objeto de análise são textos prosaicos com predomínio da função
referencial da linguagem; e
c) seu objetivo é a identificação de desvios à disciplina gramatical da língua
portuguesa, ainda que esses desvios possam vir a representar hipóteses
significativas do usuário em relação à linguagem e possam constituir, na
variedade lingüística do usuário, estruturas admissíveis.
Pelo que vimos até agora, por meio de testes simples que fizemos, podemos
arriscar, então, duas hipóteses: primeira, a programação embutida nos revisores
eletrônicos se baseia na gramática normativa tradicional, uma vez que o que eles
fazem é o mesmo que um gramático normativo típico faria diante de um texto, ou
seja, o revisor trabalha com a definição de erro; segunda (em decorrência da
primeira), então, os revisores eletrônicos são úteis para revisar textos escritos
segundo a variante culta, mas não são completamente eficientes para realizar esse
trabalho. O revisor gramatical eletrônico do Word trabalha com uma concepção
homogênea de linguagem: só existe uma língua correta.
Desse modo, voltamos ao conhecimento de que a Gramática Tradicional
desenvolveu uma sintaxe baseada na análise de frases bem formadas dadas a
priori. Ou seja, parte de uma frase gramatical e aceitável e dela faz a análise para
ilustrar a teoria sintática. Apesar de não haver nada de errado com esse método –
haja vista a riqueza e sucesso da sintaxe tradicional -, deparamo-nos
105
freqüentemente com uma das limitações desse método analítico: uma quantidade
grande de regras não é explicitada, de vez que estudamos a possibilidade de frase
e não todas as possibilidades similares do modelo escolhido.
Se quisermos uma descrição mais exaustiva das regras sintáticas da língua,
podemos recorrer ao método dedutivo, também utilizado pela Gramática GerativoTransformacional. Essa gramática é dedutiva no sentido de que não parte de
exemplos de frases bem formadas, mas de regras que devem gerar frases bem
formadas. O método dedutivo faz o caminho inverso do método analítico da
Gramática Tradicional, que vai da frase dada para a sua estrutura sintática,
enquanto aquele obtém frases a partir da estrutura sintática dada.
O método utilizado pela Gramática Gerativo-Transformacional está presente na
criação da gramática eletrônica, conforme vimos na parte de sintaxe computacional
neste trabalho. No entanto, percebemos falhas na sua proposta. Basta analisar as
telas de aconselhamento oferecidas pela gramática do Word. Claro que a definição
de todas as regras necessárias à geração de um determinado tipo de frase exige
que se leve em conta um volume muito grande de variáveis, por isso temos que
questionar a possibilidade de se criar esse conjunto de regras tão completo e
eficiente que gera todas as frases possíveis da língua.
Parece-nos, esse, um ato impossível de se efetivar, principalmente no que
tange a um programa de computador. Uma sintaxe que gera frases gramaticais e
aceitáveis exige que se estabeleçam regras semânticas, além das sintáticas. E no
estabelecimento das regras semânticas de geração a situação se complica
consideravelmente. A inclusão de regras semânticas no modelo computacional
certamente daria mais poder à teoria gramatical embutida nele, mas requereria um
esforço de descrição que ultrapassaria os recursos de produção e programação
atuais.
Segundo Lucchesi (2007:18-21), quando aprendemos que o homo sapiens é
uma espécie que se distingue dos demais primatas por possuir um poderoso
dispositivo mental que lhe permite organizar de forma bem complexa suas
percepções do mundo e expressar seus pensamentos em frases, com um poder
criativo potencialmente ilimitado, compreendemos, também, que todo homem é
dotado desse dispositivo. Dispositivo que é constituído por um complexo sistema de
regras, que nem o mais sofisticado programa computacional até hoje produzido
possui, e o qual todo ser humano possui como capacidade mental.
106
Portanto, não há uma frase sequer que seja falada sem o acionamento desse
complexo mecanismo, desse dispositivo mental de regras que gera frases e que
chamamos tecnicamente de gramática. “O livro a que chamamos “gramática” é
apenas
uma
tentativa
aproximada
de
representar
esse
sistema
mental,
fundamentada em alguma teoria sobre a linguagem humana “ (idem:19).
O que existe, então, são gramáticas diferentes, ou melhor dizendo, distintas
programações lingüísticas mentais, entre o oral e o escrito.
Por isso, a habilidade da mente humana em analisar e reconhecer
corretamente falas, estilos e gramática não é reproduzida satisfatoriamente pelos
computadores, porque mentes e computadores trabalham diferentemente.
Muito ainda precisa ser melhorado quanto às regras contidas no revisor
gramatical eletrônico. Sabemos que a Informática, apesar de seu dinamismo, não
consegue dar conta integralmente da vastidão e dinamismo da língua portuguesa. A
gramática oferecida pelo programa parece, então, realmente tratar-se de uma
gramática que vê a língua como um conjunto de enunciados pré-estabelecidos,
onde não cabem estruturas mais “inovadoras”, mais “soltas”, mais próximas à
modalidade brasileira da língua portuguesa, cotidiana, tão rica em seus usos
lingüísticos, em suas inversões, em sua forma de dizer o pensamento e o
sentimento dos brasileiros.
A nós importa termos tentado conhecer e dar a conhecer o que o revisor
realmente tem a oferecer aos seus usuários, neste momento histórico,
naturalmente.
Por isso, alertamos: os usuários de computador que, ao digitarem textos no
software Word, confiarem demais no seu revisor poderão incorrer em sérios erros,
podendo até mesmo passar por algum tipo de constrangimento causado por sua
ignorância de estruturas eminentemente usuais da língua que está utilizando, as
quais não são apontadas pelo revisor.
Como dissemos anteriormente, para aqueles que dominam melhor a escrita,
a solução é simplesmente ignorar o revisor quando este apresenta sugestões
incongruentes, mas a preocupação é com aqueles que confiam no que ele
apresenta. Acreditamos que essa confiança da parte de algumas - talvez, inúmeras
- pessoas se deva à mera insegurança no próprio conhecimento das regras
aprendidas na escola (ou fora dela) e um pouco de resistência em complementar
107
suas pesquisas por meio de outras fontes; em outras, por ignorância mesmo dessas
regras.
Até que ponto o usuário/redator comum de um texto no computador encontra
dificuldades por não dominar as regras de concordância contidas na gramática
eletrônica não saberemos dizer, mas temos a certeza de que, para quem deseja
escrever um bom texto, com propriedade, é imprescindível o conhecimento do nível
gramatical privilegiado no revisor eletrônico do Word. Isto é, o nível culto da
modalidade escrita da língua, em conformidade com a gramática normativa em suas
regras de concordância nominal prescritas para a linguagem culta contemporânea.
Como todo instrumento criado pelo homem, sempre haverá acusadores e
defensores da existência dos computadores e de sua influência na vida de cada
indivíduo. Todavia, não podemos deixar de reafirmar nosso alerta: o revisor
gramatical eletrônico demonstra ter problemas lingüísticos, e não tecnológicos. E
isso acontece porque sabemos que da linguagem artificial o computador dá conta;
da linguagem natural, não.
Tudo isso não impede que continue havendo questionamentos como: O que
se deve fazer para que o computador “compreenda” uma língua natural? Como
fazer para que uma máquina consiga produzir textos ou falas em uma língua
natural? Chegará o dia em que uma máquina poderá ser capaz de dominar a
sintaxe, o sistema fonológico, as nuanças semânticas e o uso pragmático, entre
outros conhecimentos, de uma língua natural?
Os estudiosos da área da lingüística computacional, como os autores com os
quais trabalhamos (dentre inúmeros outros), acreditam que, algum dia, os
computadores serão capazes, sim, de dominar a linguagem natural de maneira
satisfatória e, assim, interagir de tal modo com os humanos, em uma determinada
língua natural, que não se conseguirá distinguir as respostas da máquina das de um
outro ser humano.
Nesse início do século XXI, temos essa certeza: a informática revolucionou o
pensamento da nossa civilização e, provavelmente, a expressão Assim caminha a
humanidade adquiriu uma nova significação.
Nós... ficaremos à espera do futuro. Ou não.
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA, Napoleão Mendes. Gramática metódica da língua portuguesa: curso
único e completo. 25 ed. São Paulo: Saraiva, 1975.
BECHARA, Evanildo. Moderna gramática portuguesa. 37 ed. Rio de Janeiro:
Lucerna, 1999.
________. Lições de português pela análise sintática. Rio de Janeiro: Lucerna,
2001.
BERBER-SARDINHA, Tony. (org.) A língua portuguesa no computador. (Série As
Faces da Lingüística Aplicada). Campinas-SP: Mercado de Letras/EDUC/FAPESP,
2005.
________. (2000b) Lingüística de corpus: histórico e problemática, in Revista
D.E.L.T.A., vol. 16, n.2 [ www.scielo.br/delta].
________.(2000c) O que é um corpusè representativo?. São Paulo: LAEL PUCSP
[lael.pucsp.br/direct].
CEREJA, William R. & MAGALHÃES, Thereza C. Gramática reflexiva: texto,
semântica e interação. São Paulo: Atual Editora, 1999.
CHOMSKY, Noam. Linguagem e mente. Brasília: Universidade de Brasília, 1998.
CONSOLARO,
Hélio.
Revisor
do
Word.
www.portrasdasletras.com.br. Acessado em 21/02/2006.
Disponível
em
COSCARELLI, Carla Viana e MARTINS, Else. Viciados em F7? Nossa resposta ao
JB (27/09/2001). In Jornal do Brasil. BH, out de 2001.
COSERIU, Eugênio. Teoria da linguagem e lingüística geral. Trad. Agostinho Dias
Carneiro. Rio de Janeiro: Presença/editora da USP, 1979.
ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e
adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004.
KURY, Adriano Gama. Novas lições de análise sintática. 9 ed. São Paulo: Ática,
1999.
GENOUVRIER, Emile & PEYTARD, Jean. Lingüística e ensino do português. Trad.
Rodolfo Ilari. Coimbra: Livraria Almedina, 1973.
GREIMAS, A.J. & COURTÉS, J. Dicionário de semiótica. São Paulo: Cultrix, s/d.
JORNAL DO BRASIL. Viciados em F7. Quinta-feira, 27 de setembro de 2001. (s/a)
109
LOBATO, Lúcia M. P. Sintaxe gerativa do português: da teoria padrão à teoria da
regência e ligação. Belo Horizonte: Vigília, 1986.
LOPES, Edward. Fundamentos da lingüística contemporânea. São Paulo: Cultrix,
1993.
LUCCHESI, Dante. Espelho de contrastes. In revista Discutindo Língua Portuguesa,
nº 5, ano 1. São Paulo: Escala Educacional, 2006, p.20-23.
________. As forças da língua. In revista Discutindo Língua Portuguesa, nº 6, ano 1.
São Paulo:Escala Educacional,.2007, p. 18-21.
MANOSSO, Radamés. O software que nos corrige. In: revista Discutindo Língua
Portuguesa. Ano I, nº 3, 2006, pp.24-27.
CÂMARA Jr., J Mattoso. Estrutura da língua portuguesa. Petrópolis: Vozes, 1970.
________. Princípios de lingüística geral. Rio de Janeiro: Acadêmica, 1970.
________. História e Estrutura da Língua Portuguesa. Rio de Janeiro: Padrão, 1975.
NEVES, Maria Helena de Moura. Gramática de usos do português. São Paulo:
Editora UNESP, 2000.
OTHERO, Gabriel de Ávila & MENUZZI, Sérgio de Moura.
computacional: teoria e prática. São Paulo: Parábola Editorial, 2005.
Lingüística
PERINI, Mário. Para uma nova gramática do português. São Paulo: Ática, 1985.
RICH, Elaine. & KNIGHT, Kevin. Inteligência Artificial. São Paulo: Makron Books,
1993.
RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T.,
FILLIÉ, Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da
construção de um revisor gramatical automático para o português. Estudos
Lingüísticos. São Paulo, 2002.
SAUSSURE, Ferdinand de. Curso de lingüística geral. 3.ed. São Paulo: Cultrix,
1971.
VANOYE, Francis. Usos da Linguagem: problemas e técnicas na produção oral e
escrita. 11.ed. São Paulo: Martins Fontes, 1998.
VIEIRA, R. Lingüística computacional: fazendo uso do conhecimento da língua.
Entrelinhas, ano 2, n.4, São Leopoldo: Unisinos, 2002.
http://www1.uol.com.br/vestibuol. Acessado em 20/11/2005.
http://www.forcesystem.com. Acessado em 28/9/2005.
110
http://labbi.uesc.br/apostilas. Acessado em 16/2/2006.
http://www.amigomouse.com.br/produtos. Acessado em 16/2/2006.
http://www.inf.ufrgs.br. Acessado em 8/3/2006.
http://www.prohpor.ufba.br/projetogram. Acessado em 23/5/2006.
http://inventabrasilnet.t5.com.br/revgram.htm. Acessado em 28/6/2006.
http://intervox.nce.ufrj.br/~edpaes/historia.htm. Acessado em 21/7/2006.
http://www.dc.usfcar.br. Acessado em 1º/9/2006.
http://www.faced.ufba.br. Acessado em 5/10/2006.
http://www.portugues.com.br. Acessado em 19/10/2005.
.
ANEXO A
Informática: símbolos digitais e glossários
112
Símbolos digitais
Todos os computadores utilizam números binários – o código de máquinas para representar letras, números e símbolos escritos. Esses “códigos” de
computador foram padronizados primeiro com o American Standard Code for
Information Interchange (ASCII), em 1963.
O ASCII é, hoje, utilizado por todos os computadores pessoais nos países
que se valem do alfabeto romano e emprega uma seqüência de oito dígitos binários
(ou “bits”) para representar 128 caracteres.
É o que basta para codificar letras minúsculas e maiúsculas,
numerais, sinais de pontuação e 32 “caracteres de controle”
especiais que governam as funções do computador – com mais 128
caracteres “estendidos”, como letras acentuadas e não-latinas e
símbolos gráficos. (Enciclopédia Seleções, 2004:453)
Funciona mais ou menos assim, transcrevendo aqui o exemplo fornecido pela
obra citada acima:
Número binário
00010010
01000001
01101011
10100100
Decimal equivalente
Caractere codificado
36
65
107
164
S
A
k
ñ
Dessa maneira, quando se aperta a tecla “k”, isso gera o código de
máquina 107, que é convertido no número binário equivalente
(01101011). O sinal de código binário pode então ser processado
pelo computador, e a letra “k” aparece na tela diante do usuário – e
tudo isso se passa em microssegundos. Línguas como chinês e
japonês, porém, possuem muito mais caracteres distintos que
precisam ser representados por 16 dígitos binários. (idem)
Um brevíssimo Glossário
Apresentamos, agora, alguns termos-chave do universo computacional, a
título de ilustração e também de informação aos que ainda não os sabem.
Transcreveremos o que traz a Enciclopédia, às páginas 448-453, na qual estamos
nos baseando para compor este início de capítulo.
•
Binário – Sistema baseado nos algarismos 0 e 1.
113
•
BIOS – Chip que controla as funções básicas do computador. Armazena
dados vitais mesmo quando o computador está desligado. Inclui instruções
para dar “boot” (partida) no computador.
•
Bit – Dígito binário. Menor unidade de informação.
•
Buffer – Memória temporária que contém dados prontos para uso.
•
Bus – Fiação principal na placa-mãe.
•
Byte – Grupo de oito bits; representa – em binário – um número de 0 a 250
ou um símbolo.
•
CD-ROM – CD que armazena dados ou programa. Um único CD-ROM pode
armazenar 112 milhões de palavras de texto digital – cerca de duas vezes a
Enciclopédia Britânica.
•
Chips controladores – Chips especiais executam funções como gráficos e
controlam componentes como os drives de disco rígido.
•
CPU (Unidade central de processamento) – Chip microprocessador,
responsável pela maior parte do trabalho da máquina, processando dados e
coordenando os dispositivos de entrada, saída e armazenamento.
•
Drives (acionadores) de disco flexível, CD-ROM e/ou DVD-ROM – Vários
tipos de dispositivos de armazenamento de dados que usam discos
removíveis – variando em capacidade de 1,4 megabytes num disco flexível a
vários milhares de megabytes num DVD-ROM.
•
Drive de disco rígido – Local principal e permanente de armazenamento de
dados e programas. Armazena dados como sinais magnéticos em código
binário em discos de metal. Os dados são “lidos” e “escritos” nos discos por
pequenas cabeças magnéticas.
•
DVD – Disco de capacidade dados ou programas.
•
Arquivo – Código ou dados mantidos juntos numa unidade.
•
Hardware – Componentes físicos do computador.
•
Microprocessador – É o “cérebro” do computador, o microchip que processa
dados em alta velocidade, segundo instruções programadas.
•
Microchips – Componentes elétricos em miniatura interligados numa placa
de circuito.
•
Modem – Aparelho que liga o computador à linha telefônica.
114
•
Placa-mãe – Placa com circuito impresso, que contém os principais
microchips do computador.
•
Rede – Dois ou mais computadores conectados.
•
RAM – Memória de computador que pode ser alterada. Composta de
microchips que armazenam dados e programas em uso. Os dados da RAM
se perdem quando o computador é desligado.
•
ROM – Memória que não pode ser apagada.
•
Software – Instrução ou programa que diz a um computador o que fazer. Há
quatro tipos de software:
* Sistema Operacional (SO) – Controla o computador efetuando
tarefas do dia-a-dia, como receber dados do teclado, exibir informação
na tela ou armazená-la num disco rígido. Funciona sempre que o
computador está ligado. Os usuários em geral interagem com o SO
através de uma interface gráfica (GUI) e do teclado.
* Aplicativos – Programas criados para executar tarefas específicas.
Incluem processadores de texto (WP); controle de banco de dados
(para armazenar detalhes de estoque e clientes, por exemplo);
editoração eletrônica (DTP); e planilhas para cálculos e orçamentos.
* Software de periféricos – Os scanners, câmeras digitais,
impressoras e outros aparelhos precisam de software para ligá-los ao
computador.
* Utilitários – Fazem a tarefa de “manutenção da casa”, como verificar
arquivos de dados em busca de vírus, reparar danos ao disco rígido e
assegurar uma armazenagem eficiente de dados.
•
Vírus – Programa nocivo que se reproduz.
Glossário “internético”
Alguns termos-chave da Internet, encontrados na Enciclopédia Seleções
(2004:456-457):
•
E-mail Correio Eletrônico – usa a Internet para transmitir mensagens
entre usuários.
115
•
GIF – Graphic Interchange Format – formato comprimido para
transmissão de gráficos.
•
Hipertexto – sistema de texto clicável, surgido em 1965 e posteriormente
usado para ligar páginas da Web.
•
HTML – Hyper Text Markup Language – linguagem de programação
usada para criar páginas da Web.
•
HTTP – sistema para envio de arquivos de hipertexto (páginas da Web)
pela Internet.
•
ISP – Internet Service Provider – organização que conecta os assinantes
à Internet.
•
JPEG – Joint Photographic Experts Group – formato comprimido, usado
para transmissão de gráficos.
•
Logo on/off – senha digital para conectar-se ou desconectar-se da
Internet ou de um determinado servidor da rede.
•
Modem – Modulador-Demodulador – dispositivo para converter dados
digitais em analógicos e vice-versa, permitindo ao computador usar linhas
telefônicas.
•
MPEG – Moving Pictures Experts Group – formato comprimido, usado
para transmitir arquivos de vídeo.
•
MP3 – formato comprimido de arquivo de música.
•
POP - Point of Presence – um número de telefone do qual o usuário pode
discar para um sistema ISP e assim conectar-se à Internet.
•
Servidor – computador ou programa que oferece serviços (como acesso
ou armazenamento de arquivos da rede, ou encaminhamento de e-mails).
•
TCP/IP – Transmission Control Protocol/Internet Protocol – sistema que
movimenta dados pela Internet, criado por Vint Cerf e Robert E. Kahn.
•
URL - Uniform Resource Locator - nome do endereço de uma página da
rede. O termo foi criado por Tim Berners-Lee quando este criou a World
Wide Web (WWW) e sua URL, padrões HTML e http.
•
WAP - Wireless Application Protocol – método para acessar páginas da
rede em celulares.
Fonte: ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e
adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004.
Anexo B
ReGra: Revisor Gramatical do Word
117
Transcrição de parte do artigo publicado pelo Núcleo Interinstitucional de Lingüística
Computacional – NILC
RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T., FILLIÉ,
Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da construção de um revisor
gramatical automático para o português. Estudos Lingüísticos. São Paulo, 2002.
“A desambigüização lexical (caso “a”) torna-se pertinente porquanto, como já
foi referido, a homografia em língua portuguesa não é fenômeno raro, induzindo
freqüentemente a erros de diagnóstico uma ferramenta que, diferentemente do ser
humano, e na ausência de estratégias de representação da estrutura semânticopragmática dos enunciados lingüísticos, não pode contar senão com a forma, com a
freqüência de ocorrência e com a distribuição das palavras nas sentenças para
proceder ao processamento. A freqüência de ocorrência aparece, no ReGra, como
principal mecanismo de desambigüização lexical, apesar de, em muitos casos, a
ferramenta pouco aproveitar a prioridade de classificação, por não serem
exatamente nítidas as diferenças entre as probabilidades de ocorrências de
itens lexicais muito utilizados em mais de uma acepção gramatical. Neste caso,
é necessária a consideração de critérios distribucionais de diferenciação entre o uso
das palavras, com a delimitação dos contextos de ocorrência dos itens lexicais,
principalmente na situação da vizinhança imediata que se estabelece no
intervalo de um a cinco tokens. (...) No entanto, é forçoso considerar que os
etiquetadores concorrentes partem de um pressuposto estranho e inverso ao do
ReGra: supõem serem corretas as sentenças de entrada. Por este motivo, a
margem de indefinição do revisor é consideravelmente mais expressiva do que a
verificada em outros contextos do PLN, sendo muitas decisões lexicais adiadas
para o processamento sintático, nem sempre hábil o suficiente para capturar a
correta categorização gramatical das palavras. Para evitar a explosão
combinatória devida à indefinição lexical, restringimos o escopo de atuação do
revisor à oração simples, isolando para processamento, sempre que possível,
as coordenações e subordinações. Com a inevitável perda das relações de
dependência entre as várias orações de um período composto, o espectro de
problemas a serem resolvidos também foi restrito. Entretanto, na análise do
desempenho final, essa contingência revelou-se preferível à proliferação das
intervenções indevidas, com riscos à credibilidade do ReGra.
118
A etapa de processamento gramatical, propriamente dita (caso “b”), diretamente
relacionada à verificação da adequação gramatical da sentença de entrada, está
subdividida em três subcomponentes: a verificação de boa-formação sintática da
sentença, a etiquetação sintática de seus itens lexicais durante o parsing e a
verificação da consistência das relações de dependência entre os mesmos, com
correspondente aconselhamento ao usuário. O formalismo gramatical definido
para reconhecer sentenças bem-formadas, segue uma gramática livre de
contexto, cujo conjunto de regras de produção torna-se diretamente operacional
com as redes sintáticas (ATNs), responsáveis por derivar a sentença de entrada,
processo realizado de forma top-down, da esquerda para a direita, a partir do
símbolo inicial da gramática, com o auxílio de uma janela de geração de dimensão
variada, para evitar ciladas sintáticas freqüentes, particularmente devidas aos
problemas de desambigüização lexical. O parser apresenta como resultado uma
única possibilidade de estruturação sintática: a mais provável, segundo escolhas
gramaticais realizadas também com base na prioridade de freqüência (de suas
regras), definida a partir da análise de fragmento expressivo do corpus do NILC.
Há dois subconjuntos de regras de revisão: as pontuais, que acompanham
padrões fixos de distribuição sintática, pouco ou nada dependentes do parsing, e as
genéricas, que operam diretamente sobre a saída do parser. As primeiras,
numericamente expressivas, são extremamente eficientes, mas possuem alcance
limitado, pois se restringem a problemas de adequação lexical e ao uso de
padrões lingüísticos já registrados nas gramáticas normativas do português
(p.ex., uso de crase diante de palavras masculinas). As segundas, muito menos
numerosas e muito mais abrangentes que as anteriores, investigam as
relações de concordância e regência entre os itens lexicais etiquetados
sintaticamente. Como a saída do parser é falível, devido a indeterminações
lexicais ou a outros acidentes de processamento, o conjunto dessas regras induz
freqüentemente a ferramenta a erro.
O pós-processamento gramatical (caso “c”) consiste na identificação
precisa do desvio da norma, para o aconselhamento correspondente.
Constatada, por meio de qualquer um dos tipos de regras de revisão, a má
formação
de
alguma
estrutura
utilizada
pelo
usuário,
dispara-se
imediatamente a medida de revisão correspondente, que indicará a existência
do problema e proporá nova estrutura, a ser aceita ou rejeitada pelo usuário,
119
para que se possa persistir na verificação da sentença. Diferentemente do
aconselhamento ortográfico, que é feito pela combinação sistemática dos caracteres
da palavra não-encontrada no dicionário, o aconselhamento gramatical depende
profundamente do processamento nos níveis anteriores, razão pela qual o
aconselhador retroalimenta a revisão gramatical.”
Os resultados de testes comparativos de desempenho do ReGra obtidos pelo
NILC são, segundo os próprios pesquisadores, bastante animadores, haja vista que,
“numa avaliação global, testes de ambos os tipos demonstraram que qualquer
versão do ReGra apresenta um desempenho geral superior aos dos seus
concorrentes.
Conforme informações do NILC, para efeito de análise a atuação do ReGra
foi dividida em quatro categorias de intervenção: verdadeiros negativos (a
ferramenta não deveria intervir e não intervém), verdadeiros positivos (deveria
intervir e intervém), falsos negativos (deveria intervir e não intervém) e falsos
positivos (não deveria intervir mas intervém). Estes testes determinaram que:
a) a revisão gramatical e ortográfica automática é não apenas
possível, mas viável e útil, já que a ferramenta identifica 60,52% dos
problemas praticados pelo usuário (na situação de teste) e se omite
em apenas 17,84% dos casos; b) o preço pago para a identificação
de mais da metade das inadequações praticadas pelo usuário ainda
é alto (o número de falsos positivos ainda é maior do que o número
de verdadeiros positivos) e que as estratégias utilizadas para
reduzir o comportamento inadequado da ferramenta não têm
produzido os efeitos esperados, já que as diferenças entre as várias
versões são bem pouco significativas, se considerado o conjunto de
sentenças que compõem o corpus de teste. Estabelece-se,
portanto, como diretriz futura, mais do que a ampliação do escopo
de atuação da ferramenta (para o incremento de número de erros
identificados), uma revisão mais radical nas regras já existentes,
para que se reduza o número, ainda excessivo, de falsos
positivos. (grifo nosso)
ANEXO C
Telas de Aconselhamento da
Gramática Eletrônica do Word
Algumas “dicas” (aconselhamento) do revisor gramatical eletrônico sobre
outros aspectos, que não apenas a concordância nominal, com os quais nos
deparamos, durante a digitação do texto dessa pesquisa, sublinhados com a linha
ondulada verde. Servem a título de ilustração e também de exemplificação de
alguns
dos
aspectos
que
ainda
pesquisadores/idealizadores do revisor.
precisam
ser
“melhorados”
pelos
121
Tela 1
Sugestão do corretor: mal. Explicação: As palavras “mal” e “mau” são,
respectivamente, adjetivo e advérbio. Uma regra prática para verificar sua
utilização correta no texto consiste em substituí-las pelos seus antônimos (“bem” e
“bom”), e verificar se a frase resultante tem sentido. (grifo nosso, em negrito, para
mostrar que a gramática do revisor considera como adjetivo (“mal”) e como advérbio
“mau”, quando se sabe que prescrito pela gramática normativa é o inverso).
Tela 2
122
Tela 3
Tela 4
Tela 5
123
Tela 6
Tela 7
Tela 8
124
Tela 9
Tela 10
Tela 11
125
Tela 12
Tela 13
Tela 14
126
Tela 15
Tela 16
Tela 17
127