HENRIETTE MARCEY ZANINI A CONCORDÂNCIA NOMINAL E O REVISOR GRAMATICAL ELETRÔNICO DO WORD Cuiabá 2007 HENRIETTE MARCEY ZANINI A CONCORDÂNCIA NOMINAL E O REVISOR GRAMATICAL ELETRÔNICO DO WORD Dissertação apresentada ao Programa de Mestrado em Estudos de Linguagem da Universidade Federal de Mato Grosso – UFMT, como requisito parcial para obtenção do título de Mestre em Estudos de Linguagem. Área de concentração: Estudos Lingüísticos Orientadora: Profª. Drª. Alice Maria Teixeira Saboia Instituto de Linguagens da UFMT Cuiabá 2007 Dedico e agradeço... A Wendy e Tayná, amores e razões primeiras de todo meu viver. A minha mãe, Marley, guerreira que, entre outras coisas, me ensinou a nunca desistir, por mais árdua, longa e acidentada se mostrasse a minha trilha. A meu pai, Toni, onde quer que ele se encontre depois de ter partido para os Campos Elíseos. Demorou, mas hoje eu sei que ele realmente acreditava que eu podia realizar qualquer coisa que me propusesse a fazer. A minha irmã Andréa, que, uma semana antes da minha defesa, foi levada para trabalhar no departamento dos anjos de Deus. Minha maior incentivadora, em tudo! Aos meus irmãos, Luiz Francisco, Jeancarlo e Thiago (e suas famílias), por terem, principalmente, “agüentado” minhas reclamações, meu cansaço, muitas vezes meu desânimo, e porque sem eles, ao meu lado, sou menos gente. Ao Toninho, que de um modo muito especial também me acompanhou nessa jornada. A minha avó, Natalina Ellert, que aos 91 anos teima em dizer a todos com quem conversa que, agora, eu sou “doutora”; a minha tia Sirley, que soube entender minhas angústias e acalmar meu coração; a minha tia Leda, com quem aprendi a amar os livros e a música. A minha amiga-irmã Vera Lúcia Eilert, por seu incentivo constante e fé absoluta no “meu poder”, e pelos fichamentos que me ajudou a fazer. Às minhas amigas do coração, Tereza Sartori, Terezinha Konopaktzi, Irene Cajal, Luzia Guimarães, Vera Lúcia Lopes, Mariângela Sola López Díaz, Sônia Zaramella, Ana Maria de Souza e Maura Guimarães. Cada uma, à sua maneira, me apoiou, me ajudou, me “empurrou”, iluminando meu caminhar. Aos amigos queridos, Lívio Wogel, Delarim Martins Gomes e Javier Eduardo López Díaz, pelo “ombro” e pela ajuda incondicional sempre que precisei. À minha turma do Mestrado, amigos inesquecíveis, meus Professores de Vida: Carmen Hornick, Caroline Akie, Degmar dos Anjos, Edsônia Melo, Marcelo Silvestrim, Neusa Phillipsen, Paula Jeorgea, Rodney Mendes de Arruda e Ruth Dourado. A meus professores, formadores de mais um pouco de mim: Denise Dal’Bello, Lúcia Helena Vendrúsculo Possari, Manoel Mourivaldo, Marcos Moura Vieira, Maria Inês Pagliarini Cox, Maria Rosa Petroni e Marieta Prata. À minha professora-orientadora Profª. Drª. Alice Maria Teixeira Sabóia que, sem me conhecer e contra todas as probabilidades, acreditou firmemente que eu pudesse fazer um trabalho de qualidade. Agradeço, em especial, à banca de avaliação: Profª. Drª. Maria Inês Pagliarini Cox e Prof. Dr. Cláudio Cezar Henriques, por tão generosamente despenderem seu tempo para compartilharem comigo uma parte do seu imenso conhecimento. Henriette Marcey Zanini Os limites da minha linguagem são os limites do meu mundo. Wittgenstein RESUMO ZANINI, Henriette Marcey. A concordância nominal e o revisor gramatical eletrônico do Word Resumo: Esta dissertação aborda o revisor gramatical eletrônico do “Microsoft Office Word” para o português. Recorta-se em especial a aplicação da regra de concordância nominal, testada esta em exemplos extraídos de três gramáticas diferenciadas entre si, pelo modelo teórico-metodológico utilizado no tratamento da linguagem verbal, para detectar o modelo gramatical subjacente ao revisor estudado. Neste trabalho busca-se entender como se comporta o revisor gramatical quanto às regras de concordância nominal contidas em sua gramática, comparando-as às da gramática normativa e às dos usos cotidianos do português brasileiro padrão. Os resultados da análise do material permitem inferir que o modelo adotado pela referida ferramenta computacional assenta-se, em parte, na gramática tradicional, no que tange à regra geral, deixando, todavia, de observar as regras excepcionais prescritas. Palavras-chave: revisor gramatical eletrônico, concordância nominal, norma lingüística Abstract: This paper approaches the automatic grammar checker of the Microsoft Office Word for Portuguese Language. It observes especially the use of the nominal concordance rulers, tested themselves through examples from three diferent grammar books, by a theoretical and methodological model used in the treatment of verbal language, in order to detect the grammatical model that underlies the focused checker. Here, we search to understand how the grammar checker behaves itself facing nominal concordance rulers in its grammar, compare them with those into the normative grammar and the daily uses of standard Brazilian Portuguese. The results of the analysed material take us to grasp that the adopted model by the automatic grammar checker settling is based partly on the traditional grammar, relating to general rule, but it doesn’t observe the excepcional rules prescribed by that grammar. Key-words: automatic grammar checker, nominal concordance, linguistic rule SUMÁRIO Dedicatória e agradecimentos................................................................................ iii Epígrafe.................................................................................................................. iv Resumo/Abstract.....................................................................................................v INTRODUÇÃO ......................................................................................................07 Capítulo I – METODOLOGIA ................................................................................13 Capítulo II – O ADVENTO DO REVISOR GRAMATICAL ELETRÔNICO .............18 2.1 A Lingüística Computacional................................................................19 2.2 A Sintaxe Computacional .....................................................................24 2.3 O Revisor Gramatical Eletrônico ..........................................................30 2.3.1 Como “nasceu” o Revisor ......................................................41 2.3.2 Como funciona o revisor gramatical do Word........................49 Capítulo III – A CONCORDÂNCIA NOMINAL .......................................................55 3.1 Em Napoleão Mendes de Almeida.......................................................57 3.2 Em Evanildo Bechara...........................................................................66 3.3 Em Maria Helena Moura Neves ...........................................................78 Capítulo IV – O (DES)COMPASSO ENTRE AS NORMAS DE CONCORDÃNCIA NOMINAL CONSTANTES NAS TRÊS GRAMÁTICAS E NO REVISOR ELETRÔNICO ...................84 Capítulo V – CONCLUSÃO .................................................................................101 REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................108 ANEXO A - Informática: símbolos digitais e glossários.......................................111 ANEXO B - O ReGra: Revisor Gramatical do Word ............................................116 ANEXO C - Telas de Aconselhamento da gramática eletrônica do Word ...........120 Introdução As línguas são de certo modo seres que nos rodeiam e nos iluminam como grandes arcanjos viventes: é necessário lhes dar um espaço interior de acolhida e estar dispostos a escutá-los e a lhes prestar atenção. Ivonne Bordelois (1934-), lingüista argentina. Desde o começo dos primeiros estudos lingüísticos a preocupação com a norma, a preocupação no sentido de fixar o “bom uso” e a correção estão dentre as motivações mais fortes que levaram os estudiosos a descrever as línguas, resultando na seleção de uma determinada modalidade lingüística em detrimento de outras consideradas vulgares, impuras, incorretas, ilegítimas. Apoiada nesse pressuposto, toda a tradição lingüística ocidental atribuiu duas funções básicas ao gramático: dizer o que a língua é, descrevendo-a, e, simultaneamente, dizer o que ela deve ser. Desta forma, não é de se estranhar a ênfase no fato de a linguagem ser considerada um procedimento importantíssimo, que qualifica ou desqualifica, pela forma utilizada, o que é dito e quem o diz. Essa preocupação com o bom, com o adequado uso da linguagem encontra-se vividamente dentro de empresas, de órgãos públicos, nas redações de grandes jornais, para citar apenas alguns exemplos, e tem suscitado o aparecimento de programas de aperfeiçoamento, fazendo surgir um número considerável de manuais de cultura idiomática. Com a Internet, vários passaram a ser disponibilizados para consulta on-line, na tentativa de agilizar a vida do usuário que não dispõe, no momento em que precisa, de material impresso para tirar suas dúvidas em relação ao uso considerado correto do seu idioma. Hoje, usuários que necessitam redigir um texto, e que não são tão proficientes na escrita da língua portuguesa, encontram à sua disposição alguns softwares de correção gramatical desenvolvidos para auxiliá-los no momento de escritura de seus textos. Interessa-nos, aqui, particularmente, falar sobre o revisor gramatical eletrônico do Microsoft Word, o programa de edição de textos mais utilizado no mundo, e objeto de nossa pesquisa. 8 A idéia de trabalhar com este tema nasceu da observação de inadequações sintáticas no que diz respeito às concordâncias verbal e/ou nominal, apresentadas, principalmente, em textos de alunos de graduação. Inicialmente nos parecia que eles não procediam a uma revisão gramatical de seus escritos, porém como asseguravam que “pediam ajuda ao computador”, mais especificamente à tecla F7, percebemos a necessidade de averiguar o que se passava. Não costumávamos utilizar o recurso de clicar em Ferramentas: ortografia e gramática (desconhecíamos, ainda, que o atalho era a tecla F7) por dois simples motivos: primeiro, pelo conhecimento razoavelmente bom do idioma, e por recorrermos constantemente ao dicionário e à gramática; segundo, a quase total falta de intimidade com a maioria dos recursos computacionais, ou seja, a não utilização nem de 1/3 dos recursos que o computador oferece, entre eles como procurar a ajuda do revisor, quer ortográfico, quer gramatical. Então, ao começarmos a expor ao revisor eletrônico do Word alguns problemas lingüísticos apresentados pelos alunos, acabamos nos deparando com outros problemas que ele nos apresentava. Parecia analisar e sugerir alterações aleatoriamente, como se não houvesse um padrão que seguisse. Referimo-nos a padrão, aqui, como regras ditadas pela gramática normativa da língua portuguesa. E o mais preocupante é que para os usuários do revisor, ou seja, para as pessoas que não têm um conhecimento maior de estruturas sintáticas e regras de concordância, ele é tido como um instrumento confiável de colaboração para a correção gramatical de seus escritos. Vale uma ressalva, aqui: o termo “corretor” tem como sinônimos “revisor” e “verificador”. Optamos por utilizar com maior freqüência o termo revisor, primeiro por achá-lo, particularmente, mais adequado e, em segundo, porque é esse termo que aparece na configuração do Microsoft Office Word, presente em cada PC, tanto para Revisor Ortográfico quanto para Revisor Gramatical. Assim, é natural que, em virtude das tentativas vãs em entender a lógica com que o revisor operava, algumas interrogações começaram a nos atiçar a curiosidade, tais como: por que a descrição gramatical do revisor eletrônico não diz respeito à verificação de grande parte das estruturas usuais do português do Brasil em relação às regras de Concordância Nominal? Que gramática subjaz ao revisor gramatical eletrônico? Trata-se de uma gramática casuística, composta de um 9 elenco de frases, que considera caso a caso? Trata-se de uma gramática que vê a língua como um conjunto de enunciados pré-estabelecidos? Destes questionamentos originou-se a pergunta principal de nossa pesquisa: quais normas constam da memória da gramática eletrônica em relação à concordância nominal? Seguem o modelo tradicional ou não? E, sem respostas imediatas a essas e outras questões, principalmente no retorno das correções feitas nos textos dos alunos, surgiu, então, o desejo de procurar essas respostas por meio de uma investigação científica que desse respaldo às nossas discussões com os alunos quando eles se deparassem com as correções feitas em seus textos e os pedidos para não confiarem tanto no revisor eletrônico, mas, sim, nas velhas e boas regras encontradas nas gramáticas impressas que, sabemos, a maioria não gosta de, ou não sabe como, pesquisar. Aliás, essa confiança no revisor gramatical é um dos aspectos que precisa ser debatido, pois realmente chama a atenção ver como usuários comuns se apóiam no que lhes aconselha o revisor como correção. Confiança não compartilhada com os homens de letras - aqui representados por pessoas com conhecimento maior das normas gramaticais em relação àqueles -, como se pôde perceber, por exemplo, nas opiniões de professores de português, dispostas no subcapítulo dedicado ao funcionamento do revisor. Desta forma, pensamos realizar um trabalho que pretende, por meio da investigação científica, demonstrar qual o grau de (in)adequação da gramática eletrônica, no que diz respeito às regras de Concordância Nominal apresentadas pelo revisor do Word, com relação às regras da gramática normativa e aos usos cotidianos da língua portuguesa. Para saber mais e conseguir chegar a conclusões claras e consistentes para a composição do texto, como um todo, optamos escolher traçar um caminho que, a nosso ver, nos embasaria teoricamente e nos forneceria dados para a compreensão buscada. No primeiro capítulo encontra-se a metodologia, desenhada por nós, uma vez que não conseguimos encontrar no gênero algo com o qual pudéssemos trabalhar. Considerações sobre o revisor gramatical eletrônico estão dispostas no segundo capítulo, bem como considerações acerca da lingüística computacional e da sintaxe computacional. Acerca do revisor, dispusemos as informações que conseguimos (a maioria pela Internet) e que consideramos ainda um pouco 10 inconsistentes para compreender bem a complexidade desta ferramenta de trabalho de que dispõe um usuário de computador quando utiliza um editor de textos. Há testes que fizemos com um anúncio de venda de um revisor gramatical, infelizmente sem nome e sem datação, mas de grande ajuda para o início das reflexões acerca de algo que não conhecíamos ainda. Informações de como proceder – apenas algumas dentre as diversas orientações fornecidas pelo programa - para utilizar o revisor estão no primeiro subcapítulo e, no segundo, quem esteve e está por trás da criação, do desenvolvimento e do aprimoramento dos revisores ortográfico e gramatical para a língua portuguesa utilizados pela Microsoft Word nos computadores que se utilizam do sistema Office Word. O terceiro capítulo é dedicado às noções de concordância – ênfase na concordância nominal - prescritas para o uso do português culto, bem como os capítulos destinados ao assunto pelos três gramáticos escolhidos por nós, com as respectivas telas copiadas quando o revisor detectava um problema com alguma regra. No quarto capítulo, as análises contrastivas entre as normas de concordância nominal constantes nas três gramáticas e no revisor gramatical. Também as respostas para as perguntas iniciais de pesquisa, com as análises julgadas pertinentes. No quinto capítulo, as conclusões a que chegamos. Como anexos, disponibilizamos algumas telas de aconselhamento ofertadas pelo revisor gramatical eletrônico sobre outros tópicos gramaticais, que não apenas a concordância nominal, com os quais nos deparamos, durante a digitação do texto desta pesquisa, sublinhados com a linha ondulada verde. Servem a título de ilustração e também de exemplificação de alguns dos aspectos que ainda precisam ser melhorados pelos pesquisadores/idealizadores do revisor. Há, também, outros dois anexos: do universo da informática retiramos informações sobre o que são símbolos digitais e dois glossários de termos; e a transcrição de um artigo publicado pelo NILC quando da apresentação da última versão do ReGra – Revisor Gramatical. Por ter trabalhado com Napoleão Mendes de Almeida, Evanildo Bechara e Maria Helena Moura Neves, pensamos ser relevante a observação disposta no próximo parágrafo, o que também já nos serve de fecho para esta apresentação. 11 No contraponto entre a gramática eletrônica e as gramáticas citadas acima há um conhecimento que se faz necessário e, para obtê-lo, fizemos no segundo capítulo deste trabalho uma breve incursão aos domínios da lingüística computacional. Breve incursão porque sabemos não haver condições temporais e cognitivas para um aprofundamento nesse tema. Pretendemos apenas compreender melhor como se processa a linguagem que o computador utiliza para reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos, como um programador consegue introduzir regras gramaticais para o uso efetivo do revisor eletrônico. Nesse quesito, trabalhamos principalmente com Othero e Menuzzi (2005) e suas orientações na construção de um parser lingüístico, além de suas reflexões acerca da gramática e das programações de máquinas para responder a comandos de usuários em sua própria língua. Com relação ao trabalho do lingüista, dizem no comentário de orelha do livro: Por trás desse tipo de trabalho, deve estar o lingüista: ele é o cientista que busca compreender coisas como as nuances semânticas de uma expressão, as regras sintáticas de uma língua ou os detalhes de funcionamento de seus sons. É preciso “ensinar” essas coisas ao computador, se quisermos que essa máquina venha a interagir conosco. Pensamos que ensinar, ou reensinar, coisas ao computador depende de estudos como o que pretendemos levar a cabo. Aí reside a importância social que acreditamos ter uma pesquisa como a nossa. Alguns problemas com a gramática eletrônica serão detectados, outros, provavelmente, ficarão “sem sugestões”, haja vista a dificuldade que encontramos com o “humor” da tecla F7: às vezes, aparece a sublinha verde sob uma estrutura frasal e, às vezes, quando a mesma sentença é exposta novamente ao corretor, não aparece sublinhada em verde. Em outras, ainda, o revisor sublinha o texto, mas na janela de ortografia e gramática surge a expressão “(sem sugestão)”, ainda que seja oferecida uma explicação gramatical. (Vide tela na página seguinte.) De qualquer modo, temos a intenção de contribuir, mesmo que timidamente, para que novos estudos sejam realizados no intuito de se melhorar o desempenho da gramática eletrônica do Word, ao menos quanto às regras de concordância nominal contidas nela. 12 Capítulo I - Metodologia Em virtude de não conseguirmos encontrar um modelo metodológico o qual servisse à nossa intenção de demonstrar a adequação ou a inadequação do revisor gramatical eletrônico do Microsoft Office Word, houve a necessidade de desenhar um método próprio, sem a mínima pretensão ou ilusão de que seja algo inteiramente novo. Para buscar e encontrar respostas às dúvidas suscitadas e relatadas na parte introdutória deste trabalho, a pesquisa objetivou alcançar: • um inventário dos critérios utilizados para a organização do revisor gramatical do Word; • as normas (ou pelo menos uma boa parte delas) de Concordância Nominal constantes da memória gramatical eletrônica, verificando se seguem ou não o modelo tradicional; • exemplos de quais sentenças, dentre as submetidas e consideradas gramaticais, são reconhecidas pelo revisor, como também de sentenças tidas como corretas gramaticalmente, usuais, e que não são reconhecidas por ele; • e, ainda, a identificação de qual(is) nível(is) de linguagem é(são) contemplado(s) pela gramática do revisor do Word e pelas gramáticas utilizadas para retirada de exemplos para o corpus da pesquisa, aproximando-os ou afastando-os, conforme resultados obtidos. Alcançar estes objetivos nos auxiliará a encontrar resposta para a pergunta principal de nossa pesquisa: 1. Que normas constam da memória da gramática eletrônica em relação à Concordância Nominal? Seguem o modelo tradicional ou não? E também para responder às questões auxiliares: 1. Por que a descrição gramatical do revisor eletrônico não diz respeito à verificação de grande parte das estruturas usuais do português do Brasil em relação às regras de Concordância Nominal? 14 2. Que gramática subjaz ao revisor gramatical eletrônico? Trata-se de uma gramática casuística, composta de um elenco de frases, que considera caso a caso? Trata-se de uma gramática que vê a língua como um conjunto de enunciados pré-estabelecidos? Nosso universo de pesquisa abrangeu a gramática eletrônica do Word e as gramáticas de Napoleão Mendes de Almeida: Gramática metódica da língua portuguesa, numa edição de 1975, a Moderna gramática portuguesa, edição 1999, de Evanildo Bechara, e a Gramática de usos do português, publicada em 2000, de Maria Helena Moura Neves. Esses autores foram escolhidos por suas abordagens bem diversas no trabalho com a gramática normativa da Língua Portuguesa, além da distância temporal existente entre as publicações de seus estudos gramaticais, principalmente entre Napoleão e Bechara. O primeiro, de cunho purista; o segundo, um gramático tradicional de formação lingüística mais recente, tradutor de um dos maiores pensadores da lingüística moderna, Coseriu; e Moura Neves, de tradição filosófica, que distingue o que é prescrição e o que é uso na língua, servindo como contraponto a Napoleão e Bechara. O procedimento de coleta consistiu na verificação e extração de sentenças fornecidas como exemplos das regras de concordância nominal encontradas nas gramáticas dos autores citados no parágrafo anterior. Para isso, os capítulos, de cada uma das gramáticas dedicados ao tema, foram redigitados por nós para que as próprias regras de concordância fossem submetidas ao crivo do revisor gramatical. Os textos redigitados encontram-se no capítulo III. A cada vez que, na redigitação, aparecia a sublinha verde, o revisor era consultado. As telas com a amostragem da marcação verde do revisor e as sugestões e explicações gramaticais fornecidas por ele encontram-se nos corpos dos capítulos escolhidos, imediatamente após a regra de concordância explicitada e não reconhecida e/ou aceita pelo revisor. O mesmo procedimento descrito acima foi feito durante a redação deste trabalho, com as telas impressas servindo como “prova”. Alguns exemplos não são especificamente de problemas de concordância nominal, porém achamos interessante mostrá-los porque nos auxiliaram na análise do que chamamos de 15 “humores da F7”, a tecla de atalho para a janela de Ferramentas: Ortografia e Gramática. Para conseguirmos as telas impressas, aprendemos que devemos proceder aos seguintes passos: 1º) selecionar a palavra/expressão/frase; 2º) apertar a tecla F7 (atalho, mais rápido); 3º) apertar a tecla Print Screen SysRq, à direita, superior, do teclado alfabético; 4º) posicionar o cursor em um documento do Word e, então, “colar” por meio de CtrlC ou do botão direito do mouse. Depois, apenas redimensionar tamanhos, de acordo com a necessidade. O procedimento de análise consistiu em colher as sugestões fornecidas pelo revisor gramatical eletrônico - ou não fornecidas, pois, às vezes, ele sublinha, mas não tem sugestões a dar (vide exemplo na tela abaixo) -, além de colher as explicações gramaticais (regras e “dicas”) que o revisor apresenta para, no final, comparar quais concordâncias, exemplificadas nas gramáticas, o revisor reconhece ou não como corretas. 16 Interessante explicar que algumas sentenças são detectadas pelo revisor, outras não, conforme a configuração do computador no qual se está trabalhando. Por isso, serão encontradas telas neste trabalho com cores diferentes, pois foram copiadas de máquinas diferentes em configuração. As telas que aparecem na cor cinza, como esta acima, e principalmente as que se encontram nos capítulos redigitados de Napoleão Mendes de Almeida e Maria Helena Moura Neves respectivamente, foram retiradas de uma máquina com a seguinte configuração: Microsoft Office Word 2000 Sistema Windows XP Home Versão 2002 – Service Pack 2 Computador: Intel® Celeron ™ processador 1100 MHz, 128 MB de RAM Itautec/Philco S.A., 2001. Já as telas em cor azul, maioria, foram copiadas do nosso computador pessoal, que traz as seguintes informações de configuração: Microsoft Office Word 2003 Sistema Windows XP Professional Edição 2003 Versão 2002 – Service Pack 2 Computador: AMD Duron™ processador 950 MHz, 248 MB de RAM Itautec/Philco S.A., 2001. É importante a observação de que as duas máquinas trazem tanto o Revisor Ortográfico quanto o Revisor Gramatical para Língua Portuguesa na sua versão 7. Já foi lançado, pela Microsoft, para download inclusive, o Office 2007, porém não o quisemos conhecê-lo ainda, nem analisá-lo, porque acreditamos que seriam necessárias algumas reformulações neste texto, para o que não há mais tempo hábil, além do que recebemos a informação de especialistas no assunto de que o novo programa necessita, para funcionar bem, de um computador com mais recursos, mais potência para suportar as novas ferramentas. O que também não é o caso do computador com o qual estamos trabalhando. Em resumo, nosso universo de pesquisa foi extraído das gramáticas dos autores mencionados acima e da gramática encontrada no revisor eletrônico do 17 Word. Trabalhamos com um critério de análise que passou pelo método comparativo para encontrar respostas às nossas questões de pesquisa, porém essa pesquisa teve caráter predominantemente qualitativo. Este, enfim, é um trabalho que requereu muito esforço, principalmente pela ausência de similares no tema. Resta de bom o conhecimento adquirido e a tentativa de abordagem inicial para futuros outros estudos. No capítulo a seguir, considerações sobre lingüística e sintaxe computacionais e, também, como foi criado e como funciona o revisor gramatical eletrônico do Word, ou revisor gramatical automático, como o chamam seus criadores. Capítulo II – O advento do revisor gramatical eletrônico Escrita, leitura, visão, audição, criação, aprendizagem são capturados por uma informática cada vez mais avançada. (...) Emerge, neste final do século XX, um conhecimento por simulação que os epistemologistas ainda não inventariaram. Pierre Lévy A primeira impressão é sempre aquela que fica, como se costuma ouvir por aí? Pensamos que não, pois cada um de nós já teve, certamente, oportunidade para refazer uma primeira impressão. Se não naturalmente, pelo próprio repensar uma opinião, ao menos forçosamente, pela contingência de algum fato cotidiano. É estranho, para dizer o mínimo, para pessoas como nós – estudantes, professores, escritores, letrados, cidadãos conscientes e participativos do/no atual momento histórico, globalizado, por que passa o mundo moderno – pensar que alguém ainda não saiba tudo, ou quase tudo, sobre computadores. Afinal, já fazem parte do nosso viver, já não sabemos trabalhar sem eles. No entanto, quando deixamos nossa prepotência de lado, vemos que muitos ainda não conseguem ter um relacionamento harmonioso e satisfatório com esta ferramenta tecnológica. O senso comum costuma afirmar que tudo que é novo provoca certo medo, até se conhecer e dominar o novo. A verdade é que se ouve, ainda hoje, alguém afirmando, saudosamente, que com sua máquina de datilografia era feliz e não sabia. E muitas reclamações sobre o PC são ouvidas: “É lento!”, “Trava sempre!”, “È caro para comprar e para consertar.”, “Quero escrever de um jeito, ele muda automaticamente.”, É para enlouquecer qualquer cristão!”. Só que os computadores vieram para ficar, e a cada dia se aperfeiçoam, ultrapassam todas as idéias pré-concebidas sobre si e nos fazem engolir em seco, uma vez que somos nós a ter que nos adaptar a ele, e não o contrário, sonho de todo usuário. Para entendermos melhor como funciona um revisor, quer seja ele ortográfico, quer seja ele gramatical, precisamos conhecer como é feito um programa para a criação da gramática eletrônica que o subsidia. E, então, entramos na seara da lingüística computacional, ciência que, se comparada a outras, é bem jovenzinha ainda. E, ao entrarmos nesse campo, nos deparamos com a sintaxe 19 computacional e seus termos diferentes, como parser/parsing, Prolog etc. É o que pretendemos mostrar nos próximos subcapítulos. 2.1 A Lingüística Computacional De acordo com o pesquisador Ray Kurzweil, pioneiro em inteligência artificial, em 2029 um computador com o preço de um PC de nossos dias (aproximadamente U$ 800) terá a capacidade de computação equivalente à do cérebro humano. E, ainda segundo Kurzweil, em 2060 uma máquina que custe em torno de U$ 1.000 terá a capacidade de todos os cérebros humanos somados, o que nos levaria a atingir um progresso de vinte milênios em apenas cem anos! (Othero e Menuzzi, 2005:16) Pierre Levy (s/d), em um artigo publicado no site www.faced.ufba.br , afirma que uma tecnologia intelectual não precisa ser efetivamente utilizada por uma maioria estatística de indivíduos para ser considerada dominante. Diz ele que até o começo do século XIX, a maior parte dos franceses não sabia ler, mas mesmo assim a escrita era, havia muito, a tecnologia intelectual motriz no plano tanto imaginário como religioso, científico ou estético. “Durante séculos a verdade foi escrita, bem como o destino. O mundo desenrolava uma imensa página coberta de sinais a serem interpretados.”. Para Levy, assim como a escrita, a informática, por sua dimensão empírica, deve ser analisada como tecnologia intelectual, mas essas máquinas de calcular, essas telas, esses programas não são apenas objetos de experiência. Enquanto tecnologia intelectual, contribuem para determinar o modo de percepção e intelecção pelo qual conhecemos os objetos. Fornecem modelos teóricos para as nossas tentativas de conceber, racionalmente, a realidade. Enquanto interfaces, por seu intermédio é que agimos, por eles é que recebemos de retorno a informação sobre os resultados de nossas ações. Os sistemas de informação efetuam a mediação prática de nossas interações com o universo. Este subcapítulo será dedicado a considerações acerca de um assunto extremamente complexo ainda, muito mais desconhecido, para a maioria das pessoas. A incursão aos domínios da lingüística computacional se dará de forma bastante simples, até mesmo infantil, uma vez que não há espaço, neste trabalho, para aprofundamento desse conhecimento. Porém, é necessária esta abordagem, mesmo que deficitária, por estar esse conhecimento intrinsecamente relacionado às perguntas que norteiam o nosso pensar e para as quais buscamos respostas. 20 A referida incursão será breve, porque sabemos não haver condições temporais e cognitivas para um aprofundamento nesse tema. Pretendemos apenas compreender melhor como se processa a linguagem que o computador utiliza para reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos, como um programador consegue introduzir regras gramaticais para o uso efetivo do corretor eletrônico. Nesse quesito, trabalharemos principalmente com Othero & Menuzzi (2005) e suas orientações na construção de um parser lingüístico, além de suas reflexões acerca da gramática e das programações de máquinas para responder a comandos de usuários em sua própria língua. Comecemos, então, pela definição desta nova ciência, dada por Othero e Menuzzi (2005): Lingüística computacional é a área da ciência lingüística preocupada com o tratamento computacional da linguagem e das línguas naturais. Ela pode ser dividida em duas linhas de pesquisa distintas: a Lingüística de Corpus e o Processamento da Linguagem Natural. A Lingüística de corpus é a parte que estuda diferentes fenômenos das línguas com base em corpora eletrônicos. Conforme Berber Sardinha (2000c:2), ela “se ocupa da coleta e exploração de corpora, ou conjunto da dados lingüísticos textuais que foram coletados criteriosamente com o propósito de servirem para a pesquisa de uma língua ou variedade lingüística”. Já o Processamento de Linguagem Natural (PLN) é a área de estudo da linguagem voltada diretamente para a construção de softwares e sistemas computacionais específicos. Alguns resultados desse tipo de estudo são a criação e desenvolvimento de programas de tradutores automáticos, chatterbots, parsers, reconhecedores automáticos de voz, dentre outros. Cabe à área de PLN desenvolver programas capazes de processar (leia-se compreender e produzir) informações em LINGUAGEM NATURAL. Esses programas podem envolver diferentes áreas da lingüística, como a fonologia, a fonética, a semântica, a sintaxe, a pragmática etc. (Othero & Menuzzi, 2005:124). Ainda segundo Othero & Menuzzi (2005:11), as máquinas estão sendo programadas, cada vez mais, para responder a comandos do usuário em sua língua materna, qualquer que seja ela. Isto é resultado da busca por uma melhor interação entre humanos e máquinas, o que está se dando através da linguagem natural, ou seja, da linguagem do homem. 21 Por trás desse tipo de trabalho, deve estar o dedo do lingüista: afinal, é ele o cientista da linguagem, o cientista que busca compreender coisas como as nuances semânticas de uma expressão, as regras sintáticas de uma língua ou os detalhes de funcionamento de seus sons. E é preciso “ensinar” essas coisas a um computador – ou melhor, programar esse conhecimento na “máquina binária”, dos “zeros” e dos “uns”, isto é, do sim e do não se quisermos que essa máquina esteja pronta a interagir naturalmente conosco. (Othero e Menuzzi, 2005:12) É claro que desenvolver computadores com capacidade de interagir de forma natural com humanos ainda está distante da realidade atual, mas é um dos objetivos da lingüística computacional, que se ocupa do tratamento computacional da linguagem para diversas finalidades práticas. Os autores acima (2005:18) acreditam que, antes de tentar fazer com que uma máquina interaja efetivamente com humanos e os compreenda, é inevitavelmente necessário fazer com que ela aprenda a se comunicar com um ser humano, e a maneira mais fácil de este tipo de comunicação ocorrer é através da própria língua materna da pessoa usuária de um computador. E completam: Por isso, muitos pesquisadores vêm trabalhando com o tratamento computacional da linguagem humana (ou das línguas humanas), isto é, com maneiras de simular, no computador, aquilo que fazemos naturalmente quando conversamos com alguém. Isso exige, no entanto, que se avance no estudo do funcionamento das línguas naturais e na descrição formal dos sistemas lingüísticos, e é aí que começamos a falar da lingüística computacional. Uzskoreit (apud Othero & Menuzzi, 2005:18), pesquisador da área da informática, afirma que: Ainda que os sistemas existentes em TL [tecnologias lingüísticas] estejam longe de alcançar a habilidade humana, eles têm diversas aplicações possíveis. O objetivo é criar softwares que tenham algum conhecimento da linguagem humana. (...) Há necessidade urgente deles para que se possa melhorar a interação humanomáquina, já que o obstáculo principal na interação entre um humano e um computador é simplesmente um problema de comunicação. Os computadores de hoje não entendem nossa língua, e as linguagens de computação, por outro lado, são difíceis de se aprender e não correspondem à estrutura do pensamento humano. (Uzskoreit, sd:2). Percebe-se, agora, a dificuldade – talvez até o ceticismo de alguns – em se encontrar respostas para questões como: O que se deve fazer para que o computador “compreenda” uma língua natural? Como fazer para que uma máquina consiga produzir textos ou falas em uma língua natural? Chegará o dia em que uma 22 máquina poderá ser capaz de dominar a sintaxe, o sistema fonológico, as nuanças semânticas e o uso pragmático, entre outros conhecimentos, de uma língua natural? Os autores com os quais estamos trabalhando neste capítulo (dentre inúmeros outros) acreditam que, algum dia, os computadores serão capazes sim de dominar a linguagem natural de maneira satisfatória e, assim, interagir de tal modo com os humanos, em uma determinada língua natural, que não se conseguirá distinguir as respostas da máquina das de um outro ser humano. Porém, voltemos ao que realmente nos interessa: o estudo computacional da sintaxe da língua portuguesa, ou seja, com o modo como as frases da nossa língua se organizam e o modo como esta organização é reconhecida pelo computador. Além da fonética e da fonologia, é indiscutível a importância dos estudos da morfossintaxe e da semântica para o desenvolvimento de programas de PLN [Processamento da Linguagem Natural], pois esses estudos são fundamentais para sistemas que envolvam a compreensão ou a geração automática de frases de uma língua. Este é o caso, por exemplo, dos chatterbots, programas desenvolvidos para interagir com usuários humanos através de diálogos em linguagem natural, na modalidade escrita. “O primeiro chatterbot desenvolvido foi ELIZA, criado pelo pesquisador Joseph Weinzenbaum, no MIT, em 1966”. (Othero e Menuzzi, 2005:31). ELIZA era um programa de conversação que se utilizava de um sistema baseado em “moldes” (templates, em inglês) para construir suas frases, e que, como todos os chatterbots baseados em moldes, tinha, como uma de suas limitações, a repetição eventual de suas próprias frases e as de seu interlocutor, apresentando, freqüentemente, contradição em suas “opiniões”. Por isso, acreditamos que as próximas gerações de chatterbots devem exigir dos programadores um profundo conhecimento da sintaxe (que permitirá que desenvolvam no programa a capacidade de gerar infinitas sentenças da língua combinando um número finito de regras e elementos lexicais) e de semântica (o que tornará possível fazer com que o programa seja capaz de interpretar o significado do input lingüístico fornecido pelo usuário humano). (Othero & Menuzzi, 2005:35). Além dos chatterbots e dos tradutores automáticos, conhecimentos em sintaxe e semântica são fundamentais, também, para outros aplicativos, como parsers, geradores automáticos de resumos, corretores ortográficos e gramaticais, classificadores automáticos de documentos digitais etc. 23 O termo parsing vem da expressão latina pars orationes (partes do discurso) e tem suas raízes na tradição clássica. “De acordo com Mateus & Xavier (1992:886), parsing pode ser entendido como o ‘processo de atribuição de uma estrutura e de uma interpretação a uma seqüência lingüística’.”. (apud Othero & Menuzzi, 2005: 39) Um parser, no contexto da lingüística computacional, é um analisador automático (ou semi-automático) de sentenças. Esse tipo de programa é capaz de analisar uma sentença com base em uma gramática preestabelecida de uma determinada língua, verificando se as sentenças fazem parte ou não da língua, de acordo com o que autoriza a sua gramática. (...) também analisa sintaticamente as sentenças, decompondo-as em uma série de unidades menores, primeiramente em nódulos não-terminais (os sintagmas), até chegar a nódulos terminais (os itens lexicais) atribuindo-lhes uma estrutura de constituintes. Essa estrutura de constituintes, que representa a organização hierárquica e sintática da frase, é apresentada comumente através de árvores sintáticas ou através de colchetes rotulados. (Othero & Menuzzi, 2005:49). E de acordo com Covington (1994:42, apud Othero & Menuzzi, 2005:40), fazer o parsing de uma sentença é “determinar, por um processamento algorítmico, se a sentença é gerada por determinada gramática, e se for, que estrutura a gramática atribui a ela”. Bons exemplos de um simples algoritmo que pode fazer uma medida analítica da linguagem são os corretores ortográficos e gramaticais. Porém, uma das armadilhas dos corretores ortográficos está na leitura de uma determinada palavra dentro de um contexto. O computador não pode encontrar um erro ortográfico se a palavra estiver correta para um outro contexto (por exemplo, conserto e concerto). A habilidade da mente humana em analisar e reconhecer corretamente falas, estilos e gramática não é reproduzida satisfatoriamente pelos computadores, porque mentes e computadores trabalham diferentemente. [http://labbi.uesc.br/apostila] Mesmo assim, o poder dos computadores é inegável. Hoje, escrever um texto utilizando um processador de textos, por exemplo, se tornou tão mais fácil e tão popular, que, para milhões de usuários, é uma ferramenta considerada indispensável. 24 2.2 A Sintaxe Computacional Para compor o início deste subcapítulo serão utilizadas informações disponibilizadas pelo programa de pós-graduação em computação do Instituto de Informática da Universidade Federal do Rio Grande do Sul [www.inf.ufrgs.br], especialmente de um trabalho feito para a disciplina de Arquiteturas Especiais de Computadores, assinado por Fábio Abreu Dias de Oliveira, intitulado “Processamento de linguagem natural: princípios básicos e a implementação de um analisador sintático de sentenças da língua portuguesa”. A escolha recaiu nesses dados em virtude de sua linguagem acessível, simples e clara. Porém, também continuaremos atentos ao que Othero & Menuzzi (2005) ensinam sobre o assunto. Para que um sistema computacional interprete uma sentença em linguagem natural, é necessário manter informações morfológicas, sintáticas e semânticas, armazenadas em um dicionário, juntamente com as palavras que o sistema compreende. A primeira etapa do processamento dessa linguagem natural passa, obrigatoriamente, pelo analisador morfológico, que identifica palavras ou expressões isoladas em uma sentença. Esse processo é auxiliado por delimitadores (pontuação e espaços em branco). As palavras identificadas são classificadas de acordo com seu tipo de uso, ou, em linguagem natural, categoria gramatical. Assim, uma instância de uma palavra em uma sentença gramaticalmente válida pode ser substituída por outra do mesmo tipo, configurando uma sentença ainda válida (exemplo: substantivos, pronomes, verbos, etc.). Dentro de um mesmo tipo de palavra, existem grupos de regras que caracterizam o comportamento de um subconjunto de vocábulos da linguagem, como, por exemplo, a formação do plural de substantivos terminados em “ão” e as flexões dos verbos regulares terminados em “ar”, dentre outros. Assim, a morfologia cuida das palavras quanto a sua estrutura, forma, flexão e classificação, no que se refere a cada um dos tipos de palavras. Para Rich & Knight (1993) o “emprego do analisador morfológico é fundamental para a compreensão de uma frase, pois para formar uma estrutura coerente de uma sentença, é necessário compreender o significado de cada uma das palavras componentes.” 25 Já o analisador sintático, através da gramática da linguagem a ser analisada e das informações do analisador morfológico, procura construir árvores de derivação para cada sentença, mostrando como as palavras estão relacionadas entre si. Durante a construção da árvore de derivação, é verificada a adequação das seqüências de palavras às regras de construção impostas pela linguagem na composição de frases, períodos ou orações. Dentre estas regras, a concordância e a regência nominal e/ou verbal, assim como o posicionamento de termos na frase. Um termo corresponde a um elemento de informação (palavra ou expressão), e é tratado como unidade funcional da oração, participando da estrutura como um de seus constituintes, denominados sintagmas. Como sabemos, a análise sintática de uma oração em português deve levar em conta os seguintes sintagmas: termos essenciais (sujeito e predicado), termos integrantes (complementos verbal e nominal) e termos acessórios (adjuntos adverbial e nominal, e aposto). A análise do período, por sua vez, deve considerar o tipo de período (simples ou composto), sua composição (por coordenação ou subordinação) e a classificação das orações (absoluta, principal, coordenada ou subordinada). Nos sistemas de processamento de linguagem natural, o maior problema é a transformação de uma frase potencialmente ambígua em uma não-ambígua, a qual será utilizada pelo sistema. Esta transformação é conhecida como parsing, termo já explicado anteriormente. As abordagens de linguagens formais são utilizadas com muito sucesso no estudo da análise sintática em PLN. Dentre as principais, temos: • Gramáticas Regulares: para o processamento sintático da linguagem natural, estas gramáticas são bastante simples e facilmente reconhecidas, porém apresentam um poder de expressão limitado (equivalente ao poder de expressão de um autômato finito, reconhecedor utilizado para a análise morfológica). • Gramáticas Livres de Contexto: são muito úteis no que tange à descrição de gramáticas em linguagem natural e, em geral, são mais poderosas que as regulares já que permitem a representação de linguagens com um certo grau de complexidade. No entanto, a dificuldade em expressar dependências simples, como por exemplo a concordância entre verbo e sintagma nominal, constitui um dos maiores problemas para sua utilização no tratamento da língua natural. O autor mencionado como fonte principal dessas informações, afirma que abordagens 26 puramente livres de contexto não são suficientemente poderosas para captar a descrição adequada deste gênero de linguagem. Mas que, ainda assim, é utilizada uma notação denominada com Definite Clause Grammar (DCG), disponível em Prolog, para definir gramáticas livres de contexto e analisar sentenças, ou seja, realizar o parsing. • Gramáticas Sensíveis ao Contexto: os problemas de dependência expressos anteriormente são resolvidos nesta classe de gramática. Porém, conforme Rich & Knight (1993), ainda assim as gramáticas sensíveis ao contexto não abordam satisfatoriamente o tratamento de restrições gramaticais. O impedimento para seu uso reside na questão do reconhecimento. O problema de decidir se uma sentença pertence a uma gramática sensível ao contexto é uma função exponencial sobre o tamanho da sentença, o que torna a implementação do procedimento de verificação uma questão complexa, do ponto de vista computacional. (idem) Vale lembrar a existência de gramáticas irrestritas, também presentes na hierarquia de Chomsky, as quais não são utilizadas para a construção de interfaces em linguagem natural. O artigo-base desses dados informa que a maioria das pesquisas atuais propõe trabalhar em modelos que se situem em um nível intermediário entre as gramáticas livres de contexto e as sensíveis ao contexto, aliando boa capacidade de representação, incluindo construções que permitam modelar dependências, e um modelo computacional viável. Com relação à gramática, ainda, Othero & Menuzzi (2005:44) alertam para fato de que a maioria das versões recentes do Prolog vem equipada com uma extensão nocional conhecida como DCG, ou Gramática de Cláusula Definida (do inglês Definite Clause Grammar), que facilita a implementação de regras formais de parsing. A DCG é um formalismo de representação de gramáticas livres de contexto. Ela torna muito mais fácil implementar uma gramática e desenvolver um parser em Prolog, já que “uma gramática descrita em uma DCG é diretamente executada pelo Prolog com um analisador sintático” (Bratko, 1997:431, apud Othero & Menuzzi, idem). Prolog - PROgramming in LOGic - é uma linguagem de programação baseada na lógica. Ao contrário da maioria das linguagens de programação, que 27 são de natureza “procedural”, o Prolog é uma linguagem “declarativa”, conforme ensinam Othero & Menuzzi (2005:42). (...) outras linguagens de programação, como o Basic e o Pascal, apresentam ao computador uma solução para um problema na forma de uma série de instruções para que a máquina as execute estritamente na ordem em que foram especificadas. Programar com Prolog (...) deve ser declarativo, um programa deve simplesmente ser o enunciado do problema. A maneira como o problema é solucionado e a seqüência de instruções por que o computador deve passar para resolvê-lo são decididas pelo sistema. (McDonald & Yazdani, 1990:ix, apud Othero & Menuzzi, 2005:44) Porém, mesmo após todas essas informações do mundo computacional, como entender o processo de criação de uma gramática eletrônica? A obra que nos tem servido como base primeira, para este capítulo, escrita por Gabriel Othero e Sérgio Menuzzi, trata justamente desse ponto. Eles ensinam como desenvolver um aplicativo computacional para o tratamento da linguagem natural, com exemplo de uma aplicação prática de conhecimentos da sintaxe no desenvolvimento de um sistema de análise das frases do português – um “parser sintático” programado em linguagem Prolog. (Vide definição de parser por Othero & Menuzzi disposta no final do subcapítulo 2.1). Othero & Menuzzi simulam a criação de um parser para o reconhecimento automático de sentenças em língua portuguesa. Um parser que deverá reconhecer as sentenças gramaticais – e somente elas – e atribuir-lhes uma estrutura de constituintes. Não é possível, aqui, naturalmente, reproduzir o passo-a-passo dos procedimentos que os autores ensinam, pois envolvem teorias e metodologias diversas, tornando-se inviável uma demonstração fiel. Contudo, decidimos resumir algumas das várias etapas que constituem o trabalho, apenas para que se tenha uma idéia, mesmo que distante, de como uma gramática “se forma no interior de uma máquina”. • começa com o reconhecimento e distinção de frases consideradas gramaticais/agramaticais; • faz representações delas em diagramas arbóreos (com divisão das frases em “blocos”, ou sintagmas, até os itens lexicais); 28 • pode ter que realizar diferentes “testes” para identificar um constituinte/sintagma (testes de coordenação, interpolação, anáfora, entre outros); • nas regras de reescrita (ou regras sintagmáticas) utiliza-se dos símbolos usados por Chomsky (S,SN, SV, Det., N, V), e são elas que validam as sentenças; • há, ainda, as regras de inserção lexical, as responsáveis por introduzir as palavras abaixo de cada símbolo respectivo. Obs.: Essas regras (de reescrever e de inserção) são chamadas de gerativas, pois elas geram sentenças gramaticais a partir de instruções precisas e explícitas. Após a aplicação dessas regras, obtém-se a estrutura de uma frase válida, ou gramatical na língua definida pela gramática escolhida; • finalmente é estruturada a árvore sintática da frase a partir das regras, trabalhando como um parser top-down (que constrói uma sentença a partir de seu topo, até chegar ao nível das palavras); Os autores ressalvam, porém, que “é sabido que a gramática sintagmática apresenta uma série de limitações e precisa ser enriquecida com recursos adicionais” (idem:64). Isso se deve ao fato de a gramática criada poder gerar também sentenças claramente agramaticais, principalmente se algumas palavras forem expandidas para outra categoria. Por isso, no exemplo que dão, eles precisam adicionar alguns recursos às regras sintagmáticas e trabalhar com a descrição e classificação do léxico para implementar o tipo de gramática na linguagem Prolog. Como, na maioria dos casos, o Prolog está tentando descobrir se uma afirmação é verdadeira ou falsa, ou está tentando encontrar alguma combinação de variáveis que torne uma afirmação verdadeira, para executar um programa em Prolog é preciso fazer uma consulta à sua base de dados. “E uma consulta nada mais é do que uma chamada de uma cláusula do programa, equivalendo a uma solicitação para provar se o que pedimos é verdadeiro de acordo com a base de dados do programa “ (ibid: 66). Há basicamente dois tipos de perguntas que podemos fazer ao Prolog: perguntas sim/não (envolvendo respostas sim ou não), e perguntas QU (wh- 29 questions en inglês, envolvendo pronomes interrogativos: quem, qual, quando, onde etc.). Voltando à criação do parser, começa, então, a etapa de escrever um programa, que deve ser aberto em um editor de textos, como o bloco de notas, presente em todas as versões do MS Windows disponíveis no mercado. É no editor que serão desenvolvidos os programas que mais tarde serão rodados na plataforma do Prolog. Tudo deve ser escrito em letras minúsculas e sempre haver um ponto final no fim de cada linha. As letras maiúsculas serão usadas para as variáveis. Como exemplo de um programa simples, Othero e Menuzzi (2005:67) dão o seguinte: Sócrates é homem. O homem é mortal. Em notação Prolog, deve-se escrever: homem(socrates). mortal(X) :- homem(X). Em PROLOG Em PORTUGUÊS homem(socrates). Sócrates é homem. mortal(X) :- homem(X). O homem é mortal. Tradução – PROLOG x PORTUGUÊS A primeira premissa (homem(socrates).) é chamada em Prolog de fato. Os fatos são regras que, de certa forma, se auto-satisfazem, ou seja, são dados sempre verdadeiros, nunca apresentando variáveis. A segunda premissa (mortal(X) :- homem(X).) é uma regra em Prolog: ela apresenta uma variável e uma relação de condicionalidade, expressa pelo operador “:-“ . Ao contrário dos fatos, as regras consistem sempre de duas partes: a cabeça e o corpo: mortal(X) Cabeça :- homem(X) Corpo Para que a cabeça da regra seja verdadeira, as condições expressas em seu corpo devem ser satisfeitas. A interpretação de uma regra desse estilo é bastante simples: a :- b. a :- b, c, d. “a” é verdadeiro se “b” é verdadeiro “a” é verdadeiro se “b”, “c” e “d” forem verdadeiros 30 E, então, depois desse processo (extremamente resumido e simplificado, aqui), o programador utiliza-se do recurso de DCG (já conceituado anteriormente). Com esse recurso, as regras de reescrita podem ser convertidas de maneira bastante simples e transparente para a notação em Prolog. “Grosso modo, a DCG pode ser entendida como um recurso que torna mais fácil ao lingüista a implementação de regras sintagmáticas em Prolog”. (Othero e Menuzzi, 2005:77) Em resumo, para o desenvolvimento de uma gramática em Prolog, deve-se: a) implementar regras sintagmáticas relativas à descrição sintática do português (por exemplo, a regra: S SN SV); b) a partir dessa regra, elaborar outras para o SN e para o SV, ou conferir o que consta na literatura pertinente. (Exemplo: SN N Det N; SV V SN; c) implementar itens lexicais (Exemplo: Det João, Maria; V o,a: ama; d) implementar na gramática do parser algumas regras consagradas na literatura; e) a partir delas, pode-se usar exemplos apresentados na literatura que servem para ilustrar ou testar a regra; f) por último, trabalhar com as dificuldades encontradas para implementar uma regra em Prolog da melhor maneira possível. Os autores consultados deixam claro que há diferentes maneiras de se trabalhar com parsers sintáticos, e diversas têm sido as alternativas de desenvolvimento de ferramentas de linguagem natural que tratem da sintaxe de uma língua. Esperamos ter conseguido aclarar um pouco o que seja uma linguagem de programação, principalmente no que concerne ao desenvolvimento de uma gramática, que é um dos principais aspectos que nos interessam neste trabalho. 2.3 - O Revisor Gramatical Eletrônico A maneira mais simples e rápida de escrever corretamente. Com o Revisor Gramatical você revisa os seus textos corrigindo erros de concordância verbal e nominal, erros de ortografia, acentuação, conjugação de verbos, colocação de pronomes, dúvidas do dia-a-dia e muito mais! Também apresenta regras gramaticais que esclarecem suas dúvidas, otimizando o seu trabalho. O excerto acima faz parte de um texto on-line [www.amigomouse.com.br], na seção de oferta de compra de produtos de informática. Achamos apropriado 31 utilizarmo-nos dessa propaganda para começar este capítulo, pois há informações interessantes, muitas, talvez, não do conhecimento da maioria dos usuários de computador. Deixando de lado o objetivo de publicidade que o texto tem, vamos apresentar essas informações porque elas nos servirão, mais além, para provar nossa tese de que os revisores ainda precisam ser melhorados, e muito, em vários aspectos. Como principais características do Revisor Gramatical, aparecem: • Possui um dicionário ortográfico com mais de 2 milhões de palavras na língua portuguesa; • Revisa a gramática e a ortografia; • Possui explicação gramatical dos erros encontrados (para todo erro gramatical encontrado pelo Revisor, basta clicar no botão “Ajuda”, que o mesmo apresenta as regras gramaticais.); • Acentuador automático (reconhece palavras de uma única grafia acentuadas incorretamente e, automaticamente, corrige a acentuação, facilitando e agilizando o processo de correção ortográfica.); • Informa a existência de palavras homógrafas (as palavras homógrafas perfeitas se escrevem e se pronunciam da mesma forma. As homógrafas imperfeitas diferenciam-se entre si por um detalhe apenas (a acentuação, por exemplo). O Revisor Gramatical aponta as palavras que têm homógrafas imperfeitas para que se possa conferir se seu uso está correto.); • Corretor automático inteligente (durante a digitação, se o usuário cometer o mesmo erro ortográfico por 03 (três) vezes num mesmo documento, o Revisor Gramatical permite ao usuário inserir este erro no Dicionário Inteligente. Depois de inserto, o Revisor irá corrigir o erro automaticamente, agilizando a correção.); • Conjugador verbal (conjuga verbos em todos os tempos e modos da língua portuguesa de modo simples e fácil. Reconhece inclusive verbos impessoais como “chover”, “ventar”, etc., destacando as formas mais usuais). Este Revisor anunciado serve para aplicativos como Microsoft Word Compatíveis, Microsoft Word 2000 (Português/Inglês) versão 9.0, Microsoft Word 97 (Português/Inglês) versão 8.0 e Microsoft Word 95 (Português/Inglês) versão 7.0. 32 Como requisitos mínimos de funcionamento precisa de um PC 486 ou superior, 16 MB de RAM, 2 MB de espaço livre no disco rígido, drive de CD-ROM, Windows 95 ou superior previamente instalado, rede: NT & Novell. Decidimos testar partes dele, apenas para servir como exemplos de sua funcionalidade efetiva. A palavra “conjugador”, por exemplo, que aparece no último item das características do Revisor, não faz parte dos 2 milhões do dicionário do mesmo, e aparece sublinhada em vermelho. O mesmo ocorre com a palavra “acentuador”, no 4º item. A sugestão de ortografia correta para “conjugador” encontra-se na tela 1, copiada na página seguinte. Estas, então, são palavras que precisaríamos acrescentar ao dicionário do nosso PC. Com relação ao reconhecimento das homógrafas imperfeitas (da forma como apresentado neste texto), como por exemplo, “Ela esta bem.” e “Ela está bem.” , o revisor gramatical do computador que estamos utilizando não apontou nenhum problema, tanto com uma como com a outra forma. Assim, se não soubermos que a primeira frase torna-se inadequada, sem o acento em “esta”, também não teremos como o saber, pois o revisor não nos avisa disso. Em “Ele para, olha e fica pensando...” e “Ele para mim é um anjo.” , também não há manifestação contrária por parte do revisor quanto à acentuação que deveria existir no verbo “para” na primeira frase. Em: “Fizeram boa viajem?”, pensamos que o revisor distinguiria o verbo “viajem” do substantivo “viagem”. Isso não aconteceu. Ele sublinhou em verde “fizeram boa” e sugeriu o que aparece na tela 2. Concluindo: o revisor NÂO aponta as homógrafas imperfeitas para conferência de sua correção. Quanto ao reconhecimento e correção automática, por parte do revisor, de palavras de grafia única acentuadas incorretamente, em alguns casos isso se mostra verdadeiro, em outros, não. Vejamos: “Vocé”, digitada propositalmente por nós, foi realmente corrigida imediatamente, aparecendo “Você”. Se se utilizar a tecla F7 (ortografia e gramática), a sugestão de grafia “Você” aparecerá. Mas quando digitamos a palavra “pêrola”, ele apresentou 25 sugestões de escritura de diferentes palavras, mas não a grafia “pérola” .(Vide tela 3.) 33 Tela 1 Tela 2 34 Tela 3 O teste agora é da conjugação de verbos em todos os tempos e modos, inclusive os impessoais. Somente alguns exemplos: “Chove chuva, chove sem parar...” “Amaram-no mais que tudo neste mundo.” “Fazer silêncio, por favor.” Mas, em: “(...) Se me ainda amas, por amor não ames: Trairias-me comigo.” (Já sobre a fronte – Poesia Completa. Ricardo Reis/Fernando Pessoa) 35 Tela 4 A ênclise na forma verbal “trairias-me” não foi reconhecida como correta pelo revisor, que apresentou a sugestão de ortografia conforme tela acima. Por pura curiosidade, decidimos reescrever o trecho não aceito antepondo o pronome oblíquo ao verbo, e o revisor, após mostrar a sublinha verde, manifestouse assim: Se me ainda amas, por amor não ames: Me trairias comigo. 36 Tela 5 Como se pôde perceber até agora, o revisor gramatical tem lá seus humores. Não são de admirar, então, as inúmeras reclamações dos mais diversos tipos de usuários quando se utilizam do editor de textos do Word e pedem “ajuda” ao revisor eletrônico para verificar a correção de seus textos. Algumas sugestões do revisor tornam-se engraçadas, porque completamente ilógicas para qualquer falante razoável da língua portuguesa. Dílson Catarino, professor, em um de seus textos de dicas de gramática no site do uol/vestibulares, quando mostra como se deve usar os pronomes demonstrativos em textos, faz a seguinte advertência: Somente mais um comentário, sem ligação alguma com os estudos de hoje: ao escrever um texto em seu computador, nunca confie no corretor do Word, pois ele apresenta falhas clamorosas. E cita como exemplo, uma das frases do próprio texto que ele escreveu naquele dia.: Onde escrevi: Não se deve andar com os vidros do automóvel abertos nas grandes cidades brasileiras, o sinistro Word diz: Não se deve andar com os vidros do automóvel aberto nas grandes cidades brasileira ou Não se deve andar com os vidros dos automóveis abertos nas grandes cidades brasileiros. (grifos do autor) 37 E termina com um desabafo revoltado: Que é isso, meu santo protetor dos professores de Português?! Como deixam acontecer isso? Será que nossa Língua é tão desprezada assim? Será que nenhum dos nossos ilustres imortais usa computador? Ou será que eles escrevem como o Word quer? Quanto à “acusação” aos imortais não podemos nos pronunciar, uma vez que não dispomos de informações confiáveis de que eles se comportem ou não como supõe o autor acima. Quanto à reclamação do referido professor, redigitamos a frase mencionada e acionamos a tecla F7. O revisor nada acusou. Porém, este é um dado sobre o qual já alertamos anteriormente: a configuração de cada computador pessoal interfere quanto às manifestações do revisor eletrônico, seja o ortográfico, seja o gramatical. Acreditamos que o PC de Catarino não dispunha, à época, da mesma configuração deste que estamos utilizando agora. Quanto à confiança cega que alguns usuários depositam no revisor eletrônico, o Jornal do Brasil publicou matéria, em 27/09/2001, cujo título era Viciados em F7. (Imediatamente o revisor sublinhou em verde o título. A tela com a sugestão ortográfica e a explicação gramatical está mais à frente). O articulista começa explicando o que é a tecla F7 e diz que Para quem se garante nos quesitos ortografia e gramática, o corretor automático é um chato que fica sublinhando, em verde ou vermelho (conforme o caso), nomes de pessoas, palavras que não estão no dicionário e erros que não existem – como segue regras rígidas, muitas vezes ele aponta como erro formas que na verdade são opcionais ou licenças poéticas. Mais adiante, o texto fala sobre a tábua de salvação que é a tecla F7 para os não “tão craques” em português, impedindo que não sejam entregues trabalhos repletos de “erros ortográficos constrangedores”, uma vez que os possíveis erros são apontados pelo revisor, que oferece soluções para os problemas. Afirma o JB, Assim, formou-se uma verdadeira legião de viciados em F7. Indiferentes à discussão sobre qual é o melhor dicionário, eles dispensam cuidados ao digitar e não se preocupam com a ortografia. O relaxamento pode chegar a tal ponto de a pessoa repetir o mesmo erro diversas vezes, ignorando a possibilidade de aprender a grafia correta. O artigo termina com uma fala do exemplo citado pelo jornal, um “exdependente” nas palavras do articulista, e que hoje tira suas dúvidas no dicionário, 38 em vez de continuar confiando apenas no corretor eletrônico: O mercado de trabalho exige que se escreva corretamente, e eu pretendo acompanhar o mercado. Tela relativa à página anterior. O revisor considera inadequada a concordância feita no título. Como era de se esperar, o artigo no Jornal do Brasil suscitou respostas em defesa do uso do revisor eletrônico. Duas leitoras de Belo Horizonte, Carla Viana Coscarelli e Else Martins, enviaram carta ao jornal, intitulada Viciados em F7? Nossa resposta ao JB (27/09/2001), que foi publicada em outubro de 2001. Assim começa o texto: A informática entrou em nossa vida – isso não tem retorno - e sua influência na escrita é inevitável. De pouco adianta torcer o nariz ou fechar os olhos para as conseqüências que o uso do teclado e dos programas de texto provocam na escrita das pessoas. Necessário se faz estudar essas modificações e, sem pré-conceitos, analisar até onde isso é bom ou não. (...) A crítica que mais se faz ao uso dos corretores de texto e das comunicações sincrônicas (chats) e assincrônicas (e-mail) é o fato de que eles levam o indivíduo a escrever errado. No primeiro caso, inclusive, dizem até que “vicia”! As autoras da resposta ao JB defendem que é preciso entender que alguns aspectos da escrita merecem mais atenção do que ortografia e separação de sílabas, entre outras “questões menores”, na visão delas. Afirmam que língua não 39 se resume a ortografia. Há muito além disso, a sintaxe, a semântica, a textualidade, os fatores pragmáticos, a discursividade, e ninguém discute isso na imprensa. A ortografia é sempre a grande vedete. O que elas propõem é a desnecessidade de perder tempo com questões ortográficas, e deixar sua resolução por conta do corretor ortográfico. Acreditam que quanto menos tivermos de nos preocupar com isso no momento da criação, melhor, pois sobrará tempo e recursos cognitivos para as atividades de planejamento e organização das idéias no texto, para escolher melhor os recursos lingüísticos a serem usados e as estratégias textuais que melhor seduzirão o leitor. (sic) Acrescentam ainda, as duas leitoras, que não há programa de computador que consiga substituir as escolhas semânticas e estruturas frasais de cada produtor. Além disso, pelo fato de seguir normas rígidas, o recurso de correção sintática e ortográfica não exclui a participação do usuário: Apareceu o risquinho verde no texto e, imediatamente, vai-se verificar o que está acontecendo, que tipo de correção é sugerida. Apareceu o risquinho vermelho e vai-se verificar o erro ortográfico cometido. E concluem, em sua resposta: Que diferença faz tirar dúvidas no dicionário de papel ou no eletrônico? Muita. Enquanto o rapaz do nosso exemplo está a consultar um dicionário, o colega ao lado já analisou e aceitou ou não a correção proposta e produziu infinitamente mais. (...) o texto produzido em computador vai aos poucos instalando um texto novo, criativo, ágil e que exige um leitor que domine os recursos de produção desse texto, para melhor entendê-lo. À parte acusações ou defesas, o corretor eletrônico permanece impassível diante de tudo isso. As considerações anteriores, sobre os textos publicados no Jornal do Brasil, foram feitas no intuito de servirem de exemplos, dentre os tantos encontrados por nós, principalmente na Internet, das opiniões favoráveis ou contrárias ao uso do revisor eletrônico do Word. Hélio Consolaro, professor de português e coordenador do site www.portrasdasletras.com.br, num artigo intitulado “Revisor do Word”, afirma que “Os limites do revisor são dois: a qualidade do conhecimento lingüístico de quem abasteceu o seu léxico (o dicionário) e a limitação do programa”. E continua: As nuanças de concordância, regência. Exemplo: Juliana era as esperanças do time. O revisor aponta erro de concordância, porque não distingue que Juliana se trata de nome de pessoa, nesse caso o verbo SER concorda com ele. 40 Grifamos, em verde, o que estava sublinhado pelo corretor, na citação acima, para comprovar a afirmação de Consolaro. Tela 6 Mais uma surpresa: a sugestão vem na forma de “era as esperança”, concordando “esperança”, provavelmente, com “do time”, termo subseqüente, mais próximo. Quando digitada a frase “era as esperança”, o corretor permaneceu em silêncio. Consolaro, como tantos outros, não necessariamente professores de português apenas, aconselha levar a sério os apontamentos que o Word apresenta, verificando se há razão ou não dos mesmos estarem sendo feitos, não deixando de pesquisar em gramáticas ou dicionários quando houver dúvidas. E termina o conselho com uma advertência: “Erra mais quem tem muita certeza”. 41 2.3.1 Como “nasceu” o Revisor Não nos foi fácil, nem rápido, conseguir informações sobre a criação e os criadores do revisor gramatical do Word, mesmo tendo a Internet e o site da Microsoft à nossa disposição. Os e-mails enviados, solicitando ajuda, ficaram sem respostas. Tínhamos, em mãos, um único texto - um artigo de divulgação - encontrado num site e que falava sobre um revisor gramatical chamado ReGra, da Itautec. Porém, como ignorávamos completamente o significado do ícone da Itautec-Philco, que vem, conforme a configuração de algumas máquinas, na tela de iniciação do computador, não conseguíamos aliar uma coisa à outra. Após inúmeras buscas, conseguimos encontrar uma fonte fidedigna sobre a origem do revisor que temos em nossas máquinas de sistema do Windows: um texto escrito pelos próprios pesquisadores/criadores do ReGra, conseguido via Internet, e apresentado em São Paulo, em 2002, num encontro de Estudos Lingüísticos. Restou-nos, dessa forma, trabalhar com apenas duas fontes e a impressão de que não há dados suficientes e satisfatórios para compor esse subcapítulo. No entanto, disponibilizaremos o que conseguimos mesmo correndo o risco de serem insuficientes as informações sobre como surgiu o revisor que utilizamos rotineiramente. No site http://inventabrasilnet.t5.com.br/revgram.htm há um artigo intitulado Revisor Gramatical falando sobre a Itautec, empresa brasileira de computadores e softwares, que precisou desenvolver, em 1993, um revisor ortográfico para um processador de texto utilizado nos computadores fabricados por ela. A empresa procurou o Núcleo Interinstitucional de Lingüística Computacional (NILC), formado por pesquisadores dos Institutos de Ciências Matemáticas e de Computação e de Física da USP de São Carlos e da Faculdade de Letras da Universidade Paulista (Unesp), de Araraquara. Esse grupo, composto de alunos e professores, pesquisava, à época, um software de processamento da língua portuguesa. A Itautec-Philco, que já possuía um revisor ortográfico de textos, interessou-se pela pesquisa, pois pretendia aprimorar seu revisor ortográfico, incluindo um revisor gramatical capaz de detectar e corrigir erros de concordância e de regência verbal e nominal, entre outros. 42 Em 1994, Maria das Graças Volpe Nunes, pesquisadora-responsável pelo NILC, e seus colaboradores apresentaram o Revisor Gramatical Automático para o Português. A princípio, o revisor deveria apenas se preocupar com os erros mais comuns das secretárias, devido ao perfil corporativo dos clientes Itautec-Philco, mas o produto acabou posteriormente incorporado ao Word da Microsoft. O projeto foi aprovado no PITE, em 1996, e contou também com a colaboração dos professores Cláudio Lucchesi, Tomas Kowaltowski e Jorge Stolfi, do Instituto de Computação da Unicamp. Em São Carlos, sob a coordenação da professora Maria das Graças Volpe Nunes, foram desenhados os algoritmos e formado o banco de base de palavras e, em Campinas, desenvolveu-se a compactação do sistema e a diminuição do tempo de resposta do programa. Em 1997, a empresa começou a vender, no varejo, a primeira versão do revisor gráfico e gramatical, em caixas próprias, como um produto de prateleira. No final desse ano, a Microsoft procurou a empresa para incorporar o revisor no programa Office, o mais vendido no Brasil e em todo o mundo. O antigo revisor criado em Portugal para a língua portuguesa comportava 200 mil palavras; o da Itautec já dispunha de 1,5 milhão de palavras. O revisor foi incorporado ao Office 2000. A empresa brasileira licenciou o produto por um período de três anos e, pelo trabalho desenvolvido, o professor Lucchesi recebeu o Prêmio Santista de Informática, em 1999. Anunciava o artigo: Com as funções de revisão licenciadas, o usuário de qualquer um dos aplicativos que compõem o Microsoft Office poderá ter seus erros gramaticais e ortográficos corrigidos automaticamente, desde erros de concordância verbal, uso de crase, regência, colocação pronominal até a grafia correta das palavras em português. Além de todos esses recursos, o Microsoft Office contará também com um dicionário de sinônimos e antônimos (thesaurus), como recurso extra de consulta. As demais funções do Revisor Word não licenciadas pela Microsoft continuarão a ser comercializadas pela Itautec sob o nome de Revisor Plus. Constarão do Revisor Plus os recursos de conjugação de verbos, consulta à gramática da língua portuguesa, acentuação automática de documentos, consulta a verbetes semelhantes, dicas sobre erros mais freqüentes, consulta a brocardos jurídicos e dicionários português/português, português/inglês e inglês/português. Também farão parte do produto dicionários temáticos nas áreas de Medicina, Direito, Administração e Informática. O Revisor Plus estará disponível para comercialização simultaneamente com o lançamento da próxima versão do Microsoft Office em português. (grifo nosso) 43 Afirma o artigo ainda que, apesar de as pesquisas em processamento de linguagem natural (PLN) de português terem se iniciado muito antes da década de 1990, praticamente nada havia sido feito que visasse à criação de uma ferramenta robusta e de uso genérico requerendo recursos lingüísticos e computacionais de grande monta. O PLN trata do processamento envolvendo análise, interpretação e produção de uma linguagem humana por uma máquina, sendo uma área da inteligência artificial voltada para os estudos e desenvolvimento de sistemas que permitam interpretar e gerar linguagem natural. “O processamento de linguagem natural ainda é coisa nova. (...) Além das limitações do PLN, tínhamos o limite da falta de experiência em produção de produtos comerciais”, afirma Maria das Graças Volpe Nunes, no citado artigo. O sistema de correção gramatical foi chamado de ReGra, não incluindo as rotinas para detecção de erros ortográficos, embora a base lexical que suporta o corretor ortográfico tenha sido compilada para o projeto de correção gramatical. O ReGra é constituído por três módulos principais: i) o módulo estatístico – realiza uma série de cálculos, fornecendo parâmetros físicos de um texto sob análise, com o número total de parágrafos, de sentenças, de palavras, de caracteres, etc. O componente mais importante desse módulo, entretanto, é o que fornece o “índice de legibilidade”, uma indicação do grau de dificuldade da leitura do texto. O conceito de índice de legibilidade surgiu a partir do trabalho de Flesch, de 1948, para a língua inglesa e busca uma correlação entre tamanhos médios de palavras e sentenças e a facilidade de leitura. Não inclui aspectos de compreensão do texto, que requereriam tratamento de mecanismos complexos de natureza lingüística, cognitiva e pragmática. O índice Flesch, assim como outros similares, tem sido empregado para uma grande variedade de línguas, mas o trabalho do NILC foi o primeiro para o português. Através de um estudo comparativo de textos originais em inglês e traduzidos para o português, verificou-se que a equação que fornece o índice Flesch precisaria ter seus parâmetros adaptados para o português, pois as palavras desta língua são em média mais longas, em termos de número de sílabas, do que em inglês. (artigo supra) ii) o módulo mecânico – detecta erros facilmente identificáveis que não são percebidos por um corretor ortográfico, como, por exemplo, palavras e símbolos de pontuação repetidos; presença de símbolos de pontuação isolados; uso não balanceado de símbolos delimitadores, como parênteses e aspas; capitalização 44 inadequada, como o início da sentença com letra minúscula; e ausência de pontuação no final da sentença. iii) o módulo gramatical – contém mais de dez mil regras de correção, realiza inclusive a análise sintática automática das sentenças. As regras foram testadas em textos reais não corrigidos, como cartas comerciais, redações de vestibulares e teses, e em textos editados, como os de livros e revistas. O banco de textos empregado nestes testes contém mais de 37 milhões de palavras. A última versão (não se pode saber com certeza qual é, pois não há sua datação) conta ainda com uma minigramática eletrônica, disponível ao usuário através de hipertexto, que explica as principais regras gramaticais da língua portuguesa. Possui também um dicionário de sinônimos e antônimos. Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns entre usuários de nível médio, como secretárias e profissionais de escritório em geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo “erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram como forma desviante da norma culta. Cita o artigo que Nas primeiras versões do ReGra, os erros eram detectados através de regras heurísticas implementadas na forma de redes de transição estendidas (augmented transition networks), numa abordagem que se poderia chamar de “error-driven”. As primeiras versões do ReGra apresentavam vários benefícios do ponto de vista da implementação computacional: agilidade, especificidade, rapidez, portabilidade, e disponibilidade de memória. Entretanto, seu escopo de atuação era muito limitado: problemas envolvendo itens lexicais não contíguos e estruturas recursivas não podem ser atingidos pelas estratégias heurísticas normalmente desenhadas por abordagens error-driven. Para prover a essas insuficiências, optou-se por analisar sintaticamente as sentenças do usuário, antes de operar a revisão propriamente dita. Isso permite aplicar regras que apontam desvios nas relações entre núcleos e adjuntos, entre núcleos e modificadores, entre regentes e regidos. A realização de análise sintática automática obviamente requer que todos os itens lexicais estejam categorizados apropriadamente. Para tanto, realizou-se em paralelo a construção do léxico, que envolveu a compilação exaustiva das palavras da língua portuguesa e a hierarquização das categorias dos itens lexicais morfologicamente ambíguos. Uma vez que alguns erros em contextos lingüísticos específicos ocorrem independentemente de desvios sintáticos, na versão atual do ReGra convivem as duas abordagens mencionadas acima. Ou seja, além de realizar análise sintática automática, 45 muitas das regras heurísticas da primeira versão foram mantidas, como as de correção de erros de crase. Mas a professora Maria das Graças Volpe Nunes faz questão de lembrar que, devido às ambigüidades semânticas e sintáticas da língua portuguesa, o software nunca estará completo: “Uma única palavra pode apresentar distintos significados, pertencendo ou não à mesma classe gramatical. Para conhecer a função e posição gramatical correta, é necessário saber o que determinada palavra significa em cada situação”. Até aqui, trabalhamos com os dados do material que mencionamos como o primeiro em mãos. A partir de agora, completaremos esses dados com o trabalho disponibilizado pelo NILC – Núcleo Interinstitucional de Lingüística Computacional de São Carlos -, encontrado no site www.dc.ufscar.br. , que foi escrito pelos próprios pesquisadores do ReGra e apresentado em um encontro de Estudos Lingüísticos em São Paulo, 2002. Segundo eles, a construção de revisores gramaticais automáticos, embora seja uma área bem consolidada na Lingüística Computacional atualmente, é uma tarefa complexa, “dependente de restrições severas de robustez (para contemplar tarefas em tempo real) e abrangência (para servir a qualquer tipo de requisição)”. As principais razões dessa complexidade provêm, na fala dos autores: a) da necessidade de se representar eletronicamente grandes repositórios de informações lingüísticas (léxicas, sintáticas, semânticas e/ou pragmáticas) e b) da incorporação de processos computacionais que dêem conta, sistemática e eficientemente, das principais características do problema em foco. Considerando-se, em particular, o contexto de processamento automático do português, ela se reveste de importância maior, devido à escassez de ferramentas computacionais. Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais, transcritas aqui: a) seus usuários-alvo são indivíduos com suposta proficiência no português em nível secundário ou superior; b) seu objeto de análise são textos prosaicos com predomínio da função referencial da linguagem; e c) seu objetivo é a identificação de desvios à disciplina gramatical da língua portuguesa, ainda que esses desvios possam vir a representar hipóteses 46 significativas do usuário em relação à linguagem e possam constituir, na variedade lingüística do usuário, estruturas admissíveis. Quanto à arquitetura do ReGra, atualmente (a. 2002 (?)) ele dispõe dos seguintes recursos operacionais, conforme disponibilizado no artigo em questão: 1) um léxico, com mais de um milhão e meio de formas do português; 2) um conjunto de regras de desambigüização lexical; 3) um verificador mecânico, constituído de um conjunto de regras para identificação de problemas de digitação (excesso de espaços em branco, balanceamento de delimitadores, etc.) e de seu correspondente aconselhador mecânico; 4) um verificador ortográfico, constituído dos correspondentes conjunto de regras e aconselhador, o qual sugere as formas lexicalizadas próximas daquelas não constantes do léxico; 5) um verificador gramatical, constituído de: a) uma gramática com mais de 600 regras de reescrita que contemplam a maior parte das possibilidades sintáticas de períodos simples do português; b) um parser, ou analisador sintático automático, capaz de derivar representações arbóreas(hierárquicas) a partir de listas de palavras do português, segundo as estruturas previstas na gramática; c) um conjunto de regras de verificação gramatical, subdivididas em distribucionais (com a consideração dos contextos mínimos, à esquerda e à direita) e estruturais (dependentes da identificação das funções sintáticas); d) um aconselhador gramatical, capaz de sugerir correspondentes corretos para formas ou estruturas consideradas inadequadas e e) um conjunto de mensagens de revisão, associada aos padrões derivados da verificação gramatical; 6) uma minigramática, indexada como hipertexto às mensagens de revisão, para consulta. Relativamente ao léxico do ReGra, os pesquisadores dizem ser ele um “repositório de formas lexicais válidas para o português contemporâneo, acrescidas de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico como “um recurso à revisão gramatical, servindo também de apoio ao módulo ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”. 47 Em relação à sua estruturação, o aspecto organizacional para o acesso automático é que recebe ênfase, não o aspecto morfológico. Dizem os autores que isso implica o arquivamento exaustivo das formas do português, Sem considerar, p.ex., o aproveitamento de sufixos flexionáveis e derivacionais da língua. Essa organização resultou também no armazenamento das lexias simples, i.e., das formas de radical único (p.ex., pé) ou das formas hifenizadas (p.ex., pé-de-moleque), decisão determinada por questões de compactação do léxico, operação que, ao menos, por enquanto, rejeita o tratamento de lexias complexas, tais como as locuções (p.ex., ‘na medida em que’, ‘à distância’) ou palavras compostas (p.ex., ‘boca de urna’, ‘estado civil’). (...) A definição lexical exaustiva tem, ainda, a desvantagem de multiplicar as formas homônimas, resultando em extrema redundância formal do sistema. (...) Por exemplo, informações gramaticais distintas para uma mesma forma implicam entradas lexicais diversas (canto¹ [verbo], canto ² [substantivo]). É preocupação constante do NILC refinar a constituição do léxico do ReGra, em virtude - para citar uma das razões dessa preocupação - do surgimento de muitos problemas de registros lexicais serem gerados pela inserção automática de palavras, “cuja resolução exige um grande esforço humano, altamente especializado”. Outra razão relevante é o problema da ambigüidade lexical, pois interfere na eficiência e robustez do ReGra. As alterações de representação lexical citadas implicam profunda alteração do modelo representacional adotado, principalmente se considerarmos a necessidade de associar às palavras sua caracterização semântica, por si só uma tarefa já altamente complexa na lingüística computacional e, especialmente, no contexto de revisão gramatical irrestrita, como é o caso do ReGra. (...) a revisão do analisador sintático se faz obrigatória. Quanto à gramática do ReGra, o processo de revisão gramatical se subdivide em três etapas: a) o pré-processamento da cadeia de entrada, com a etiquetação dos itens lexicais e a conseqüente desambigüização da informação lexical; b) o processamento gramatical propriamente dito, com a verificação da correção das escolhas gramaticais feitas pelo usuário; e c) o pós-processamento sintático, com a aplicação de procedimentos de aconselhamento gramatical para readequação da cadeia de entrada aos padrões perseguidos pela ferramenta. Os resultados de testes comparativos de desempenho do ReGra obtidos pelo NILC são, segundo os próprios pesquisadores, bastante animadores, haja vista que, “numa avaliação global, testes de ambos os tipos demonstraram que qualquer 48 versão do ReGra apresenta um desempenho geral superior aos dos seus concorrentes. Conforme informações do NILC, para efeito de análise a atuação do ReGra foi dividida em quatro categorias de intervenção: verdadeiros negativos (a ferramenta não deveria intervir e não intervém), verdadeiros positivos (deveria intervir e intervém), falsos negativos (deveria intervir e não intervém) e falsos positivos (não deveria intervir mas intervém). Estes testes determinaram que: a) a revisão gramatical e ortográfica automática é não apenas possível, mas viável e útil, já que a ferramenta identifica 60,52% dos problemas praticados pelo usuário (na situação de teste) e se omite em apenas 17,84% dos casos; b) o preço pago para a identificação de mais da metade das inadequações praticadas pelo usuário ainda é alto (o número de falsos positivos ainda é maior do que o número de verdadeiros positivos) e que as estratégias utilizadas para reduzir o comportamento inadequado da ferramenta não têm produzido os efeitos esperados, já que as diferenças entre as várias versões são bem pouco significativas, se considerado o conjunto de sentenças que compõem o corpus de teste. Estabelece-se, portanto, como diretriz futura, mais do que a ampliação do escopo de atuação da ferramenta (para o incremento de número de erros identificados), uma revisão mais radical nas regras já existentes, para que se reduza o número, ainda excessivo, de falsos positivos. (grifo nosso) Quanto aos textos, eles são revisados pelo ReGra à taxa de, aproximadamente, 200 palavras por segundo, o que, segundo seus criadores, comprova o eficiente desempenho de seu analisador sintático e seus recursos lingüísticos, disponíveis eletronicamente e muito importantes para o processamento do português de um modo geral. Contudo, seu aprimoramento consiste num grande desafio, do ponto de vista de modelagem, de manipulação automática de informações lingüísticas e de auxílio a tarefas que o usuário realiza no ambiente computacional. (...) Basta notar que, em suas últimas cinco versões, o ReGra avançou apenas 1,04% na redução de intervenções indevidas e apenas 3,27% na ampliação das intervenções devidas. (...)o público-alvo do revisor, constituído por usuários do português brasileiro com nível de escolaridade médio, tem-se revelado insatisfeito com a restrição do escopo de intervenção do ReGra aos problemas ortográfico-sintáticos, exigindo a consideração de problemas de natureza semântico-pragmática, quase sempre relacionados a níveis maiores do que a oração. É necessário, p.ex., que tratemos problemas de estilo, muito mais vinculados ao propósito da eficácia comunicativa do que ao da adequação à norma gramatical. 49 Para uma melhor compreensão de como foi pensado para funcionar o revisor gramatical, e para complementar as informações disponibilizadas neste subcapítulo, optamos por reproduzir parte do artigo do NILC que descreve a gramática do ReGra, o qual dispomos na seção Anexos. Isso se deve ao receio que temos de, ao tentar explicar o processo por nós mesmos, não conseguirmos fazê-lo corretamente, visto ser conteúdo completamente novo e complexo para nós. 2.3.2 Como funciona o revisor gramatical do Word O Word exibe linhas onduladas vermelhas abaixo das palavras que não constam no dicionário do corretor ortográfico, e linhas verdes abaixo de sentenças que o corretor considera fora de concordância gramatical ou que tenha duplo sentido em uma frase. Este estudo somente trabalhará com as linhas onduladas verdes, uma vez que pesquisará as regras de concordância nominal constantes do programa. Para verificar a gramática em um documento, quando se deparar com uma estrutura frasal sublinhada em verde, o usuário deve selecionar a referida estrutura e clicar em menu Ferramentas item “Ortografia e gramática” ou, mais rapidamente, pressionar o atalho da tecla F7. Exemplo: Os professor não querem dar aula hoje. 50 Ao se deparar com a tela acima, o usuário tem a oportunidade de verificar onde ocorreu o erro apontado pelo revisor e proceder à correção sugerida por ele. Caso haja dúvidas sobre a coerência da(s) sugestão(ões), ou o usuário queira explicação gramatical para ela(s), deve clicar no botão “Explicar”, e o revisor oferecerá dicas e regras de concordância consideradas corretas. E a tela apareceria assim: Se o usuário clicar em “Alterar”, o programa automaticamente fará a correção da estrutura frasal de acordo com a sugestão que estiver em destaque (na cor azul). Por isso, é aconselhável que se preste atenção à qual forma, singular ou plural (quando aparecerem as duas juntas), que se pretende efetivamente utilizar. Gostaríamos de chamar a atenção aqui para a tela impressa acima. Apesar de termos propositalmente concordado “Os professor”, o revisor nos mostra uma tela não de concordância nominal, mas sim de concordância verbal, com as explicações dadas para o verbo “querer”, não fazendo menção alguma sobre o artigo “Os” estar no plural e o substantivo “professor”, no singular. Naturalmente que alguém, a esta altura, poderia questionar: “E daí? A sugestão de correção está correta, pouco importa, então, se vêm explicações de concordância verbal ou 51 nominal.”. Concordamos com a afirmação, porém isso nem sempre ocorre. A sugestão correta, queremos dizer. Ademais, não podemos nos esquecer daqueles que não são tão proficientes em gramática e sobre os quais falamos anteriormente. Naturalmente que eles não perderão tempo com regras gramaticais exibidas por um revisor gramatical eletrônico – e sabemos que eles não perderiam esse tempo muito menos com uma gramática impressa -, mas, como já falamos, nem sempre a sugestão vem de forma correta, ou não vem, pois o corretor não detecta a incorreção. Se o usuário simplesmente confiar no revisor, pode permanecer no erro, o que poderá prejudicá-lo seriamente dependendo de para quem se destina seu texto escrito. Por exemplo, numa carta, o candidato a um cargo em uma empresa, pode querer usar como um dos argumentos para ser aceito como funcionário, uma oração do tipo: “Vim para esta cidade a dois anos e moro há cinco quadras da empresa.”. O revisor aponta incorreção no primeiro período, e sugere a utilização de “há” no lugar de “a”, mas não vê nada de errado com o segundo período. Pois bem, a gramática prescreve que se deve utilizar, com referência a distância, a preposição “a”, e não “há”. Caso quem vá ler a carta seja um tanto ou quanto rigoroso em relação à ortografia, pode baixar alguns pontos na avaliação do candidato. 52 É claro que este exemplo é simplório, mas serve para mostrar que, como já dito anteriormente, conhecer regras gramaticais básicas para dar conta de uma situação lingüística é imprescindível. Por isso, é aconselhável não se tornar totalmente dependente da ajuda nem sempre confiável do revisor. Vejamos, ainda, o funcionamento do revisor gramatical quando se trata de parágrafos. Adoramos quando ele aponta nossos deslizes na escrita, mas ficamos irritados quando insiste em substituir nossa digitação por outra palavra que não desejamos, supostamente mais apropriada segundo sua lógica fria. Esse ritmo calculista dos revisores automáticos também acaba criticado sob a alegação de que não detectam uma série de problemas de texto que um revisor humano localizaria facilmente. Antes de dar razão aos críticos, é preciso saber o alcance desses programas. (MANOSSO, Radamés. O Software que nos corrige. In: revista Discutindo Língua Portuguesa. Ano 1, nº 3, 2006.) A pontuação é algo apontado constantemente pelo revisor eletrônico. Na maior parte das estruturas com que temos nos deparado, há uma porcentagem 53 relativamente alta de acertos do revisor, porém quando se trata de um caso como o exposto na tela acima, a colocação de uma expressão apositiva, fica mais difícil ele aconselhar corretamente. Outro exemplo: No século 19, a questão se tornou bastante popular, e multiplicaram-se “soluções” que poderíamos chamar de ingênuas, para não dizer inverossímeis. Todas elas propunham sempre uma origem muito simples para a linguagem humana e, por nunca considerarem a sua alta complexidade, nada diziam sobre o mais importante – isto é, como se deu o grande salto do muito simples para o altamente complexo. (FARACO, Carlos Alberto. No rastro da fala. In: revista revista Discutindo Língua Portuguesa. Ano 1, nº 3, 2006.) 54 Esses exemplos, dentre inúmeros outros, são para demonstrar as limitações que os revisores ainda carregam. Como dissemos anteriormente, para aqueles que dominam melhor a escrita, a solução é simplesmente ignorar o revisor quando este apresenta sugestões incongruentes, mas a preocupação é com aqueles que confiam no que ele ordena. Uns, por mera insegurança no próprio conhecimento das regras aprendidas na escola (ou fora dela) e um pouco de resistência em pesquisar em gramáticas; outros, por ignorância mesmo dessas regras. Pelo que vimos até agora por meio de testes simples, podemos arriscar, então, duas hipóteses: primeira, a programação embutida nos revisores eletrônicos se baseia na gramática normativa tradicional, uma vez que o que eles fazem é o mesmo que um gramático normativo típico faria diante de um texto; segunda (em decorrência da primeira), então, os revisores eletrônicos são úteis para revisar textos escritos segundo a variante culta, mas não são completamente eficientes para realizar esse trabalho. Muito ainda precisa ser melhorado quanto às regras contidas nele. Sabemos que a Informática, apesar de seu dinamismo, não consegue dar conta integralmente da vastidão e dinamismo das línguas naturais. Capítulo III – A concordância nominal Conhecer as regras de concordância do padrão culto serve, entre outros fins, como meio de adequação e interação social. Cereja & Magalhães Em Português a concordância consiste em se adaptar a palavra determinante ao gênero, número e pessoa da palavra determinada. (Bechara, 1999: 543). A concordância pode ser nominal ou verbal. A concordância nominal é a que se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o numeral ou o particípio (palavras determinantes) e o substantivo ou pronome (palavras determinadas) a que se referem. Já a concordância verbal é a que se verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da oração. A concordância pode ser estabelecida de palavra para palavra ou de palavra para sentido. A concordância de palavra para palavra será total ou parcial (também chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das palavras determinadas numa série de coordenação. A concordância de palavra para sentido se diz ainda concordância “ad sensum” ou silepse, ou mais modernamente, concordância ideológica. No capítulo destinado às Concordâncias Nominal e Verbal, Bechara adverte o falante para estar atento à liberdade de concordância que a língua portuguesa muitas vezes oferece. Essa liberdade deve ser cuidadosamente aproveitada para não prejudicar a clareza da mensagem e a harmonia do estilo. Na língua oral, em que o fluxo do pensamento corre mais rápido que a formulação e estruturação da oração, é muito comum enunciar primeiro o verbo – elemento fulcral da atividade comunicativa – para depois se seguirem os outros termos oracionais. Nestas circunstâncias, o falante costuma enunciar o verbo no singular, porque ainda não pensou no sujeito a quem atribuirá a função predicativa contida no verbo ; se o sujeito, neste momento, for pensado como pluralidade, os casos de discordância serão aí freqüentes. O mesmo ocorre com a concordância nominal, do particípio. (Bechara, 1999:544). A língua escrita, formalmente mais elaborada, tem meios de evitar estas discordâncias. 56 Cereja & Magalhães (1999:345) afirmam que a concordância nominal (assim como a verbal) está relacionada com os princípios lógicos da língua e que concordar adequadamente é demonstrar domínio dos mecanismos básicos de funcionamento da língua, defendidos pelo padrão culto. Mas alertam que Se não observamos esses mecanismos durante a interlocução, ainda assim é possível haver comunicação. Porém, dependendo de quem é nosso interlocutor, da expectativa que ele tem em relação a nós ou da impressão que desejamos passar a ele, o desvio das normas do padrão culto pode frustrar a finalidade da comunicação. Em certas situações de interação verbal – por exemplo, numa entrevista para se conseguir um emprego, no preenchimento de uma ficha, numa carta ou num artigo enviados a um jornal, numa palestra, etc. -, o desvio reiterado das regras de concordância pode causar a impressão de baixo nível cultural, pouca leitura, desleixo em relação à língua e até ser fonte de preconceito. Conhecer as regras de concordância do padrão culto serve, entre outros fins, como meio de adequação e interação social. Segundo Lucchesi (2006:21), “O pecado mortal lingüístico é a falta de concordância. E isso tem uma única razão: ela é a grande marca da linguagem popular”. Para o autor acima, a falta de concordância na fala popular tem razões históricas, uma vez que, durante os primeiros séculos de sua colonização, o Brasil foi um país rural, de pequenas cidades costeiras pouco influentes sobre o restante do território. “Nesses incipientes núcleos urbanos, a elite procurava falar como se fazia na metrópole portuguesa” (idem:22). Mesmo após a independência do país, o Português teve que conviver com as variedades da língua tupi faladas pelos povos indígenas do litoral brasileiro no século XVI. Como se sabe, o tupi, adotado pelos colonos portugueses e pelos jesuítas na catequese, tornou-se o idioma mais falado na província de São Paulo até o século 18. Depois, vieram os escravos africanos, falando centenas de línguas. “Abria-se, assim, um imenso fosso entre uma elite que se esmerava em reproduzir os padrões conservadores de Portugal e a língua falada pelo povo: um Português mestiço e alterado pelo contato entre diferentes línguas” (Lucchesi, 2006:22). Mas um dos aspectos mais universais das situações de contato maciço entre línguas é justamente o que mais causa preconceito: a perda das regras da concordância. Em todas as regiões do planeta onde ocorreram esses fenômenos (América, África, Ásia ou Oceania), a língua européia imposta perdeu em algum nível as suas regras de concordância. (idem) 57 A partir do final do século 19, com a vinda de aproximadamente 3 milhões de imigrantes italianos, alemães e japoneses e, posteriormente, com a urbanização da sociedade brasileira – conseqüência do processo de industrialização do país -, e com o movimento modernista propondo um resgate radical da cultura popular brasileira, passa a haver uma valorização da linguagem brasileira com suas variantes coloquiais. Apesar de a tradição gramatical brasileira continuar a impingir sobre a sociedade o modelo do Português europeu, o que gera ainda um forte sentimento de insegurança lingüística, principalmente nos segmentos escolarizados, “a fala popular aos poucos vem incorporando – ao contrário do que acontecia – estruturas da fala culta, em razão da crescente influência dos centros urbanos sobre as demais regiões do país” (Lucchesi:23). As opiniões de Lucchesi servem de apoio à análise que pretendemos efetivar quando falarmos sobre que nível gramatical privilegia o revisor eletrônico do Word. Ou seja, até que ponto o usuário/redator de um texto no computador encontra dificuldades por não dominar as regras de concordância contidas na gramática eletrônica. Por ser o objeto de estudo deste trabalho, disponibilizamos, a seguir, as regras de concordância nominal constantes das gramáticas de Napoleão Mendes de Almeida, Evanildo Bechara e Maria Helena Moura Neves, que foram copiadas, redigitadas, por nós com o intuito explicado na parte introdutória desta dissertação. 3.1 GRAMÁTICA METÓDICA DA LÍNGUA PORTUGUESA Napoleão Mendes de Almeida CONCORDÂNCIA NOMINAL CONCORDÂNCIA DO ADJETIVO COM O SUBSTANTIVO REGRA GERAL: O adjetivo, quer adjunto adnominal quer predicativo, quer anteposto quer posposto, concorda em gênero e número com o substantivo a que se refere. Ex.: “Via recolhidas no santuário as tábuas de bronze”. “Hei de fazer públicos os seus desaforos”. 58 REGRAS ESPECIAIS * Se o adjetivo se refere a vários substantivos do singular e do mesmo gênero, e vem: 1) Posposto – vai, indiferentemente, para o plural e para o gênero dos substantivos ou fica no singular: Ex.: “Nessa leitura e escrita tão arrepiadas de dificuldades”. “Rugido, grito, gemido conglobados num só hiato”. “... a consciência e a dignidade humanas”. “Coragem e disciplina digna de granadeiros” “... rudeza e pusilanimidade alheia”. Nota – Será de obrigação o singular, quando o adjetivo só se referir ao último substantivo: Ex.: “O casaco e o chapéu redondo eram o meu alvará”. 2) Anteposto – concorda com o substantivo mais próximo: Ex.: “... cujo trajo e gesto indicavam...” “... notando o estrangeiro modo e uso” “Chegada a hora e a ocasião”. Notas: 1ª - Os exemplos de construção no plural não devem ser imitados: Ex.: “ Desbotadas a cor e a frescura da infância ” “ A mão cujos índice e polegar ” 2ª - Somente quando predicativo do objeto é que o adjetivo pode ir para o plural: Ex.: “ Eu julgava satisfeitos o pai e o filho ” “ ... entretinham vivas a idéia e a saudade “ 3ª - Se aos substantivos precederem títulos ou pronomes de tratamento, a concordância se efetuará no plural: Ex.: “ Os apóstolos Barnabé e Paulo “ “ Os irmãos Joaquim e José ” “ Os Sres. Silva e Cia ” (sic) * Se o adjetivo se refere a vários substantivos no singular e de gênero diferente, e vem: 1) Ex.: Posposto – vai para o plural masculino: “Nariz, face e boca monstruosos” “...comércio e navegação costeiros” “Uma posse e um domínio incompletos” Notas: 1ª - Pode também concordar com o substantivo mais próximo se o sentido o exige, ou o queremos: Ex.: “Manda-me livro e fruta madura” “Talento e habilidade rara” (ou raros) “Ali dei a tradução em língua e estilo moderno” “... o retrato de Maria com túnica e escapulário branco” 2ª - Se os substantivos forem sinônimos, o adjetivo concordará com o mais próximo: Ex.: “As maldições se cumpriam no povo e gente hebréia”. 59 2) Anteposto – concorda com o mais próximo ou, indiferentemente, vai para o plural masculino: Ex.: “Pasmado Diogo e a multidão” “...atentos o juízo e generosidade” “Demais disso, sua mãe e irmão eram ricos” “Perdida a cor e o alento” “...tinha tornado inúteis a inteligência e o braço” “...declarou criminosa a ré e o réu” “Verão os homens ensangüentados o sol e a lua”. * O adjetivo que se refere a substantivo do plural e de gêneros diversos vai, geralmente, para o plural e para o gênero do substantivo mais próximo: Ex.: “ As armas e os barões assinalados” ou: Os barões e as armas assinaladas “ ... carícias e bens paternos “ “ ...mordomos e confrarias festeiras” “...casas e corações abertos” “...atos e fórmulas religiosas” Nota: Há em bons escritores nossos o emprego exclusivo do plural masculino: Ex.: “ Os recursos e as tropas desproporcionados” “ Pais e mães carregados de família” “...enviando os breves e cartas destinados a protegê-los” “ Pagos as rendas, foros e impostos”. * Se o adjetivo se refere a substantivo do mesmo gênero e de números diferentes, e vem: 1) Anteposto – concorda com o substantivo mais próximo: Ex.: “ Os seus filhos e marido são meus hóspedes” “ Sua astúcia e tiranias” “ Sua mulher e filhas”. 2) Posposto – vai para o plural de igual gênero dos substantivos: Ex.: “ ...com as colônias e com a civilização romanas” “ Se os recursos e o tempo absorvidos...” “ Vês aqui as mãos e a língua delinqüentes”. * Se os substantivos forem sinônimos ou formarem gradação nas idéias enunciadas, a concordância do adjetivo se efetuará com o mais próximo, quer venha antes quer depois: Ex.: “ ...depreender-se de uma idéia e pensamento falso”. “ ingratidão na fraqueza e temor natural” “...para servirem ao interesse e gosto alheio”. “...a fé e a amizade declarada”. * Mais de um adjetivo qualifica ou determina o mesmo substantivo – Podem ser dadas à frase várias formas: Ex.: O primeiro batalhão e o segundo; O primeiro e o segundo batalhão; O primeiro e segundo batalhão. Gramáticos há que permitem a construção: “O primeiro e o segundo batalhões” – levando-se para o plural o substantivo ao qual se referem vários 60 adjetivos no singular. Aceitam essa concordância Constâncio, Pacheco Júnior, Soares Barbosa, Rui Barbosa e Mário Barreto, aos quais apóiam exemplos dos melhores manejadores do idioma. Conceitua Epifânio Dias que se pode dizer: “Os dois poderes, temporal e espiritual”, “Os dois poderes, o temporal e o espiritual” (Observe-se a vírgula no primeiro exemplo e a repetição do artigo no segundo). Reconheço casos em que o plural do substantivo se impõe pelo uso (“Nos dias 24 e 29 de junho”), mas o mais seguro é evitar, sempre que possível, a flexão do substantivo, porque, seja como for, o adjetivo é que concorda com o substantivo e não este com aquele. EXEMPLOS DIVERSOS: “As expressões que se empregam na lei prussiana e na francesa” “ ...na terrível peleja do bom e do mau princípio” “ As personagens são as do velho e do novo testamento” “ A primeira e a segunda ameia” * Se o substantivo vem antecedido de alguma coisa, qualquer coisa, vai para o feminino se não intervém a preposição de (“Alguma coisa consoladora”) e para o masculino com a presença dessa partícula (“Alguma coisa de consolador”). * Em expressões como “pobre do homem”, “desgraçado de ti”, a interposição da preposição de não impede a concordância do adjetivo: “Desgraçadas das mulheres” – “Coitados dos que foram para a guerra”. * O adjetivo antecedido de nada de, algo de, muito de, um quê de, um quid de, o que quer que seja de, um não sei quê de concorda com o sujeito conforme pelo sentido estiver em relação com ele ou com o nome de significação geral e indefinida que aquelas palavras e expressões encerram: Ex.: “ Este escritores têm o que quer que seja de ímpios e ateus”. “ Têm muito de garridas e romeiras essas raparigas”. “ Mostraram eles na linguagem muito de duro e áspero” (ou de duros e ásperos) “ Possuem elas um não se quê de esquisito”. * O substantivo aposto concorda com seu fundamental em gênero e número sempre que possível: Ex.: “ O ódio, filho do orgulho” “ A esperança, filha da fé” “ Estes instrumentos, produtos de nossa fabricação” CONCORDÂNCIA DO PREDICATIVO COM O SUJEITO REGRA GERAL: O predicativo, quando constituído de adjetivo ou de pronome, concorda com o sujeito em gênero e número: Ex.: “ Pedro é generoso” “ Maria parece bondosa” “ É você o procurador da casa? - Sou-o” (O pronome está concordando com procurador) REGRAS ESPECIAIS * Quando o predicativo é constituído de substantivo abstrato ou de substantivo de uma só forma genérica, deixa de concordar com o sujeito, ficando invariável: Ex.: “ As propriedades não são natureza”. 61 “ As lágrimas do aflito não são crime”. “ As cores que no camaleão são gala, no polvo são malícia”. “ Ele é a esperança da família”. * Há casos curiosos de discordâncias do predicativo com o sujeito quando este, sem nenhuma determinação, é expresso em sua generalidade abstrata: Ex.: “Cerveja não é bom para a saúde”. “Pimenta é bom para estimular”. “É necessário paciência”. “É proibido entrada”. “Não é necessário mulheres na fábrica”. Os predicativos bom, necessário, proibido assumem a forma aparentemente masculina, mas realmente neutra, visto que os substantivos a que se referem, tomados em sua generalidade abstrata, assumem sentido vago, no qual como que se oblitera o conceito genérico. OUTROS EXEMPLOS: “É bom toda a cautela” - “É necessário prudência nos negócios” – “É preciso mais areia” – “Não é preciso margem” – “É feio blusa em criança” – “Uma caixa de sapato seria bom para guardar os brinquedos”. É este um dos vestígios interessantes do gênero neutro em português. Logo, porém, que esses sujeitos recebam uma determinação positiva, despojam-se do caráter neutro, e o predicativo assume a flexão genérica correspondente: Ex.: “Esta cerveja não é boa para a saúde”. “Aquelas pimentas são boas para estimular”. “É necessária a paciência”. “É proibida a entrada”. * Quanto à concordância do predicativo, devemos observar o seguinte: 62 1) Referindo-se a nome tomado em sentido determinado (antecedido de artigo), varia em gênero e número: “Sois a mãe desta criança? Sou-a” – “Sois a professora desta escola? Sou-a” (Este a é pronome articular, e não pronome pessoal). 2) Referindo-se a nome tomado em sentido vago, indeterminado (não antecedido de artigo, e equivalente, então, a isto, isso, aquilo) ou referindo-se a adjetivo, fica invariável na sua forma masculina, ou antes, neutra: “Sois mãe? Souo” (=Sou isso) – “Sua mãe era vã como o são todas” – “Se Henrique fora ambicioso não o era menos sua mulher” – “Se jamais houve condição para inveja, aquela o foi sem nenhuma falta”. CONCORDÂNCIA DO PRONOME REGRA GERAL: Quando flexível, o pronome concorda em gênero e número com o nome a que se refere: Ex.: “Para isso é preciso mais esforço que para defrontar a morte, mas tu o terás; inspirar- to-ão o meu exemplo e a santa memória de nossos pais”. “Quero tê-lo, Vasco, porque tu o desejas”. REGRAS ESPECIAIS * Os pronomes oblíquos o, a, os, as, referindo-se a substantivos de gêneros diversos, tomam no plural a flexão masculina: Ex.: Porque essas honras vãs, esse ouro puro Verdadeiro valor não dão à gente: Melhor é merecê-los sem os ter Que possuí-los sem os merecer. * Referindo-se a um substantivo modificado por outro regido da preposição de companhia com, pode o pronome ir para o plural, como acontece com o verbo: Ex.: “Passava um dia de inverno o arcebispo com sua comitiva a serra de Gerez... salteou-os uma chuva fria e importuna”. 63 CONCORDÂNCIA IRREGULAR OU FIGURADA (p.416) SILEPSE Concordância irregular, também chamada concordância figurada, é a que opera não com o termo expresso, mas com outro termo latente, isto é, oculto, mentalmente subentendido. Outros nomes tem* ainda semelhante concordância: semiótica, lógica, latente, anormal, mental, nomes que denotam operar-se a concordância não com a letra, mas com o espírito, com a idéia da frase. Tal tipo de concordância se denomina silepse. Etimologicamente (do grego syn = com, mais lépsis, do verbo lambánô = tomar, prender), silepse é sinônimo de compreensão. A silepse pode ser de gênero, de número e de pessoa. A silepse de GÊNERO opera-se: 1 - Com os nomes próprios de rios e de cidades, concordando o adjetivo não com o substantivo próprio em si, expresso na frase, mas com o apelativo dessas classes ( rio, cidade): masc. fem. “Cartago foi destruídA” (cidade). “O Paraíba é tortuosO” (rio). Nota – Sabemos já que constituem exceções alguns nomes de cidades: “O Porto está cheiO de visitantes” – “O Rio de Janeiro é festivO”. 2 - Nas expressões de tratamento (vossa senhoria, vossa mercê, vossa alteza, sua excelência, sua majestade, etc.), em que a concordância se opera não com o gênero dessas expressões, mas com o sexo ou com a natureza do cargo da pessoa a que essas expressões são dirigidas: “Vossa majestade é poderosO” (rei) – “Vossa 64 alteza é bondosO” (príncipe) – “Vossa senhoria foi indicadO” (homem) – “Você está enganadA” (mulher). 3 – Com os artigos o e um, quando, em certas frases já consagradas, constituem atributivos de nomes femininos que se referem a pessoa de sexo masculino: “Pedro é um criança” “O besta do Antônio” “Antônio é um banana” 4 – Em outros casos em que o pronome concorda não com o gênero da palavra expressa, mas com o sexo da pessoa a que a palavra se refere: “Conheci uma criança... mimos e castigos podiam com ele; mas em lhe falando na mãe e no que custara para lhe dar a vida, o infeliz, que nunca a vira, enternecia-se” - “Só nove crianças de 6 até 8 anos e tais que é lástima vê-los”. 5 – Como preencher, numa ficha em que se discriminam os dados identificadores de uma pessoa, o que pede a nacionalidade? Se homem, como escrever na frente da palavra nacionalidade: brasileiro ou brasileira? Se de homem se tratar, brasileiro é que se deverá consignar. Brasileira, tão só quando de mulher forem os dados. Não haja nisso admiração. À pergunta “Qual o estado civil?” ninguém se aventuraria a declarar “casado”, quando de mulher se tratasse. “Estado” está na ficha, mas “casada” se põe, porque não o estado mas a mulher é que se qualifica. A silepse de NÚMERO opera-se: 1 – Com o adjetivo no singular em função predicativa aos sujeitos nós (empregado em lugar de eu), vós (quando empregado em lugar de tu): “Antes sejamos breve que prolixo” – “Vós estais enganado” – “Amigo atento e obrigado somos” – “Estamos persuadido disso”. Nota: a) Ao emprego de nós com valor de eu, e de vós, com valor de tu já tivemos ocasião de referir-nos no § 342, 1. Nós é empregado em lugar de eu pelos reis, pelos papas e prelados (plural majestático). O verbo irá para o plural, mas o adjetivo, como dissemos, concordará silepticamente. b) Emprega-o ainda o escritor ou o orador, para efeito retórico, mas não poderá empregar ora eu, ora nós; ou sempre uma, ou sempre outra forma, notando- 65 se ainda que as formas pronominais oblíquas e os possessivos devem ser uniformes com a escolha: Nós julgamos... foi-nos relatado... nossa opinião. c) Vós emprega-se em lugar de tu quando se trata o interlocutor com deferência especial. Curioso é notar a não existência de tal emprego em latim: o interlocutor, fosse quem fosse – superior jerárquico (sic), rei ou o próprio Deus – era sempre tratado por tu. Vós, nesse idioma, só se empregava quando realmente plural. 2 – Quando, sendo o sujeito coletivo de forma singular, vai, entretanto o verbo para o plural, conformando-se com a pluralidade lógica do coletivo: “Estavam pegados* com ele uma infinidade de homens” – “A máxima parte dos homens morrem antes dos cinqüenta” – “Abalou o colégio quase todo em procissão pelas ruas de Coimbra, capitaneados pelo seu reitor”. Note-se, nesses casos, uma destas particularidades: 1 – a pluralidade lógica contida no coletivo; 2 – a distância geralmente existente entre o sujeito e o verbo; 3 – a presença de um genitivo plural. 66 Nota – 90% dos homens viajaram Discriminemos estes casos: – No plural ou no singular o verbo? a) Quando o predicado é constituído de verbo de ligação ou de locução verbal passiva, o verbo e o predicativo (ou o particípio nas locuções passivas) deixam-se influenciar pelo número e pelo gênero do partitivo: “90% das MULHERES SÃO analfabetAS” – “30% da nossa PRODUÇÃO é exportadA” – “20% da POPULAÇÃO ESTAVA acamadA” – “50% das PROFESSORAS DEVEM ser nomeadAS por merecimento”. b) Quando o número porcentual vem antecedido ou seguido de adjunto no plural, é melhor aceitar o plural: “BONS 30% DÃO conta das obrigações” – ESSES 5% da boiada MORRERAM” – “90% DOS HOMENS VIAJARAM”. E assim: “Duas terças partes da população são aliadófilas” – “Duas terças partes do país foram devastadas”. c) Afora esses casos o singular é empregado: “90% da imprensa DEFENDE” – “80% do eleitorado COMPARECEU” – “90% da borracha latino-americana ainda PROVÉM de árvores nativas” – exatamente como diz o inglês, cioso do s final da terceira pessoa do singular do indicativo presente: “Ninety percent of Latin American rubber still COMES from wild jungle trees”. d) Quanto a “parte de”, “metade de”, “a maior parte de” , “a maioria de”, veja o § 711. e) Quanto à idéia de quantidade, veja o § 713. A silepse de PESSOA consiste em operar-se a concordância do verbo não com a pessoa do aposto claro, mas com a pessoa do fundamental oculto: “Dizem que os cariocas somos pouco dados a jardins públicos” – isto é: “...que nós, os cariocas, somos...” (O verbo concorda com o fundamental oculto nós, e não com o aposto claro “os cariocas”). OUTROS EXEMPLOS: “Ali ficamos alguns amigos” – “Os dois íamos ali por visita” – “Os portugueses fazemos este nome particular” – “Os quatro que escapamos, nos lançamos ao mar” - “Todos os filhos de Adão padecemos nossas mutilações e fealdades” – “Uns esperando andais noturnas horas, outros subis telhados e paredes” – “Os outros saltamos para testemunhar a catástrofe”. 3.2 MODERNA GRAMÁTICA PORTUGUESA Evanildo Bechara CONCORDÂNCIA NOMINAL Considerações gerais – Em Português a concordância consiste em se adaptar a palavra determinante ao gênero, número e pessoa da palavra determinada. A concordância pode ser nominal ou verbal – Diz-se concordância nominal a que se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o numeral ou o particípio (palavras determinantes) e o substantivo ou pronome (palavras determinados (sic)) a que se referem. Diz-se concordância verbal a que se 67 verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da oração. A concordância pode ser estabelecida de palavra para palavra ou de palavra para sentido. A concordância de palavra para palavra será total ou parcial (também chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das palavras determinadas numa série de coordenação: “Repeli-a, porque se me ofereciam vida e honra a troco de perpétua infâmia” [AH.1, 147]. “ porque entre ele e Suintila... está o céu e o inferno” [AH.2, 124]. “...via-se em todas as faces pintado o espantoso e o terror” [AH.2, 124]. “Quando a educação, os livros, e o sentir daqueles que nos odeiam, apagou em nossa alma o selo da cruz” [AH.2, 143]. A concordância de palavra para sentido se diz ainda concordância “ad sensum” ou silepse: “ A plebe vociferava as mais afrontosas injúrias contra D. Leonor: e se chegassem a entrar no paço, ela sem dúvida seria feita pedaços pelo tropel furioso” [AH.2, 41]. É preciso estar atento a que a liberdade de concordância que a língua portuguesa muitas vezes oferece, deve ser cuidadosamente aproveitada para não prejudicar a clareza da mensagem e a harmonia do estilo. Na língua oral, em que o fluxo do pensamento corre mais rápido que a formulação e estruturação da oração, é muito comum enunciar primeiro o verbo – elemento fulcral da atividade comunicativa – para depois se seguirem os outros termos oracionais. Nestas circunstâncias, o falante costuma enunciar o verbo no singular, porque ainda não pensou no sujeito a quem atribuirá a função predicativa contida no verbo ; se o sujeito, neste momento, for pensado como pluralidade, os casos de discordância serão aí freqüentes. O mesmo ocorre com a concordância nominal, do particípio. A língua escrita, formalmente mais elaborada, tem meios de evitar estas discordâncias. Concordância nominal A – Concordância de palavra para palavra 1) Há uma só palavra determinada. A palavra determinante irá para o gênero e número da palavra determinada: “Aflige-nos a glória alheia contestada com a nossa insignificância” [MM]. “Os bons exemplos dos pais são as melhores lições e a melhor herança para os filhos” [MM]. “Eu amo a noite solitária e muda” [GD. 3, I, 314]. Eu estou quite. Nós estamos quites. 2) Há mais de uma palavra determinada. Observar-se-ão os seguintes casos: 1º) Se as palavras determinadas forem do mesmo gênero, a palavra determinante irá para o plural e para o gênero comum, ou poderá concordar, principalmente se vier anteposta, em gênero e número com a mais próxima: A língua e (a) literatura portuguesas ou A língua e (a) literatura portuguesa. 68 “Amava no estribeiro-mor as virtudes e a lealdade nunca desmentidas” [RS.1, 124]. “O tom e gesto caricioso, com que ela dizia isto, não moveu medianamente o esposo” [CBr. 1, 158]. “e os nossos Basílio e Durão, bem assim o Sr. Magalhães...” [OM, 72]. OBSERVAÇÕES: 1º) Se as palavras determinadas se referirem a uma só pessoa ou coisa, impõe-se o singular do determinante: seu fiel amigo e servidor 2º) É injusta a crítica do gramático E. Carlos Pereira aos seguintes exemplos: “ ...a mão esquerda, entre cujos índice e polegar pendia o pergaminho...” [AH.5, II, 24] e “...pelas exigências cada vez maiores destas devoradoras e insaciáveis fome e sede de leitura” [AC.1, 315]. 3º) Precedendo um substantivo (título ou prenome), ocorre o plural: os irmãos Pedro e Paulo. Os apóstolos Barnabé e Paulo. 4º) Um determinante (adjetivo) no plural pode estar aposto a um sujeito no singular que venha colocado depois, quando este sujeito é algum dos pronomes cada um, cada qual, ninguém, nenhum, referidos a pessoas ou coisas já mencionadas: sobressaltados com esta vista, procurava cada um pôr-se a salvo [ED]. 2º) Se as palavras determinadas forem de gêneros diferentes, a palavra determinante irá para o plural masculino ou concordará em gênero e número com a mais próxima: “Vinha todo coberto de negro: negros o elmo, a couraça e o saio” [AH.1, 107]. “como se um grande incêndio devorasse as brenhas e os carvalhais antigos” [AH.1, 86]. “Calada a natureza, a terra e os homens” [GD.3, I, 315]. com boa coragem e zelo, com coragem e zelo bom (ou bons), com bons coragem e zelo toda sua luta e sacrifícios. todos seus sacrifícios e luta. OBSERVAÇÕES: 1º) Por uma questão de agrado auditivo (eufonia), prefere-se que numa série de palavras determinadas de gêneros diferentes seguida de palavra determinante no masculino plural, venha a determinada masculina em último lugar. 69 2º) Se, neste caso, se tratar de pronome possessivo posposto, a concordância deste se fará com o último substantivo: “Este velho desterrado por gosto e eleição sua...” [RS.1, 16]. 3º) Quando há idéia de reciprocidade, torna-se obrigatório o emprego do plural: “Ele entrou prazenteiro... e encontrou padrinho e afilhada empenhados em uma discussão sobre autoridade” [LBa apud SS.1 § 257 obs.]. 3º) Há uma só palavra determinada e mais de um determinante. A palavra determinada irá para o plural ou ficará no singular, sendo, neste último caso, facultativa a repetição do artigo. Em geral, isto ocorre com adjetivos de nacionalidade: As literaturas brasileira e portuguesa ou A literatura brasileira e portuguesa (maneira de dizer menos freqüente e, com exagero de lógica gramatical, considerada errônea por muitos autores) ou A literatura brasileira e a portuguesa. “e os cronistas tudense e toledano fazem a luta dos dous reis depois daquele consórcio” [AH.6, III, 86]. “Li um anúncio, convidando mestra de línguas inglesa e francesa para o colégio” [CBr. 1, 128]. “O pequeno reino sucessivamente perlustrou as costas ocidental e oriental da África...” (C. de Laet, I, 211) as séries quarta e quinta a quarta e quinta série (ou séries) B – Concordância de palavra para sentido A palavra determinante pode deixar de concordar em gênero e número com a forma da palavra determinada para levar em consideração, apenas, o sentido em que esta se aplica: o (vinho) champanha, o (rio) Amazonas. Entre os diversos casos desta concordância pelo sentido aparecem os seguintes: 1) As expressões de tratamento do tipo de V. Exª., V. Sª., etc.: atencioso (referindo-se a homem) V. Exª. é atenciosa (referindo-se a mulher) OBSERVAÇÃO: Quando se junta um adjetivo a tais formas de tratamento, tal adjetivo fica no gênero da forma de tratamento: Sua Majestade fidelíssima foi contrariado pelos representantes diplomáticos. 70 2) A expressão a gente aplicada a uma ou mais pessoas com inclusão da que fala: “Pergunta a gente a si próprio (refere-se a pessoa do sexo masculino) quanto levaria o solicitador ao seu cliente por ter sonhado com o seu negócio” [PC apud MBa. 2, 413] 3) O termo determinado é um coletivo seguido de determinante em gênero ou número (ou ambos) diferentes: “Acocorada em torno, nus, a negralhada miúda, de dois a oito anos” [HC.2, 84]. 4) A palavra determinada aparece no singular e mais adiante o determinante no plural em virtude de se subentender aquela no plural: “Não compres livro somente pelo título: ainda que pareçam bons, são muitas vezes péssimos” [JR.1, 321]. “Mas não nos constou em que ano começou nem quantos esteve com ele” [LS apud JR.1] C - Outros casos de concordância nominal 1) Um e outro, nem um nem outro – Com um e outro, põe-se no singular o determinado (substantivo), e no singular ou no plural o verbo da oração, quando estas expressões aparecem como sujeito: “Alceu Amoroso Lima (...) teve a boa idéia de caracterizar e diferençar o ensaio e a crônica, dizendo que um e outro gênero se afirmam pelo estilo”. “Parou um momento e, olhando para um e outro lado, endireitou a carreira...” [AH. 1, 107]. “Mas uma e outra cousa duraram apenas rápido instante” [AH.1, 218]. Com nem um nem outro é de rigor o singular para o substantivo e verbo: Nem um nem outro livro merece ser lido. Com um ou outro o substantivo também fica no singular e invariavelmente no singular aparece o verbo de que a expressão serve de sujeito: “Um ou outro soldado, indisciplinadamente, revidava, disparando à toa, a arma para os ares” [EC, 2ªed., 428]. Se as expressões um e outro, nem um nem outro se aplicarem a nomes de gêneros diferentes, é mais comum o emprego das formas masculinas: “Tornou a vê-la, foi visto por ela, e acabaram namorados um do outro” [MA. 12, 1ª. ed., 39) “Ali teve el-rei escondido algum tempo, e lá começaram os seus amores com a rainha, que tão fatais foram para um e outro” [Ah.2, 35]. “Repousavam bem perto um do outro a matéria e o espírito” [AH.1, 44]. Não raro pode aparecer a concordância com o termo referido: “...vivia o casal venturoso de um certo Izraim persa letrado e da sua esposa Proftásia que um e outra cultivavam para deleite do espírito a filosofia grega” [JR.2, 15]. 2) Mesmo, próprio, só – Concordam com a palavra determinada em gênero e número: Ele mesmo disse a verdade. Ela mesma disse a verdade. Elas próprias foram ao local. Nós não estamos sós. 71 “Eles sós se encaminham para essa parte...” [AH.1, 153]. Em língua literária ocorre o adjetivo só variável onde no colóquio se prefere usar do advérbio só, portanto invariável: “Com sós 27 anos de idade... já a palidez da morte se via lutar no seu rosto com as rosas da mocidade [AC.10]. Mesmo, além de se empregar na idéia de identidade (= em pessoa), aparece ainda como sinônimo de próprio, até: “ao mesmo demônio se deve fazer justiça, quando ele a tiver [AV apud Ed.2, §86,a]. Este último sentido e mais o emprego adverbial junto de aqui, já, agora (aqui mesmo, já mesmo, agora mesmo) facilitaram o aparecimento moderno da palavra como advérbio, modo de dizer que os puristas condenam, mas que vem ganhando a simpatia geral: “...vaidosos de seus apelidos, mas inofensivos, e virtuosos mesmo por vaidade de imitarem seus avoengos” [CBr.6,219]. É preciso atenção para não fazer a concordância de menos com o substantivo seguinte: Mais amores e menos confiança (e não menas!). Vale a mesma observação para somenos (= de menor valor): “Há neles coisas boas e coisas más ou somenos” [MB.2, 239]. 3) Leso – É adjetivo, e não forma do verbo lesar, em construções de tipo: crime de lesa-pátria, crime de leso-patriotismo. Por isso há de concordar com o seu determinado em gênero e número: “Como se a substância não fosse já um crime de leso-gosto e lesa-seriedade, ainda por cima as pernas saíam sobre as botas” [CBr.1, 83]. 4) Anexo, apenso e incluso – Anexo, apenso e incluso, como adjetivo, concordam com a palavra determinada em gênero e número: Correm anexos (inclusos, apensos) aos processos vários documentos. Vai anexa (inclusa, apensa) a declaração solicitada. OBSERVAÇÃO: Usa-se invariável em anexo, em apenso: Vai em anexo (em apenso) a declaração. Vão em anexo (em apenso) as declarações. 5) Dado e visto – Usados adjetivamente, concordam em gênero e número com o substantivo determinado: Dado (Visto) o problema que se nos apresentou, resolvemos desistir do contrato. Dadas (Vistas) as circunstâncias, foram-se embora. 6) Meio – Com o valor de “metade”, usado adjetivamente, concorda em gênero e número com o termo determinado, claro ou oculto: “Para aquilatar a importância do tropeiro, basta lembrar que o Brasil tem cerca de oito e meio milhões de quilômetros quadrados de superfície...” [AAr.2, 102]. Era meio-dia e meia (i.é: e meia hora). 7) Pseudo e todo – Usados em termos compostos ficam invariáveis. A pseudo-sabedoria dos tolos é bem grande. 72 A fé todo-poderosa que nos guia é nossa salvação. 8) Tal e qual – Tal, como todo determinante, concorda em gênero e número com o determinado: Tal opinião é absurda. Tais razões não me movem. Em correlação, tal qual também procedem à mesma concordância: Ele não era tal quais seus primos. Os filhos são tais qual o pai. Os boatos são tais quais as notícias. OBSERVAÇÕES: 1ª) em lugar de tal qual, podem aparecer: tal e qual, tal ou qual. 2ª) Não confundir tal qual flexionáveis com tal qual, tal qual como invariáveis que valem “como”: “Descerra uns sorrisos discretos, sem mostrar os dentes, tal qual como as inglesas de primeiro sangue” [CBr apud CJ.1, 32]. 73 9) Possível – Com o mais possível, o menos possível, o melhor possível, o pior possível, quanto possível, o adjetivo possível fica invariável, ainda que se afaste da palavra mais: Paisagens o mais possível belas Paisagens o mais belas possível Paisagens quanto possível belas Com o plural os mais, os menos, os piores, os melhores, o adjetivo possível vai para o plural: Paisagens as mais belas possíveis. Estão erradas concordâncias como: Paisagens as mais belas possível. Fora destes giros, a concordância de possível se processa normalmente: “As alturas e o abismo são as fronteiras dele: no meio estão todos os universos possíveis” [AH.2, 160]. 10) A olhos vistos – É tradicional o emprego da expressão a olhos vistos no sentido de claramente, visivelmente, em referência a nomes femininos ou masculinos: “...padecia calada e definhava a olhos vistos” [MA.5, 13 apud Tradições Clássicas, 370]. Mais rara, porém correta, é a concordância de visto com a pessoa ou coisa que se vê: “As minhas forças medravam a olhos vistas de dia para dia” [AC apud CR.1, 554]. “O barão desmedrara a olhos visto” [CBr apud PDo.2, 32]. 11) É necessário paciência – Com as expressões do tipo é necessário, é bom, é preciso, significando ‘é necessário’, o adjetivo pode ficar invariável, qualquer que seja o gênero e o número do termo determinado, quando se deseja fazer uma referência de modo vago ou geral. Poder-se-á também se fazer normalmente a concordância: 74 É necessário paciência. É necessária muita paciência. “O fato de ter sido precisa a explicação (...) [AP.1, 424, nº. 25]. “Eram precisos outros três homens” [AM.1 apud RBa.1,33]. É possível ainda, em tais casos, aparecer no singular o próprio verbo da oração: “É doce ao velho Sons d’argentina voz” [GD apud SS.1, 254]. Como acentua Barbadinho, a flexão de necessária(s) é mais freqüente que a de precisa. 12) Adjetivo composto – Nos adjetivos compostos de dois ou mais elementos referidos a nacionalidades, a concordância em gênero e número com o determinado só ocorrerá no último adjetivo do composto: Acordo luso-brasileiro Amizade luso-brasileira Lideranças luso-brasileiras 13) Alguma coisa boa ou alguma coisa de bom – Em alguma coisa boa o adjetivo concorda com o termo determinado: “Quem tivesse reparado em Fr. Vasco perceberia facilmente que na sua alma se passava também alguma cousa extraordinária” [AH apud MBa.7, 144]. Em alguma coisa de bom, o adjetivo não concorda com coisa, sendo empregado neutralmente (como algo de novo, nada de extraordinário, nada de trágico, etc.). Por atração pode-se fazer a concordância do adjetivo com o termo determinado que funciona como sujeito da oração: “Que tinha pois, Ricardina, de sedutora!” [CBr apud MBa.7, 146]. “Amor próprio do vilão; que a infâmia nada tinha de engenhosa” [Id., ibid.]. Se os homens não tivessem alguma coisa de loucos seriam incapazes de heroísmo [MM]. (ver sugestão do corretor eletrônico, abaixo) A vida nada tem de trágica. 75 14) Um pouco de luz e uma pouca de luz – Ao lado da construção normal um pouco de luz pode ocorrer a concordância atrativa uma pouca de luz, por se haverem fundido numa só expressão as duas seguintes maneiras de dizer: pouco de luz + pouca luz (Dá-se ao fenômeno o nome de contaminação ou cruzamento sintático. Cf. pág.596.). “e aos pés deles os fiéis que obtinham para última jazida uma pouca de terra...” [AH.1,154]. 15) Concordância do pronome – O pronome, como palavra determinante, concorda em gênero e número com a palavra determinada. Emprega-se o pronome oblíquo os em referência a nomes de diferentes gêneros: “A generosidade, o esforço e o amor ensinaste-os tu em toda a sua sublimidade” [AH.1, 25]. 16) Nós por eu, vós por tu – Empregando-se vós em referência a uma só pessoa, põe-se no singular o adjetivo: “Sois injusto comigo” [AH apud ED.2, § 14,b]. Ao se empregar, em idênticas condições, o pronome nós, o adjetivo pode ficar no singular ou ir para o plural: Antes sejamos breve que prolixo. “Entre o desejo de alimentar a curiosidade do leitor e o receio de faltar à exação histórica, hesitávamos perplexos” [AH apud ED.2, §14,b]. 17) Alternância entre adjetivo e advérbio – Há casos em que a língua permite usar ora o advérbio (invariável) ora o adjetivo (variável): “Vamos a falar sérios” [CBr apud MBa.1, 265]. Vamos a falar sério. “Os momentos custam caros” [RS apud MBa.1, 265]. Os momentos custam caro. A vida custa tão cara aos velhos quanto é barata para os moços [MM]. “Era esta a herança dos miseráveis, que ele sabia não escassearem na quase solitária e meia arruinada Cartéia” [AH.1, 12]. A voz sumiu-se-lhe, toda trêmula [EQ.3, 647]. 76 A distinção entre adjetivos e advérbios só se dá claramente quando a palavra determinada está no feminino ou no plural caso em que a flexão nos leva a melhor interpretar o termo como adjetivo. Na língua padrão atual, a tendência é para nestes casos proceder dentro da estrita regra da gramática e usais tais termos sem flexão, adverbialmente. Entram nesta possibilidade de flexão as construções de tanto mais, quanto menos, pouco mais, muito mais, em que o primeiro elemento pode concordar ou não com o substantivo: Com quanto mais razão, muito mais honra. Com quanta mais razão, muita mais honra. Poucas mais palavras trocamos [CBr apud MBa.4, 21]. Notemos, por fim, que alerta é rigorosamente um advérbio e, assim, não aparece flexionado: Estamos todos alerta. Há uma tendência para se usar desta palavra como adjetivo, mas a língua padrão recomenda se evite tal prática. Junto de substantivo alerta adquire significado e função de adjetivo: “A moça aguardava com inteligência curta, os sentidos alertas” [CLi apud RBa.2, 14]. Em sentido contrário, aparece o engano de não se flexionar o adjetivo quite. Deve-se dizer: Estou quite. Estamos quites. 18) Particípios que passaram a preposição e advérbios – Alguns particípios passaram a ter emprego equivalente a preposição e advérbio (como, por exemplo, exceto, salvo, mediante, não obstante, tirante, etc.) e, como tais, normalmente devem aparecer invariáveis. Entretanto, não se perdeu de todo a consciência de seu antigo valor, e muitos escritores procedem à concordância necessária: “Os tribunais, salvas exceções honrosas, reproduziam... todos os defeitos do sistema” [RS2, IV, 67]. 77 “A razão desta diferença é que a mulher (salva a hipótese do cap. CI e outras) entrega-se por amor...” [MA.1, 327]. Como bem pondera Epifânio Dias, flexionar tais termos “é expressar-se na verdade com correção gramatical, mas de modo desusado” [ED.2, §220, a]. Deste modo, a língua moderna dá preferência a dizer “salvo exceções”, “salvo a hipótese”. 19) A concordância com numerais – Quando se empregam os cardinais pelos ordinais, não ocorre a flexão: Página um. Figura vinte e um. OBSERVAÇÕES: 1ª) Na linguagem jurídica diz-se: A folhas vinte e uma. A folhas quarenta e duas. 2ª) Embora se tenha usado o substantivo no singular precedido de numeral combinado com um, uma, a preferência atual é pô-lo no plural: vinte e um dias, as mil e uma noites, etc. 3ª) Milhar é masculino e portanto não admite seus adjuntos postos no feminino a concordar com o núcleo substantivo feminino: Os milhares de pessoas ( e não: as milhares de pessoas). 20) A concordância com os adjetivos designativos de nomes de cores – Surgem as incertezas quando o nome de cor é constituído de dois adjetivos. Neste caso, a prática mais comum é deixar o primeiro invariável na forma do masculino e fazer a concordância do segundo com o substantivo determinado, embora não deixem de aparecer exemplos em bons autores em que estejam flexionados os dois adjetivos: olhos verde-claros, ondas verde-azuladas. 78 3.3 GRAMÁTICA DE USOS DO PORTUGUÊS Maria Helena Moura Neves Concordância Nominal 5.2. Questões de concordância (p.117) a) Quando um substantivo no plural é determinado ou qualificado distributivamente por dois ou mais adjuntos coordenados, esses adjuntos são usados no singular: Se somarmos os pontos dos segundo e terceiro LUGARES, que não são nossos concorrentes diretos, constataremos que ainda continuamos sendo o primeiro lugar. (FSP) Vitrúvio, nos seus seis princípios, dedicou-se praticamente à estética do projeto arquitetônico, não se referindo a ela somente na primeira e na sexta CATEGORIAS. (AQT) Os bancos dão uma guinada nos rumos da política de financiamento, liberando financiamento para projetos de desenvolvimento apenas quando acompanhados de políticas sensíveis aos IMPACTOS social e ambiental. (AMN) b) Recomenda a gramática tradicional normativa que se use no singular o substantivo determinado pela expressão um e outro: João de Oliveira deixou-se ficar num botequim próximo a conversar com um e outro INDIVÍDUO. (MP) De uma e de outra MARGEM, o mato se mostrava tão fechado que só se podia mesmo ir sempre em frente. (ALE) Santo Tirso intercalava uma e outra FRASE de louvor para desviar-se do ramerrão do texto. (PFV) Entretanto, o plural é bastante usado: Um e outro INSTRUMENTOS podem, isoladamente, praticá-la, como está representado nas Figs. 13 & 14 e é o preceito dos tocólogos alemães. (OBS) É sempre imprecisa a fronteira que separa um e outro DELITOS. (VEJ) 79 Grades artesanais de ferro torcido foram recortadas e adaptadas para portas, janelas e CORRIMÃOS. (FSP) Às 10h30m, começa a prova para JUNIORES, aspirantes e principais, com 70 quilômetros de percurso. (GAZ) 80 O curso é dirigido a operadores SENIORES, coordenadores, supervisores e empresários. (FSP) 8.5 Nomes próprios de pessoas (tanto nomes como sobrenomes) se pluralizam normalmente, como os substantivos comuns: (p.172) E minha mãe era FERREIRA, dos FERREIRAS de Viana do Castelo. (VPB) 81 Os PEREIRAS constituíam numerosa e patriarcal família. (DEN) Ah, que não suscitaram os MENESES em matéria de invenção! (CCA) Somente não tocava nos RIBEIROS, porquanto o assunto devia constrangê-la. (FR) Aprecio sinceramente a coragem dos MELCHIORES e dos ROBÉRIOS que talvez não saibam distinguir a realidade da miragem. (VP) # Entretanto, é comum que, especialmente no caso dos sobrenomes, a pluralização seja feita apenas pelo determinante: Lembrei-me instantaneamente que os LAMBETH eram proprietários da residência de Renata. (L) Os BATTAGLIA e os MANFREDE desconversavam. (VN) De algumas donas e donzelas gabava-se francamente a beleza, a distinção. Dona Heloísa, Dona Berta, AS MOURA, AS FRANCO, AS OLIVEIRAS, AS ROSSO. (CF) 82 i) Com substantivos concretos: os adjetivos indicam dimensão ou medida (p.190) Agora já não éramos PEQUENO rebanho a escorregar num declive: constituíamos boiada NUMEROSA. (MEC) 5.7 Um adjetivo pode referir-se a dois ou mais substantivos coordenados: (p.218) Se o adjetivo em função adnominal estiver posposto, o mais comum é que a concordância de gênero se faça com a soma dos gêneros dos substantivos (masculino + masculino = masculino; feminino + feminino = feminino; masculino + feminino = masculino), embora ocorra também a concordância com o gênero e o número do substantivo mais próximo: [Paris Match] dedicara um número às favelas do Rio, com estatísticas e fotografias CLAMOROSAS. (BH) No rosto dela ainda a emoção e ansiedade GERADAS pelo sonho. (ARA) Fontenelle é tido como o mais legítimo dos que governaram o Território, com a conta de quarenta anos de convivência com a terra e o povo ACREANOS. (CRU) Todos são homens e mulheres TRISTÍSSIMOS. (NOF) - Impossível – disse o rei, com suco de véspera correndo pela pauta e o jargão REAL. (AUB) Durante as refeições, não sou mais a “presença” que rouba a naturalidade e o bom humor GERAL. (A) Se o adjetivo (em função adnominal ou predicativa) estiver anteposto, o mais comum é que a concordância de gênero e número seja feita com o substantivo mais próximo, mas também ocorre concordância com o conjuntivo dos substantivos: Fica bem CLARA a natureza e posição dos grupos e pessoas que encaram a ordem. (DIR) Acho muito BONITO o realismo e a precisão dos retratos daquela época. (VEJ) Tão PARECIDOS são o tom e o delírio. (VEJ) 83 No próximo capítulo, as normas de concordância nominal constantes na gramática eletrônica do revisor do Word, acompanhadas dos resultados contrastivos que obtivemos entre elas e as dos gramáticos acima. Capítulo IV – O (des)compasso entre as normas de Concordância Nominal constantes das três gramáticas e no revisor eletrônico. Após a apresentação das regras de concordância nominal, encontradas nas obras dos gramáticos com os quais trabalhamos, disponibilizamos, neste capítulo, as regras de concordância nominal que conseguimos retirar do programa do revisor gramatical do Word, para tentarmos responder à nossa principal pergunta de pesquisa. Estão enumeradas apenas por praticidade didática. Conseguimos elencar quinze regras apresentadas pelo revisor gramatical quando da submissão de sentenças que ele sublinhava em verde. Muitas sentenças, mais de quarenta pelos nossos cálculos, foram submetidas. Por isso, se houver outras regras além das apresentadas aqui, acreditamos que as descobriremos por puro golpe de sorte, pois não descobrimos outro meio de obtê-las a não ser expondo sentenças e pedindo explicações sobre o apontamento em verde feito pelo revisor, o que se caracteriza em um trabalho exaustivo e, muitas vezes, frustrante. Quanto ao levantamento que fizemos, nos capítulos dedicados à Concordância Nominal, em Napoleão Mendes de Almeida o computador detectou mais problemas de concordância verbal. Dos 6 apontamentos feitos em verde pelo revisor, quando da digitação do texto, 4 eram de concordância verbal, 1 sobre o uso do particípio passado e apenas 1 de concordância nominal, apresentando a primeira regra disposta aqui: O predicativo do sujeito concorda em número e gênero com o sujeito da sentença. (Vide tela na página 61) Em Bechara, de todos os exemplos de regras de concordância nominal expostos ao revisor, apenas 7 foram apontados como erros, em sua maioria nas concordâncias consideradas ‘especiais’. (Páginas 68, 69, 72, 74, 75, 76 e 77) Já em Moura Neves não houve um capítulo digitado, uma vez que ela apresenta tópicos gramaticais de uma maneira diferente da tradicionalmente conhecida, elencada em partes separadas. Tentamos, porém, digitar e apresentar ao revisor tudo o que considerávamos relevante para a concordância nominal e, dentro do que apresentamos, 9 problemas foram detectados. Todos eles referentes também aos casos de concordâncias especiais. (Páginas 78, 79, 80, 81 e 82) Por não querermos repetir as telas, relativas a cada regra, já dispostas nos capítulos de concordância nominal pertencentes a Napoleão, Bechara e Moura 85 Neves, decidimos, em vista do farto material coletado, dispor, nesta parte, algumas com as quais nos deparamos durante a escritura do texto do nosso trabalho. Exceção feita nos exemplos das regras de nº 3, 6 e 9 porque o computador com o qual trabalhamos não detectou os mesmos problemas encontrados nos exemplos dos autores citados acima e, por conseguinte, não nos foi possível obter as mesmas regras. 4.1 Regras de Concordância Nominal da gramática eletrônica do Word 1. O predicativo do sujeito concorda em número e gênero com o sujeito da sentença. Mas ele reconhece como concordâncias corretas as frases abaixo: 3. Chuva é necessário para a agricultura. 4. Aspirina é bom para dor de cabeça. E para corretas, acima, sugere correto. 86 87 2. Os apostos de natureza adjetiva devem concordar em gênero e número com as palavras a que se apõem. 3. Os adjetivos precedidos da preposição “de” constituem locuções adjetivas de valor genérico e, por isso, conservam o gênero masculino e o número singular. (Evanildo Bechara) 88 4. No português, os modificadores de núcleos nominais (como o predicativo do objeto direto ou os adjuntos adnominais) devem concordar em gênero e número com as palavras que eles modificam. 89 90 5. O artigo, o pronome, o numeral e o adjetivo, quando determinantes, devem sempre concordar em gênero e número com o substantivo a que se referem. 91 6. Adjetivos como “quite” devem concordar com o sujeito dos verbos de ligação (ser, estar, permanecer, ficar, continuar, parecer, permanecer (sic), andar, viver, tornar-se...) em gênero e número, mesmo que este sujeito esteja oculto. (Moura Neves) 92 7. O artigo nas contrações deve concordar em gênero e número com o substantivo que o segue. 8. O predicativo do objeto direto concorda em número e gênero com o objeto direto. 93 9. O pronome, o numeral e o adjetivo, quando adjuntos adnominais, devem sempre concordar em gênero e número com o substantivo a que se referem. (Moura Neves) 10. No português, os modificadores do substantivo devem concordar com o substantivo que eles modificam. 94 11. O pronome, o adjetivo e o numeral, quando adjuntos adnominais a um núcleo composto, devem sempre concordar com o substantivo mais próximo ou com o gênero e o número comuns ao conjunto dos substantivos modificados. 95 13. O predicativo do sujeito concorda em número e gênero com o sujeito, mesmo que posposto. 14. Os apostos devem concordar com as palavras a que se apõem. 96 15. O verbo “ser” e a palavra “necessário” devem concordar em gênero e número com a palavra que aparece em seguida. 97 Mas, o revisor aponta concordância incorreta na própria regra que dita: 16. O substantivo e o adjetivo “meia” não devem ser confundidos com o advérbio “meio”, que é invariável. Achamos interessante, mais uma vez, mostrar o que, às vezes, vem sublinhado em verde pelo revisor gramatical. Copiamos, redigitando, o que o próprio revisor oferece como regra de concordância nominal, e ele mesmo não a reconhece como escrita correta. 98 4.2 Respostas às perguntas de pesquisa Comecemos relembrando as questões. Primeiro, as auxiliares: Por que a descrição gramatical do revisor eletrônico não diz respeito à verificação de grande parte das estruturas usuais do português do Brasil em relação às regras de Concordância Nominal? Que gramática subjaz ao revisor gramatical eletrônico? Trata-se de uma gramática casuística, composta de um elenco de frases, que considera caso a caso? Trata-se de uma gramática que vê a língua como um conjunto de enunciados pré-estabelecidos? E, depois, a principal: Que normas constam da memória da gramática eletrônica em relação à Concordância Nominal? Seguem o modelo tradicional ou não? Quanto à principal questão, além de dispormos, no subcapítulo anterior, das normas que conseguimos retirar da gramática eletrônica, da maneira como nos foram ofertadas pelas telas de aconselhamento do revisor, quando acionado, temos a complementar que, após contrastar as informações obtidas, percebemos que a maioria das regras de concordância nominal inseridas no programa que criou o revisor gramatical são regras das gramáticas normativas, tradicionais. O fato de os problemas que foram detectados serem, preferencialmente, da área de concordâncias especiais, leva-nos a (re)considerar os critérios para a formação do parser do programa que desenvolve o revisor. Acreditamos, então, que é por esse motivo – o de ter sido programada seguindo um modelo tradicional - que a gramática eletrônica não dá conta de grande parte das estruturas usuais do português do Brasil quando em situações lingüísticas que apresentem uma escritura não tão culta quanto à da gramática que serviu de base à inserção de regras gramaticais no momento da criação do ReGra. Pois, como se pôde perceber, o revisor eletrônico contempla o nível de linguagem culto, recomendado pela Academia de Letras e pelas gramáticas normativas, no qual a linguagem se mantém estática, em que as ousadias, as inovações, as criações não têm lugar. As sentenças reconhecidas como gramaticalmente corretas, quando submetidas ao revisor, são aquelas que têm suas regras contempladas no banco de dados da gramática eletrônica que, como já dissemos, insere-se muito mais na abordagem tradicional e parece se caracterizar como um feixe de sentenças finitas, fechadas, sem muita liberdade de outras combinações nos seus elementos. 99 Ou seja, o não reconhecimento de sentenças tidas como gramaticalmente corretas, usuais, é por conta da gramática programada para o revisor, com número finito de regras e sem muita mobilidade para escrita em estilo diferente do que o proposto por essa gramática eletrônica. O grupo do NILC - Núcleo Interinstitucional de Lingüística Computacional - , que criou o ReGra, deixa claro as dificuldades encontradas pela limitação do programa. “O parser apresenta uma única possibilidade de estruturação sintática: a mais provável, segundo as escolhas gramaticais realizadas também com base na prioridade de freqüência (de suas regras)”. Isso nos remete ao modelo de análise distribucional, criado por Z.S. Harris, o qual tem como princípio básico a observação de que as partes de uma língua se compõem e não se distribuem caoticamente, mas fazem parte de um sistema e, por isso, se situam em posições bem determinadas, umas em relação às outras. Esses elementos se deixam agrupar em classes e essas classes ocorrem em certas posições dentro de um contexto, mas não ocorrem em outras posições dentro desse mesmo contexto. Assim, a soma dos contextos em que dada classe de elementos pode aparecer, contrastada com a soma dos contextos em que tal classe não pode ocorrer, define a distribuição de quaisquer elementos da língua. Este tipo de distribuição é limitado a fundamentar suas observações em contextos típicos, não em qualquer contexto. Para Greimas (s/d:132), a análise distribucional, de caráter indutivo e descritivo, aplica-se essencialmente em descobrir distribuições, ou seja, o conjunto dos contextos nos quais uma dada unidade lingüística se pode encontrar. Esse procedimento, que, em princípio, evita qualquer recurso ao sentido como critério, está fundamentado na coocorrência que, discernindo relações de compatibilidade ou de incompatibilidade no eixo sintagmático entre os elementos, permite o estabelecimento de classes distribucionais, levadas em conta as combinações e as restrições reconhecidas. Este tipo de abordagem, de natureza taxonômica, conduz a uma segmentação da frase e vai dar na análise em constituintes imediatos que serviu de ponto de partida à gramática gerativa. Assim, de acordo com alguns testes que fizemos, se há inversão de lugares de termos essenciais ou integrantes, ou intercalação de termos acessórios, na frase/oração, fatos bastante recorrentes na escrita do português brasileiro, em muitos casos encontramos a limitação da gramática do revisor em reconhecer e aceitar como corretos esses tipos de sentenças. Isto acontece, segundo o NILC, 100 porque “A atuação do revisor gramatical restringe-se à oração simples, isolando para processamento, sempre que possível, as coordenações e subordinações”. Cabe aqui, agora, uma observação que julgamos relevante. Quando nos deparamos com o sublinhado verde e com a tela de concordância nominal, durante a digitação deste trabalho e em outras situações, de todas as ocorrências a que se repete com mais freqüência é a que contempla a regra de nº 4: No português, os modificadores de núcleos nominais (como o predicativo do objeto direto ou os adjuntos adnominais) devem concordar em gênero e número com as palavras que eles modificam. Em seguida vêm as regras que numeramos em 5, 9 e 10 e as relativas ao uso de apostos. Outro ponto importante destacado pelos criadores do revisor eletrônico, e já dito anteriormente, é que: “O formalismo gramatical, definido para reconhecer sentenças bem-formadas, segue uma gramática livre de contexto”. Gramáticas livres de contexto são muito úteis no que tange à descrição de gramáticas em linguagem natural e, em geral, são mais poderosas que as regulares, já que permitem a representação de linguagens com um certo grau de complexidade. No entanto, a dificuldade em expressar dependências simples, como por exemplo a concordância entre verbo e sintagma nominal, constitui um dos maiores problemas para sua utilização no tratamento da língua natural. E, concluem, “(...) abordagens puramente livres de contexto não são suficientemente poderosas para captar a descrição adequada deste gênero de linguagem”. No próximo capítulo, a conclusão deste trabalho. Capítulo V - Conclusão A escrita permite fixar o pensamento e fazê-lo atravessar o espaço e o tempo. Francis Vanoye Dentre as características incontestáveis da língua escrita, encontra-se a importância que a mesma tem quando se percebe que é sobre a “conservação do escrito que se funda nossa civilização, que, pouco a pouco, substitui a lei oral pela lei escrita” (Vanoye, 1998:72). Mas, continua Vanoye (idem:71), a escrita fixa a linguagem articulada, e, ao fazê-lo, transforma essa linguagem, pela passagem da fonia à grafia, numa nova linguagem, que possui uma existência independente da primeira. Por ser muito menos móvel que a língua falada, as transformações da língua escrita são muito lentas e muito pouco numerosas. Por isso mesmo permite fixar o pensamento e fazê-lo atravessar o espaço e o tempo. É graças à escrita que o homem pode efetuar uma reflexão, uma análise de seu próprio pensamento. A linguagem articulada possui uma função essencialmente concreta, utilitária; serve primeiro para comunicar. A linguagem escrita vai além dessa função de comunicação (idem). Relativamente à concordância nominal no português escrito, esta possui algumas particularidades interessantes – para alguns, de difícil aprendizado formal. A regra geral, do acordo de gênero que ocorre entre o substantivo e o adjetivo, é bem conhecida e parece não preocupar os nativos de língua portuguesa, que se esforçam, quando a situação assim o exige, em lembrar-se de associar masculino com masculino, feminino com feminino. A concordância de gênero, com exceção de alguns dialetos, é uma regra categórica do português. O mesmo já não ocorre com a de número, por isso vemos, em situações de fala corriqueiras, na maioria orais, a não concordância considerada correta pela gramática normativa. Mas, a escritura de um texto começa a se tornar complicada quando não se têm interiorizadas, de maneira formal, as outras regras ditadas pela norma da língua. Como concordar corretamente na escrita, por exemplo, seqüências de substantivos adjetivadas por um só atributo? E os adjetivos compostos, hifenizados? E nos casos de concordância em que a regra só é válida para adjetivos que funcionam como adjuntos adnominais, mas não para os que funcionam como predicativos? Se não se tiver uma gramática à mão, torna-se uma tarefa “dolorosa”, 102 impossível para alguns, que acabam por desistir. Afinal, “o que é mesmo adjunto adnominal? E predicativo? Nem sei o que é isso, como vou distinguir um do outro? O que tem a ver concordância atrativa com eles? E o que é concordância atrativa?”. E isso é opinião corrente da maioria dos brasileiros que dizem não saber português. Na verdade, entendemos que eles estão se referindo, mesmo que não conscientemente, à própria insegurança, ou ignorância, na escrita desse português, já que a fala “tudo aceita, desde que a mensagem seja entendida”. O desconhecimento - por não aprendizagem efetiva - das normas prescritas pela gramática tradicional sempre foi um problema para a maioria dos falantes do português brasileiro. Não cabem aqui discussões sobre a eficiência do ensino/não-ensino desse tipo de gramática nas escolas. Os exemplos acima buscam mostrar algo de que falamos anteriormente: a dificuldade de uma imensa parcela da população brasileira na produção de textos escritos com um mínimo de correção gramatical. Quanto à realidade atual, todos têm a percepção clara de que os computadores invadiram o dia-a-dia de milhares de usuários, e isto se deu porque sua velocidade e potência aumentaram, seu tamanho e preço diminuíram. Essa revolução na computação começa a se dar ainda nas décadas de 1980 e 1990. Microcomputadores surgem em escritórios, casas e escolas, com programas acessíveis aos novos usuários. Poderosos bancos de dados possibilitaram às organizações armazenar e processar imensas quantidades de informação, enquanto as redes interligavam as máquinas, permitindo o compartilhamento de dados e programas. Então poderíamos pensar que, com a facilidade oriunda do uso cada vez mais “popular” dos computadores, isto é, por um número crescente de pessoas se valendo, hoje em dia, de computadores para escrever seus textos e desenvolver seus trabalhos, o fato de haver um revisor ortográfico e um gramatical como ferramenta de auxílio à correção desses textos, seria a “salvação da lavoura” para os que não têm um domínio adequado da gramática da língua. E isso, em parte, é verdadeiro, uma vez que os revisores mais atualizados demonstram um desempenho já bastante satisfatório. Todavia, continua preocupante o fato de que uma máquina não consegue fazer escolhas porque simplesmente desconhece o contexto ou a intenção lingüística/comunicativa de quem a está utilizando num dado momento. Explicamos 103 melhor: quando o revisor se manifesta com seu sublinhado vermelho e faz sugestão de reescritura de grafia de uma palavra, ele oferece o que tem em seu dicionário. O usuário, por sua vez, se não tiver um vocabulário bom, pode aceitar uma das sugestões sem perceber que aquela palavra escolhida não cabe no contexto no qual pretende inseri-la. Portanto, uma das armadilhas dos corretores ortográficos está na leitura de uma determinada palavra dentro de um contexto. O computador não pode encontrar um erro ortográfico se a palavra estiver correta para um outro contexto (por exemplo, viagem e viajem), principalmente porque o revisor tem dificuldades em apontar as homógrafas imperfeitas para conferência de sua correção. Relativamente ao léxico do ReGra, seus criadores dizem ser ele um “repositório de formas lexicais válidas para o português contemporâneo, acrescidas de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico como “um recurso à revisão gramatical, servindo também de apoio ao módulo ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”. (grifo nosso) Devido às ambigüidades semânticas e sintáticas da língua portuguesa, o software nunca estará completo, afirmam os pesquisadores do NILC: “Uma única palavra pode apresentar distintos significados, pertencendo ou não à mesma classe gramatical. Para conhecer a função e posição gramatical correta, é necessário saber o que determinada palavra significa em cada situação”. O mesmo se dá com o sublinhado verde, mais complexo porque trabalha com regras gramaticais, esquecidas ou desconhecidas por muitos dos usuários. Assim, podemos voltar aos exemplos dispostos acima. Se eu, como usuário, tenho a possibilidade de aceitar ou rejeitar as sugestões, somente poderei fazer isso se entender o que o revisor está me dizendo. (grifo nosso) Os próprios criadores do revisor gramatical eletrônico do Word admitem que “o problema de decidir se uma sentença pertence a uma gramática sensível ao contexto é uma função exponencial sobre o tamanho da sentença, o que torna a implementação do procedimento de verificação uma questão complexa, do ponto de vista computacional”. (grifo nosso) Ainda há o fato de a gramática criada para um computador poder gerar também sentenças claramente agramaticais, principalmente se algumas palavras forem expandidas para outra categoria. Por isso, dizem os especialistas que é 104 preciso adicionar alguns recursos às regras sintagmáticas e trabalhar com a descrição e classificação do léxico para implementar o tipo de gramática na linguagem Prolog. Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns entre usuários de nível médio, como secretárias e profissionais de escritório em geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo “erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram como forma desviante da norma culta. (grifo nosso) Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais, transcritas aqui: a) seus usuários-alvo são indivíduos com suposta proficiência no português em nível secundário ou superior; b) seu objeto de análise são textos prosaicos com predomínio da função referencial da linguagem; e c) seu objetivo é a identificação de desvios à disciplina gramatical da língua portuguesa, ainda que esses desvios possam vir a representar hipóteses significativas do usuário em relação à linguagem e possam constituir, na variedade lingüística do usuário, estruturas admissíveis. Pelo que vimos até agora, por meio de testes simples que fizemos, podemos arriscar, então, duas hipóteses: primeira, a programação embutida nos revisores eletrônicos se baseia na gramática normativa tradicional, uma vez que o que eles fazem é o mesmo que um gramático normativo típico faria diante de um texto, ou seja, o revisor trabalha com a definição de erro; segunda (em decorrência da primeira), então, os revisores eletrônicos são úteis para revisar textos escritos segundo a variante culta, mas não são completamente eficientes para realizar esse trabalho. O revisor gramatical eletrônico do Word trabalha com uma concepção homogênea de linguagem: só existe uma língua correta. Desse modo, voltamos ao conhecimento de que a Gramática Tradicional desenvolveu uma sintaxe baseada na análise de frases bem formadas dadas a priori. Ou seja, parte de uma frase gramatical e aceitável e dela faz a análise para ilustrar a teoria sintática. Apesar de não haver nada de errado com esse método – haja vista a riqueza e sucesso da sintaxe tradicional -, deparamo-nos 105 freqüentemente com uma das limitações desse método analítico: uma quantidade grande de regras não é explicitada, de vez que estudamos a possibilidade de frase e não todas as possibilidades similares do modelo escolhido. Se quisermos uma descrição mais exaustiva das regras sintáticas da língua, podemos recorrer ao método dedutivo, também utilizado pela Gramática GerativoTransformacional. Essa gramática é dedutiva no sentido de que não parte de exemplos de frases bem formadas, mas de regras que devem gerar frases bem formadas. O método dedutivo faz o caminho inverso do método analítico da Gramática Tradicional, que vai da frase dada para a sua estrutura sintática, enquanto aquele obtém frases a partir da estrutura sintática dada. O método utilizado pela Gramática Gerativo-Transformacional está presente na criação da gramática eletrônica, conforme vimos na parte de sintaxe computacional neste trabalho. No entanto, percebemos falhas na sua proposta. Basta analisar as telas de aconselhamento oferecidas pela gramática do Word. Claro que a definição de todas as regras necessárias à geração de um determinado tipo de frase exige que se leve em conta um volume muito grande de variáveis, por isso temos que questionar a possibilidade de se criar esse conjunto de regras tão completo e eficiente que gera todas as frases possíveis da língua. Parece-nos, esse, um ato impossível de se efetivar, principalmente no que tange a um programa de computador. Uma sintaxe que gera frases gramaticais e aceitáveis exige que se estabeleçam regras semânticas, além das sintáticas. E no estabelecimento das regras semânticas de geração a situação se complica consideravelmente. A inclusão de regras semânticas no modelo computacional certamente daria mais poder à teoria gramatical embutida nele, mas requereria um esforço de descrição que ultrapassaria os recursos de produção e programação atuais. Segundo Lucchesi (2007:18-21), quando aprendemos que o homo sapiens é uma espécie que se distingue dos demais primatas por possuir um poderoso dispositivo mental que lhe permite organizar de forma bem complexa suas percepções do mundo e expressar seus pensamentos em frases, com um poder criativo potencialmente ilimitado, compreendemos, também, que todo homem é dotado desse dispositivo. Dispositivo que é constituído por um complexo sistema de regras, que nem o mais sofisticado programa computacional até hoje produzido possui, e o qual todo ser humano possui como capacidade mental. 106 Portanto, não há uma frase sequer que seja falada sem o acionamento desse complexo mecanismo, desse dispositivo mental de regras que gera frases e que chamamos tecnicamente de gramática. “O livro a que chamamos “gramática” é apenas uma tentativa aproximada de representar esse sistema mental, fundamentada em alguma teoria sobre a linguagem humana “ (idem:19). O que existe, então, são gramáticas diferentes, ou melhor dizendo, distintas programações lingüísticas mentais, entre o oral e o escrito. Por isso, a habilidade da mente humana em analisar e reconhecer corretamente falas, estilos e gramática não é reproduzida satisfatoriamente pelos computadores, porque mentes e computadores trabalham diferentemente. Muito ainda precisa ser melhorado quanto às regras contidas no revisor gramatical eletrônico. Sabemos que a Informática, apesar de seu dinamismo, não consegue dar conta integralmente da vastidão e dinamismo da língua portuguesa. A gramática oferecida pelo programa parece, então, realmente tratar-se de uma gramática que vê a língua como um conjunto de enunciados pré-estabelecidos, onde não cabem estruturas mais “inovadoras”, mais “soltas”, mais próximas à modalidade brasileira da língua portuguesa, cotidiana, tão rica em seus usos lingüísticos, em suas inversões, em sua forma de dizer o pensamento e o sentimento dos brasileiros. A nós importa termos tentado conhecer e dar a conhecer o que o revisor realmente tem a oferecer aos seus usuários, neste momento histórico, naturalmente. Por isso, alertamos: os usuários de computador que, ao digitarem textos no software Word, confiarem demais no seu revisor poderão incorrer em sérios erros, podendo até mesmo passar por algum tipo de constrangimento causado por sua ignorância de estruturas eminentemente usuais da língua que está utilizando, as quais não são apontadas pelo revisor. Como dissemos anteriormente, para aqueles que dominam melhor a escrita, a solução é simplesmente ignorar o revisor quando este apresenta sugestões incongruentes, mas a preocupação é com aqueles que confiam no que ele apresenta. Acreditamos que essa confiança da parte de algumas - talvez, inúmeras - pessoas se deva à mera insegurança no próprio conhecimento das regras aprendidas na escola (ou fora dela) e um pouco de resistência em complementar 107 suas pesquisas por meio de outras fontes; em outras, por ignorância mesmo dessas regras. Até que ponto o usuário/redator comum de um texto no computador encontra dificuldades por não dominar as regras de concordância contidas na gramática eletrônica não saberemos dizer, mas temos a certeza de que, para quem deseja escrever um bom texto, com propriedade, é imprescindível o conhecimento do nível gramatical privilegiado no revisor eletrônico do Word. Isto é, o nível culto da modalidade escrita da língua, em conformidade com a gramática normativa em suas regras de concordância nominal prescritas para a linguagem culta contemporânea. Como todo instrumento criado pelo homem, sempre haverá acusadores e defensores da existência dos computadores e de sua influência na vida de cada indivíduo. Todavia, não podemos deixar de reafirmar nosso alerta: o revisor gramatical eletrônico demonstra ter problemas lingüísticos, e não tecnológicos. E isso acontece porque sabemos que da linguagem artificial o computador dá conta; da linguagem natural, não. Tudo isso não impede que continue havendo questionamentos como: O que se deve fazer para que o computador “compreenda” uma língua natural? Como fazer para que uma máquina consiga produzir textos ou falas em uma língua natural? Chegará o dia em que uma máquina poderá ser capaz de dominar a sintaxe, o sistema fonológico, as nuanças semânticas e o uso pragmático, entre outros conhecimentos, de uma língua natural? Os estudiosos da área da lingüística computacional, como os autores com os quais trabalhamos (dentre inúmeros outros), acreditam que, algum dia, os computadores serão capazes, sim, de dominar a linguagem natural de maneira satisfatória e, assim, interagir de tal modo com os humanos, em uma determinada língua natural, que não se conseguirá distinguir as respostas da máquina das de um outro ser humano. Nesse início do século XXI, temos essa certeza: a informática revolucionou o pensamento da nossa civilização e, provavelmente, a expressão Assim caminha a humanidade adquiriu uma nova significação. Nós... ficaremos à espera do futuro. Ou não. REFERÊNCIAS BIBLIOGRÁFICAS ALMEIDA, Napoleão Mendes. Gramática metódica da língua portuguesa: curso único e completo. 25 ed. São Paulo: Saraiva, 1975. BECHARA, Evanildo. Moderna gramática portuguesa. 37 ed. Rio de Janeiro: Lucerna, 1999. ________. Lições de português pela análise sintática. Rio de Janeiro: Lucerna, 2001. BERBER-SARDINHA, Tony. (org.) A língua portuguesa no computador. (Série As Faces da Lingüística Aplicada). Campinas-SP: Mercado de Letras/EDUC/FAPESP, 2005. ________. (2000b) Lingüística de corpus: histórico e problemática, in Revista D.E.L.T.A., vol. 16, n.2 [ www.scielo.br/delta]. ________.(2000c) O que é um corpusè representativo?. São Paulo: LAEL PUCSP [lael.pucsp.br/direct]. CEREJA, William R. & MAGALHÃES, Thereza C. Gramática reflexiva: texto, semântica e interação. São Paulo: Atual Editora, 1999. CHOMSKY, Noam. Linguagem e mente. Brasília: Universidade de Brasília, 1998. CONSOLARO, Hélio. Revisor do Word. www.portrasdasletras.com.br. Acessado em 21/02/2006. Disponível em COSCARELLI, Carla Viana e MARTINS, Else. Viciados em F7? Nossa resposta ao JB (27/09/2001). In Jornal do Brasil. BH, out de 2001. COSERIU, Eugênio. Teoria da linguagem e lingüística geral. Trad. Agostinho Dias Carneiro. Rio de Janeiro: Presença/editora da USP, 1979. ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004. KURY, Adriano Gama. Novas lições de análise sintática. 9 ed. São Paulo: Ática, 1999. GENOUVRIER, Emile & PEYTARD, Jean. Lingüística e ensino do português. Trad. Rodolfo Ilari. Coimbra: Livraria Almedina, 1973. GREIMAS, A.J. & COURTÉS, J. Dicionário de semiótica. São Paulo: Cultrix, s/d. JORNAL DO BRASIL. Viciados em F7. Quinta-feira, 27 de setembro de 2001. (s/a) 109 LOBATO, Lúcia M. P. Sintaxe gerativa do português: da teoria padrão à teoria da regência e ligação. Belo Horizonte: Vigília, 1986. LOPES, Edward. Fundamentos da lingüística contemporânea. São Paulo: Cultrix, 1993. LUCCHESI, Dante. Espelho de contrastes. In revista Discutindo Língua Portuguesa, nº 5, ano 1. São Paulo: Escala Educacional, 2006, p.20-23. ________. As forças da língua. In revista Discutindo Língua Portuguesa, nº 6, ano 1. São Paulo:Escala Educacional,.2007, p. 18-21. MANOSSO, Radamés. O software que nos corrige. In: revista Discutindo Língua Portuguesa. Ano I, nº 3, 2006, pp.24-27. CÂMARA Jr., J Mattoso. Estrutura da língua portuguesa. Petrópolis: Vozes, 1970. ________. Princípios de lingüística geral. Rio de Janeiro: Acadêmica, 1970. ________. História e Estrutura da Língua Portuguesa. Rio de Janeiro: Padrão, 1975. NEVES, Maria Helena de Moura. Gramática de usos do português. São Paulo: Editora UNESP, 2000. OTHERO, Gabriel de Ávila & MENUZZI, Sérgio de Moura. computacional: teoria e prática. São Paulo: Parábola Editorial, 2005. Lingüística PERINI, Mário. Para uma nova gramática do português. São Paulo: Ática, 1985. RICH, Elaine. & KNIGHT, Kevin. Inteligência Artificial. São Paulo: Makron Books, 1993. RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T., FILLIÉ, Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da construção de um revisor gramatical automático para o português. Estudos Lingüísticos. São Paulo, 2002. SAUSSURE, Ferdinand de. Curso de lingüística geral. 3.ed. São Paulo: Cultrix, 1971. VANOYE, Francis. Usos da Linguagem: problemas e técnicas na produção oral e escrita. 11.ed. São Paulo: Martins Fontes, 1998. VIEIRA, R. Lingüística computacional: fazendo uso do conhecimento da língua. Entrelinhas, ano 2, n.4, São Leopoldo: Unisinos, 2002. http://www1.uol.com.br/vestibuol. Acessado em 20/11/2005. http://www.forcesystem.com. Acessado em 28/9/2005. 110 http://labbi.uesc.br/apostilas. Acessado em 16/2/2006. http://www.amigomouse.com.br/produtos. Acessado em 16/2/2006. http://www.inf.ufrgs.br. Acessado em 8/3/2006. http://www.prohpor.ufba.br/projetogram. Acessado em 23/5/2006. http://inventabrasilnet.t5.com.br/revgram.htm. Acessado em 28/6/2006. http://intervox.nce.ufrj.br/~edpaes/historia.htm. Acessado em 21/7/2006. http://www.dc.usfcar.br. Acessado em 1º/9/2006. http://www.faced.ufba.br. Acessado em 5/10/2006. http://www.portugues.com.br. Acessado em 19/10/2005. . ANEXO A Informática: símbolos digitais e glossários 112 Símbolos digitais Todos os computadores utilizam números binários – o código de máquinas para representar letras, números e símbolos escritos. Esses “códigos” de computador foram padronizados primeiro com o American Standard Code for Information Interchange (ASCII), em 1963. O ASCII é, hoje, utilizado por todos os computadores pessoais nos países que se valem do alfabeto romano e emprega uma seqüência de oito dígitos binários (ou “bits”) para representar 128 caracteres. É o que basta para codificar letras minúsculas e maiúsculas, numerais, sinais de pontuação e 32 “caracteres de controle” especiais que governam as funções do computador – com mais 128 caracteres “estendidos”, como letras acentuadas e não-latinas e símbolos gráficos. (Enciclopédia Seleções, 2004:453) Funciona mais ou menos assim, transcrevendo aqui o exemplo fornecido pela obra citada acima: Número binário 00010010 01000001 01101011 10100100 Decimal equivalente Caractere codificado 36 65 107 164 S A k ñ Dessa maneira, quando se aperta a tecla “k”, isso gera o código de máquina 107, que é convertido no número binário equivalente (01101011). O sinal de código binário pode então ser processado pelo computador, e a letra “k” aparece na tela diante do usuário – e tudo isso se passa em microssegundos. Línguas como chinês e japonês, porém, possuem muito mais caracteres distintos que precisam ser representados por 16 dígitos binários. (idem) Um brevíssimo Glossário Apresentamos, agora, alguns termos-chave do universo computacional, a título de ilustração e também de informação aos que ainda não os sabem. Transcreveremos o que traz a Enciclopédia, às páginas 448-453, na qual estamos nos baseando para compor este início de capítulo. • Binário – Sistema baseado nos algarismos 0 e 1. 113 • BIOS – Chip que controla as funções básicas do computador. Armazena dados vitais mesmo quando o computador está desligado. Inclui instruções para dar “boot” (partida) no computador. • Bit – Dígito binário. Menor unidade de informação. • Buffer – Memória temporária que contém dados prontos para uso. • Bus – Fiação principal na placa-mãe. • Byte – Grupo de oito bits; representa – em binário – um número de 0 a 250 ou um símbolo. • CD-ROM – CD que armazena dados ou programa. Um único CD-ROM pode armazenar 112 milhões de palavras de texto digital – cerca de duas vezes a Enciclopédia Britânica. • Chips controladores – Chips especiais executam funções como gráficos e controlam componentes como os drives de disco rígido. • CPU (Unidade central de processamento) – Chip microprocessador, responsável pela maior parte do trabalho da máquina, processando dados e coordenando os dispositivos de entrada, saída e armazenamento. • Drives (acionadores) de disco flexível, CD-ROM e/ou DVD-ROM – Vários tipos de dispositivos de armazenamento de dados que usam discos removíveis – variando em capacidade de 1,4 megabytes num disco flexível a vários milhares de megabytes num DVD-ROM. • Drive de disco rígido – Local principal e permanente de armazenamento de dados e programas. Armazena dados como sinais magnéticos em código binário em discos de metal. Os dados são “lidos” e “escritos” nos discos por pequenas cabeças magnéticas. • DVD – Disco de capacidade dados ou programas. • Arquivo – Código ou dados mantidos juntos numa unidade. • Hardware – Componentes físicos do computador. • Microprocessador – É o “cérebro” do computador, o microchip que processa dados em alta velocidade, segundo instruções programadas. • Microchips – Componentes elétricos em miniatura interligados numa placa de circuito. • Modem – Aparelho que liga o computador à linha telefônica. 114 • Placa-mãe – Placa com circuito impresso, que contém os principais microchips do computador. • Rede – Dois ou mais computadores conectados. • RAM – Memória de computador que pode ser alterada. Composta de microchips que armazenam dados e programas em uso. Os dados da RAM se perdem quando o computador é desligado. • ROM – Memória que não pode ser apagada. • Software – Instrução ou programa que diz a um computador o que fazer. Há quatro tipos de software: * Sistema Operacional (SO) – Controla o computador efetuando tarefas do dia-a-dia, como receber dados do teclado, exibir informação na tela ou armazená-la num disco rígido. Funciona sempre que o computador está ligado. Os usuários em geral interagem com o SO através de uma interface gráfica (GUI) e do teclado. * Aplicativos – Programas criados para executar tarefas específicas. Incluem processadores de texto (WP); controle de banco de dados (para armazenar detalhes de estoque e clientes, por exemplo); editoração eletrônica (DTP); e planilhas para cálculos e orçamentos. * Software de periféricos – Os scanners, câmeras digitais, impressoras e outros aparelhos precisam de software para ligá-los ao computador. * Utilitários – Fazem a tarefa de “manutenção da casa”, como verificar arquivos de dados em busca de vírus, reparar danos ao disco rígido e assegurar uma armazenagem eficiente de dados. • Vírus – Programa nocivo que se reproduz. Glossário “internético” Alguns termos-chave da Internet, encontrados na Enciclopédia Seleções (2004:456-457): • E-mail Correio Eletrônico – usa a Internet para transmitir mensagens entre usuários. 115 • GIF – Graphic Interchange Format – formato comprimido para transmissão de gráficos. • Hipertexto – sistema de texto clicável, surgido em 1965 e posteriormente usado para ligar páginas da Web. • HTML – Hyper Text Markup Language – linguagem de programação usada para criar páginas da Web. • HTTP – sistema para envio de arquivos de hipertexto (páginas da Web) pela Internet. • ISP – Internet Service Provider – organização que conecta os assinantes à Internet. • JPEG – Joint Photographic Experts Group – formato comprimido, usado para transmissão de gráficos. • Logo on/off – senha digital para conectar-se ou desconectar-se da Internet ou de um determinado servidor da rede. • Modem – Modulador-Demodulador – dispositivo para converter dados digitais em analógicos e vice-versa, permitindo ao computador usar linhas telefônicas. • MPEG – Moving Pictures Experts Group – formato comprimido, usado para transmitir arquivos de vídeo. • MP3 – formato comprimido de arquivo de música. • POP - Point of Presence – um número de telefone do qual o usuário pode discar para um sistema ISP e assim conectar-se à Internet. • Servidor – computador ou programa que oferece serviços (como acesso ou armazenamento de arquivos da rede, ou encaminhamento de e-mails). • TCP/IP – Transmission Control Protocol/Internet Protocol – sistema que movimenta dados pela Internet, criado por Vint Cerf e Robert E. Kahn. • URL - Uniform Resource Locator - nome do endereço de uma página da rede. O termo foi criado por Tim Berners-Lee quando este criou a World Wide Web (WWW) e sua URL, padrões HTML e http. • WAP - Wireless Application Protocol – método para acessar páginas da rede em celulares. Fonte: ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004. Anexo B ReGra: Revisor Gramatical do Word 117 Transcrição de parte do artigo publicado pelo Núcleo Interinstitucional de Lingüística Computacional – NILC RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T., FILLIÉ, Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da construção de um revisor gramatical automático para o português. Estudos Lingüísticos. São Paulo, 2002. “A desambigüização lexical (caso “a”) torna-se pertinente porquanto, como já foi referido, a homografia em língua portuguesa não é fenômeno raro, induzindo freqüentemente a erros de diagnóstico uma ferramenta que, diferentemente do ser humano, e na ausência de estratégias de representação da estrutura semânticopragmática dos enunciados lingüísticos, não pode contar senão com a forma, com a freqüência de ocorrência e com a distribuição das palavras nas sentenças para proceder ao processamento. A freqüência de ocorrência aparece, no ReGra, como principal mecanismo de desambigüização lexical, apesar de, em muitos casos, a ferramenta pouco aproveitar a prioridade de classificação, por não serem exatamente nítidas as diferenças entre as probabilidades de ocorrências de itens lexicais muito utilizados em mais de uma acepção gramatical. Neste caso, é necessária a consideração de critérios distribucionais de diferenciação entre o uso das palavras, com a delimitação dos contextos de ocorrência dos itens lexicais, principalmente na situação da vizinhança imediata que se estabelece no intervalo de um a cinco tokens. (...) No entanto, é forçoso considerar que os etiquetadores concorrentes partem de um pressuposto estranho e inverso ao do ReGra: supõem serem corretas as sentenças de entrada. Por este motivo, a margem de indefinição do revisor é consideravelmente mais expressiva do que a verificada em outros contextos do PLN, sendo muitas decisões lexicais adiadas para o processamento sintático, nem sempre hábil o suficiente para capturar a correta categorização gramatical das palavras. Para evitar a explosão combinatória devida à indefinição lexical, restringimos o escopo de atuação do revisor à oração simples, isolando para processamento, sempre que possível, as coordenações e subordinações. Com a inevitável perda das relações de dependência entre as várias orações de um período composto, o espectro de problemas a serem resolvidos também foi restrito. Entretanto, na análise do desempenho final, essa contingência revelou-se preferível à proliferação das intervenções indevidas, com riscos à credibilidade do ReGra. 118 A etapa de processamento gramatical, propriamente dita (caso “b”), diretamente relacionada à verificação da adequação gramatical da sentença de entrada, está subdividida em três subcomponentes: a verificação de boa-formação sintática da sentença, a etiquetação sintática de seus itens lexicais durante o parsing e a verificação da consistência das relações de dependência entre os mesmos, com correspondente aconselhamento ao usuário. O formalismo gramatical definido para reconhecer sentenças bem-formadas, segue uma gramática livre de contexto, cujo conjunto de regras de produção torna-se diretamente operacional com as redes sintáticas (ATNs), responsáveis por derivar a sentença de entrada, processo realizado de forma top-down, da esquerda para a direita, a partir do símbolo inicial da gramática, com o auxílio de uma janela de geração de dimensão variada, para evitar ciladas sintáticas freqüentes, particularmente devidas aos problemas de desambigüização lexical. O parser apresenta como resultado uma única possibilidade de estruturação sintática: a mais provável, segundo escolhas gramaticais realizadas também com base na prioridade de freqüência (de suas regras), definida a partir da análise de fragmento expressivo do corpus do NILC. Há dois subconjuntos de regras de revisão: as pontuais, que acompanham padrões fixos de distribuição sintática, pouco ou nada dependentes do parsing, e as genéricas, que operam diretamente sobre a saída do parser. As primeiras, numericamente expressivas, são extremamente eficientes, mas possuem alcance limitado, pois se restringem a problemas de adequação lexical e ao uso de padrões lingüísticos já registrados nas gramáticas normativas do português (p.ex., uso de crase diante de palavras masculinas). As segundas, muito menos numerosas e muito mais abrangentes que as anteriores, investigam as relações de concordância e regência entre os itens lexicais etiquetados sintaticamente. Como a saída do parser é falível, devido a indeterminações lexicais ou a outros acidentes de processamento, o conjunto dessas regras induz freqüentemente a ferramenta a erro. O pós-processamento gramatical (caso “c”) consiste na identificação precisa do desvio da norma, para o aconselhamento correspondente. Constatada, por meio de qualquer um dos tipos de regras de revisão, a má formação de alguma estrutura utilizada pelo usuário, dispara-se imediatamente a medida de revisão correspondente, que indicará a existência do problema e proporá nova estrutura, a ser aceita ou rejeitada pelo usuário, 119 para que se possa persistir na verificação da sentença. Diferentemente do aconselhamento ortográfico, que é feito pela combinação sistemática dos caracteres da palavra não-encontrada no dicionário, o aconselhamento gramatical depende profundamente do processamento nos níveis anteriores, razão pela qual o aconselhador retroalimenta a revisão gramatical.” Os resultados de testes comparativos de desempenho do ReGra obtidos pelo NILC são, segundo os próprios pesquisadores, bastante animadores, haja vista que, “numa avaliação global, testes de ambos os tipos demonstraram que qualquer versão do ReGra apresenta um desempenho geral superior aos dos seus concorrentes. Conforme informações do NILC, para efeito de análise a atuação do ReGra foi dividida em quatro categorias de intervenção: verdadeiros negativos (a ferramenta não deveria intervir e não intervém), verdadeiros positivos (deveria intervir e intervém), falsos negativos (deveria intervir e não intervém) e falsos positivos (não deveria intervir mas intervém). Estes testes determinaram que: a) a revisão gramatical e ortográfica automática é não apenas possível, mas viável e útil, já que a ferramenta identifica 60,52% dos problemas praticados pelo usuário (na situação de teste) e se omite em apenas 17,84% dos casos; b) o preço pago para a identificação de mais da metade das inadequações praticadas pelo usuário ainda é alto (o número de falsos positivos ainda é maior do que o número de verdadeiros positivos) e que as estratégias utilizadas para reduzir o comportamento inadequado da ferramenta não têm produzido os efeitos esperados, já que as diferenças entre as várias versões são bem pouco significativas, se considerado o conjunto de sentenças que compõem o corpus de teste. Estabelece-se, portanto, como diretriz futura, mais do que a ampliação do escopo de atuação da ferramenta (para o incremento de número de erros identificados), uma revisão mais radical nas regras já existentes, para que se reduza o número, ainda excessivo, de falsos positivos. (grifo nosso) ANEXO C Telas de Aconselhamento da Gramática Eletrônica do Word Algumas “dicas” (aconselhamento) do revisor gramatical eletrônico sobre outros aspectos, que não apenas a concordância nominal, com os quais nos deparamos, durante a digitação do texto dessa pesquisa, sublinhados com a linha ondulada verde. Servem a título de ilustração e também de exemplificação de alguns dos aspectos que ainda pesquisadores/idealizadores do revisor. precisam ser “melhorados” pelos 121 Tela 1 Sugestão do corretor: mal. Explicação: As palavras “mal” e “mau” são, respectivamente, adjetivo e advérbio. Uma regra prática para verificar sua utilização correta no texto consiste em substituí-las pelos seus antônimos (“bem” e “bom”), e verificar se a frase resultante tem sentido. (grifo nosso, em negrito, para mostrar que a gramática do revisor considera como adjetivo (“mal”) e como advérbio “mau”, quando se sabe que prescrito pela gramática normativa é o inverso). Tela 2 122 Tela 3 Tela 4 Tela 5 123 Tela 6 Tela 7 Tela 8 124 Tela 9 Tela 10 Tela 11 125 Tela 12 Tela 13 Tela 14 126 Tela 15 Tela 16 Tela 17 127