PESQUISAS EM TRADUÇÃO E LINGÜÍSTICA DE CORPUS Diva Cardoso de Camargo∗ RESUMO: Nos últimos anos, a tecnologia informática transformou-se em grande aliada de diversas áreas de estudo, fornecendo inúmeros recursos de exploração. No tocante à interface dos estudos da tradução com a lingüística de corpus, um novo universo de pesquisas tem-se aberto com o desenvolvimento de ferramentas eletrônicas e o tratamento computacional da língua, com diferentes finalidades e aplicações. O alcance e o impacto dessa nova perspectiva evidenciam-se pela quantidade de pesquisas e publicações que utilizam esses recursos e metodologias adequadas para pesquisas em corpus de textos traduzidos. O objetivo deste trabalho é apresentar exemplos concretos de projetos que se caracterizam pela interdisciplinaridade entre esses campos do saber. PALAVRAS-CHAVE: Tradução literária; Tradução especializada; Tradução juramentada; Estudos de tradução baseados em corpus; Lingüística de corpus ABSTRACT: Nowadays, computational technology is offering relevant contributions to several academic fields, by allowing a diversity of exploration resources. In relation to the interface between Translation Studies and Corpus Linguistics, new avenues have been opened with the development of electronic tools for observing the nature of the language of translation in relation to the language of the original texts. The impact of this new perspective is evidenced by the amount of research projects and publications which use adequate theory and methodology for studying corpora of translated texts. This paper aims at presenting concrete examples of interdisciplinary research projects in the area of CorpusBased Translation Studies. KEWWORDS: Literary translation; Specialized translation; Sworn translation; Corpus-Based Translation Studies; Corpus Linguistics Introdução As pesquisas baseadas em corpora de textos traduzidos (TTs) têm-se tornado cada vez mais variadas e com diversas possibilidades de aplicação, explorando desde o conceito de mudança lingüística (descrito por Catford (1965) como desvio da correspondência formal) a investigações de características específicas da linguagem da tradução e seu impacto ideológico (Baker 1999, 2000, 2004). Em decorrência, tem aumentado, acentuadamente, a importância de estudos científicos e sistemáticos baseados em corpus, que permitam um melhor entendimento das possibilidades e das limitações das trocas lingüísticas e culturais ocorridas no ato tradutório, uma melhor compreensão das convergências ∗ Universidade Estadual Paulista − UNESP, câmpus de São José do Rio Preto R. Cristóvão Colombo, 2265 15054-000 − São José do Rio Preto − SP Tel.: +55 17 3221 2423; email: [email protected] 2 e divergências entre a língua fonte (LF) e a língua meta (LM), bem como uma percepção mais nítida do papel do tradutor e sua influência no processo tradutório. Quanto à interface dos estudos da tradução com a lingüística de corpus, um novo universo de pesquisas tem-se aberto com o desenvolvimento de ferramentas eletrônicas e o tratamento computacional da língua, com diferentes finalidades e aplicações. O alcance e o impacto dessa perspectiva evidenciam-se também na área da tradução pela quantidade de pesquisas e publicações que utilizam esses recursos e metodologias adequadas para pesquisas em corpus de TTs. 1. Os estudos da tradução baseados em corpus e a lingüística de corpus O uso de corpora é de grande influência em vários centros. Sobretudo na Europa, a amplitude e diversidade das pesquisas passaram a exigir um aumento considerável do uso de corpora. Na Grã-Bretanha, estão sediados centros importantes pertencentes às universidades de Birmingham, Brighton, Lancaster, Liverpool, Londres, Manchester. No processo de incorporação da University of Manchester Institute of Science and Technology − UMIST à Universidade de Manchester, esta passou, desde junho de 2003, a abrigar um centro pioneiro e, tanto quanto se saiba, o mais conceituado na elaboração de um corpus especificamente desenhado para pesquisas em tradução. Nesse centro liderado por Baker, está sediado o Translational English Corpus − TEC (Corpus do Inglês Traduzido), com a primeira e a maior coleção totalmente computadorizada existente em nível mundial, com cerca, atualmente, de 10.000.000 de palavras, a partir de diversas línguas européias e não-européias nas categorias de ficção, biografia, jornais e revistas de bordo. Por sua vez, Portugal conta, notadamente, com o projeto COMPARA, (http://www.portugues.mct.pt/COMPARA/), levado a efeito por Santos (1998) e por uma equipe de pesquisadores. Fora da Europa, a investigação por meio de corpora não está tão desenvolvida, mas algumas universidades já sentiram a necessidade do uso de corpora. Nos Estados Unidos, paradoxalmente aos centros de pesquisa de renome e ao avanço tecnológico, ainda são poucas as investigações baseadas em corpus. Uma explicação poderia estar na força da lingüística gerativotransformacional de Chomsky que dificultaria a penetração e a aceitação da lingüística de corpus nos centros americanos. No Brasil, a pesquisa em corpus ocorre em centros mais voltados para a lingüística computacional, a lexicologia, e o ensino de línguas. Pode-se citar o Programa de Estudos Pós-Graduados em Lingüística Aplicada a Estudos da Linguagem − LAEL, da PUC/SP, por abrigar um centro pioneiro em estudos da linguagem e, dentre esses estudos, distinguirem-se as pesquisas em corpora do projeto DIRECT conduzido por Berber Sardinha (1997, 1999a, 1999b, 1999c, 2004), especialista em lingüística de corpus. Sediado no LAEL, o Banco de Português − BP contém textos originais (TOs) em português representativos da língua geral. Sobre as contribuições da lingüística de corpus para o ensino e aprendizagem de línguas estrangeiras, destaca-se, pela sua importância, o projeto COMET, liderado por Tagnin (2001), da USP, o qual está elaborado para conter material de ensino para as línguas alemã, espanhola, francesa, inglesa e italiana, 3 e também traduções técnicas nas áreas da informática, odontologia e direito. Também o CORDIALL é um projeto promissor que está sendo desenvolvido por Alves, Magalhães, e Pagano (2001), do Núcleo de Estudos da Tradução − NET, da Faculdade de Letras da UFMG, com vistas ao estudo de características discursivas e cognitivas por meio de uma abordagem interdisciplinar que congrega subsídios dos estudos de corpora, dos estudos da tradução, dos estudos da cognição, da análise do discurso e dos estudos culturais. Em decorrência, tem aumentado no Brasil e no mundo, cada vez mais, a necessidade de pesquisas usando corpora nos vários campos de investigação quer de cunho acadêmico, em especial nas áreas da tradução, lexicologia e terminologia, quer para fins comerciais em centros de pesquisa mantidos, em diversos países, por grandes empresas de telecomunicações, e de produtos de informática, como a Xerox, Microsoft, e Cânon. Desse modo, a situação das universidades brasileiras tem mudado devido tanto à influência, no exterior, da pesquisa baseada em corpus, como ao intercâmbio crescente com centros, no exterior, onde a lingüística de corpus, os estudos da tradução, a lexicologia e terminologia já estão mais desenvolvidos. Dado o avanço que a lingüística de corpus trouxe para a análise de TTs, na opinião de Berber Sardinha (2003) já haveria, no momento, maior unanimidade entre os pesquisadores da tradução e os lingüistas de corpus a respeito da exploração de corpora para a disciplina dos estudos da tradução. De acordo com o autor, os resultados alcançados com esse tipo de observação têm demonstrado que: a organização da linguagem é muito mais complexa do que o suposto, ficando claro que a utilização de corpora, de certa forma, deixou de ser uma opção para investigações na área. (BERBER SARDINHA 2003, p. 70) Também explica que os corpora possibilitam ao tradutor perceber e aprender a lidar com probabilidades que, na verdade, já estão internalizadas pelos usuários de uma língua: Os corpora apenas registram o resultado cumulativo dessas probabilidades; e os modos como elas se manifestam e podem ser pesquisadas oferecem dados elucidativos tanto para o tradutor como para o pesquisador na área da tradução. (BERBER SARDINHA 2003, p. 70) Sob esse aspecto, a lingüística de corpus tem mostrado que a intuição humana é bastante inexata; também tem contribuído para que questões controversas a respeito do conceito de equivalência e do papel da intuição passem a ser repensadas a partir de evidências levantadas em investigações de traduções baseadas em corpora. Tradicionalmente, a identificação da rede de equivalentes na tradução teria de apoiar-se na intuição e na experiência prévia do tradutor; por outro lado, a utilização de um corpus de tradução permite verificar o uso real de equivalentes 4 empregados pelos tradutores, o que traz implicações no tocante à maior indicação de traduzir para o vernáculo do que para o idioma estrangeiro. Na opinião de Tognini Bonelli: Com a evidência possibilitada pelo uso de corpus, e com uma a metodologia para identificar sistematicamente o perfil lexical e gramatical relevantes de uma palavra ou expressão e relacioná-los ao peso conotativo e à função pragmática, esta abordagem reduzirá a lacuna existente entre traduzir de e para a própria língua materna (TOGNINI-BONELLI, 2001, p. 136). Nesse aspecto, os corpora têm mais a oferecer aos tradutores do que se imagina, porquanto fornecem evidências de como as palavras são empregadas, das possibilidades de como é traduzido um dado termo ou segmento textual, além de abrir outras perspectivas sobre o processo e a natureza da tradução. Em conseqüência do uso de corpora, vão emergir novas idéias a respeito da linguagem e concepções antigas precisarão ser reavaliadas. Desse modo, os estudos da tradução baseados em corpus têm contribuído, de forma dinâmica, para os estudos da tradução como um todo, uma vez que os dados podem ser distribuídos e manipulados de vários modos, por meio de métodos e técnicas diferentes de processamento da lingüística de corpus utilizando listas de palavras, palavras-chave e concordâncias, que permitem ao analista observar ocorrências, compará-las, aceitar ou refutar hipóteses. 2. A proposta de Baker Reconhecendo a tradução enquanto espaço diferencial que deve ser privilegiado na cultura de chegada, Baker (1993) considera a tradução como objeto de estudo per se, e elege, como quadro metodológico para pesquisa, a abordagem da lingüística de corpus. Nesse sentido, Baker destaca que: a tarefa mais importante que aguarda a aplicação das técnicas de corpus nos estudos da tradução [...] é a elucidação da natureza do texto traduzido como um evento comunicativo mediado. (BAKER 1993, p. 243) Dentre as possíveis generalizações que foram propostas, em virtude de a utilização de corpora eletrônicos paralelos ou comparáveis possibilitar maior amplitude e funcionalidade para estudos da natureza da tradução, as investigações lideradas por Baker têm detectado certas características ou traços recorrentes que não são resultado da interferência de sistemas lingüísticos específicos, e que se apresentam tipicamente nos TTs mas não em TOs (Baker 1996, p.180-184), a saber: • Simplificação: tendência em tornar mais simples e de mais fácil compreensão a linguagem empregada na tradução. Evidências podem ser encontradas nos TTs em relação aos TOs, como repetição de palavras e mudança na 5 pontuação para trazer maior clareza ao enunciado (mas não necessariamente empregar uma linguagem mais explícita) (Baker 1996, p.180-184). A simplificação também envolve o menor comprimento das frases nos TTs; e a substituição de ambigüidades existentes nos TOs, de modo a torná-las mais precisas nos TTs. Duas medidas possíveis de traços de simplificação são fornecidas pela razão forma/item (type/token ratio) e pela densidade lexical. A razão forma/item é uma medida da variação vocabular presente num texto ou corpus. O uso de vocabulário menos variado pode ser um traço característico dos TTs e também de textos direcionados para falantes não nativos de uma língua, a fim de torná-los mais fáceis de serem processados pelo leitor. Por sua vez, a densidade lexical diz respeito à contagem simples e em intervalos para a extração da razão entre itens e formas. Outra maneira de se considerar a densidade lexical é possível ao obter-se a proporção de palavras de conteúdo em oposição a palavras gramaticais de um corpus: em ocorrendo, no modo de construir os TTs, o emprego de mais redundância por meio do maior número de palavras gramaticais e menor de palavras lexicais, haveria uma indicação do uso de traços de simplificação para tornar os TTs mais compreensíveis para o leitor da LM. • Explicitação: tendência geral em explicar e expandir dados do TO, por meio de uma linguagem mais explícita, mais clara para o leitor do TT. Manifestações dessa tendência podem ser expressas sintática e lexicalmente, e podem ser observadas habitualmente, em relação aos TOs, como a maior extensão dos TTs, a utilização de apostos, o emprego exagerado de vocabulário e de conjunções coordenativas explicativas. Johansson (1995) detecta um aumento de cerca de 10% no número de palavras nos TTs em inglês em relação aos respectivos TOs em norueguês, e também detecta um aumento na direção tradutória inversa. Embora o comprimento do texto em função do número de palavras seja inevitavelmente influenciado, em parte, pela estrutura morfológica de cada língua, os resultados obtidos pelo pesquisador mostramse reveladores por apontarem um aumento nos TTs em ambas as direções tradutórias. • Normalização ou conservacionismo: tendência para exagerar características da LM e para adequar-se aos seus padrões típicos. Pode ser observada tanto no nível de palavras individuais ou de colocações. Frases longas e elaboradas bem como elementos redundantes, utilizados nos TOs, são substituídos por colocações menores, e as redundâncias são, muitas vezes, omitidas. Também as sentenças não terminadas nos TOs são freqüentemente completadas nos TTs. Outrossim, o ritmo da LM torna-se, em geral, mais fluente, uma vez que aspectos incomuns de pontuação existentes na LF são padronizados, de modo a adaptarem-se a aspectos mais comuns da LM. Essa tendência, de acordo com Baker (1996, p. 183), seria possivelmente influenciada pelo status da LF e da LM, dado que, quanto mais alto for o status da LF, menor seria a tendência à normalização. 6 • Estabilização: tendência para a tradução localizar-se no centro de um contínuo, evitando-se os extremos. Diferentemente da normalização, que é dependente da LM ao exagerar suas características nos TTs, o processo de estabilização não é dependente nem da LM nem da LF. Das quatro características típicas e recorrentes da tradução, esta é a que menos recebeu atenção na literatura da área. Manifestações podem ser encontradas, por exemplo, na tendência de os tradutores empregarem a linguagem culta nas marcas da linguagem oral utilizadas pelo autor do TO para caracterizar determinados personagens. Dentro dessa perspectiva, as quatro hipóteses de simplificação, explicitação, normalização e estabilização poderiam indicar que as características lingüísticas presentes nos TTs também variam de acordo com fatores extralingüísticos, dentre outros: estratégias de publicação, finalidade dos TTs, limitações dos clientes e intermediários, injunções do mercado editorial, normas de tradução presentes na cultura da LM. O enfoque comparativo em corpora paralelos ou comparáveis têm contribuído ativamente para a teoria da tradução, ao procurar elucidar a natureza dos TTs e o processo tradutório, objetos esses considerados essenciais para delimitar os objetivos e a área de atuação da disciplina. Dessa maneira, ao invés de exames de TTs voltados apenas para o levantamento de características distintivas do TO, a fim de reproduzi-las na tradução, ou do levantamento de desvios da norma por parte do tradutor, novos horizontes têm sido abertos aos estudos da tradução por meio de contribuições da lingüística de corpus, permitindo que se proponham diferentes investigações sobre o estilo de determinado tradutor, ou grupo de tradutores, ou corpus de material traduzido que pertença a um dado período ou a diferentes tipologias textuais. Como decorrência, a presença do tradutor no texto ou, mais especificamente, de traços individuais dessa presença começam a fazer parte da literatura sobre tradução. Em virtude de uma tendência dos estudos da tradução baseados em corpus valer-se de exemplos autênticos, seria uma das possíveis abordagens que poderia, talvez, vir a diminuir um pouco a suspeita de uma boa parte dos tradutores profissionais em relação à teoria da tradução. Nesse sentido, a pesquisa de corpora de TTs tem trazido importantes contribuições para a prática tradutória ao procurar descrever o que o tradutor realmente faz com a LM. No entanto, existem limitações para se iniciar uma pesquisa em corpus paralelo ou comparável, dentre elas a necessidade de embasamento teóricometodológico e treinamento específico, preparação dos textos em formato adequado de análise, além de subsídios financeiros para a aquisição de equipamentos avançados de computação, de software de análise (ex.: WordSmith Tools, MultiConcord) e de CD-Roms. Apesar dessas dificuldades, os corpora em formato eletrônico analisados com o auxílio de ferramentas computacionais podem oferecer uma série de vantagens para pesquisas em tradução, como: manipulação de grande quantidade de dados; acesso a dados autênticos, observáveis e verificáveis; repetição de uma experiência e confirmação de intuições e conclusões; estudos de freqüência sobre dados encontrados e não-encontrados; obtenção de dados quantitativos/estatísticos; e generalizações. 7 Desta feita, os estudos por meio do uso de corpora de TTs são de considerável relevância para a disciplina de estudos da tradução, não só por partirem do conceito teórico de pesquisa descritiva baseada na língua em uso, mas também por aceitarem os princípios da lingüística de corpus como metodologia. 3. Alguns exemplos de pesquisas com base nos estudos da tradução baseados em corpus e na lingüística de corpus Devido às possibilidades oferecidas pelos corpora paralelos ao facilitarem e agilizarem o exame dos TTs em relação aos respectivos TOs, esse tipo de corpus permite estudos descritivo-comparativos, por exemplo, entre o uso de padrões estilísticos próprios do tradutor, o qual se distingue do uso de padrões estilísticos próprios do autor. Já os corpora comparáveis de TTs especializados (cf. definição de Tognini-Bonelli, 2001, p. 134-5), representam determinado gênero; ao conterem TOs de mesma natureza na L1 (ou LF) e na L2 (ou LM), e TTs na L1, permitem observar, por exemplo, como se empregam termos ou unidades fraseológicas de uma dada linguagem de especialidade. Por sua vez, como os tradutores públicos raramente guardam os TOs, o tipo de corpus indicado para o exame de características da tradução juramentada também é o comparável. • Exemplos de pesquisas com corpus de traduções literárias: 1 - Pesquisa Projeto PETra 2 - Pesquisa Tradução literária • Exemplos de pesquisas com corpus de traduções especializadas 3 - Pesquisa Tradução especializada • Exemplos de pesquisas com corpus de traduções juramentadas 4 - Pesquisa Tradução juramentada 5 - Pesquisa Tradução juramentada – unidades fraseologicas Referências bibliográficas ALVES, F; MAGALHÃES, C. M.; PAGANO, A. Metodologias de Pesquisa em Tradução. Belo Horizonte: FALE-UFMG, 2001. BAKER, M. Corpus linguistics and translation studies: implications and applications. In: BAKER, M.; FRANCIS, G.; TOGNINI-BONELLI, E. (Ed.). Text and technology: in honour of John Sinclair. Amsterdam: John Benjamins, 1993. p. 233250. ______. Corpus-based translation studies: the challenges that lie ahead In: SOMERS, H. (Ed.). Terminology, LSP and translation studies in language 8 engineering: in honour of Juan C. Sager. Amsterdam: John Benjamins, 1996. p. 175-186. ______. Lingüística e estudos culturais: paradigmas complementares ou antagônicos nos estudos da tradução? In: MARTINS, M. A. P. (Org.). Tradução e multidisciplinaridade. Rio de Janeiro: Lucerna, 1999. p.15-34. ______. Towards a methodology for investigating the style of a literary translator. Target. v. 12, n. 2, p. 241-266, 2000. ______. A corpus-based view of similarity and difference in translation. In: ARDUINI, S.; HODGSON, R. (Ed.) Translating similarity and difference. Manchester: St. Jerome, 2004. BERBER SARDINHA, A. P. Patterns of lexis in original and translated business reports: textual differences and similarities. In: SIMMS, K. Translating sensitive texts: linguistic aspects. Amsterdam: Rodopi, 1997. p. 147-153. _____. A influência do tamanho do corpus de referência na obtenção de palavraschave. DIRECT Papers 38. São Paulo: PUC/SP. 1999a. Disponível em: http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008. _____. Usando WordStmith Tools na investagação da linguagem. DIRECT Papers 40. São Paulo: PUC/SP. 1999b. Disponível em: http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008. _____. Using key words in text analysis: Practical aspects. DIRECT Papers 42. São Paulo: PUC/SP. 1999c. Disponível em: http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008. BERBER SARDINHA, A. P. Uso de corpora na formação de tradutores. D.E.L.T.A. 19:Especial, p. 43-70. 2003. ______. Lingüística de corpus. São Paulo: Manole, 2004. CAMARGO, D. C. Padrões de estilo de tradutores − PETra: investigação em corpora de traduções literárias, especializadas e juramentadas. Projeto de pesquisa apresentado como requisito parcial para aprovação do Plano Trienal para 2004-2006. São José do Rio Preto: IBILCE, 2004. Não publicado. ______. Padrões de estilo de tradutores: um estudo de semelhanças e diferenças em corpora de traduções literárias, especializadas e juramentadas. 2005. 512 f. Tese (Livre-Docência em Estudos da Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2005. CATFORD, J. C. A linguistic theory of translation. London: Oxford University Press, 1965, 1969. ______. Uma teoria lingüística da tradução. Tradução Centro de Especialização de Tradutores de Inglês, do Instituto de Letras da PUC/Camp. São Paulo: Cultrix; Campinas: PUC/Camp., 1980. JOHANSSON, S. Mens sana in corpore sano: on the role of corpora in linguistic research. The European English messenger. 4, p. 19-25, 1995. ORENHA, A. Colocações e unidades fraseológicas em contratos sociais e estatutos sociais traduzidos no modo juramentado e não submetidos ao processo 9 de juramentação. Tese (Doutorado em Estudos da Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto. Em desenvolvimento. PAIVA, P. T. P. Análise de um corpus constituído de textos da área médica na direção português-inglês. 2006. 224 f. Dissertação (Mestrado em Estudos da Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2006. ROCHA, C. F. Tradução Juramentada: semelhanças e diferenças no uso de termos simples, expressões fixas e semifixas em contratos de compra e venda e em títulos executivos. Tese (Doutorado em Estudos da Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto. Em desenvolvimento. SANTOS, D. Perception verbs in English and Portuguese. In: JOHANSSON, S.; OKSEFJELL, S. (Ed.) Corpora and cross-linguistic research: theory, method, and case studies. Amsterdam/Atlanta: Rodopi, 1998, p. 319-342. TAGNIN, S. E. O. COMET: um COrpus Multilíngüe para Ensino e Tradução. São Paulo: USP, 2001, manuscrito. TOGNINI-BONELLI, E. Corpus linguistics at work. Amsterdam: John Benjamins. 2001. VALIDÓRIO, V. C. Uma Investigação sobre o comportamento lingüístico-tradutório de tradutores profissionais na tradução de marcadores culturais em obras de cunho regionalista. 2008. Tese (Doutorado em Estudos da Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2008.