Pesquisas em tradução e lingüística de corpus

Propaganda
PESQUISAS EM TRADUÇÃO E LINGÜÍSTICA DE CORPUS
Diva Cardoso de Camargo∗
RESUMO: Nos últimos anos, a tecnologia informática transformou-se em grande
aliada de diversas áreas de estudo, fornecendo inúmeros recursos de exploração.
No tocante à interface dos estudos da tradução com a lingüística de corpus, um
novo universo de pesquisas tem-se aberto com o desenvolvimento de ferramentas
eletrônicas e o tratamento computacional da língua, com diferentes finalidades e
aplicações. O alcance e o impacto dessa nova perspectiva evidenciam-se pela
quantidade de pesquisas e publicações que utilizam esses recursos e
metodologias adequadas para pesquisas em corpus de textos traduzidos. O
objetivo deste trabalho é apresentar exemplos concretos de projetos que se
caracterizam pela interdisciplinaridade entre esses campos do saber.
PALAVRAS-CHAVE: Tradução literária; Tradução especializada; Tradução
juramentada; Estudos de tradução baseados em corpus; Lingüística de corpus
ABSTRACT: Nowadays, computational technology is offering relevant
contributions to several academic fields, by allowing a diversity of exploration
resources. In relation to the interface between Translation Studies and Corpus
Linguistics, new avenues have been opened with the development of electronic
tools for observing the nature of the language of translation in relation to the
language of the original texts. The impact of this new perspective is evidenced by
the amount of research projects and publications which use adequate theory and
methodology for studying corpora of translated texts. This paper aims at presenting
concrete examples of interdisciplinary research projects in the area of CorpusBased Translation Studies.
KEWWORDS: Literary translation; Specialized translation; Sworn translation;
Corpus-Based Translation Studies; Corpus Linguistics
Introdução
As pesquisas baseadas em corpora de textos traduzidos (TTs) têm-se
tornado cada vez mais variadas e com diversas possibilidades de aplicação,
explorando desde o conceito de mudança lingüística (descrito por Catford (1965)
como desvio da correspondência formal) a investigações de características
específicas da linguagem da tradução e seu impacto ideológico (Baker 1999,
2000, 2004).
Em decorrência, tem aumentado, acentuadamente, a importância de estudos
científicos e sistemáticos baseados em corpus, que permitam um melhor
entendimento das possibilidades e das limitações das trocas lingüísticas e
culturais ocorridas no ato tradutório, uma melhor compreensão das convergências
∗
Universidade Estadual Paulista − UNESP, câmpus de São José do Rio Preto
R. Cristóvão Colombo, 2265
15054-000 − São José do Rio Preto − SP
Tel.: +55 17 3221 2423; email: [email protected]
2
e divergências entre a língua fonte (LF) e a língua meta (LM), bem como uma
percepção mais nítida do papel do tradutor e sua influência no processo tradutório.
Quanto à interface dos estudos da tradução com a lingüística de corpus, um
novo universo de pesquisas tem-se aberto com o desenvolvimento de ferramentas
eletrônicas e o tratamento computacional da língua, com diferentes finalidades e
aplicações. O alcance e o impacto dessa perspectiva evidenciam-se também na
área da tradução pela quantidade de pesquisas e publicações que utilizam esses
recursos e metodologias adequadas para pesquisas em corpus de TTs.
1. Os estudos da tradução baseados em corpus e a lingüística de corpus
O uso de corpora é de grande influência em vários centros. Sobretudo na
Europa, a amplitude e diversidade das pesquisas passaram a exigir um aumento
considerável do uso de corpora. Na Grã-Bretanha, estão sediados centros
importantes pertencentes às universidades de Birmingham, Brighton, Lancaster,
Liverpool, Londres, Manchester. No processo de incorporação da University of
Manchester Institute of Science and Technology − UMIST à Universidade de
Manchester, esta passou, desde junho de 2003, a abrigar um centro pioneiro e,
tanto quanto se saiba, o mais conceituado na elaboração de um corpus
especificamente desenhado para pesquisas em tradução. Nesse centro liderado
por Baker, está sediado o Translational English Corpus − TEC (Corpus do Inglês
Traduzido), com a primeira e a maior coleção totalmente computadorizada
existente em nível mundial, com cerca, atualmente, de 10.000.000 de palavras, a
partir de diversas línguas européias e não-européias nas categorias de ficção,
biografia, jornais e revistas de bordo. Por sua vez, Portugal conta, notadamente,
com o projeto COMPARA, (http://www.portugues.mct.pt/COMPARA/), levado a
efeito por Santos (1998) e por uma equipe de pesquisadores.
Fora da Europa, a investigação por meio de corpora não está tão
desenvolvida, mas algumas universidades já sentiram a necessidade do uso de
corpora. Nos Estados Unidos, paradoxalmente aos centros de pesquisa de
renome e ao avanço tecnológico, ainda são poucas as investigações baseadas em
corpus.
Uma explicação poderia estar na força da lingüística gerativotransformacional de Chomsky que dificultaria a penetração e a aceitação da
lingüística de corpus nos centros americanos.
No Brasil, a pesquisa em corpus ocorre em centros mais voltados para a
lingüística computacional, a lexicologia, e o ensino de línguas. Pode-se citar o
Programa de Estudos Pós-Graduados em Lingüística Aplicada a Estudos da
Linguagem − LAEL, da PUC/SP, por abrigar um centro pioneiro em estudos da
linguagem e, dentre esses estudos, distinguirem-se as pesquisas em corpora do
projeto DIRECT conduzido por Berber Sardinha (1997, 1999a, 1999b, 1999c,
2004), especialista em lingüística de corpus. Sediado no LAEL, o Banco de
Português − BP contém textos originais (TOs) em português representativos da
língua geral. Sobre as contribuições da lingüística de corpus para o ensino e
aprendizagem de línguas estrangeiras, destaca-se, pela sua importância, o projeto
COMET, liderado por Tagnin (2001), da USP, o qual está elaborado para conter
material de ensino para as línguas alemã, espanhola, francesa, inglesa e italiana,
3
e também traduções técnicas nas áreas da informática, odontologia e direito.
Também o CORDIALL é um projeto promissor que está sendo desenvolvido por
Alves, Magalhães, e Pagano (2001), do Núcleo de Estudos da Tradução − NET,
da Faculdade de Letras da UFMG, com vistas ao estudo de características
discursivas e cognitivas por meio de uma abordagem interdisciplinar que congrega
subsídios dos estudos de corpora, dos estudos da tradução, dos estudos da
cognição, da análise do discurso e dos estudos culturais.
Em decorrência, tem aumentado no Brasil e no mundo, cada vez mais, a
necessidade de pesquisas usando corpora nos vários campos de investigação
quer de cunho acadêmico, em especial nas áreas da tradução, lexicologia e
terminologia, quer para fins comerciais em centros de pesquisa mantidos, em
diversos países, por grandes empresas de telecomunicações, e de produtos de
informática, como a Xerox, Microsoft, e Cânon.
Desse modo, a situação das universidades brasileiras tem mudado devido
tanto à influência, no exterior, da pesquisa baseada em corpus, como ao
intercâmbio crescente com centros, no exterior, onde a lingüística de corpus, os
estudos da tradução, a lexicologia e terminologia já estão mais desenvolvidos.
Dado o avanço que a lingüística de corpus trouxe para a análise de TTs, na
opinião de Berber Sardinha (2003) já haveria, no momento, maior unanimidade
entre os pesquisadores da tradução e os lingüistas de corpus a respeito da
exploração de corpora para a disciplina dos estudos da tradução. De acordo com
o autor, os resultados alcançados com esse tipo de observação têm demonstrado
que:
a organização da linguagem é muito mais complexa do que o
suposto, ficando claro que a utilização de corpora, de certa forma,
deixou de ser uma opção para investigações na área. (BERBER
SARDINHA 2003, p. 70)
Também explica que os corpora possibilitam ao tradutor perceber e aprender a
lidar com probabilidades que, na verdade, já estão internalizadas pelos usuários
de uma língua:
Os corpora apenas registram o resultado cumulativo dessas
probabilidades; e os modos como elas se manifestam e podem ser
pesquisadas oferecem dados elucidativos tanto para o tradutor como
para o pesquisador na área da tradução. (BERBER SARDINHA
2003, p. 70)
Sob esse aspecto, a lingüística de corpus tem mostrado que a intuição
humana é bastante inexata; também tem contribuído para que questões
controversas a respeito do conceito de equivalência e do papel da intuição
passem a ser repensadas a partir de evidências levantadas em investigações de
traduções baseadas em corpora.
Tradicionalmente, a identificação da rede de equivalentes na tradução teria
de apoiar-se na intuição e na experiência prévia do tradutor; por outro lado, a
utilização de um corpus de tradução permite verificar o uso real de equivalentes
4
empregados pelos tradutores, o que traz implicações no tocante à maior indicação
de traduzir para o vernáculo do que para o idioma estrangeiro. Na opinião de
Tognini Bonelli:
Com a evidência possibilitada pelo uso de corpus, e com uma a
metodologia para identificar sistematicamente o perfil lexical e
gramatical relevantes de uma palavra ou expressão e relacioná-los
ao peso conotativo e à função pragmática, esta abordagem reduzirá
a lacuna existente entre traduzir de e para a própria língua materna
(TOGNINI-BONELLI, 2001, p. 136).
Nesse aspecto, os corpora têm mais a oferecer aos tradutores do que se
imagina, porquanto fornecem evidências de como as palavras são empregadas,
das possibilidades de como é traduzido um dado termo ou segmento textual, além
de abrir outras perspectivas sobre o processo e a natureza da tradução. Em
conseqüência do uso de corpora, vão emergir novas idéias a respeito da
linguagem e concepções antigas precisarão ser reavaliadas.
Desse modo, os estudos da tradução baseados em corpus têm contribuído,
de forma dinâmica, para os estudos da tradução como um todo, uma vez que os
dados podem ser distribuídos e manipulados de vários modos, por meio de
métodos e técnicas diferentes de processamento da lingüística de corpus
utilizando listas de palavras, palavras-chave e concordâncias, que permitem ao
analista observar ocorrências, compará-las, aceitar ou refutar hipóteses.
2. A proposta de Baker
Reconhecendo a tradução enquanto espaço diferencial que deve ser
privilegiado na cultura de chegada, Baker (1993) considera a tradução como
objeto de estudo per se, e elege, como quadro metodológico para pesquisa, a
abordagem da lingüística de corpus. Nesse sentido, Baker destaca que:
a tarefa mais importante que aguarda a aplicação das técnicas de
corpus nos estudos da tradução [...] é a elucidação da natureza do
texto traduzido como um evento comunicativo mediado. (BAKER
1993, p. 243)
Dentre as possíveis generalizações que foram propostas, em virtude de a
utilização de corpora eletrônicos paralelos ou comparáveis possibilitar maior
amplitude e funcionalidade para estudos da natureza da tradução, as
investigações lideradas por Baker têm detectado certas características ou traços
recorrentes que não são resultado da interferência de sistemas lingüísticos
específicos, e que se apresentam tipicamente nos TTs mas não em TOs (Baker
1996, p.180-184), a saber:
•
Simplificação: tendência em tornar mais simples e de mais fácil compreensão a
linguagem empregada na tradução. Evidências podem ser encontradas nos
TTs em relação aos TOs, como repetição de palavras e mudança na
5
pontuação para trazer maior clareza ao enunciado (mas não necessariamente
empregar uma linguagem mais explícita) (Baker 1996, p.180-184).
A
simplificação também envolve o menor comprimento das frases nos TTs; e a
substituição de ambigüidades existentes nos TOs, de modo a torná-las mais
precisas nos TTs. Duas medidas possíveis de traços de simplificação são
fornecidas pela razão forma/item (type/token ratio) e pela densidade lexical. A
razão forma/item é uma medida da variação vocabular presente num texto ou
corpus. O uso de vocabulário menos variado pode ser um traço característico
dos TTs e também de textos direcionados para falantes não nativos de uma
língua, a fim de torná-los mais fáceis de serem processados pelo leitor. Por
sua vez, a densidade lexical diz respeito à contagem simples e em intervalos
para a extração da razão entre itens e formas. Outra maneira de se considerar
a densidade lexical é possível ao obter-se a proporção de palavras de
conteúdo em oposição a palavras gramaticais de um corpus: em ocorrendo, no
modo de construir os TTs, o emprego de mais redundância por meio do maior
número de palavras gramaticais e menor de palavras lexicais, haveria uma
indicação do uso de traços de simplificação para tornar os TTs mais
compreensíveis para o leitor da LM.
•
Explicitação: tendência geral em explicar e expandir dados do TO, por meio de
uma linguagem mais explícita, mais clara para o leitor do TT. Manifestações
dessa tendência podem ser expressas sintática e lexicalmente, e podem ser
observadas habitualmente, em relação aos TOs, como a maior extensão dos
TTs, a utilização de apostos, o emprego exagerado de vocabulário e de
conjunções coordenativas explicativas. Johansson (1995) detecta um aumento
de cerca de 10% no número de palavras nos TTs em inglês em relação aos
respectivos TOs em norueguês, e também detecta um aumento na direção
tradutória inversa. Embora o comprimento do texto em função do número de
palavras seja inevitavelmente influenciado, em parte, pela estrutura
morfológica de cada língua, os resultados obtidos pelo pesquisador mostramse reveladores por apontarem um aumento nos TTs em ambas as direções
tradutórias.
•
Normalização ou conservacionismo: tendência para exagerar características da
LM e para adequar-se aos seus padrões típicos. Pode ser observada tanto no
nível de palavras individuais ou de colocações. Frases longas e elaboradas
bem como elementos redundantes, utilizados nos TOs, são substituídos por
colocações menores, e as redundâncias são, muitas vezes, omitidas. Também
as sentenças não terminadas nos TOs são freqüentemente completadas nos
TTs. Outrossim, o ritmo da LM torna-se, em geral, mais fluente, uma vez que
aspectos incomuns de pontuação existentes na LF são padronizados, de modo
a adaptarem-se a aspectos mais comuns da LM. Essa tendência, de acordo
com Baker (1996, p. 183), seria possivelmente influenciada pelo status da LF
e da LM, dado que, quanto mais alto for o status da LF, menor seria a
tendência à normalização.
6
•
Estabilização: tendência para a tradução localizar-se no centro de um contínuo,
evitando-se os extremos. Diferentemente da normalização, que é dependente
da LM ao exagerar suas características nos TTs, o processo de estabilização
não é dependente nem da LM nem da LF. Das quatro características típicas e
recorrentes da tradução, esta é a que menos recebeu atenção na literatura da
área. Manifestações podem ser encontradas, por exemplo, na tendência de os
tradutores empregarem a linguagem culta nas marcas da linguagem oral
utilizadas pelo autor do TO para caracterizar determinados personagens.
Dentro dessa perspectiva, as quatro hipóteses de simplificação, explicitação,
normalização e estabilização poderiam indicar que as características lingüísticas
presentes nos TTs também variam de acordo com fatores extralingüísticos, dentre
outros: estratégias de publicação, finalidade dos TTs, limitações dos clientes e
intermediários, injunções do mercado editorial, normas de tradução presentes na
cultura da LM.
O enfoque comparativo em corpora paralelos ou comparáveis têm
contribuído ativamente para a teoria da tradução, ao procurar elucidar a natureza
dos TTs e o processo tradutório, objetos esses considerados essenciais para
delimitar os objetivos e a área de atuação da disciplina. Dessa maneira, ao invés
de exames de TTs voltados apenas para o levantamento de características
distintivas do TO, a fim de reproduzi-las na tradução, ou do levantamento de
desvios da norma por parte do tradutor, novos horizontes têm sido abertos aos
estudos da tradução por meio de contribuições da lingüística de corpus, permitindo
que se proponham diferentes investigações sobre o estilo de determinado tradutor,
ou grupo de tradutores, ou corpus de material traduzido que pertença a um dado
período ou a diferentes tipologias textuais. Como decorrência, a presença do
tradutor no texto ou, mais especificamente, de traços individuais dessa presença
começam a fazer parte da literatura sobre tradução. Em virtude de uma tendência
dos estudos da tradução baseados em corpus valer-se de exemplos autênticos,
seria uma das possíveis abordagens que poderia, talvez, vir a diminuir um pouco a
suspeita de uma boa parte dos tradutores profissionais em relação à teoria da
tradução. Nesse sentido, a pesquisa de corpora de TTs tem trazido importantes
contribuições para a prática tradutória ao procurar descrever o que o tradutor
realmente faz com a LM.
No entanto, existem limitações para se iniciar uma pesquisa em corpus
paralelo ou comparável, dentre elas a necessidade de embasamento teóricometodológico e treinamento específico, preparação dos textos em formato
adequado de análise, além de subsídios financeiros para a aquisição de
equipamentos avançados de computação, de software de análise (ex.: WordSmith
Tools, MultiConcord) e de CD-Roms.
Apesar dessas dificuldades, os corpora em formato eletrônico analisados
com o auxílio de ferramentas computacionais podem oferecer uma série de
vantagens para pesquisas em tradução, como: manipulação de
grande
quantidade de dados; acesso a dados autênticos, observáveis e verificáveis;
repetição de uma experiência e confirmação de intuições e conclusões; estudos
de freqüência sobre dados encontrados e não-encontrados; obtenção de dados
quantitativos/estatísticos; e generalizações.
7
Desta feita, os estudos por meio do uso de corpora de TTs são de
considerável relevância para a disciplina de estudos da tradução, não só por
partirem do conceito teórico de pesquisa descritiva baseada na língua em uso,
mas também por aceitarem os princípios da lingüística de corpus como
metodologia.
3. Alguns exemplos de pesquisas com base nos estudos da tradução
baseados em corpus e na lingüística de corpus
Devido às possibilidades oferecidas pelos corpora paralelos ao facilitarem e
agilizarem o exame dos TTs em relação aos respectivos TOs, esse tipo de corpus
permite estudos descritivo-comparativos, por exemplo, entre o uso de padrões
estilísticos próprios do tradutor, o qual se distingue do uso de padrões estilísticos
próprios do autor. Já os corpora comparáveis de TTs especializados (cf. definição
de Tognini-Bonelli, 2001, p. 134-5), representam determinado gênero; ao
conterem TOs de mesma natureza na L1 (ou LF) e na L2 (ou LM), e TTs na L1,
permitem observar, por exemplo, como se empregam termos ou unidades
fraseológicas de uma dada linguagem de especialidade. Por sua vez, como os
tradutores públicos raramente guardam os TOs, o tipo de corpus indicado para o
exame de características da tradução juramentada também é o comparável.
• Exemplos de pesquisas com corpus de traduções literárias:
1 - Pesquisa Projeto PETra
2 - Pesquisa Tradução literária
• Exemplos de pesquisas com corpus de traduções especializadas
3 - Pesquisa Tradução especializada
• Exemplos de pesquisas com corpus de traduções juramentadas
4 - Pesquisa Tradução juramentada
5 - Pesquisa Tradução juramentada – unidades fraseologicas
Referências bibliográficas
ALVES, F; MAGALHÃES, C. M.; PAGANO, A. Metodologias de Pesquisa em
Tradução. Belo Horizonte: FALE-UFMG, 2001.
BAKER, M. Corpus linguistics and translation studies: implications and
applications. In: BAKER, M.; FRANCIS, G.; TOGNINI-BONELLI, E. (Ed.). Text and
technology: in honour of John Sinclair. Amsterdam: John Benjamins, 1993. p. 233250.
______. Corpus-based translation studies: the challenges that lie ahead In:
SOMERS, H. (Ed.). Terminology, LSP and translation studies in language
8
engineering: in honour of Juan C. Sager. Amsterdam: John Benjamins, 1996. p.
175-186.
______. Lingüística e estudos culturais: paradigmas complementares ou
antagônicos nos estudos da tradução? In: MARTINS, M. A. P. (Org.). Tradução e
multidisciplinaridade. Rio de Janeiro: Lucerna, 1999. p.15-34.
______. Towards a methodology for investigating the style of a literary translator.
Target. v. 12, n. 2, p. 241-266, 2000.
______. A corpus-based view of similarity and difference in translation. In:
ARDUINI, S.; HODGSON, R. (Ed.) Translating similarity and difference.
Manchester: St. Jerome, 2004.
BERBER SARDINHA, A. P. Patterns of lexis in original and translated business
reports: textual differences and similarities. In: SIMMS, K. Translating sensitive
texts: linguistic aspects. Amsterdam: Rodopi, 1997. p. 147-153.
_____. A influência do tamanho do corpus de referência na obtenção de palavraschave. DIRECT Papers 38. São Paulo: PUC/SP. 1999a. Disponível em:
http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008.
_____. Usando WordStmith Tools na investagação da linguagem. DIRECT
Papers
40.
São
Paulo:
PUC/SP.
1999b.
Disponível
em:
http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008.
_____. Using key words in text analysis: Practical aspects. DIRECT Papers 42.
São
Paulo:
PUC/SP.
1999c.
Disponível
em:
http://sites.uol.com.br/tony4/homepage.html; último acesso em 24/06/2008.
BERBER SARDINHA, A. P. Uso de corpora na formação de tradutores.
D.E.L.T.A. 19:Especial, p. 43-70. 2003.
______. Lingüística de corpus. São Paulo: Manole, 2004.
CAMARGO, D. C. Padrões de estilo de tradutores − PETra: investigação em
corpora de traduções literárias, especializadas e juramentadas. Projeto de
pesquisa apresentado como requisito parcial para aprovação do Plano Trienal
para 2004-2006. São José do Rio Preto: IBILCE, 2004. Não publicado.
______. Padrões de estilo de tradutores: um estudo de semelhanças e diferenças
em corpora de traduções literárias, especializadas e juramentadas. 2005. 512 f.
Tese (Livre-Docência em Estudos da Tradução) – Instituto de Biociências, Letras e
Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2005.
CATFORD, J. C. A linguistic theory of translation. London: Oxford University
Press, 1965, 1969.
______. Uma teoria lingüística da tradução. Tradução Centro de Especialização
de Tradutores de Inglês, do Instituto de Letras da PUC/Camp. São Paulo: Cultrix;
Campinas: PUC/Camp., 1980.
JOHANSSON, S. Mens sana in corpore sano: on the role of corpora in linguistic
research. The European English messenger. 4, p. 19-25, 1995.
ORENHA, A. Colocações e unidades fraseológicas em contratos sociais e
estatutos sociais traduzidos no modo juramentado e não submetidos ao processo
9
de juramentação. Tese (Doutorado em Estudos da Tradução) – Instituto de
Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José
do Rio Preto. Em desenvolvimento.
PAIVA, P. T. P. Análise de um corpus constituído de textos da área médica na
direção português-inglês. 2006. 224 f. Dissertação (Mestrado em Estudos da
Tradução) – Instituto de Biociências, Letras e Ciências Exatas, Universidade
Estadual Paulista, São José do Rio Preto, 2006.
ROCHA, C. F. Tradução Juramentada: semelhanças e diferenças no uso de
termos simples, expressões fixas e semifixas em contratos de compra e venda e
em títulos executivos. Tese (Doutorado em Estudos da Tradução) – Instituto de
Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José
do Rio Preto. Em desenvolvimento.
SANTOS, D. Perception verbs in English and Portuguese. In: JOHANSSON, S.;
OKSEFJELL, S. (Ed.) Corpora and cross-linguistic research: theory, method, and
case studies. Amsterdam/Atlanta: Rodopi, 1998, p. 319-342.
TAGNIN, S. E. O. COMET: um COrpus Multilíngüe para Ensino e Tradução. São
Paulo: USP, 2001, manuscrito.
TOGNINI-BONELLI, E. Corpus linguistics at work. Amsterdam: John Benjamins.
2001.
VALIDÓRIO, V. C. Uma Investigação sobre o comportamento lingüístico-tradutório
de tradutores profissionais na tradução de marcadores culturais em obras de
cunho regionalista. 2008. Tese (Doutorado em Estudos da Tradução) – Instituto de
Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José
do Rio Preto, 2008.
Download