Tradução & Comunicação Revista Brasileira de Tradutores Nº. 22, Ano 2011 DA INFORMAÇÃO AO CONHECIMENTO: ESTUDO TERMINOLÓGICO BASEADO EM CORPORA NA ÁREA DO SEGMENTO ACCIONISTA From information to knowledge: corpora-based terminology study in the stock market area Inês Rodrigues Pedro Instituto Superior de Línguas e Administração - Lisboa, PT [email protected] RESUMO Estudo contrastivo da terminologia do segmento accionista dos mercados financeiros utilizada no âmbito jornalístico em inglês e português europeu com vista à elaboração de uma base de dados terminológica bilingue. Após uma breve introdução a aspectos teórico práticos da Terminologia e da Linguística de Corpus, apresentamos a metodologia do processo terminológico bilingue e os resultados da investigação realizada a partir dos cinco termos mais frequentes no corpus em português europeu e os seus equivalentes em inglês, a saber: acção, share e stock; título, security e equity; índice e index; bolsa, stock market, exchange e bourse; empresa e company. Concluímos com a avaliação do contributo do presente projecto para os Estudos de Tradução. Palavras-Chave: base de dados terminológica bilingue; corpora comparáveis; linguística de corpus; segmento accionista; terminologia; tradução. ABSTRACT Contrastive study in terminology used in journalist texts in the stock market area of financial markets written in English and European Portuguese in order to create a bilingual terminological database. After a brief introduction into theoretical and practical aspects of Terminology and Corpus Linguistics, the methodology utilized throughout the bilingual terminological creation is followed by a discussion of the research results obtained based on the five most frequently used terms in European Portuguese and their equivalents in English: acção, share and stock; título, security and equity; índice and index; bolsa, stock market, exchange and bourse; empresa and company. In the conclusions’ section, an evaluation of the study’s contribution to Translation Studies is presented. Keywords: bilingual terminological database; comparative corpora; corpus linguistics; stock market; terminology; translation. Anhanguera Educacional Ltda. Correspondência/Contato Alameda Maria Tereza, 2000 Valinhos, São Paulo CEP 13.278-181 [email protected] Coordenação Instituto de Pesquisas Aplicadas e Desenvolvimento Educacional - IPADE Artigo Original Recebido em: 01/08/2011 Avaliado em: 04/09/2011 Publicação: 30 de setembro de 2011 55 56 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista 1. INTRODUÇÃO O principal objectivo do projecto foi analisar empiricamente o léxico especializado de uma área do saber específica, o domínio do segmento accionista, com vista à construção de uma base de dados (BD) terminológica1 consultável por prestadores de serviços linguísticos (tradutores, intérpretes, revisores etc.) e especialistas financeiros à procura de um equivalente, em língua inglesa, para determinado termo em português europeu e vice-versa. Com base em corpora comparáveis em inglês e português: 1) identificámos termos, criámos sistemas conceptuais, elaborámos definições e localizámos informações fraseológicas; 2) elaborámos uma BD terminológica bilingue, em inglês e português europeu, com as informações obtidas mediante o objectivo anterior. Nas últimas décadas, o progresso do conhecimento humano, coadjuvado pelo desenvolvimento dos meios de transporte e comunicação, com destaque para a Internet, resultou no aumento dos léxicos especializados. Ambicionamos transformar-nos numa sociedade do conhecimento, mas somos, antes de mais, uma sociedade da informação, com um excesso de dados que muitas vezes parecem impossíveis de gerir. Para tradutores e terminólogos, o desafio da escassez de fontes e informação tornou-se, com a generalização do acesso à Internet, o desafio oposto: o da multiplicidade de fontes e informações que se tornam difíceis de conciliar. Está nas mãos da comunidade científica desenvolver e divulgar ferramentas e abordagens que auxiliem o tradutor, enquanto intermediário profissional entre comunidades linguísticas, a transformar informação em conhecimento útil para o seu trabalho2. Deste modo, consideramos que o presente projecto se encontra directamente relacionado com a actividade da tradução, quer pelo resultado (uma base de dados terminológica bilingue) quer pelo processo, o qual poderá servir para divulgar estratégias de extracção de terminologia que qualquer tradutor deverá conseguir transpor, mediante as adaptações necessárias, para o seu âmbito de trabalho. Cumpre sublinhar que uma parte da qualidade da tradução especializada, em particular, depende da qualidade 1 Disponível na íntegra em: <https://docs.google.com/leaf?id=0B8P8DfJfV5GJYWQ3NWQ4ZGQtMDQ2Ny00ZmJkLTg 5ZGEtOGZkM2NkN2U0Yzcx&hl=en>. Acesso em: 25 jul. 2011. 2 Ackoff (1989) distingue, através de uma hierarquia, cinco categorias do saber humano: dados (data), informação (information), conhecimento (knowledge), compreensão (understanding) e sabedoria (wisdom). Na perspectiva de Ackoff, os dados não têm significado além da sua mera existência; a informação consiste em dados que adquiriram significado graças ao estabelecimento de relações entre si; o conhecimento consiste na aplicação de dados e informação; compreensão é o processo cognitivo e analítico que permite alcançar conhecimento novo a partir do conhecimento adquirido (por exemplo, com base na tabuada [conhecimento], é-se capaz de realizar uma operação de multiplicação mais complexa); sabedoria é um processo de extrapolação que exige todos os níveis anteriores do saber. Apesar de polémica, esta hierarquização alerta para a necessidade de diferenciação entre vários tipos de saber e, mais concretamente, entre informação e conhecimento. Para efeitos do presente estudo, consideramos importante distinguir esses dois conceitos, algumas vezes utilizados indiscriminadamente como sinónimos (por exemplo, nas expressões «sociedade da informação»/«sociedade do conhecimento»), salientando que «conhecimento» se encontra a jusante e num patamar superior a «informação». Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 57 terminológica e esta, por sua vez, depende dos recursos que o tradutor tiver ao seu dispor e da pesquisa que for capaz de desenvolver. De entre as aplicações informáticas para o processamento de dados linguísticos, devemos realçar a evolução das ferramentas de análise de corpora. Este tipo de software permite explorar, de uma forma sistemática e semiautomática, volumes elevados de texto em formato electrónico, sendo uma mais valia para os profissionais que, não sendo peritos numa determinada área, têm de a dominar. É no âmbito deste desenvolvimento tecnológico que se insere também o surgimento de memórias de tradução, de programas de alinhamento de texto e de gestão de dados terminológicos, de grande utilidade para o tradutor especializado e na elaboração de glossários, dicionários e bases de dados terminológicas. A escassez de recursos terminológicos desse tipo em português europeu é generalizada em vários ramos do saber, nomeadamente no âmbito do segmento accionista dos mercados financeiros. Contudo, a motivação para o presente projecto prende-se sobretudo com a divulgação de uma abordagem que permita ao estudante de tradução e ao tradutor terminólogo desenvolver competências no sentido de se tornar capaz, autonomamente, de transformar a informação em conhecimento útil aplicável no processo de tradução e visível no produto da tradução. O alargamento da panóplia de ferramentas e abordagens metodológicas torna-se tanto mais premente se tivermos em consideração a afirmação dos Estudos de Tradução como disciplina independente da Linguística, dos Estudos Culturais ou Literários e, concretamente, a recente autonomização dos cursos do ensino superior de tradução em relação aos Estudos Literários e Culturais em algumas instituições do ensino superior portuguesas. Em suma, consideramos a Terminologia uma disciplina que pode ser colocada ao serviço da actividade tradutória e o processo descrito sobretudo uma ferramenta adaptável a outros contextos, e não um fim esgotado em si. O desenvolvimento sistematizado de um trabalho terminológico, com recurso a corpora de linguagem especializada, permite ao tradutor superar um dos grandes desafios da sua actividade, que é «o de encontrar traduções satisfatórias para determinados termos ou expressões» (TAGNIN, 2007, p. 1), e justificar as opções tomadas, podendo, a qualquer momento, por exemplo, citar as suas fontes e fornecer definições e contextos de determinados termos. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 58 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista 2. METODOLOGIA Na presente secção, expomos a metodologia subjacente à criação da BD terminológica bilingue, nomeadamente, o processo de delimitação do domínio e a construção dos corpora. A questão da categorização dos domínios e subdomínios de uma BD terminológica é complexa, mas facilita a transmissão e a aquisição de conhecimentos. Em primeiro lugar, estabelecemos o supra-domínio «mercado». Segundo a definição do dicionário electrónico Houaiss (HOUAISS, 2001), «mercado» designa um espaço fictício em que qualquer produto ou serviço é passível de transacção. Podemos realizar distinções entre mercados, dividindo os por produto ou serviço negociado (por exemplo, mercado do ouro ou do café). «Mercado financeiro» é o «mercado de oferta e procura de capitais a médio e longo prazo»3, podendo ser subdividido em diversos segmentos. Com base na pesquisa em literatura especializada, optámos pela decomposição do mercado de capitais em três segmentos: segmento obrigacionista, segmento de produtos derivados e segmento accionista. Durante a exploração do corpus do segmento accionista (CSA), apercebemo-nos da possibilidade de agregar as unidades terminológicas pelas seguintes categorias: «intervenientes», «produtos», «processos», «instrumentos» e «cenários». De facto, no mercado accionista, tal como em qualquer outro tipo de mercado, procede-se, num determinado espaço ou lugar (cenário), real ou virtual, à compra e venda de bens (produtos), com recurso a processos e instrumentos fixos ou semi-fixos, entre uma série de intervenientes. Para a construção do corpus do segmento accionista (CSA) – composto pelo corpus PT e pelo corpus EN –, recorremos aos artigos das versões em linha de jornais especializados, em português europeu e inglês, que prestam informações, em geral, sobre a economia, as finanças e o mundo empresarial, e, especificamente, sobre a evolução do segmento accionista a um público especializado composto sobretudo por investidores. Para o corpus PT, recorremos ao Jornal de Negócios e ao Diário Económico e, para o corpus EN, ao Financial Times, ao Bloomberg e ao Irish Times. A recolha teve lugar entre Novembro de 2009 e Fevereiro de 2010. É um corpus bilingue comparável com um total de 462 390 palavras, composto em 40,05% (185 201 palavras) por textos originais em inglês (corpus EN) e 59,95% (277 189 palavras) por textos originais em português europeu (corpus PT). 3 Disponível em: <http://www.instituto-camoes.pt/lextec/por/domain_3/definition/17721.html>. Acesso em: 25 jul. 2011. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 3. 59 DISCUSSÃO DE RESULTADOS Recorrendo à função da lista de palavras da ferramenta de análise de corpora AntConc (ANTHONY, 2005, p. 7-13), criámos uma lista das palavras mais frequentes do corpus por ordem de frequência descendente. A lista de frequências produzida desta forma apresenta 9829 palavras/formas lexicais. Posteriormente, recolhemos as formas lexicais com uma frequência superior a 40 ocorrências. A selecção foi realizada com recurso às linhas de concordâncias para a) efeitos de desambiguação gramatical e de b) verificação da possibilidade de categorização do candidato a termo como um termo do segmento accionista. Procedemos também à pesquisa de bigramas e trigramas, ou seja, sequências de duas e três palavras, respectivamente, por ordem de frequência, com mais de 40 ocorrências no corpus PT. Os resultados estão sistematizados na seguinte lista de unidades terminológicas (Quadro 1). Quadro 1. Unidades terminológicas (corpus PT). Unidades terminológicas acção nota de análise accionista OPA analista operadora avaliação papel banca participação banco perda bolsa petrolífera casa de investimento ponto cimenteira posição cobertura praça companhia preço-alvo construtora prémio cotação previsão empresa recomendação estimativa retalhista exposição risco ganho sector grupo sentimento índice sessão investidor sociedade mercado target negociação título Fonte: Corpus PT. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 60 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista Realizámos um processo idêntico com o corpus EN, com 9663 formas, obtendo as 10 palavras lexicais mais frequentes no corpus EN (Quadro 2). Quadro 2. Unidades terminológicas (corpus EN). Unidades terminológicas per cent / percent year index shares stocks company market bank group investors Fonte: Corpus EN. Após a pré-selecção de dados, realizámos a recolha, a validação e o processamento de dados referentes aos cinco termos mais frequentes no corpus PT: «acção», «título», «índice», «bolsa» e «empresa». Em simultâneo, tendo os termos em português europeu por base, levámos a cabo o mesmo processo para o corpus EN. Por não ser possível delimitar as três componentes, optámos por expor este processo na sua globalidade. 3.1. Acção, share e stock Através da análise dos «micro-contextos» (ALMEIDA, 2008, p. 35) em que o lema «acção» surge, estabelecemos este termo como um dos mais importantes do corpus PT, com uma frequência relativa de 674 ocorrências em 100 000 palavras. Assume dois tipos de papéis preponderantes do ponto de vista sintáctico, tanto como sujeito como complemento de objecto directo (COD). Na posição de sujeito, «acção» ocorre com verbos que descrevem tendências de subida («apreciar», «brilhar», «impulsionar») e descida («deslizar», «recuar», «tombar»). Simultaneamente, observámos o comportamento do termo «acção» como COD ao nível dos verbos que selecciona («adquirir», «emitir», «negociar a prémio», «recomprar»). Numa segunda fase, com vista a explorar unidades terminológicas e fraseológicas, analisámos as linhas de concordâncias produzidas pela função de n-gramas, com a pesquisa de «de acção/de acções», dado que a estrutura nome + de + nome é uma das classes de nomes compostos mais produtivas em português (RANCHHOD; Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 61 CARVALHO, 2006). Cumpre destacar que as unidades fraseológicas, compostas por um núcleo terminológico e por um núcleo eventivo sobretudo de base verbal (comprar / compra; emitir / emissão; comportar-se / comportamento), mas também adjectival (líquido / liquidez) , remeteram, em parte, para o campo semântico dos verbos observados na primeira etapa, confirmando o carácter consistente da linguagem de especialidade em análise. Na fase seguinte, procedemos à pesquisa do equivalente terminológico de «acção» em inglês. Os equivalentes directos de «acção» em inglês, «shares» e «stocks», surgem entre as cinquenta formas mais frequentes do corpus EN. Através da comparação das frequências relativas de «acção», «share» e «stock» (674, 456 e 468 ocorrências em 100 000 palavras, respectivamente), inferimos que se trata de termos com importância semelhante em ambos os corpora. A análise dos contextos permitiu concluir que os termos «share» e «stock» apresentam um comportamento a nível das formas de combinação com verbos semelhante ao do termo «acção». Verificámos, assim, ser possível estabelecer equivalências, entre o português europeu e o inglês, ao nível dos verbos que acompanham os termos «share», «stock» e «acção», na posição de sujeito, para descrever tendências de valorização («to gain», «to leap», «to rise») ou desvalorização («to decline», «to fall back», «to plummet») durante as sessões da bolsa. Na posição de COD, o perfil dos termos «share» e «stock» é análogo ao perfil de «acção» no corpus PT (por exemplo, «comprar»/«to buy» ou «to purchase», «emitir»/«to issue», «negociar a prémio»/«to trade at a premium»): constatámos que «share» e «stock» também assumem um papel fundamental na frase como sujeito e COD, seleccionando verbos semanticamente próximos aos observados para «acção». 3.2. Título, security e equity Identificadas 1126 ocorrências do termo «título» (frequência de 406 ocorrências em 100 000 palavras), apercebemo-nos da predominância da estrutura «títulos + de (+ artigo definido) + nome», com 620 ocorrências. Na estrutura «títulos + de (+ artigo definido) + nome», o espaço «nome» pode ser preenchido pela firma da sociedade (Wal Mart, Galp Energia, etc.) ou, nomeadamente, pelas seguintes opções: empresa, banco, banca, sector, grupo e índice (por exemplo: «títulos do sector dos media», «títulos da banca»; «títulos das farmacêuticas»; «títulos do sector energético»; «títulos das petrolíferas»). No contexto específico da linguagem jornalística do segmento accionista, é possível aplicar o hiperónimo «título» em detrimento do hipónimo «acção»: o termo Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 62 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista «título» surge associado à evolução global das acções das sociedades cotadas em bolsa ao longo de um outro período de tempo, normalmente, por comparação a uma determinada referência. Assim se explicam estruturas comparativas como «os títulos que mais», com 24 ocorrências, e «o título mais», com 48 ocorrências. Do ponto de vista sintáctico, a utilização do termo «título» predomina na posição de sujeito, co-ocorrendo com verbos que descrevem os movimentos de descida e subida do valor das cotações, à semelhança de «acção». Subdividimo-los em verbos de tendência ascendente («apreciar»; «escalar»; «encontrar-se em alta») e de tendência descendente («deslizar»; «encontrar-se em baixa»; «perder»; «recuar»). A observação do perfil do termo «título» na posição de COD também foi produtiva, tendo-se recolhido verbos como «deter», «impulsionar», «negociar», «pressionar», «sustentar» e «transaccionar». Por fim, organizámos as unidades fraseológicas compostas pelo termo «título» e por um núcleo eventivo («cobertura do título»; «recomendação para o título»; «liquidez do título»; «volatilidade do título»). Novamente, verificámos que as unidades fraseológicas são de base verbal (cobrir / cobertura; recomendar / recomendação) e adjectival (líquido / liquidez; volátil / volatilidade). O equivalente terminológico prima facie de «título» é «security». De facto, a definição que se segue permitiu categorizá-lo como um hiperónimo de acções («stocks»), obrigações («bonds») e instrumentos derivados («derivatives»), à semelhança da definição de «título»: «An instrument representing ownership (stocks), a debt agreement (bonds) or the rights to ownership (derivatives).» Fonte: Investopedia4 «Termo utilizado para descrever uma ampla variedade de instrumentos de investimento transaccionáveis, ou negociáveis, tais como acções, obrigações, títulos de participação, warrants, unidades de participação em fundos de investimento, instrumentos derivados (futuros, opções,…), etc.» Fonte: IAPMEI 5 A pesquisa do lema «security» no corpus EN, porém, revelou-se frustrante: a frequência de 10 ocorrências do termo não é comparável com as 406 ocorrências de «título» em 100 000 palavras. Além disso, através da observação dos contextos, inferimos que o perfil pragmático e sintáctico de «security» não é análogo ao de «título», que surge 4 Disponível em: <http://www.investopedia.com/terms/s/security.asp>. Acesso em: 26 jul. 2011. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 63 sobretudo em contextos descritivos da evolução das acções, associado a uma entidade, sendo abundante a construção «títulos + de + nome» (Figura 1). Fonte: Corpus EN. Figura 1. Lista de concordâncias de «securities». Perante a inadequação da primeira hipótese colocada, optámos por partir para a pesquisa do termo «equity» no corpus EN. Com a frequência relativa de 180 ocorrências em 100 000 palavras, este termo aproxima-se mais da frequência de «título» no corpus PT. O objectivo foi comparar o perfil de «equity» com o de «título», na qualidade de hiperónimo e sinónimo aproximado de «acção». Deste modo, se o termo «título» pode descer um patamar hierárquico de hiperónimo para sinónimo aproximado de «acção», pretendemos verificar se o contrário também acontece, ou seja, se «equity», um sinónimo de «stock» e «share», pode subir um patamar hierárquico, situando-se ao nível de hiperónimo destes termos. O termo «equity» co-ocorre com adjectivos que especificam zonas geográficas que podem referir-se a uma determinada bolsa («London equities») ou à generalidade dos títulos no mundo («global equities»), não sendo utilizado para veicular dados relativos ao desempenho das acções de uma empresa específica. Tem, portanto, um carácter mais abrangente, podendo servir para introduzir uma notícia. No corpus PT, «título» pode desempenhar um papel análogo: «London equities bounced back on Wednesday, with miners and banks in demand […].» Fonte: Corpus EN «O título mais movimentado esta segunda feira foi o do BCP, com 11,8 milhões de acções transaccionadas, um terço da média habitual, seguido da EDP e Sonae, com 4,5 e 2,3 milhões de papéis negociados, respectivamente.» Fonte: Corpus PT Pela análise dos verbos, apurámos que o termo «equity» apresenta um comportamento sintáctico semelhante ao de «título», sendo que alguns verbos que 5 Disponível em: <http://www.iapmei.pt/acessivel/iapmei-gls-02.php?glsid=4&letra=V>. Acesso em: 26 jul. 2011. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 64 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista selecciona, na posição de sujeito, denotam uma valorização («to advance»; «to rebound; «to rise») ou desvalorização («to drop»; «to fall»; «to lose ground») das acções. De forma semelhante, observámos que uma parte das unidades fraseológicas recolhidas remete para o tipo de verbos observados, ou seja, para verbos que descrevem tendências de ganhos e de perdas, por exemplo, «equity rally», «rebound in equities», «surge in equities», «drop in equities», «slide in equities». Além disso, algumas das unidades fraseológicas localizadas no corpus EN podem ser consideradas equivalentes das extraídas do corpus PT («escalada do título» / «surge in equities» e «rally in equities»; «volatilidade do título» / «equity volatility»). Em síntese, examinámos os adjectivos e os verbos que co-ocorrem com o termo «título», na posição de sujeito e de COD, e recolhemos unidades fraseológicas. Apesar de ser um hiperónimo de «acção», «título» pode, no contexto do segmento accionista, ser usado como sinónimo desse termo. No corpus EN, a baixa frequência do termo «security» e os contextos em que surge alertaram para a sua inadequação como equivalente de «título». Deste modo, não nos limitámos à equivalência ao nível das «palavras isoladas» (TOGNINI-BONELLI, MANCA, 2004, p. 295), prestando a devida atenção aos seus contextos. Presumimos que um equivalente de «título» teria de ter um perfil semelhante em texto, seleccionando, por exemplo, verbos que denotassem uma valorização ou desvalorização das acções. Numa abordagem bottom up, explorámos o comportamento de «equity», com vista a entender-se poderíamos considerá lo como estando ao mesmo nível hierárquico superior de «título». De facto, constatámos, mediante a análise dos micro e macro-contextos, que «equity» pode subir um patamar hierárquico através, por exemplo, da atribuição de uma posição cimeira num artigo ou de um adjectivo que remeta para um conjunto, e não para aspectos específicos. Finalmente, cumpre referir que as frequências de «título» e de «equity» são demasiado díspares para serem ignoradas. Trata-se de um caso em que os profissionais dos jornais de expressão inglesa são mais precisos, evitando termos mais abrangentes quando podem utilizar termos exactos, sacrificando porventura a variedade lexical do texto. Por sua vez, os jornalistas dos jornais de expressão portuguesa evitam as repetições, à custa da exactidão terminológica, tratando de igual forma conceitos distintos. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 65 448 ocorrências em 3.3. Índice e index O termo «índice» apresenta uma frequência relativa de 100 000 palavras, apresentando um comportamento semelhante ao de «acção» e «título»: a nível sintáctico, pode ocorrer na posição de sujeito ou na posição de COD; no que diz respeito aos verbos que gravitam à sua volta, são, sobretudo, verbos que dão conta de tendências de subida («apreciar»; «expandir-se»; «valorizar») e descida («afundar»; «estar em queda»; «negociar no vermelho»). Também as unidades fraseológicas identificadas remetem para a valorização («subida do índice»; «valorização do índice») ou desvalorização («descida do índice»; «queda do índice») dos índices e para processos que podem ocorrer no seu seio, nomeadamente a saída («saída do índice») e entrada («entrada no índice») de acções de novas empresas. O corpus EN inclui 480 ocorrências em 100 000 palavras do lema «index», equiparável às 448 ocorrências de «índice» no corpus PT. Do ponto de vista sintáctico, o perfil de «index» corresponde ao de «índice», assumindo um papel preponderante como sujeito e co-ocorrendo com verbos que transmitem os movimentos de subida (por exemplo, «to jump»; «to rally»; «to soar») e descida («to decline»; «to plunge»; «to slip back») registados pelas acções que integram os índices. Na posição de COD, observámos a co-ocorrência com verbos do campo semântico dos identificados nas ocorrências de «index» em posição de sujeito, ou seja, verbos que dão conta de uma tendência ascendente («to help up»; «to push higher»; «to send to a high») e descendente («to drag down»; «to send down»; «to weigh down»). 3.4. Bolsa, stock market, exchange e bourse No corpus PT, o termo «bolsa» apresenta uma frequência relativa de 419 ocorrências em 100 000 palavras. Identificaram-se dois grandes tipos de verbos que descrevem as tendências ascendentes («negociar em alta»; «somar ganhos»; «valorizar») e descendentes («encerrar em queda»; «negociar em terreno negativo»; «perder terreno») no desempenho das bolsas. Recolhemos igualmente os verbos que descrevem uma acção praticada sobre «bolsa» e categorizámo los como exercendo uma influência positiva («animar»; «impulsionar»; «dar força a») ou negativa («deprimir»; «penalizar»; «tirar força a»). Por fim, identificámos unidades fraseológicas compostas pelo núcleo terminológico («bolsa») e, predominantemente, por um núcleo eventivo de base verbal (abertura / abrir; fecho / fechar; entrada / entrar). Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 66 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista Iniciámos o processo de estabelecimento de equivalências definindo «stock market» como equivalente prima facie em inglês de «bolsa». A sua frequência relativa é de 29 ocorrências em 100 000 palavras, um número pouco relevante em comparação com as 419 ocorrências em 100 000 palavras no corpus PT, pelo que optámos por pesquisar outros possíveis sinónimos: «bourse» e «exchange». No caso de «bourse», registámos uma frequência relativa de 18 em 100 000 palavras e, no caso de «exchange», 52 ocorrências em 100 000 palavras. Também estas frequências não são equiparáveis à relevância concedida ao termo «bolsa» no corpus PT. A análise mais atenta do corpus EN revelou dois aspectos: em primeiro lugar, no corpus EN, à semelhança do que se verifica no corpus PT, é possível fazer referência a uma determinada bolsa de valores através do nome da cidade em que se situa, como demonstram os exemplos que se seguem: «Em Londres, o FTSE aproxima-se do maior ganho […].». Fonte: Corpus PT «Cadbury’s shares fell 4p in London on Tuesday to 777p […].» Fonte: Corpus EN Além disso, as referências são mais concretas no corpus EN: no corpus PT, fazem-se referências no corpo do artigo ao conceito mais abrangente de «bolsa» como instituição e espaço e não ao respectivo índice, o instrumento concreto de medida; pelo contrário, no corpus EN, menciona-se a bolsa, ou a respectiva cidade, no título do artigo, especificando-se o índice no corpo do artigo. Passamos a concretizar: [Título] «Acções da Cimpor sobem mais de 1% após tombo de ontem [Corpo do artigo] «As acções da Cimpor estão em alta na bolsa de Lisboa […].» Fonte: Corpus PT [Título] «London’s mid cap stocks fall after PBR» [Corpo do artigo] «The FTSE 100 fell back on Wednesday […].» Fonte: Corpus EN Mediante esta análise, esclarecemos a reduzida importância do conceito de «bolsa» como instituição e espaço físico no corpus EN em comparação com o corpus PT. Porém, através da observação dos contextos, verificámos que «stock market», «exchange» e «bourse» apresentam, do ponto de vista fraseológico e sintáctico, comportamentos semelhantes entre si e equiparáveis ao perfil de «bolsa» no corpus PT. Assim, na posição de sujeito, os termos «exchange» e «stock market» inserem-se em estruturas sintácticas semelhantes às observadas no caso de «share», co-ocorrendo com verbos que descrevem Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 67 tendências ascendentes (to jump; to pick up; to rise) e descendentes (to be down; to fall; to retreat). Em síntese, analisámos o termo que designa a instituição e o espaço físico/virtual em que são transaccionados bens entre os intervenientes. Verificámos que, no corpus PT, é possível tomar-se o todo pela parte, fazendo-se referência à bolsa que emite um determinado índice e não ao índice em si, porventura para evitar repetições. À semelhança dos termos «título» e «security», deparámo-nos com a falta de comparabilidade das frequências relativas de «bolsa» e «stock market». Para encontrar um equivalente de «bolsa» no corpus EN, expandimos as possibilidades de equivalência a outros termos, «exchange» e «bourse», e, graças aos contextos, verificámos que estes termos seleccionam verbos equiparáveis aos seleccionados pelo termo «bolsa» no corpus PT, descrevendo processos semelhantes. 3.5. Empresa e company O termo «empresa» apresenta a frequência relativa de 404 ocorrências em 100 000 palavras. Destaca-se também o recurso directo ao nome da empresa, precedida do determinante artigo definido, número singular, forma feminina (por exemplo, «Às 9h55, a Teixeira Duarte subia 1,96% […].)», bem como a sinónimos ou sinónimos aproximados, nomeadamente, «companhia» (83 ocorrências) e «sociedade» (43 ocorrências), com um comportamento semelhante do ponto de vista fraseológico e sintáctico ao do termo «empresa». Finalmente, com vista a evitar a repetição, nos artigos em português europeu, é possível omitir-se o termo «empresa» e recorrer-se ao adjectivo que especifica o respectivo sector de actividade. Por exemplo, uma empresa com actividade no sector dos seguros pode ser denominada apenas «a seguradora». O termo «empresa» co-ocorre com verbos e estruturas sintácticas já observadas com os termos «acção» e «título», por exemplo: «A Semapa valoriza 1,51% para 7,52 euros […].» «A Portucel aprecia 0,79% para 1,905 euros e a Altri avança 0,37% para 3,785 euros.» Fonte: Corpus PT Nestes casos, trata-se o tema do desempenho das acções da respectiva empresa no mercado, sem se mencionar o termo «acção», «título» nem «papel». De facto, apurámos que é possível referenciar-se a empresa em vez de se mencionar as suas acções, tomandose o todo pela parte, ou seja, o conceito de empresa pode desempenhar a função Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 68 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista semântica de «acção» ou «título», comportando-se como seu sinónimo. Além disso, a análise dos verbos co-ocorrentes permitiu inferir das actividades e resultados de uma empresa que influenciam a percepção do seu valor por parte dos investidores. Optámos pela sua categorização em dois grupos abrangentes, «actividades» e «resultados», sendo que o primeiro engloba os actos comuns da empresa como sociedade comercial (cortar/suprimir empregos; distribuir/pagar dividendos) e o segundo abarca os actos relacionados com o registo de lucros/prejuízos e a apresentação de resultados (divulgar/apresentar resultados; registar prejuízos). Em seguida, explorámos o equivalente directo em inglês de «empresa» no corpus EN, o termo «company». Embora «company» seja um termo produtivo no corpus EN, com uma frequência relativa de 481 ocorrências em 100 000 palavras , localizámos ainda uma panóplia de sinónimos aproximados: «maker», «producer», «firm», «operator», «business» e «corporation». Tal como observado durante a análise das ocorrências de «empresa» no corpus PT, também no corpus EN detectámos referências a uma determinada empresa quando o contexto remete para as respectivas acções. Observem-se os seguintes exemplos: «Suez Environnement advanced 4.8 per cent to 16.25 […].» «In the Netherlands, mail company TNT gained 1 per cent to 20.9.» Fonte: Corpus EN Da mesma forma, a partir da observação dos micro-contextos de «company», verificámos que, no corpus EN, este termo remete para o quotidiano de uma empresa e para os seus actos como tal, e não somente para o valor e evolução das respectivas acções em bolsa. Estabelecemos, deste modo, para o inglês, um paralelo com as «actividades» (to cut jobs; to pay dividends) e os «resultados» (to report results; to report losses) encontrados no corpus PT. Resumindo, nesta secção, apresentámos os resultados das pesquisas efectuadas para o termo «empresa», no corpus PT, e «company», no corpus EN. A frequência real deste interveniente no segmento accionista é de difícil contabilização, dada a possibilidade de contornar o termo «empresa»/«company» e sinónimos aproximados através da utilização da designação específica da sociedade em questão. Observámos que o termo apresenta perfis idênticos no corpus PT e no corpus EN: tanto pode tomar a posição que o termo «acção» ocupa, descrevendo oscilações de cotação em bolsa, como servir para veicular informações sobre as actividades e os resultados de uma empresa. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 4. 69 CONCLUSÕES No presente estudo, apresentámos o processo subjacente à criação da BD terminológica bilingue do jornalismo especializado na área do segmento accionista recorrendo à Terminologia como uma disciplina auxiliar à actividade tradutória e à metodologia empírica da Linguística de Corpus. Definimos por objectivos a identificação de termos e informações fraseológicas, a criação de sistemas conceptuais e a elaboração de definições no sentido de organizar os dados recolhidos numa BD terminológica bilingue, em inglês e português europeu. Apresentámos também a metodologia subjacente à construção do corpus bilingue desde a delimitação do domínio e dos subdomínios à sua construção. Seguidamente, procedemos à pré selecção de dados no corpus PT e no corpus EN e, dada a impossibilidade de expor a recolha, a validação e o processamento de dados relativo a todos os termos da BD, seleccionámos os cinco termos mais frequentes no corpus PT e discutimos o respectivo processo terminológico bilingue. Confirmámos, empiricamente, com base no corpus PT e no corpus EN, que a linguagem especializada em estudo se caracteriza pela consistência a nível terminológico e sintáctico. Assim, concluímos que a abordagem sistemática desta linguagem especializada permitirá, a um público não especializado, apropriar-se da sua terminologia, fraseologias e construções sintácticas mais relevantes, contribuindo para a redacção de textos naturais nesta. O processo de trabalho subjacente à descrição terminológica e fraseológica da linguagem especializada do jornalismo do segmento accionista foi moroso, em parte devido à construção de raiz do corpus bilingue. Decerto, para o tradutor, muitas vezes confrontado com prazos limitados, o recurso a uma metodologia semelhante à apresentada não será viável. No entanto, parece aconselhável considerar este tipo de abordagem se, pelo contrário, o objectivo for a especialização numa determinada área, até porque, no mercado actual português, não há oferta de formação especializada aprofundada em todos os domínios do saber, nem em domínios muito específicos. Além disso, a formação existente tende a basear-se na noção clássica de termo como nome e a ignorar aspectos fraseológicos (por exemplo, os verbos de especialidade). Deste modo, esperamos ter contribuído para a evolução dos Estudos de Tradução através da divulgação de uma metodologia de trabalho útil ao processo prático da tradução. Um aspecto essencial da formação actual do tradutor é a terminologia e os métodos de trabalho terminológico, assim como o domínio de ferramentas informáticas que podem ser colocadas ao serviço da tradução. De facto, na nossa opinião, o alargamento da panóplia de abordagens metodológicas é imperativo no quadro da Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 70 Da informação ao conhecimento: estudo terminológico baseado em corpora na área do segmento accionista afirmação dos Estudos de Tradução como disciplina independente da Linguística, dos Estudos Culturais ou Literários. O recurso a corpora permitiu a recolha de informação de carácter terminológico, fraseológico e conceptual. De facto, o texto foi a âncora da investigação, contribuindo para a autenticidade deste estudo descritivo. Além disso, explorámos e aplicámos a metodologia da Terminologia à elaboração de uma bases de dados bilingue, tendo concluído que esta disciplina é importante para a descrição da comunicação especializada, em geral, e para a tradução especializada, em concreto. Os recursos terminológicos promovem, por um lado, a língua como forma de transmissão de conhecimento especializado e, por outro lado, as próprias áreas técnico científicas, na medida em que a sistematização e a divulgação dos seus léxicos contribuem para a reflexão sobre o conhecimento e, por conseguinte, para a maturação do mesmo. Cumpre realçar, igualmente, que o presente projecto apresenta certas limitações pelo facto de não ter sido realizado em equipa. De facto, em geral, os projectos terminológicos são multidisciplinares, envolvendo terminólogos, especialistas da área e profissionais da informática, sobretudo para a gestão de sistemas informáticos complexos. Pensamos que será proveitoso colaborar com um terminológo de língua inglesa e com especialistas responsáveis pela validação terminológica nas duas línguas. De facto, uma das sugestões para investigação futura prende-se com a expansão do CSA, ao nível linguístico e da tipologia textual, através da sua alimentação com textos de outras línguas, contemplando, nomeadamente, a variante do português do Brasil e com textos de outros níveis de especialização e resultantes de outras situações de comunicação. Além disso, propomos o estudo mais aprofundado dos verbos especializados do segmento accionista à semelhança do trabalho de Almeida (ALMEIDA, 2008) para a terminologia jurídico parlamentar, bem como a exploração dos estrangeirismos. Durante a construção e a análise do CSA, apercebemo-nos do recurso a uma linguagem metafórica e da presença de recursos estilísticos criativos, sobretudo no título da notícia, mas também ao longo do corpo do artigo. Por exemplo, no corpus EN, numa notícia relativa à oferta pública de aquisição lançada sobre a Cimpor, recorre-se ao verbo «to cement» para referir o aumento de ganhos em bolsa: «Cimpor bid helps bourses cement gains». Outro exemplo semelhante do corpus EN é «European telecoms ring the changes»; no corpus PT, observámos fenómenos comparáveis: «[EDP] Renováveis tira energia à bolsa»; «Banca tira crédito à bolsa». Deste modo, num âmbito distinto do da Terminologia, consideramos interessante a exploração das figuras de estilo no CSA. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71 Inês Rodrigues Pedro 71 REFERÊNCIAS ACKOFF, Russell Lincoln. From Data to Wisdom. Journal of Applied Systems Analysis, v. 16, p. 3-9. 1989. ALMEIDA, Zara Soares de. Terminologia Jurídico Parlamentar – Combinatórias Terminológicas e Equivalência na Base de Dados Terminológica e Textual da Assembleia da República. 2008. 111p. Tese (Mestrado em Ciências da Linguagem - área de Especialização Lexicologia e Lexicografia) Faculdade de Ciências Sociais e Humanas, Universidade Nova de Lisboa, Lisboa. Disponível em: <http://www.clunl.edu.pt>. Acesso em: 26 jul. 2011. ANTHONY, Lawrence. AntConc: A Learner and Classroom Friendly, Multi Platform Corpus Analysis Toolkit. Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning, 2005, p. 7-13. Disponível em: <http://www.antlab.sci.waseda.ac.jp/research/iwlel_2004_anthony_antconc.pdf>. Acesso em: 27 jul. 2011. DICIONÁRIO Eletrônico Houaiss da Língua Portuguesa. Curitiba: Editora Objetiva. Instituto de Apoio às Pequenas e Médias Empresas e à Inovação (IAPMEI). 2001. Disponível em: <http://www.iapmei.pt>. Acesso em: 26 jul. 2011. INSTITUTO CAMÕES (glossário terminológico multilingue). Disponível em: <http://www.instituto-camoes.pt/glossario/>. Acesso em: 26 jul. 2011. INVESTOPEDIA. Disponível em: <http://www.investopedia.com/terms/s/security.asp>. Acesso em: 26 Julho 2011). RANCHHOD, Elisabete Marques; CARVALHO Paula. Expressões Multipalavra - Questões lexicais e sintácticas. Material de ensino na Primeira Escola de Verão da Linguateca (Universidade do Porto, Porto, Portugal, 10-14 julho de 2006). TAGNIN, Stella E. O. A Identificação de equivalentes tradutórios em corpora comparáveis. Anais do I Congresso Internacional da ABRAPUI. Belo Horizonte, 3 a 6 de junho de 2007. Disponível em: <http://www.fflch.usp.br/dlm/comet/>. Acesso em: 26 jul. 2011. TOGNINI BONELLI, Elena; MANCA, Elena. Welcoming children, pets and guests: towards functional equivalence in the languages of ‘agriturismo’ and ‘farmhouse holidays’. TradTerm 10, v.10, p. 295-312, 2004. Inês Rodrigues Pedro Doutora em Línguas e Literaturas Modernas Estudos Ingleses e Alemães, com especialização em Tradução, pela Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa e pósgraduada em Ciência Política e Relações Internacionais - Estudos Europeus - pela mesma instituição. É mestre em Tradução Jurídica e Empresarial pelo Instituto Superior de Línguas e Administração Campus Lisboa. É tradutora desde 2006. A sua formação inclui estágios no âmbito do Programa Leonardo Da Vinci e no Banco Central Europeu. Tradução & Comunicação: Revista Brasileira de Tradutores • Nº. 22, Ano 2011 • p. 55-71