Linguística de Corpus e Tradução Maria José Bocorny Finatto Aline Evers O que é? Para o que serve? O que é? Como organizar um corpus? Para o que serve? O que é? Exercício de percepção Como organizar um corpus? Para o que serve? O que é? Exercício de percepção Como organizar um corpus? Para o que serve? O que é? Como beneficiar-se de um corpus na tradução? O que é Linguística de Corpus? O que é LINGUÍSTICA? O que é um CORPUS? Conjunto de dados linguísticos (orais ou escritos) sistematizados segundo determinados critérios, representativos do uso linguístico, dispostos de tal modo que possam ser processados por computador. (BERBER SARDINHA, 2004) Linguística de Corpus serve para quê? Lexicologia e Lexicografia Sintaxe Semântica Pragmática Terminologia e Terminografia TRADUÇÃO Análise do Discurso/Texto Sociolinguística Psicolinguística Linguística Histórica Estilística Ensino de Línguas Linguística de corpus serve para... •Explorar estatisticamente elementos lexicais •Observar combinatórias de palavras •Caracterizar gêneros textuais •Depreender a sistematicidade através da observação •Identificar perfis de práticas textuais •Localizar padrões de uso (leitura vertical) •Compreender sentidos (leitura horizontal) •Ver o que se usa – de verdade – em relação ao que dizem que se deveria usar... “computer tools don’t do the thinking” Linguística de/com Corpus? Utilizaram corpus Alexander Cruden 1737 • Concordância da Bíblia Samuel Johnson • Dictionary of the English Language 1755 James Murray 1879 Franz Boas 1911 • Oxford English Dictionary • Handbook of American Indian Languages • Corpora orais Otto Jespersen • Modern English Grammar on Historical Principles 1949 • Exemplos de uso da língua Linguística de/com Corpus? Utilizaram corpus Charles C. Fries 1940 • American English Grammar • Gramática baseada em corpus J. R. Firth 1890-1960 • Significado e contexto F. W. Käding 1897 • 100 milhões de palavras • 5 mil analistas G. K. Zipf 1902-1950 • Estatística lexical • Lei de Zipf Zelig Harris 1909-1992 • Estudo com papers de imunologia Linguística sem Corpus? NÃO utilizaram corpus Saussure Chomsky Lyons Austin Searle 1857-1913 1928-... 1932-... 1911-1960 1932... H. P. Grice Dan Sperber Deirde Wilson 1913-1988 2000-... 2000-... Enfim... há coisas MUITO BOAS também sem isso! O que é Linguística de Corpus? Focos da Linguística de Corpus “Tradicionalmente, a análise linguística tem enfatizado a estrutura – identificar unidades estruturais e classes [...]. Focalizamos uma determinada característica e investigamos as formas em que estruturas similares ocorrem em diferentes contextos e como servem para diferentes funções. Uma análise da estrutura vai descrever as similaridades gramaticais e as diferenças. Já a ênfase no uso da linguagem permite investigar como os falantes usam os recursos da linguagem, indo além da descrição gramatical”. (BIBER, 1998) Linguística de Corpus PRESSUPOSTOS FUNDAMENTAIS Visão sociolinguística da comunicação Língua é uso Empirismo/ Observação extensiva da linguagem Visão probabilística da linguagem – “diga com quem andas e te direi quem és” Configuração sistêmico-funcional do significado no(s) contexto(s) Tratamento estatístico e qualitativo de dados Representatividade do corpus? Extensão x Objetivos de Uso A representatividade está relacionada às perguntas que se pretende responder, aos objetivos e finalidades da pesquisa/trabalho a ser desenvolvida(o) TAMANHO não é documento! CORPORA disponíveis CORPUS IDIOMA TAMANHO SITE BP – Banco de Português PT 233 milhões www2.lael.pucsp.br/corpora Compara PT-IN X www.linguateca.pt/COMPARA Lácio-Web PT 4,2 milhões www.nilc.icmc.usp.br/lacioweb/ Longman Corpus Network IN-IN 145 milhões www.longman.com/dictionaries/corpus BNC – British National Corpus IN 100 milhões http://www.natcorp.ox.ac.uk/ BROWN MANNHEIMER Entre outros... Tipos de CORPUS/CORPORA? Modo Tempo Conteúdo Autoria Falado: porções de fala transcrita Sincrônico: período de tempo Especializado Aprendiz Escrito: textos escritos Diacrônico: períodos de tempo Regional ou Dialetal Falante nativo Histórico: de tempo passado Multilíngue Tradutor Disposição Interna Alinhado Finalidade De estudo De referência Como organizar um corpus? Tipos de CORPUS/CORPORA? Tipos de CORPUS/CORPORA? Vejamos alguns exemplos Corpora e ferramentas www.ufrgs.br/textecc www.ufrgs.br/termisul Ao traduzir, como beneficiar-se de um corpus? • Uso de alinhadores • Uso de concordanciadores • WEBCORP (http://www.webcorp.org.uk/) • Projeto COMET–CORTRAD–CORTEC (http://www.fflch.usp.br/dlm/comet/consulta_cortrad.html) •Respondendo perguntas •Uso comum + frequência •Treinamento/formação de tradutores UM EXERCÍCIO • Vamos tentar observar o que é mais recorrente e o que é mais raro no uso de uma dada palavra que está em um corpus ALGUNS EXEMPLOS EM TRADUÇÃO • [PORT] Toda alteração funcional provoca uma alteração em cadeia nos segmentos subjacentes,ou seja, em todo o complexo articular e muscular do corpo. • [ENG] Any functional relationship provokes a chain of alterations in the subjacent segments,i.e., through out the articular and muscular components of the body.[~] 786 páginas do Word alinhadas! CORPUS TRADUÇÕES DE PEDIATRIA CONVENCIONALIDADE DA TRADUÇÃO DE VERBOS CAUSAIS EM PEDIATRIA CYBELE M. OLIVEIRA ALLE–UFRGS Sábado–15h30 DÁ UM TRABALHÃO! • • • • • Reunir corpus no seu dia-a- dia Usar corpora já reunidos Aproveitar trabalhos baseados em corpora Acompanhar resultados de trabalhos acadêmicos POSSAMAI, Viviane. “Associações sintagmáticas como unidades de tradução especializadas e proposta de ferramenta de apoio ao tradutor” (PEDIATRIA, corpus segmentado por seções, ferramenta TM com dados recorrentes do corpus) PPG-Letras da UFRGS em breve “The language looks rather different when you look at a lot of it at once” (Sinclair, 1991, p. xviii) OBRIGADA! Para maiores informações, visite nosso site: www.ufrgs.br/textecc Ou envie um e-mail: [email protected] [email protected]