Oficina de Linguística de Corpus e Tradução.

Propaganda
Linguística de Corpus e
Tradução
Maria José Bocorny Finatto
Aline Evers
O que é?
Para o que
serve?
O que é?
Como organizar
um corpus?
Para o que
serve?
O que é?
Exercício de
percepção
Como organizar
um corpus?
Para o que
serve?
O que é?
Exercício de
percepção
Como organizar
um corpus?
Para o que
serve?
O que é?
Como beneficiar-se
de um corpus na
tradução?
O que é Linguística de
Corpus?
O que é LINGUÍSTICA?
O que é um CORPUS?
Conjunto de dados linguísticos (orais ou escritos)
sistematizados
segundo
determinados
critérios,
representativos do uso linguístico, dispostos de tal modo
que possam ser processados por computador.
(BERBER SARDINHA, 2004)
Linguística de Corpus serve para
quê?
Lexicologia e
Lexicografia
Sintaxe
Semântica
Pragmática
Terminologia e
Terminografia
TRADUÇÃO
Análise do
Discurso/Texto
Sociolinguística
Psicolinguística
Linguística Histórica
Estilística
Ensino de Línguas
Linguística de corpus serve para...
•Explorar estatisticamente elementos lexicais
•Observar combinatórias de palavras
•Caracterizar gêneros textuais
•Depreender a sistematicidade através da observação
•Identificar perfis de práticas textuais
•Localizar padrões de uso (leitura vertical)
•Compreender sentidos (leitura horizontal)
•Ver o que se usa – de verdade – em relação ao que dizem que se
deveria usar...
“computer tools don’t do the
thinking”
Linguística de/com Corpus?
Utilizaram corpus
Alexander
Cruden 1737
• Concordância da Bíblia
Samuel Johnson • Dictionary of the English Language
1755
James Murray
1879
Franz Boas
1911
• Oxford English Dictionary
• Handbook of American Indian Languages
• Corpora orais
Otto Jespersen • Modern English Grammar on Historical Principles
1949
• Exemplos de uso da língua
Linguística de/com Corpus?
Utilizaram corpus
Charles C. Fries
1940
• American English Grammar
• Gramática baseada em corpus
J. R. Firth
1890-1960
• Significado e contexto
F. W. Käding
1897
• 100 milhões de palavras
• 5 mil analistas
G. K. Zipf
1902-1950
• Estatística lexical
• Lei de Zipf
Zelig Harris
1909-1992
• Estudo com papers de imunologia
Linguística sem Corpus?
NÃO utilizaram corpus
Saussure
Chomsky
Lyons
Austin
Searle
1857-1913
1928-...
1932-...
1911-1960
1932...
H. P.
Grice
Dan
Sperber
Deirde
Wilson
1913-1988
2000-...
2000-...
Enfim... há coisas MUITO BOAS
também sem isso!
O que é Linguística de Corpus?
Focos da Linguística de Corpus
“Tradicionalmente, a análise linguística tem enfatizado a
estrutura – identificar unidades estruturais e classes [...].
Focalizamos uma determinada característica e
investigamos as formas em que estruturas similares
ocorrem em diferentes contextos e como servem para
diferentes funções. Uma análise da estrutura vai
descrever as similaridades gramaticais e as diferenças. Já
a ênfase no uso da linguagem permite investigar como os
falantes usam os recursos da linguagem, indo além da
descrição gramatical”.
(BIBER, 1998)
Linguística de Corpus
PRESSUPOSTOS
FUNDAMENTAIS
Visão sociolinguística da comunicação
Língua é uso
Empirismo/ Observação extensiva da
linguagem
Visão probabilística da linguagem – “diga
com quem andas e te direi quem és”
Configuração sistêmico-funcional do
significado no(s) contexto(s)
Tratamento estatístico e qualitativo de
dados
Representatividade do corpus?
Extensão x Objetivos de Uso
A representatividade está relacionada às
perguntas que se pretende responder, aos
objetivos e finalidades da
pesquisa/trabalho a ser desenvolvida(o)
TAMANHO não é documento!
CORPORA disponíveis
CORPUS
IDIOMA
TAMANHO
SITE
BP – Banco de Português
PT
233
milhões
www2.lael.pucsp.br/corpora
Compara
PT-IN
X
www.linguateca.pt/COMPARA
Lácio-Web
PT
4,2
milhões
www.nilc.icmc.usp.br/lacioweb/
Longman Corpus Network
IN-IN
145
milhões
www.longman.com/dictionaries/corpus
BNC – British National
Corpus
IN
100
milhões
http://www.natcorp.ox.ac.uk/
BROWN
MANNHEIMER
Entre outros...
Tipos de CORPUS/CORPORA?
Modo
Tempo
Conteúdo
Autoria
Falado:
porções de
fala transcrita
Sincrônico:
período de
tempo
Especializado
Aprendiz
Escrito: textos
escritos
Diacrônico:
períodos de
tempo
Regional ou
Dialetal
Falante nativo
Histórico: de
tempo
passado
Multilíngue
Tradutor
Disposição
Interna
Alinhado
Finalidade
De estudo
De referência
Como organizar um corpus?
Tipos de CORPUS/CORPORA?
Tipos de CORPUS/CORPORA?
Vejamos alguns exemplos
Corpora e ferramentas
www.ufrgs.br/textecc
www.ufrgs.br/termisul
Ao traduzir, como beneficiar-se de
um corpus?
• Uso de alinhadores
• Uso de concordanciadores
• WEBCORP (http://www.webcorp.org.uk/)
• Projeto COMET–CORTRAD–CORTEC
(http://www.fflch.usp.br/dlm/comet/consulta_cortrad.html)
•Respondendo perguntas
•Uso comum + frequência
•Treinamento/formação de tradutores
UM EXERCÍCIO
• Vamos tentar observar o que é mais
recorrente e o que é mais raro no uso de uma
dada palavra que está em um corpus
ALGUNS EXEMPLOS EM
TRADUÇÃO
• [PORT] Toda alteração funcional provoca uma
alteração em cadeia nos segmentos subjacentes,ou
seja, em todo o complexo articular e muscular do
corpo.
• [ENG] Any functional relationship provokes a chain
of alterations in the subjacent segments,i.e.,
through out
the articular and muscular components of the
body.[~]
786 páginas do Word alinhadas!
CORPUS TRADUÇÕES DE PEDIATRIA
CONVENCIONALIDADE DA TRADUÇÃO
DE VERBOS CAUSAIS EM PEDIATRIA
CYBELE M. OLIVEIRA ALLE–UFRGS
Sábado–15h30
DÁ UM TRABALHÃO!
•
•
•
•
•
Reunir corpus no seu dia-a- dia
Usar corpora já reunidos
Aproveitar trabalhos baseados em corpora
Acompanhar resultados de trabalhos acadêmicos
POSSAMAI, Viviane. “Associações sintagmáticas
como unidades de tradução especializadas e
proposta de ferramenta de apoio ao tradutor”
(PEDIATRIA, corpus segmentado por seções,
ferramenta TM com dados recorrentes do corpus)
PPG-Letras da UFRGS em breve
“The language looks rather different when you
look at a lot of it at once”
(Sinclair, 1991, p. xviii)
OBRIGADA!
Para maiores informações, visite nosso site:
www.ufrgs.br/textecc
Ou envie um e-mail:
[email protected]
[email protected]
Download