o latim clássico de cícero à luz da linguística de corpus

Propaganda
O LATIM CLÁSSICO DE
CÍCERO À LUZ DA
LINGUÍSTICA DE
CORPUS
Caio Begotti — UFPR 2012
AGRADECIMENTOS
Alessandro
Borges
Rodrigo
Márcio
AGENDA
Motivação
Implementação
Usos possíveis
Objetivos
MOTIVAÇÃO
PLN em
Inglês
Línguas
Clássicas
Linguística
(Aplicada)
MOTIVAÇÃO
Meu trabalho
Línguas
Clássicas
PLN em
Inglês
Linguística
(Aplicada)
MOTIVAÇÃO
• Cícero
• Linguística de corpus
• Dados dizem muito
• Apoio dos resultados do inglês
• Pesquisas similares (pra ensino)
• Linguística aplicada no mundo real é em inglês
IMPLEMENTAÇÃO
• Dados abertos
• Corpora
• Curadoria
• Trabalho constante
• Fonte de respostas
• Filtros e montagem
• Stopwords
• XML
• Programação
• Python
• NLTK
• Análise de Distribuição de Frequência
USOS POSSÍVEIS
• Mais programação, mais análises
• Estudo estilístico ou gramatical do latim
• Ensino de latim a partir dos corpora
• Concordâncias
• Vocabulários reais
• Reading Latin
OBJETIVOS
• Criar corpora usáveis em computação: 75 de Cícero, mais de 1 milhão de termos
• Criar análises com programação de computadores: 1.000 linhas
• Criar catálogo lexical pra estudo/ensino: ≈ 550 termos
• Criar catálogo de stopwords para o latim: ≈ 600 termos
OBRIGADO!
Download