Isabel Hub Faria (Fac. Letras, Univ. Lisboa)

Propaganda
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Linguística, processamento da informação verbal e tecnologias
da língua falada e da língua escrita
Isabel Hub Faria
Faculdade de Letras da Universidade de Lisboa
Área de Ciências da Linguagem
[email protected]
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Agradecimento
 “O processo de validação do conhecimento
como legitimação (…) diz respeito à
relação entre o sujeito e o objecto, mas
também à relação entre os sujeitos e,
sobretudo, às relações entre os sujeitos a
propósito do objecto”
Bourdieu, 2001:102
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Os critérios para a classificação de uma ciência mudam, ao longo do
tempo, em função de








Métodos
Tecnologias de investigação
Teorias
Aplicações
Interacção com outras ciências
Política científica
Divulgação (media)
…
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
 A dimensão transdisciplinar da linguagem verbal requer
o reconhecimento da existência
de uma capacidade biológica para adquirir e desenvolver linguagem
que permite que os humanos,
sem instrução explícita e num curto espaço de tempo,
adquiram como primeira língua aquela a que estão natural e
normalmente expostos,
na comunidade a que pertencem.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Hauser, Chomsky e Fitch, 2002
 Formação de equipas de investigação multidisciplinares e planificação
da investigação pelo reconhecimento de
objectos de estudo transdisciplinares.
 Abertura das agências financiadoras a projectos pluridisciplinares,
com a constituição de grupos multidisciplinares de avaliação.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Exemplo de um objecto tranversal: O plurilinguismo







Capacidade biológica
O cérebro plurilingue – computação, gramática e processamento
Desenvolvimento de L1 e aprendizagem de línguas não maternas
Processamento da informação oral em L1 e Ln1, i.e., compreensão
e interacção verbal em diversas línguas
Vários sistemas de escrita ou diversos princípios reguladores das
ortografias de cada língua
Produção oral em L1 e Ln1 e pragmática adequada
Aspectos sociolinguísticos e culturais da comunicação em L1 e Ln1
Mudança na concepção do que é ‘aprender línguas’
Consideração das funções específicas do conhecimento implícito
e do conhecimento explícito na organização da memória
Mudança na forma de conceber e avaliar o que é , de facto,
‘conhecimento linguístico’
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Da Filologia à Linguística
A escrita, tida como fonte para o estudo da variação e
mudança ao longo da história da línguas, e a ausência
de instrumentos de registo áudio restringiram o
acesso ao conhecimento e descrição de milhares de
línguas sem escrita.
Um instrumento precioso na passagem para o século
20 - O Alfabeto Fonético Internacional
A representação padronizada dos sons presentes nas produções orais das
diversas línguas permite registar línguas sem escrita e regula a respectiva
reprodução oral, em situação de leitura de línguas com diversos sistemas
de escrita ou com ortografias mais ou menos transparentes dentro do
mesmo sistema de escrita
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Da Linguística às Ciências da Linguagem
O acesso ao registo de línguas até então não estudadas obriga, numa
primeira fase, ao desenvolvimento de novos métodos de análise (ex: método
estruturalista) e, posteriormente, à procura de universais linguísticos num
universo de milhares de línguas.
Perante a observação da diversidade das línguas e da variação no interior das
mesmas, desenvolvem-se modelos explicativos.
O conceito de faculdade de linguagem, formulado por Chomsky logo nos
seus trabalhos dos anos 50, apresenta-se como um modelo teórico (GU) dos
princípios universais e parâmetros de internalização da gramática da língua a
que o falante está exposto.
Ao longo de 60 anos, o modelo e o conceito de faculdade de linguagem é
reformulado na perspectiva da evolução biológica em geral e da espécie em
particular.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Nos anos 50
As relações preferenciais da Linguística situavam-se principalmente na área
das Ciências Sociais e Humanidades
Literatura
História
Geografia
Sociologia
Antropologia
Psicologia
Tornam-se visíveis, a par da Filologia
Linguística Histórica
Geografia Linguística e Dialectologia
Sociologia da Linguagem
Antropologia Linguística
Psicologia da Linguagem
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Dos anos 60 ao final do século XX
Isabel Hub Faria FLUL
[1]
A evolução regista-se primeiro em função da investigação de natureza teórica
(Chomsky), na perspectiva da formalização das línguas naturais, por um lado, e
nas vertentes cognitivista e experimental da ‘realidade psicológica dos modelos’
(G. Miller).
As relações com a Psicologia revelam uma aproximação à Ciência Cognitiva pelo
reconhecimento da Psicolinguística.
A Linguística Teórica, no contacto com a Sociologia, define-se como
Sociolinguística, por oposição à Sociologia da Linguagem.
A aproximação à Filosofia da Linguagem, à Filosofia Analítica, à Lógica, à
Matemática, à Inteligência Artificial e à Cibernética tem reflexos no
desenvolvimentos da Pragmática (Austin), da Semântica Formal (Montague)
e da Linguística Computacional.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
a dificuldade em encontrar suporte empiricamente satisfatório através da experimentação para alguns dos modelos teóricos apresentados leva ao
Dos anos 60 ao final do século XX
[2]
A dificuldade em encontrar suporte empiricamente satisfatório para os
modelos teóricos através da experimentação leva ao reforço da ligação com
a Psicologia Cognitiva, daí resultando, primeiro, a Semântica Cognitiva
‘fuzzy’ , depois a Linguística Cognitiva (Lakoff, Fillmore).
Da crítica à reformulação dos modelos teóricos generativistas, surgem a
Teoria dos Actos de Fala (Searle), a Linguística Sistémica e Funcional
(Halliday), a Lexical Functional Grammar (Kaplan & Bresnan), a Generalized
Phrase Structure Grammar (Gazdar & col.), etc.
As relações entre linguagem e cognição passam também pela Neurologia,
com atenção específica às perturbações da linguagem adquiridas,
nomeadamente as afasias, no âmbito da Neurolinguística (Luria).
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Dos anos 60 ao final do século XX
Isabel Hub Faria FLUL
[3]
Uma nova fase com foco na experimentação é, a partir dos anos 80,
suportada pelo desenvolvimento das tecnologias de imagiologia cerebral,
de potenciais evocados, de registo dos movimentos dos olhos, tecnologias
que, desta vez, revelam resultados surpreendentes, ao tornarem
progressivamente disponível, mais directo e visível o acesso a indicadores
do que está a ter lugar no cérebro durante o desempenho de tarefas de
processamento auditivo, visual ou multimodal da informação verbal, oral
ou escrita.
Simultaneamente assiste-se, no âmbito da Neurociência ou nela apoiado, a
um forte investimento no desenvolvimento de modelos computacionais de
processamento automático, de reconhecimento e síntese de fala.
No século XXI a Linguística insere-se numa área mais ampla de partilha do
objecto de estudo, a área de Ciências da Linguagem.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
A Área de Ciências da Linguagem
Faculdade de Letras da Universidade de Lisboa
compreende
 Departamento de Linguística Geral e Românica
DLGR
 Centro de Linguística da Universidade de Lisboa
CLUL
onde se inserem
 Laboratório de Psicolinguística
 Laboratório de Fonética
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
www.clul.ul.pt
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Estão a decorrer três projectos no âmbito do convénio CLUL/INESC
POSTPORT
Adaptação de Tecnologias de Fala a outras variantes do Português
REAP. PT
Sistema de apoio ao ensino da Língua Portuguesa L1 e L2
Adaptação para o Português do sistema REAP desenvolvido pela CMU
PT-STAR
Tradução Fala-Fala [Inglês-Português; Português Inglês] - projecto
também integrado no âmbito da cooperação Portugal - CMU.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Tópicos de investigação
1. Estudo das principais diferenças e semelhanças entre variedades do
Português, tanto a nível segmental como prosódico, identificação
automática das variedades, elaboração de léxicos de pronúncia e de sistemas
de conversão grafema-fone e adaptação dos módulos prosódia.
2. Reconhecimento de fala espontânea, com todos os problemas que lhe são
inerentes. Tem-se vindo a insistir na detecção automática de disfluências e
no tratamento de fenómenos de redução e sandhi.
3. Detecção automática de unidades de tipo frásico (típicas da fala
espontânea) com especiais implicações no reconhecimento e na tradução,
envolvendo, nesta última, a transposição de padrões rítmicos e melódicos da
lingua de origem para a língua de destino.
(4) Identificação e hierarquização das principais questões a abordar no
ensino do Português como L1 e L2, tanto de um ponto de vista da
compreensão como da produção (pretende-se vir a incluir exercícios que
possam ser utilizados também como apoio à terapia de fala).
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
www.labpsicoling.com
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Eye-tracker ASL 504
Os resultados obtidos até ao momento
permitem-nos identificar condições
linguísticas de maior ou menor peso para
o processamento e, consequentemente,
para a compreensão da língua escrita.
Com este projecto pretendemos
 identificar estruturas que, no Português Europeu, induzem uma leitura
fluente, na base de uma computação regular e automática, por contraste
com as que desencadeiam activação de recursos cognitivos adicionais

identificar estratégias de superação da complexidade e/ou da
ambiguidade em tarefas de leitura e avançar na criação de testes de
diagnóstico especificamente elaborados para a avaliação da leitura do
Português Europeu escrito
Projecto PTDC/LIN/67854/2006
Compreensão na Leitura: Processamento de palavras, frases e textos
www.labpsicoling.com/projectos/
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Por exemplo
na leitura de palavras interessa-nos observar se o número de
fixações no interior da palavra e o tempo de leitura da palavra
variam em função





da extensão silábica da palavra
da complexidade silábica da palavra
do acento de palavra
da presença, ausência e tipo de morfemas derivacionais
da presença ou ausência de acentos gráficos
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
TAPA-PE
Tendo por base um protótipo já existente (TAPAC-PE),
este projecto consiste na elaboração de um
instrumento de rastreio, análise e diagnóstico de
problemas e/ou desvios relacionados com a
produção articulatória dos sons do Português
Europeu.
Este instrumento vai permitir realizar todos os
procedimentos habituais nos processos de avaliação
de forma automatizada.
Projecto PTDC/LIN/66928/2006
Teste de Avaliação da Produção Articulatória em Português Europeu
www.labpsicoling.com/projectos/
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Prevista a instalação
do Baby Lab para
2010, parcerias
internacionais
Previsto o
estabelecimento de
parcerias nacionais e
internacionais no âmbito
da Fonética Forense
www.fl.ul.pt/LaboratorioFonetica/frep
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
O FreP - Frequency in Portuguese permite
 identificar e contar, a partir de *texto escrito* todas as unidades
e padrões fonológicos desde o nível da palavra até à unidade
mais baixa que é o traço.
 conhecer, em qualquer texto escrito electrónico (em formato
txt.), a frequência de unidades e padrões tais como palavras
prosódicas, clíticos fonológicos, tipos silábicos, segmentos
fonéticos, traços fonológicos, distribuição do acento de palavra,
palavras ortográficas
 conhecer a frequência dessas unidades e padrões em função de
vários aspectos, por exemplo, palavras prosódicas e clíticos em
função do tamanho (em número de sílabas e em número de
segmentos), clíticos em função da direccionalidade de
cliticização fonológica, distribuição do acento em função do
tamanho das palavras (em número de sílabas)
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Foram já realizados trabalhos em áreas como as da aquisição, da linguística histórica,
da dialectologia, da sociolinguística ou da terapia de fala.
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Mestrado e Doutoramento em Ciência Cognitiva
curso inter-faculdades, organizado conjuntamente pelas
Faculdades de Ciências, Letras, Medicina e Psicologia e Ciências da
Educação.
Início em 2008-2009.
www.mest_ciencia_cognitiva.di.fc.ul.pt/
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Parceria FLUL-FMUL aberta a outras
instituições nacionais e estrangeiras.
A partir de 2009-2010
Isabel Hub Faria FLUL
Linguística, Biologia, Neurociência
Cognitiva, Psicologia, Saúde
Engenharias, Inteligência Artificial
Educação, Comunicação, Sociologia
Antropologia, Direito
Artes do Espectáculo, Teatro
Cinema, Canto, Literatura, História
Geografia, Arquitectura, Música
www.doutoramentovlc.com
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita
Isabel Hub Faria FLUL
Obrigada pela atenção!
Esperamos encontrar-nos no Ciência 2010!
Ciência e tecnologias da língua falada e escrita
Fundação Calouste Gulbenkian
29-30 de Julho
Download