Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria Faculdade de Letras da Universidade de Lisboa Área de Ciências da Linguagem [email protected] Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Agradecimento “O processo de validação do conhecimento como legitimação (…) diz respeito à relação entre o sujeito e o objecto, mas também à relação entre os sujeitos e, sobretudo, às relações entre os sujeitos a propósito do objecto” Bourdieu, 2001:102 Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Os critérios para a classificação de uma ciência mudam, ao longo do tempo, em função de Métodos Tecnologias de investigação Teorias Aplicações Interacção com outras ciências Política científica Divulgação (media) … Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL A dimensão transdisciplinar da linguagem verbal requer o reconhecimento da existência de uma capacidade biológica para adquirir e desenvolver linguagem que permite que os humanos, sem instrução explícita e num curto espaço de tempo, adquiram como primeira língua aquela a que estão natural e normalmente expostos, na comunidade a que pertencem. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Hauser, Chomsky e Fitch, 2002 Formação de equipas de investigação multidisciplinares e planificação da investigação pelo reconhecimento de objectos de estudo transdisciplinares. Abertura das agências financiadoras a projectos pluridisciplinares, com a constituição de grupos multidisciplinares de avaliação. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Exemplo de um objecto tranversal: O plurilinguismo Capacidade biológica O cérebro plurilingue – computação, gramática e processamento Desenvolvimento de L1 e aprendizagem de línguas não maternas Processamento da informação oral em L1 e Ln1, i.e., compreensão e interacção verbal em diversas línguas Vários sistemas de escrita ou diversos princípios reguladores das ortografias de cada língua Produção oral em L1 e Ln1 e pragmática adequada Aspectos sociolinguísticos e culturais da comunicação em L1 e Ln1 Mudança na concepção do que é ‘aprender línguas’ Consideração das funções específicas do conhecimento implícito e do conhecimento explícito na organização da memória Mudança na forma de conceber e avaliar o que é , de facto, ‘conhecimento linguístico’ Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Da Filologia à Linguística A escrita, tida como fonte para o estudo da variação e mudança ao longo da história da línguas, e a ausência de instrumentos de registo áudio restringiram o acesso ao conhecimento e descrição de milhares de línguas sem escrita. Um instrumento precioso na passagem para o século 20 - O Alfabeto Fonético Internacional A representação padronizada dos sons presentes nas produções orais das diversas línguas permite registar línguas sem escrita e regula a respectiva reprodução oral, em situação de leitura de línguas com diversos sistemas de escrita ou com ortografias mais ou menos transparentes dentro do mesmo sistema de escrita Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Da Linguística às Ciências da Linguagem O acesso ao registo de línguas até então não estudadas obriga, numa primeira fase, ao desenvolvimento de novos métodos de análise (ex: método estruturalista) e, posteriormente, à procura de universais linguísticos num universo de milhares de línguas. Perante a observação da diversidade das línguas e da variação no interior das mesmas, desenvolvem-se modelos explicativos. O conceito de faculdade de linguagem, formulado por Chomsky logo nos seus trabalhos dos anos 50, apresenta-se como um modelo teórico (GU) dos princípios universais e parâmetros de internalização da gramática da língua a que o falante está exposto. Ao longo de 60 anos, o modelo e o conceito de faculdade de linguagem é reformulado na perspectiva da evolução biológica em geral e da espécie em particular. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Nos anos 50 As relações preferenciais da Linguística situavam-se principalmente na área das Ciências Sociais e Humanidades Literatura História Geografia Sociologia Antropologia Psicologia Tornam-se visíveis, a par da Filologia Linguística Histórica Geografia Linguística e Dialectologia Sociologia da Linguagem Antropologia Linguística Psicologia da Linguagem Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Dos anos 60 ao final do século XX Isabel Hub Faria FLUL [1] A evolução regista-se primeiro em função da investigação de natureza teórica (Chomsky), na perspectiva da formalização das línguas naturais, por um lado, e nas vertentes cognitivista e experimental da ‘realidade psicológica dos modelos’ (G. Miller). As relações com a Psicologia revelam uma aproximação à Ciência Cognitiva pelo reconhecimento da Psicolinguística. A Linguística Teórica, no contacto com a Sociologia, define-se como Sociolinguística, por oposição à Sociologia da Linguagem. A aproximação à Filosofia da Linguagem, à Filosofia Analítica, à Lógica, à Matemática, à Inteligência Artificial e à Cibernética tem reflexos no desenvolvimentos da Pragmática (Austin), da Semântica Formal (Montague) e da Linguística Computacional. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL a dificuldade em encontrar suporte empiricamente satisfatório através da experimentação para alguns dos modelos teóricos apresentados leva ao Dos anos 60 ao final do século XX [2] A dificuldade em encontrar suporte empiricamente satisfatório para os modelos teóricos através da experimentação leva ao reforço da ligação com a Psicologia Cognitiva, daí resultando, primeiro, a Semântica Cognitiva ‘fuzzy’ , depois a Linguística Cognitiva (Lakoff, Fillmore). Da crítica à reformulação dos modelos teóricos generativistas, surgem a Teoria dos Actos de Fala (Searle), a Linguística Sistémica e Funcional (Halliday), a Lexical Functional Grammar (Kaplan & Bresnan), a Generalized Phrase Structure Grammar (Gazdar & col.), etc. As relações entre linguagem e cognição passam também pela Neurologia, com atenção específica às perturbações da linguagem adquiridas, nomeadamente as afasias, no âmbito da Neurolinguística (Luria). Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Dos anos 60 ao final do século XX Isabel Hub Faria FLUL [3] Uma nova fase com foco na experimentação é, a partir dos anos 80, suportada pelo desenvolvimento das tecnologias de imagiologia cerebral, de potenciais evocados, de registo dos movimentos dos olhos, tecnologias que, desta vez, revelam resultados surpreendentes, ao tornarem progressivamente disponível, mais directo e visível o acesso a indicadores do que está a ter lugar no cérebro durante o desempenho de tarefas de processamento auditivo, visual ou multimodal da informação verbal, oral ou escrita. Simultaneamente assiste-se, no âmbito da Neurociência ou nela apoiado, a um forte investimento no desenvolvimento de modelos computacionais de processamento automático, de reconhecimento e síntese de fala. No século XXI a Linguística insere-se numa área mais ampla de partilha do objecto de estudo, a área de Ciências da Linguagem. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL A Área de Ciências da Linguagem Faculdade de Letras da Universidade de Lisboa compreende Departamento de Linguística Geral e Românica DLGR Centro de Linguística da Universidade de Lisboa CLUL onde se inserem Laboratório de Psicolinguística Laboratório de Fonética Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL www.clul.ul.pt Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Estão a decorrer três projectos no âmbito do convénio CLUL/INESC POSTPORT Adaptação de Tecnologias de Fala a outras variantes do Português REAP. PT Sistema de apoio ao ensino da Língua Portuguesa L1 e L2 Adaptação para o Português do sistema REAP desenvolvido pela CMU PT-STAR Tradução Fala-Fala [Inglês-Português; Português Inglês] - projecto também integrado no âmbito da cooperação Portugal - CMU. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Tópicos de investigação 1. Estudo das principais diferenças e semelhanças entre variedades do Português, tanto a nível segmental como prosódico, identificação automática das variedades, elaboração de léxicos de pronúncia e de sistemas de conversão grafema-fone e adaptação dos módulos prosódia. 2. Reconhecimento de fala espontânea, com todos os problemas que lhe são inerentes. Tem-se vindo a insistir na detecção automática de disfluências e no tratamento de fenómenos de redução e sandhi. 3. Detecção automática de unidades de tipo frásico (típicas da fala espontânea) com especiais implicações no reconhecimento e na tradução, envolvendo, nesta última, a transposição de padrões rítmicos e melódicos da lingua de origem para a língua de destino. (4) Identificação e hierarquização das principais questões a abordar no ensino do Português como L1 e L2, tanto de um ponto de vista da compreensão como da produção (pretende-se vir a incluir exercícios que possam ser utilizados também como apoio à terapia de fala). Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL www.labpsicoling.com Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Eye-tracker ASL 504 Os resultados obtidos até ao momento permitem-nos identificar condições linguísticas de maior ou menor peso para o processamento e, consequentemente, para a compreensão da língua escrita. Com este projecto pretendemos identificar estruturas que, no Português Europeu, induzem uma leitura fluente, na base de uma computação regular e automática, por contraste com as que desencadeiam activação de recursos cognitivos adicionais identificar estratégias de superação da complexidade e/ou da ambiguidade em tarefas de leitura e avançar na criação de testes de diagnóstico especificamente elaborados para a avaliação da leitura do Português Europeu escrito Projecto PTDC/LIN/67854/2006 Compreensão na Leitura: Processamento de palavras, frases e textos www.labpsicoling.com/projectos/ Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Por exemplo na leitura de palavras interessa-nos observar se o número de fixações no interior da palavra e o tempo de leitura da palavra variam em função da extensão silábica da palavra da complexidade silábica da palavra do acento de palavra da presença, ausência e tipo de morfemas derivacionais da presença ou ausência de acentos gráficos Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL TAPA-PE Tendo por base um protótipo já existente (TAPAC-PE), este projecto consiste na elaboração de um instrumento de rastreio, análise e diagnóstico de problemas e/ou desvios relacionados com a produção articulatória dos sons do Português Europeu. Este instrumento vai permitir realizar todos os procedimentos habituais nos processos de avaliação de forma automatizada. Projecto PTDC/LIN/66928/2006 Teste de Avaliação da Produção Articulatória em Português Europeu www.labpsicoling.com/projectos/ Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Prevista a instalação do Baby Lab para 2010, parcerias internacionais Previsto o estabelecimento de parcerias nacionais e internacionais no âmbito da Fonética Forense www.fl.ul.pt/LaboratorioFonetica/frep Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL O FreP - Frequency in Portuguese permite identificar e contar, a partir de *texto escrito* todas as unidades e padrões fonológicos desde o nível da palavra até à unidade mais baixa que é o traço. conhecer, em qualquer texto escrito electrónico (em formato txt.), a frequência de unidades e padrões tais como palavras prosódicas, clíticos fonológicos, tipos silábicos, segmentos fonéticos, traços fonológicos, distribuição do acento de palavra, palavras ortográficas conhecer a frequência dessas unidades e padrões em função de vários aspectos, por exemplo, palavras prosódicas e clíticos em função do tamanho (em número de sílabas e em número de segmentos), clíticos em função da direccionalidade de cliticização fonológica, distribuição do acento em função do tamanho das palavras (em número de sílabas) Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Foram já realizados trabalhos em áreas como as da aquisição, da linguística histórica, da dialectologia, da sociolinguística ou da terapia de fala. Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Mestrado e Doutoramento em Ciência Cognitiva curso inter-faculdades, organizado conjuntamente pelas Faculdades de Ciências, Letras, Medicina e Psicologia e Ciências da Educação. Início em 2008-2009. www.mest_ciencia_cognitiva.di.fc.ul.pt/ Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Parceria FLUL-FMUL aberta a outras instituições nacionais e estrangeiras. A partir de 2009-2010 Isabel Hub Faria FLUL Linguística, Biologia, Neurociência Cognitiva, Psicologia, Saúde Engenharias, Inteligência Artificial Educação, Comunicação, Sociologia Antropologia, Direito Artes do Espectáculo, Teatro Cinema, Canto, Literatura, História Geografia, Arquitectura, Música www.doutoramentovlc.com Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho Linguística, processamento da informação verbal e tecnologias da língua falada e da língua escrita Isabel Hub Faria FLUL Obrigada pela atenção! Esperamos encontrar-nos no Ciência 2010! Ciência e tecnologias da língua falada e escrita Fundação Calouste Gulbenkian 29-30 de Julho