Teorias e Métodos em Processamento de Frases Abralin Marcus Maia & Eva Fernández Fevereiro de 2005 Ementa Introdução à subárea da Psicolingüística conhecida como Processamento de Frases. A natureza da relação entre a sintaxe e a percepção; gramática e parser; o papel da sintaxe nos diferentes modelos de processamento de frases: a teoria da Complexidade Derivacional, os princípios de Kimball, a teoria do “garden-path”, o modelo de construal. A crise do princípio "Late Closure". O Processamento de Orações Relativas. A Hipótese da Prosódia Implícita. A representação da linguagem nos bilíngües. A arquitetura dos sistemas de percepção e produção. Métodos experimentais. As Ciências Cognitivas Ciências Cognitivas Psicolingüística Processamento lingüístico Processamento de frases As Ciências Cognitivas Diagnóstico de Gardner (Gardner, Howard (1984).The Mind’s New Science) 1. 2. 3. 4. Nível de análise de Representações Mentais A metáfora do computador eletrônico Processos mentais estritamente cognitivos A agenda de tópicos relevantes remonta à tradicão filosófica da Antiguidade 5. A interdisciplinariedade A interdisciplinaridade nas Ciências Cognitivas (Gardner, 1987) O Problema de Platão As questões fundamentais da Lingüística Moderna “Como podemos saber tanto se temos tão poucas evidências?” (Chomsky, 1986) - O que é o conhecimento lingüístico? - Como o conhecimento lingüístico é utilizado? - Como o conhecimento lingüístico é adquirido? (Chomsky, 1995) A Faculdade da Linguagem (…) there is a component of the human mind/brain, dedicated to language – the language faculty – interacting with other systems. (…) the language faculty has at least two components: a cognitive system that stores information, and performance systems that access that information and use it in various ways. (Chomsky, 1995, p.2) Chomsky (1995) x Chomsky (1998) “Performance systems are presumably at least in part language-specific, hence components of the language faculty. But they are generally assumed not to be specific to particular languages: they do not vary in the manner of the cognitive system, as linguistic environments vary”. (Chomsky, 1995, p. 2) Chomsky (1998) “Processing systems vary with languages and languages types, even for very young infants, enabling them to sort out distinct languages in the data to which they are exposed. (…)” (Chomsky, 1998, p. 3) Competência & Desempenho Competência e Desempenho / \ Gramática Parser Saber Fazer Gramaticalidade x Aceitabilidade * a processar atriz a produtor decidiu contratou que novo o a emissora demitiu que o ? A atriz que o novo diretor que o produtor contratou demitiu decidiu processar a emissora. Slips of the tongue a. Antecipações: bake my bike por take my byke b. Perseveração: painted the poor por painted the door/ tentou a torte por tentou a sorte c. Reversão: Katz e Fodor por Fatz e Kodor / bortou o colo por cortou o bolo d. Blending: grave erro por grerro Representação & Acesso Teoria x Prática A teoria ficaria incompleta sem a caracterização do nível de processamento O uso permite explicitar questões, problematizar e desenvolver e reformular a teoria Uma teoria do uso embasa qualquer aplicação da teoria do conhecimento lingüístico a problemas práticos, como eficiência de leitura, ensino de línguas, lingüística computacional, parsers, tradução automática, etc. Níveis diferenciados de representação Realidade epistemológica: Afirmação mais modesta, inclui o o quê da competência lingüística, mas não o como dos processos mentais. Realidade Psicológica: Afirmação mais forte, inclui o o quê da competência e o como dos processos mentais. Realidade neurológica: Afirmação ainda mais forte, pois deve incluir o o quê da competência, o como dos processos mentais, além do mapeamento cerebral desses processos. Realidade computacional: Afirmacão mais fraca, diz respeito exclusivamente aos processos inerentes às ferramentas de sistemas computacionais em Inteligência Artificial. Isonomia BIO: Tempo: Ling: Anatomia ø Fisiologia Organogênese ms meses/anos Gramática Processamento Aquisição Dillinger, M., 1992 ? séculos Evolução Milênios Mud. hist. Evolução Autonomia Diga as cores, rapidamente: Verde Azul Amarelo Preto Violeta Grená A Modularidade da Mente Processos Modulares Processos cognitivos gerais automático não-automático rápido/reflexo lento/reflexão específico geral obrigatório opcional impenetrável (encapsulado) acessível à reflexão consciente regulares/sistemáticos idiossincráticos Fodor, J.(1983). The Modularity of Mind) Processamento da Informação Um navio japonês entrava na baía um navio brasileiro. Mãe suspeita de assassinato do filho morre. Alguém atirou no pai da atriz que estava na varanda com seu marido. O policial viu o turista com a ferida. A memória… Há mais no processamento do que a gramática. Processamento = gramática + memória Relativamente pouca atenção tem sido prestada a uma das questões fundamentais da Lingüística Moderna, no dizer de Chomsky: Como o conhecimento lingüístico é utilizado? Note-se que muitas noções lingüísticas não são propriedades da língua como tal, mas do uso lingüístico. Assim é com a noção de produtividade que implica que os meios para gerar um número ilimitado de frases está presente, de alguma forma, na mente humana. A estrutura lingüística não determina o processamento lingüístico. Dada uma estrutura frasal particular, ainda há um sem número de maneiras através das quais se pode compreender ou produzir uma frase com aquela estrutura. Alguns desses modos podem ser preferíveis em relação a outros por razões puramente psicológicas: por sobrecarregarem menos a memória, por exemplo. O que se quer dizer é que o Processamento Lingüístico é uma tarefa conjunta entre princípios lingüísticos e mecanismos psicológicos. O processamento da informação Os sistemas de processamento de informação, um dos diagnósticos de Gardner para as Ciências Cognitivas, advêm do desenvolvimento da Ciência da Computação na década de 50. tendo tido papel importante na revolução cognitivista, anti-behaviorista dos 50. Da visão da mente como caixa-preta avançou-se para a visão da mente como processadora de informações que como o computador é capaz de decodificar, armazenar, manipular e recuperar informação. Assim, impulsionados pela metáfora do computador, os pesquisadores passaram a investigar a capacidade humana de processamento, levantando questões como: - Quanta informação podemos armazenar? - Qual a duração da armazenagem? - Qual a sua recuperabilidade? Dos esforços para responder tais questões resultaram numerosas descobertas a respeito das capacidades de processamento e de memória humanas. O sistema de processamento informacional Os atos de compreender e produzir a linguagem são desempenhados dentro dos parâmetros do nosso sistema de processamento da informação. Este sistema consiste de 3 componentes estruturais – memória sensorial memória de trabalho memória de longo prazo, além de um conjunto de processos de controle que governam o fluxo de informação dentro do sistema. O armazenamento sensorial Sperling, G. (1960). The information available in brief visual presentations. A M 1 J 7 Z 3 V L K C B Armazenagem sensorial Experimento 1 Materiais: Quadros de 12 letras e/ou números arranjados em quatro colunas e três fileiras apresentados por 50 ms (1/20 segundos) Tarefa: reportagem total Resultado: nem ½ dos 12 itens era lembrado em média, embora os informatnes reportassem lembrar-se de mais itens, perdendo-os durante a reportagem (artefato do experimento). Experimento 2 Mesmos materiais com tarefa de reportagem parcial, através de tons diferenciados correspondentes às fileiras. Resultado: ¾ das fileiras era reportado, indicando que ¾ do conjunto era retido. Experimento 3 Tons atrasados em 1 segundo provocava declínio no desempenho da reportagem de 75% para 36% , inferindo-se ser de 1 segundo o tempo de retenção da informação no sistema de armazenagem visual. Estudos semelhantes foram desenvolvidos para o sistema de armazenagem auditiva por Darvwin, Turvin & Crowder (1972), observando-se que, neste caso a diferença entre a reportagem total e a parcial era de 4 segundos, indicando que o tempo de persistência auditivo é de 4 segundos. Memória de Trabalho Memória de Longo prazo Característica Unidade Capacidade Recuperação Duração M.Trabalho Bloco 7 ± 2 blocos Fácil/rápida 30 segundos M.Longo Prazo Sem restrições Sem limite definido Difícil/vagarosa Indefinidamente longa Processamento serial e paralelo Processamento Serial: algoritmo incrementacional e determinístico Ondas sonoras fones fonemas morfemas / palavras sintagmas frases integração discursiva/pragmática Aplicação de operações mentais sobre cadeias de símbolos, em que o output de uma operação serve de input para a próxima. Processamento Paralelo Um modelo serial divide o processo de compreensão em estágios: acesso lexical, parsing, forma fonética, etc. Tais processos ocorrem um de cada vez, sem debordamento. Em um modelo de processamento em paralelo todos esses processos podem ocorrer simultaneamente. Assim, pode-se especificar foneticamente um vocábulo ao mesmo tempo que se acessa outro e se constrói estrutura sintática. Modelos conexionistas Os modelos conexionistas ≠ modelos computacionais. Inspiram-se nos estudos sobre os neurônios. Na verdade, cada neurônio é extremamente vagaroso, só processando cerca 5 instruções por segundo. Como há 1012 neurônios no cérebro e 1015 conexões entre eles, o cérebro é capaz de processar tarefas complexas, tais como a compreensão da linguagem Conexões O comportamento inteligente resulta dos pesos das conexões entre os neurônios, em uma função de mapeamento: Pandemonium Processamento bottom-up e top down O processamento bottom-up é aquele que procede do nível mais baixo para o nível mais elevado. Um modelo top-down, por outro lado, permite que a informação do nível mais alto influencie o processamento de níveis mais baixos. Efeitos top-down Métodos Público Manipulado Natural Privado Métodos Público Manipulado Natural Privado Julgamento gramaticalidade Métodos Público Manipulado Natural Privado Julgamento gramaticalidade Etnográfico Métodos Público Privado Manipulado Experimental Elicitação Julgamento gramaticalidade Natural Etnográfico Métodos Público Privado Manipulado Experimental Elicitação Julgamento gramaticalidade Natural Etnográfico Insight Métodos experimentais Leitura auto-monitorada Decisão lexical Priming Julgamento imediato de aceitabilidade/gramaticalidade Monitoramento de fonemas Locação de clicks Eye-tracking A Psicolingüística A Psicolingüística divide-se em: 1. Psicolingüística Experimental - o estudo da compreensão e da produção lingüística 2. Psicolingüística Desenvolvimental - o estudo da aquisição da linguagem. A Psicologia e a Lingüística nunca se integraram com total sucesso na Psicolingüística, a não ser por curtos períodos. Há uma discordância fundamental a respeito da relação entre a linguagem e a cognição que mais ou menos divide os psicolingüistas: 1. A posição da autonomia lingüística ou da Modularidade Os lingüistas assumem que o âmago da linguagem é um sistema lingüístico especializado ou GRAMÁTICA, que tem interface com outros sistemas cognitivos ao nível do input e do output. Entretanto, as regras e representações desse sistema são distintas das de outros sistemas cognitivos. Assim, de acordo com esta posição, uma teoria da compreensão e da produção lingüística deve incluir entre seus princípios explanatórioss um componente ou módulo gramatical. Note-se, por outro lado, que a estrutura gramatical pode ser estudada independentemente do seu uso na comunicação. 2. A posição Cognitivista A gramática é um epifenômeno de processos cognitivos mais gerais. A compreensão de frases Parsing Compreensão Interpretação Integração de diferentes tipos de conhecimento Grafema Som/Fonema Prosódia? Prosódia? Informação lexical - categoria gramatical - grade de subcategorização - grade temática - propriedades de controle - traços formais - traços semânticos Análise sintática Integração discursiva Integração pragmática Contexto Experiência de mundo Modelos (3) Modelos de Processamento de Frases Incrementacional- Satisfação DTC Garden Path Construal Interativo de condições Conexionismos |-------- | ------------------ | --------|------- | ---------------------------| -------------------------------------| Minimalista Teorias Paramétricas + Sintático + Semântico Questões Algumas questões fundamentais da área de Processamento Sintático 1. Que tipos de informação são utilizados no parsing? Sintaxe, Semântica , Pragmática - sintaxe - análise de constituintes, dependências de longa distância, constituintes descontínuos, subcategorização - semântica lexical - significado, papel temático. - pragmática - identificar referentes , integraçao contextual e discursiva, plausibilidade 2. Qual o ordenamento dos processos de parsing on line? Sistema modular? Interativo? Que informação está disponível quando? 3. Há Princípios universais de parsing? Estes princípios podem ser ultrapassados pelo conhecimento lexical/pragmático? Esses princípios são independentes de uma língua específica?