1 Erica dos Santos Rodrigues O PROCESSAMENTO DA CONCORDÂNCIA DE NÚMERO ENTRE SUJEITO E VERBO NA PRODUÇÃO DE SENTENÇAS (versão apresentada para defesa em 16 de março de 2006) Tese de Doutorado Tese apresentada ao Programa de Pós-graduação em Letras da PUC-Rio como requisito parcial para obtenção do título de Doutor em Letras. Orientadora: Profa. Letícia Maria Sicuro Corrêa (PUC-Rio) Co-orientador: Prof. Jairo Morais Nunes (USP-SP) 2 Para meu filho Henrique, pelo olhar terno, sempre. 3 Agradecimentos A Letícia Sicuro Corrêa, minha orientadora, pelo contínuo aprendizado intelectual, pela dedicação constante, pela amizade e compreensão nos momentos críticos. A Jairo Nunes, por ter renovado minha paixão pela sintaxe, pelo estímulo para a realização do trabalho e pelo tratamento sempre gentil e delicado. A meu marido, pelo afeto, pela amizade, por ter acreditado mais em mim do que eu mesma. Aos meus pais, pelo carinho e pela dedicação sem medidas. Aos meus professores da PUC, da UFRJ e da UNICAMP, pela certeza de que estou na profissão certa. A Cristina, Helena, Tânia, Claudinha, Vanise, Maria do Carmo, Violeta e Carmelita, por que vocês são o máximo, porque fazer tese é impossível sem amigos. A Marina, amizade mais recente, pelas discussões de sintaxe e pela generosidade de compartilhar seu conhecimento. A Juanito Avelar e Andrés Saab, pela troca de bibliografia e pelos comentários e sugestões. A meu amigo-programador Claver, pela implementação dos experimentos, pelos papos, pelo exemplo de tranqüilidade. Aos meus colegas da PUC, da UNICAMP e da UFRJ – Juanito, Ana Paula, Jéssica, Sílvia, Cínthia, Marcelo, Ricardo, Márcio, Antônio e outros, que eu possa ter esquecido de mencionar, pelo convívio e pela troca de idéias. Aos meus colegas de trabalho, pela força na longa jornada. Às meninas da secretaria, pelo sorriso largo e pela presteza em tudo. A todo o pessoal do LAPAL, pela ajuda na aplicação dos experimentos e na caçada a voluntários. A Michele, pela ajuda com os arremates da tese. Aos participantes dos experimentos, pelos erros, meu material precioso de pesquisa. 4 Resumo Rodrigues, Erica dos Santos; Corrêa, Letícia M. Sicuro. Nunes, Jairo M. Processamento da concordância de número entre sujeito e verbo na produção de sentenças. Rio de Janeiro, 2006. XXXp. Tese de Doutorado – Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro. O processamento da concordância de número sujeito-verbo na produção de sentenças por falantes do dialeto culto do português brasileiro é investigado. A dissertação focaliza os chamados erros de atração e seu principal objetivo é identificar os fatores que interferem no processamento da concordância e prover uma explicação psicolingüística que seja compatível com pressupostos do Programa Minimalista da Lingüística Gerativa. Mais especificamente, busca-se examinar: i) as condições que favorecem os erros e as propriedades sintáticas que levam um núcleo interveniente a ser tomado como o controlador da concordância; ii) a interferência de informação morfofonológica de número dos elementos que integram os modificadores do DP sujeito; iii) a interferência de informação semântica de número no estabelecimento da concordância. Ainda como objetivo específico busca-se distinguir em termos estruturais os DPs responsáveis pelos erros de atração daqueles que licenciam uma forma singular ou plural do verbo -as chamadas construções partitivas. Aplica-se uma tarefa psicolingüística envolvendo julgamento de gramaticalidade a fim de investigar diferenças de processamento da concordância entre as construções partitivas e os DPs complexos. A relevância dos tópicos investigados se deve ao fato de estes permitirem uma discussão mais ampla acerca da autonomia do formulador sintático. Parte-se de vasta revisão da literatura, na qual se reportam interferências sintáticas, semânticas e morfofonológicas no processamento da concordância em diferentes línguas. Explicações apresentadas por modelos de produção interativos e não-interativos são discutidas. Inclui-se ainda uma caracterização da concepção minimalista de língua, com o tratamento da concordância como processo de valoração de traços formais, e um modelo de produção de natureza serial, nãointerativo, que incorpora um parser-monitorador funcionando paralelamente à formulação dos enunciados – modelo PMP (produção monitorada por parser). Em seguida, reportam-se 5 experimentos com falantes de português. Os resultados 5 indicaram efeito de marcação e de distância linear entre o núcleo do sujeito e o verbo, com mais erros para núcleo do sujeito não-marcado (singular) e linearmente distante do verbo, e efeito de posição estrutural do núcleo interveniente, com maior incidência de erros para os núcleos hierarquicamente próximos do nó mais alto do DP sujeito e núcleos inseridos em PPs argumentos. Um efeito semântico de distributividade associado a efeito de marcação também foi obtido. Quanto a fatores morfofonológicos, a informação de número no determinante (e não no nome) mostrou-se crucial para a identificação do número do DP sujeito. É proposta uma versão ampliada e revista do modelo PMP que unifica explicações para os erros de concordância em termos de uma escala de acessibilidade da representação do DP sujeito pela memória de trabalho e que leva em consideração as expectativas do parser como possível fator de interferência em erros de atração. Essa interferência ocorreria após o parsing do primeiro DP e afetaria a codificação morfofonológica do verbo. Em suma, a tese aqui veiculada é a de que os erros de concordância não ocorrem na computação sintática e que o formulador sintático atua de forma autônoma. Palavras-chave Psicolingüística; processamento de sentença; concordância entre sujeito e verbo; concordância entre sujeito e verbo no português; erros de atração; parser monitorador; distância linear e hierárquica; efeitos de distributividade; efeitos morfofonológicos. 6 Abstract Rodrigues, Erica dos Santos; Corrêa, Letícia M. Sicuro (Advisor); Nunes, Jairo M. (Co-advisor). Processing of Subject-verb Number Agreement in Sentence Production. Rio de Janeiro, 2006. XXXp. Phd Dissertation – Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro. The processing of subject-verb number agreement in sentence production by speakers of the standard dialect of the Brazilian Portuguese is investigated. The dissertation focuses on attraction errors and its main aim is to identify the factors that interfere in agreement processing and to provide a psycholinguistic account, which is compatible with assumptions of the Minimalist Program of Generative Linguistics. This work examines, in particular: i) the conditions that favor attraction errors and the syntactic properties which make an intervenient head to be considered as the agreement controller; ii) the role of morphophonological information on number provided by the DP subject modifiers; iii) the interference of conceptual number in agreement. Additionally, the work intends to distinguish, in structural terms, the DPs responsible for attraction errors from those DPs that allow a singular and a plural form of the verb – the so-called partitive constructions. A psycholinguistic procedure of grammaticality judgment is conducted in order to verify agreement processing differences between partitive constructions and complex DPS. The relevance of these topics is due to the fact that they enable a more comprehensive discussion on the autonomy of the syntactic formulator in language production. An extensive review of the existing literature was carried out and results are reported, concerning the interference from syntactic, semantic and morphophonological factors on agreement processing in different languages. Explanations provided by interactive and noninteractive models are discussed in this work. The minimalist conception of language is presented according to which agreement is described as a feature valuation process and a serial non-interactive production model is characterized, which incorporates a monitoring-parser that works in parallel with speech formulation – PMP model (parser monitored production). A total of 5 experiments with Portuguese speakers are reported. The results show an effect of markedness and linear distance between the subject and the verb, with more 7 errors caused by non-marked (singular) subject heads that are linearly distant from the verb, and an effect of the structural position of the intervenient head, with a large number of errors for intervenient heads that are near to the upper phrasal marker of the DP and for heads which are inserted in PP arguments. A semantic effect of distributivity associated with an effect of markedness was also obtained. As far as morphphonological factors, number information of the determiner (and not of the noun) has shown to be critical to subject number identification. A revised and improved version of the PMP model is proposed that unifies possible explanations for agreement in terms of on an accessibility scale of the DP subject representation in the working memory and that takes into account parser predictions as a possible factor of interference in attraction errors. This interference would occur after the parsing of the DP and would affect the morphophonological encoding of the verb. In sum, the main argument of the thesis is that agreement errors do not occur in the syntactic computation and that the syntactic formulator works autonomously. Keywords Psycholinguistics; Sentence Processing; Sentence Production; Subject-verb agreement; Subject-verb agreement in Portuguese; Attraction Errors; Monitoring Parser; Linear and hierarchical distance; Distributivity effects; Morphophonological effects. 8 SUMÁRIO 1 Introdução 15 2 Arquitetura do sistema de produção e o processamento da concordância: a autonomia do formulador sintático em modelos interativos e não-interativos 20 3 Articulação entre teoria lingüística e psicolingüística no estudo do processamento da concordância 26 3.1 Arquitetura do sistema lingüístico e a derivação sintática da sentença no Minimalismo 27 3.2 Formulação sintática e derivação sintática 31 4 A investigação de erros de produção no estudo do processamento da concordância sujeito-verbo 37 4.1 Tipos de erros e fatores atuantes no processamento da concordância 38 4.1.1 Fatores semânticos 4.1.1.1 Distributividade 4.1.1.2 Coletivos, bipartidos e pluralia tantum 4.1.2 Fatores sintáticos 4.1.2.1 Distância linear 38 38 43 49 50 4.1.2.1.1 Distância linear entre o núcleo do sujeito e o verbo 50 4.1.2.1.2 Distância linear do núcleo interveniente em relação ao verbo 53 4.1.2.2 Distância hierárquica 60 4.1.2.3 Status argumental do sintagma modificador 64 4.1.2.3.1Resolução de ambigüidades estruturais e o papel de informação relativa à estrutura argumental de nomes e verbos 65 4.1.2.3.2 Diferenças estruturais entre argumentos e adjuntos e questões de acessibilidade no processamento 77 4.1.2.3.3 Erros de atração e o papel do status argumental de PPs modificadores 79 4.1.3 Fatores morfofonológicos 82 9 5 Distinguindo casos de concordância licenciados pela gramática da língua de falhas de processamento: uma análise da concordância “facultativa” com construções partitivas 88 5.1 Análise lingüística 5.1.1 Concordância “ad sensum” distributiva 89 89 e leitura de grupo vs. leitura 5.1.2 Estrutura das partitivas e dupla possibilidade de concordância 97 5.1.2.1 Análise proposta 5.1.2.2 A dupla possibilidade de concordância 5.2 Experimento psicolingüístico de julgamento de gramaticalidade contrastando construções partitivas x DPs complexos 106 116 120 6 Modelos interativos e não-interativos diante dos erros de atração 127 6.1 Modelos interativos 6.2 Modelos não-interativos 127 128 131 7. Modelo PMP – modelo de produção monitorada por parser 7.1 Propriedades do modelo 132 7.1.1 Incrementalidade moderada 132 7.1.2 Computação automática da concordância como processo de valoração de traços 135 7.1.3 Monitoração concomitante à produção por parte de um parser 136 7.2 Procedimentos implementados pelo parser monitorador e explicação dos erros de atração 137 8. Experimentos de produção induzida de erros 140 8.1 Questões metodológicas no estudo da produção da linguagem e a tarefa de indução de erros 141 8.2 Experimentos 143 8.2.1 Experimento 1 – distância linear sujeito-verbo e tipo de modificador 8.2.2 Experimento 2 – posição linear vs. posição hierárquica do núcleo interveniente e marcação morfofonológica 143 148 10 8.2.3 Experimento 3 – status argumental do PP modificador 8.2.4 Experimento 4 – distributividade e marcação morfofonológica 8.2.5 Experimento 5 – distributividade 154 158 163 9 Modelo de produção PMP revisto e ampliado 167 9.1 Erros de atração e escala de acessibilidade das representações geradas pelo parser 167 9.2 Modelo PMP e Programa Minimalista: considerações acerca de um tratamento unificado para a computação sintática da concordância 173 10 Síntese e considerações finais 176 11 Referências bibliográficas 184 12 Apêndice 198 11 Lista de figuras Figura 1: Arquitetura do sistema de produção da linguagem e monitoração da fala. 21 Figura 2: Concordância como operação de cópia de traços (Vigliocco, Butterworth & Garrett, 1996). 23 Figura 3: Concordância como operação de unificação de traços (Vigliocco, Butterworth & Garrett, 1996). 24 Figura 4: Computação da concordância através da operação Agree. 30 Figura 5: Esquema de percolação ascendente do traço de número do núcleo interveniente para o nó mais alto do sujeito. 60 Figura 6: Esquema de percolação ascendente do traço de número de núcleos intervenientes inseridos em PPs e em orações 61 Figura 7: Operações de Number Marking e Number Morphing no processamento da concordância sujeito-verbo (adaptado de Bock et al., 2001) 129 Figura 8: Modelo PMP de processamento da concordância na produção de sentenças 139 Figura 9: Modelo PMP revisto e ampliado (explicação 2) 171 Figura 10 : Modelo PMP revisto e ampliado (explicação 3) 172 12 Lista de gráficos Gráfico 1: Médias de respostas SIM em função do tipo de DP sujeito 123 Gráfico 2: Médias de respostas SIM em função do número do verbo 124 Gráfico 3: Médias de respostas SIM em função do tipo de DP sujeito e do número do verbo 124 Gráfico 4: Médias de erros de concordância em função do tipo de modificador e da distância entre o núcleo do sujeito e o verbo 146 Gráfico 5: Médias de erros de concordância em função do número de N1 e do número de N2 152 Gráfico 6: Médias de erros de concordância em função do status argumental do PP modificador 156 Gráfico 7: Médias de erros de concordância em função do número do DP do nome local 161 Gráfico 8: Médias de erros de concordância em função do tipo de expressão lingüística do DP distributivo 162 Gráfico 9: Médias de erros de concordância em função da distributividade do DP sujeito 164 Gráfico 10: Médias de erros de repetição do DP sujeito 165 13 Lista de tabelas Tabela 1:Média de erros de concordância por condição experimental 146 Tabela 2: Média de erros de concordância em função de Número de N1 e Número de N2 151 Tabela 3: Média de erros de concordância em função do status argumental do PP que contém o núcleo interveniente 156 Tabela 4: Média de erros de concordância em função do número do DP do nome local 160 Tabela 5: Média de erros de concordância em função do tipo de expressão lingüística de distributividade 161 Tabela 6: Média de erros de concordância em função da distributividade do DP sujeito 164 Tabela 7: Média de erros de repetição do preâmbulo em função da distributividade do DP sujeito 165 14 É preciso começar o desenho para saber o que se quer desenhar. Pablo Picasso 15 1 Introdução A presente tese tem como tema o processamento da concordância de número entre sujeito e verbo na produção de sentenças e está vinculada ao Projeto Explorando relações de interface língua-sistemas de desempenho no processamento da concordância e na aquisição da linguagem normal e desviante (CNPq), em desenvolvimento pelo Grupo de Pesquisa em Processamento e Aquisição da Linguagem, no LAPAL (Laboratório de Psicolingüística e Aquisição da Linguagem), da PUC-Rio. O estudo da concordância no âmbito da pesquisa realizada em Psicolingüística é de particular relevância, pois permite a discussão de questões centrais acerca do processamento humano da linguagem, em especial, permite investigar como diferentes fontes de informação são recuperadas e mantidas na memória durante a produção da linguagem, como se dá o fluxo dessas informações ao longo do processamento e em que medida o formulador sintático atua de forma autônoma em relação aos demais componentes da arquitetura do sistema de produção. A pesquisa sobre a concordância é também de grande interesse para o estabelecimento de uma articulação entre Psicolingüística e teoria lingüística, nomeadamente no que diz respeito ao trabalho que vem sendo desenvolvido dentro do quadro teórico do Programa Minimalista (Chomsky 1995, 1998, 1999, 2001). A caracterização de como se dá o estabelecimento da concordância durante a produção de sentenças poderá contribuir para uma melhor explicitação de como os sistemas de desempenho interagem com o sistema computacional da linguagem, do tipo de restrição que esses sistemas impõem às operações realizadas pelo sistema computacional, da relação entre derivação sintática num modelo formal de língua e o processo de formulação de sentenças em tempo real, entre outros aspectos. O estudo da produção da linguagem enfrenta, não obstante, dificuldades de ordem metodológica, não sendo simples o controle do input que dá origem à produção bem como a obtenção de medidas confiáveis acerca das variáveis manipuladas. Nesse cenário, o emprego de técnicas que envolvem a produção induzida de erros se apresenta como uma alternativa importante em termos experimentais. A idéia por trás dessas técnicas é que o “erro” funcionaria como 16 uma espécie de janela para se investigar o funcionamento interno do sistema de produção, permitindo, no caso da pesquisa sobre a concordância, a formulação de hipóteses acerca da autonomia do formulador sintático. Cumpre notar que nesse tipo de investigação, “erro” não é entendido como um desvio da norma culta, examinado sob uma perspectiva prescritivista. Trata-se de um lapso, uma falha de processamento, que ocorre com relativa freqüência na língua, sendo por vezes prontamente corrigido pelo falante. O tipo de erro analisado no estudo da concordância é o “erro de atração”, o qual se caracteriza pela concordância do verbo com um núcleo nominal interveniente entre aquele e o núcleo do sujeito, como se observa em (1). (1) A análise dos resultados experimentais indicaram um efeito principal de número do núcleo interveniente no processamento da concordância. É importante distinguir erros de atração de casos como o ilustrado em (2), em que tanto a concordância canônica quanto a concordância com um núcleo interveniente são consideradas gramaticais pelos falantes da língua. (2) A maioria dos erros ocorreu/ocorreram após preâmbulos em que havia incongruência de número entre o núcleo do sujeito e o núcleo interveniente. Um modelo de produção que procure explicitar o tipo de conhecimento lingüístico empregado na computação das relações de concordância e como o sistema opera ao colocar esse conhecimento em uso precisa prover uma explicação diferenciada para (1) e (2), o que só se torna possível com a incorporação de um modelo de língua que caracterize a informação de natureza lingüística que é acessível aos sistemas de desempenho. O objetivo geral da tese é, pois, investigar o processamento da concordância de número entre sujeito e verbo por falantes do dialeto culto do português brasileiro, a fim de elucidar a natureza dos erros de concordância que ocorrem na produção de sentenças e o momento do processo de produção em que tais erros teriam origem. Procura-se distinguir esses erros dos chamados casos de concordância facultativa, em que o verbo concorda com um termo do modificador do sujeito, resultando numa estrutura licenciada pela gramática da língua. Nessa 17 investigação, busca-se uma articulação entre um modelo de língua, mais especificamente, aquele desenvolvido dentro do quadro teórico do Programa Minimalista, e um modelo de processamento voltado para a produção da linguagem. Assume-se como hipótese de trabalho a idéia que o formulador sintático funciona de forma autônoma, isto é, não está sujeito à interferência de informação diferente daquela que pode ser codificada como traços formais em um modelo de língua. Em termos mais específicos, a pesquisa apresenta os seguintes objetivos: ¾ Examinar a interferência de fatores pertinentes à sintaxe e sua expressão no processamento da concordância, em particular no que diz respeito à organização linear dos constituintes da sentença, à estrutura hierárquica do DP1 sujeito e à natureza argumental do modificador do sujeito; ¾ Verificar a interferência de fatores morfofonológicos no processamento da concordância, em especial o papel da informação de número codificada nos núcleos nominais do DP sujeito; ¾ Avaliar o papel de informação semântica/conceitual de número do sujeito no estabelecimento da concordância verbal, em particular nos casos em que se observa uma não correspondência entre número conceitual e número gramatical, como nos sujeitos envolvendo substantivos coletivos e sintagmas com leitura distributiva. 1 DP é a abreviatura para Determiner Phrase (sintagma determinante), termo introduzido na literatura lingüística por Abney (1987) para fazer referência a estruturas que teriam um determinante como núcleo e um NP como complemento. A partir de semelhanças observadas entre estruturas nominais e verbais, como as estruturas de genitivo em inglês, Abney propôs que o determinante seria um núcleo funcional com propriedades semelhantes a I (Inflection) e que o NP seria o complemento desse núcleo D. Note-se, contudo, que o termo DP não é em geral empregado na literatura psicolingüística e as estruturas nominais são identificadas apenas como NPs. Nesta tese, utiliza-se NP quando este foi o termo adotado na literatura e mantêm-se inalteradas as representações nas quais as estruturas nominais foram analisadas como NPs. Nos demais casos, emprega-se DP, visto que o tratamento de alguns fenômenos relativos ao processamento da concordância parece requerer uma estrutura mais ampla do que o NP. Além disso, este é o termo correntemente utilizado em trabalhos desenvolvidos no âmbito da Teoria Gerativa, com a qual se busca uma aproximação na presente tese. 18 ¾ Prover uma análise lingüística para a concordância do verbo com sujeitos formados por expressões partitivas (A maioria de, Uma parte de), a fim de diferenciar esse tipo de sujeito de outros estruturalmente semelhantes em que apenas a concordância canônica com o verbo é admitida. ¾ Detalhar e avaliar o modelo de processamento da concordância de número entre sujeito-verbo, proposto por Rodrigues & Corrêa (2004)/Corrêa e Rodrigues (2005)2, procurando verificar se o referido modelo dá conta dos resultados experimentais em português e se consegue explicar diferenças entre línguas. Cumpre destacar, ainda, a relevância do presente trabalho do ponto de vista didático. Como se sabe, a concordância é um dos tópicos do ensino de gramática que mais estigmatiza aqueles que não dominam a norma culta. Qualquer tipo de desvio do que está prescrito nos compêndios gramaticais é imediatamente tratado como erro, sem uma problematização dos fatores que podem estar levando à produção de uma determinada forma. Aspectos ligados à variação lingüística e a aspectos relacionados a processamento são confundidos, impedindo muitas vezes que o professor identifique a fonte de dificuldades enfrentadas pelos alunos. Acredita-se, portanto, que uma caracterização dos fatores processuais que podem interferir no estabelecimento da concordância venha a contribuir para uma conscientização do professor quanto a aspectos da língua que independem do dialeto falado pelo aluno. O trabalho está organizado da seguinte maneira. No segundo capítulo, apresenta-se como a arquitetura do sistema de produção da linguagem vem sendo caracterizada em modelos interativos e não-interativos, com particular ênfase à questão da autonomia do formulador sintático. No terceiro capítulo, são tecidas considerações acerca de uma possível aproximação entre Psicolingüística e os desenvolvimentos recentes da teoria lingüística Gerativista, nomeadamente o Programa Minimalista. Apresenta-se em linhas gerais a arquitetura do sistema lingüístico nessa perspectiva teórica e 2 O trabalho apresentado em Rodrigues & Corrêa (2004) baseia-se no modelo desenvolvido em Corrêa & Rodrigues (2005), a partir da idéia de acessibilidade a representações derivadas do parsing no discurso (Corrêa 1993, 2000). 19 examinam-se pontos de compatibilidade e incompatibilidade entre derivação sintática em um modelo formal de língua e derivação on-line de uma sentença. O capítulo 4 é uma ampla revisão da literatura referente à pesquisa sobre erros de concordância, em que são apresentados resultados experimentais acerca da interferência de fatores semânticos, sintáticos e morfofonológicos no processamento da concordância. No capítulo 5, busca-se prover uma análise lingüística para as construções partitivas em português. A dupla possibilidade de concordância verbal que essas construções licenciam é explicada em termos de representações estruturais distintas a elas subjacentes. Ao final do capítulo, reportam-se os resultados de um experimento psicolingüístico envolvendo um teste de julgamento de gramaticalidade, no qual se buscou verificar como os falantes avaliam a concordância singular e plural em sentenças com construções partitivas e com DPs complexos. No capítulo 6, são retomados os resultados experimentais reportados na resenha da literatura e comenta-se como modelos interativos e não interativos do processamento da concordância explicam os erros de concordância. Um modelo de produção monitorada por parser – modelo PMP (Rodrigues & Corrêa, 2004; Corrêa & Rodrigues, 2005) é apresentado no capítulo 7. São detalhadas as propriedades desse modelo e seu modo de funcionamento, procurando diferenciá-lo dos modelos de produção existentes. O capítulo 8 reúne cinco experimentos de produção induzida de erros, os quais têm como objetivo investigar a interferência de fatores sintáticos, morfofonológicos e semânticos no processamento da concordância no português. No capítulo 9, uma versão revista e ampliada do modelo PMP é proposta, tendo em vista os resultados dos experimentos. Essa versão busca explicar os erros em termos de uma escala de acessibilidade, na memória de trabalho, da representação do sujeito gerada pelo parser-monitorador. Ao final são tecidas algumas considerações acerca da possibilidade de um tratamento unificado da computação sintática da concordância e do processamento da concordância. O último capítulo apresenta uma síntese da tese, em que se retoma a hipótese de trabalho e são apontados desdobramentos futuros para a pesquisa realizada. 20 2 Arquitetura do sistema de produção e o processamento da concordância: a autonomia do formulador sintático em modelos interativos e não-interativos A produção da linguagem é concebida, na maior parte dos modelos de produção, como uma atividade complexa que envolve processamento de informação em diferentes níveis ou estágios (cf. Fromkin, 1971, 1973; Garrett 1975, 1980, 1988; Levelt, 1989; Bock & Levelt, 1994). Considera-se que a produção teria início com a conceptualização da mensagem que se deseja transmitir. Seguir-se-ia a esta etapa um processo de busca de elementos do léxico, os quais portariam traços semânticos compatíveis com os conceitos envolvidos na mensagem assim como com aspectos pertinentes à adequação de registro e a outros fatores de ordem pragmática. O acesso lexical envolveria também a recuperação de informação léxico-sintática do lema3, um tipo de representação específica que agregaria informação gramatical acerca de um dado item lexical. De posse dessas representações, um formulador conduziria a codificação gramatical da sentença. Nessa fase de codificação gramatical, ocorreria a organização hierárquica da sentença e ordenação dos constituintes de acordo com ordem linear dos constituintes na língua. A essa fase seguir-se-ia a etapa de codificação morfofonológica da informação proveniente do componente sintático e a codificação fonológica, que possibilitaria a articulação da sentença. É compatível com esses modelos a idéia de um parser monitorador, nos moldes do que propõe Levelt (1989). De acordo com Levelt, o falante usaria o próprio sistema de compreensão para monitorar os enunciados à medida que estes fossem sendo produzidos. O autor propõe que o parser teria acesso tanto às representações fonéticas pré-articulatórias, decorrentes do processo de codificação fonológica da sentença, quanto à fala já articulada. A vantagem dessa proposta é que não são necessários recursos adicionais de monitoramento para a detecção de erros: o falante, por ser ouvinte de sua própria fala, também seria capaz de 3 O termo lema, introduzido por Kempen & Hoenkamp (1987; porém já citado em Kempen & Huijbers, 1983), foi empregado originalmente para fazer referência à palavra como uma entidade semântico-sintática em oposição ao conceito de lexema, usado para designar os traços fonológicos da palavra (cf. Levelt, 1989). Com os desenvolvimentos da teoria de acesso lexical, o termo ganhou um uso mais restrito, passando a designar apenas a informação sintática acerca de uma dada palavra. Segundo Corrêa (2005ª; submetido, as propriedades que definem os lemas podem ser relacionadas a traços formais do Léxico de um modelo formal de língua enquanto que as propriedades que definem lexemas podem ser relacionadas com traços fonológicos. 21 verificar falhas em sua produção (cf. Postma, 2000). A seguir apresenta-se uma representação esquemática do processo de produção em modelos seriais. Conceptualizador Geração da mensagem Esquemas discursivos; conhecimento enciclopédico, pragmático etc. Acesso lexical Codificaç Codificação gramatical Traços semânticos Lema Codificação (morfo)fonológica Lexema Sistema de compreensão Plano fonético Articulação Audição Fig. 1: Arquitetura do sistema de produção da linguagem e monitoração da fala. Adaptação da representação de Levelt (1989) para o processamento de informações pelo falante. As caixas representam componentes de processamento e o círculo representa conhecimento armazenado. Modelos interativos x não interativos e o processamento da concordância Uma questão acerca da qual os modelos de produção de sentenças divergem diz respeito a como se dá o fluxo de informação ao longo do processamento, mais especificamente, se poderia haver ou não interação entre informações de natureza distinta num dado estágio do processamento. Dependendo da resposta dada a essa questão, os modelos podem ser definidos como não-interativos ou interativos (cf. Vigliocco & Harstuiker, 2002). Modelos não-interativos, como o caracterizado na seção anterior, apresentam, em geral, uma visão serial e unidirecional da produção da linguagem, em que não há possibilidade de interação entre os níveis de processamento (feedforward models). O input de um nível para o outro é mínimo, isto é, apenas informação relevante e necessária é encaminhada de um estágio para outro. Os modelos interativos, por sua vez, assumem uma concepção interativa do processamento com possibilidade de convergência de informações de fontes 22 distintas ao longo do processo de formulação de sentenças (Dell, 1986; Stemberger, 1985). Sob esse rótulo, agrupam-se desde modelos de orientação probabilística, baseados em satisfação de restrições, originalmente desenvolvidos no âmbito do estudo da compreensão (cf. Haskell & MacDonald, 2003), até modelos alinhados com a idéia de níveis de processamento (Vigliocco & Hartsuiker, 2002). No caso dos modelos interativos de níveis, considera-se a possibilidade de retro-alimentação de informações provenientes de um dado nível no nível anterior (feedbackward models). Tanto em modelos seriais não-interativos quanto em modelos interativos de níveis, a concordância é computada no estágio de codificação gramatical. Nos modelos não-interativos, o formulador sintático estabelece a concordância exclusivamente com base em informação de natureza léxico-sintática, não havendo interferência de fatores semânticos ou morfofonológicos no processamento. Já nos modelos interativos de níveis, considera-se que a concordância, a despeito de ser um processo sintático, poderia mobilizar informação de natureza não-sintática. Nesse caso, o formulador sintático não atuaria de forma autônoma, encapsulada. Quanto aos mecanismos sintáticos de implementação da concordância entre sujeito-verbo, duas alternativas são consideradas na literatura voltada à investigação de erros de atração: um mecanismo de cópia de traços (Kempen & Hoenkamp, 1987) e um mecanismo de unificação de traços (Kempen & Vosse, 1989; De Smedt, 1990).4 No mecanismo de cópia de traços (Kempen & Hoenkamp, 1987), uma fonte ou controlador transmite seus traços sintáticos (por exemplo, traços de pessoa, número, gênero) a um alvo. No caso da concordância sujeito-verbo, assume-se que o sujeito é o elemento controlador e que o verbo herda informação de número e pessoa do sujeito. Os valores dos traços de número e pessoa do sujeito são especificados a partir de um mapeamento de informação de natureza conceptual (no nível da mensagem) para uma representação léxico-gramatical. A transferência dos traços de número-pessoa do sujeito para o verbo se dá através da aplicação sucessiva de operações de cópia. 4 Pode-se estabelecer uma certa correspondência entre os mecanismos de cópia e de unificação de traços e os procedimentos de valoração (Chomsky, 1999) e de checagem de traços (Chomsky, 1995), propostos no âmbito do Programa Minimalista. O tratamento da concordância no Minimalismo será apresentado no capítulo 3. 23 Representação conceitual S [-pl] Número é recuperado V NPx [-pl] NP1 Lemas det PP N1[-pl] P NP2 [+pl] det The [-pl] baby[-pl] on N2 [+pl] the blankets [+pl] is crying Fig. 2: Concordância como operação de cópia de traços (Vigliocco, Butterworth & Garrett, 1996).5 No mecanismo de unificação de traços (Schieber, 1986; De Smedt, 1990; Kempen & Vosse, 1989), os elementos envolvidos na relação de concordância apresentam informação relativa a número já especificada. Esses elementos funcionam como ‘parceiros’ de mesmo status no estabelecimento da concordância de número. Nessa proposta, o valor do número tanto do sujeito quanto do verbo é resultante de informação proveniente de representações conceituais. O modelo, contudo, é mais complexo do que o de cópia na medida em que se faz necessário um procedimento para garantir que os elementos envolvidos na concordância terminem com um mesmo valor. O procedimento proposto precisa ser capaz de examinar compatibilidades, verificar a interseção dos valores e realizar a unificação dos traços de ambos os nós. Veja-se, a seguir, figura ilustrativa do funcionamento desse processo: 5 Na representação da concordância como um processo de cópia de traços, Vigliocco, Butterworth & Garrett (1996) assumem o modelo de gramática procedural incremental (Incremental Procedural Grammar), desenvolvido por Kempen & Hoemkamp (1987), no contexto de teorias computacionais de processamento de linguagem natural. Nesse modelo de gramática, os nós categoriais não seriam “elementos estruturais passivos”, mas “procedimentos ativos”, responsáveis pela construção de um tipo de constituinte sintático. Como em qualquer linguagem de programação, é permitida aos procedimentos sintáticos a chamada de subprocedimentos, dando origem a uma hierarquia de procedimentos representada em uma árvore sintática. Os nós terminais são procedimentos lexicais que não evocam nenhum subprocedimento. Os números subscritos servem para distinguir várias instanciações de um mesmo procedimento sintático na hierarquia. 24 Representação conceitual S [Pessoa:3, no: -pl] U [Pessoa:3, no: -pl] Número é recuperado NPx [-pl] NP1 Lemas det V [-pl] PP N1[-pl] P NP2 [+pl] det The baby[-pl] on N2 [+pl] the blankets [+pl] is crying Fig.3: Concordância como operação de unificação de traços (Vigliocco, Butterworth & Garrett, 1996). É importante notar que os mecanismos de cópia e de unificação de traços adotados nos modelos de produção para caracterizar a concordância integram modelos computacionais de gramática voltados à geração de linguagem natural. Embora alguns desses modelos busquem atingir um certo grau de plausibilidade lingüística e psicológica (cf. Kempen & Hoenkamp, 1987), eles não estão preocupados com questões de aprendibilidade e tampouco levam em conta limitações próprias de um processador humano ao processamento lingüístico de sentenças.6 Enquanto nos modelos psicolingüísticos, a questão da precisão e da rapidez de como o sistema de produção opera são fundamentais, nos modelos computacionais, a facilidade de implementação do sistema e de gerenciamento das tarefas é crucial. Assim, embora seja possível uma aproximação entre modelos 6 “[...] Humans and computers are subject to different constraints, in particular with respect to attention span, memory size, and processing speed. There are also differences concerning the granularity of processes, the communication cost between processors, etc. With respect to representation, computer systems are often made efficient and manageable by a homogeneity at a high level (the representation formalism), whereas humans probably depend on homogeneity at a much lower level (the neuron). […]” De Smedt, Horacek & Zock (1996, p.2). 25 psicolingüísticos e modelos computacionais, visto que ambos buscam caracterizar os procedimentos que permitem a geração de sentenças e os tipos de representação utilizados, é preciso ter em mente as diferenças quanto aos critérios que orientam a construção desses modelos. Em relação a essa questão dos critérios, tem se revelado como promissora uma aproximação entre modelos de processamento e o modelo de língua desenvolvido no Programa Minimalista da teoria lingüística gerativista (Chomsky, 1995; 1998, 1999; 2001). Isso porque nessa proposta o que orienta a organização da arquitetura do sistema lingüístico não são apenas critérios de adequação descritiva e explanatória, mas também critérios de economia e de naturalidade conceptual, relativos a como o sistema da língua interage com os demais sistemas cognitivos. No próximo capítulo, será apresentado, em linhas gerais, o modelo de língua proposto no Minimalismo e serão discutidas as compatibilidades entre a derivação sintática de uma sentença no Minimalismo e o processo de formulação em tempo real de uma sentença. 26 3 Articulação entre teoria lingüística e psicolingüística no estudo do processamento da concordância O programa de pesquisa gerativista em sua mais recente etapa – o Programa Minimalista – assume uma perspectiva galileana no estudo da linguagem. Partindo da concepção de que a natureza é perfeita e simples, Chomsky propõe como seu projeto de investigação determinar se o próprio objeto da Lingüística, a linguagem humana, apresenta uma arquitetura perfeita. Segundo Negrão (2004), a adoção dessa perspectiva instaura uma nova ótica nos estudos da sintaxe, que está associada à compreensão do que se entende pelo adjetivo “perfeito”. Como observa a autora, “perfeito” é um adjetivo relacional, que exige a explicitação de seu termo de comparação. No Programa Minimalista, entende-se por arquitetura perfeita aquela capaz de prover as informações necessárias para os demais componentes da mente humana, externos à faculdade da linguagem. Reproduz-se a seguir citação de Chomsky 2002: “A faculdade da linguagem tem que interagir com esses sistemas, senão ela não tem finalidade. Então podemos perguntar: ela é bem projetada para a interação com esses sistemas? Assim se obtém um conjunto de condições diferentes. E, de fato, a única condição que emerge claramente é a de que, dado que a linguagem é essencialmente um sistema de informação, a informação que ela armazena precisa estar acessível a esses sistemas, essa é a única condição. Pode-se perguntar, então, se a linguagem foi bem projetada para satisfazer essa condição de acessibilidade pelos sistemas nos quais ela se encaixa.”7 (Chomsky 2002, traduzido em Negrão 2004) A noção de acessibilidade do sistema lingüístico pelos sistemas de desempenho, do ponto de vista da pesquisa em Psicolingüística, instaura a possibilidade de uma retomada de diálogo com a teoria gerativista.8 7 “The language faculty has to interact with those systems, otherwise it’s not usable at all. So, we may ask: is it well designed for the interaction with those systems? Then you get a different set of conditions. And in fact the only condition that emerges clearly is that, given that the language is essentially an information system, the information it stores must be accessible to those systems, that’s the only condition. We can ask whether language is well designed to meet the condition of accessibility to the systems in which it is embedded.” (Chomsky 2002, p.108) 8 A história da Psicolingüística é marcada por momentos de aproximação e de distanciamento em relação à Teoria Lingüística Gerativista (cf. Corrêa 2002; 2005a; submetido). O primeiro momento, de aproximação, ocorreu na década de 60, com a Teoria da Complexidade Computacional (Derivational Theory of Complexity (Miller & McKean, 1964), em que se buscou estabelecer uma correspondência entre demandas de processamento e operações transformacionais necessárias à derivação de uma sentença. Diante da inadequação empírica dessa Teoria, instaurou- 27 Na caracterização das operações mentais envolvidas nos processos de produção e compreensão de enunciados, os modelos de processamento lingüístico devem levar em conta as propriedades atribuídas à língua internalizada pelo falante. Daí a necessidade de os trabalhos em Psicolingüística incorporarem uma teoria lingüística que tenha como objetivo prover um modelo formal do conhecimento lingüístico que o falante tem de sua língua (cf. Corrêa, 2002; no prelo a). Nesse sentido, o Programa Minimalista representa um avanço para a aproximação entre as duas áreas, dado que as operações realizadas pelo componente computacional devem sempre resultar em estruturas legíveis pelos sistemas de desempenho. A medida, pois, de avaliação da teoria passa a ser de certo modo externa, no sentido que o sistema computacional deve responder a restrições impostas pelos sistemas de desempenho. 3.1 Arquitetura do sistema lingüístico e a derivação sintática da sentença no Minimalismo No modelo de língua proposto no Minimalismo, a Faculdade da Linguagem compreende o sistema cognitivo da língua e os demais sistemas cognitivos com os quais este faz interface.9 O sistema cognitivo da língua envolve um léxico e um sistema computacional, que é o mecanismo responsável pela construção de objetos sintáticos a partir de um arranjo de itens lexicais selecionados do léxico e reunidos em uma Numeração. Na arquitetura proposta, os únicos níveis de representação são aqueles que fazem interface com os demais sistemas cognitivos: a Forma Lógica, que faz interface com o chamado sistema conceptual-intencional, e a Forma Fonética, que faz interface com o chamado sistema perceptualarticulatório. se um período de distanciamento. Nesse segundo momento, a Psicolingüística deixou der ser uma área de teste para a Lingüística e se voltou para questões específicas de processamento, como acesso lexical Levelt (1983), procedimentos de parsing (Kimball, 1973; Frazier & Fodor, 1978; Wanner & Maratsos, 1978; Marcus, 1980) e decodificação do sinal acústico (Mehler, 1981). A Teoria Gerativa, por seu turno, passou a ocupar-se de questões ligadas à adequação explanatória e o caráter cada vez mais abstrato do modelo passou a dificultar a formalização da relação entre gramática e processador. Um terceiro momento surge na década de 90, com o Programa Minimalista, que passa a considerar, em seu modelo de língua, restrições impostas pelas interfaces da língua com os sistemas de desempenho. Nesse cenário, a discussão acerca da relação processador lingüístico-gramática pode ser retomada e novos direcionamentos de pesquisa podem ser concebidos. 9 Hauser, Chomsky & Fitch (2002) referem-se ao sistema computacional em si como FLN (Faculty of Language in the narrow sense) e ao conjunto deste com os demais sistemas cognitivos como FLB (Faculty of Language in the broad sense). 28 Um princípio que orienta o funcionamento do sistema computacional é o Princípio da Interpretabilidade Plena (Full Interpretation). De acordo com esse princípio, só pode chegar aos níveis de interface informação passível de ser lida pelos sistemas que interagem com a língua nesses níveis; cabe ao sistema computacional da língua, portanto, eliminar informação não-interpretável nas interfaces. A interpretabilidade constitui uma propriedade de traços do léxico. Cada item lexical é um conjunto de traços semânticos, fonológicos e formais. Traços semânticos seriam interpretáveis na interface semântica e traços fonológicos seriam interpretáveis na interface fonética. Quanto aos traços formais, estes são aqueles relevantes para as operações do sistema computacional (ex.: gênero, número, pessoa, caso, etc) e podem ser interpretáveis ou não em FormaLógica. Duas possibilidades de pareamento de traços interpretáveis e nãointerpretáveis são consideradas no Programa Minimalista: através de um mecanismo de checagem de traços (Chomsky, 1995) e através de um mecanismo de valoração de traços (Chomsky, 1998, 1999). Na checagem, assume-se que todos os itens entrariam na derivação sintática com o valor de seus traços já especificado e no curso da computação sintática os traços não-interpretáveis seriam pareados aos interpretáveis, seus valores seriam checados e os nãointerpretáveis seriam eliminados. Na valoração, os traços não-interpretáveis são valorados no curso da computação sintática, também a partir do pareamento com traços interpretáveis de mesma dimensão. O ponto de envio das informações para as interfaces Forma Lógica e Forma Fonética é chamado de Spell-Out. A operação que serve para concatenar objetos sintáticos é a operação Merge, a qual é implementada sem qualquer custo computacional, e a operação que permite deslocar objetos para posições mais altas na estrutura sintática (ex. interrogativas) é a operação Move, esta com custo computacional. No que tange especificamente à questão da concordância sujeito-verbo, pode-se dizer que uma mudança importante ocorre no Minimalismo: a concordância passa a ser concebida como uma relação entre constituintes sintáticos, numa ruptura à visão assumida desde Polock (1989), em que a concordância era tratada em termos de uma projeção funcional AGR (agreement) para onde o verbo se movia a fim de receber marcas flexionais10. Essa mudança é 10 Polock (1989) propõe a cisão da categoria funcional IP (inflectional phrase) em duas categorias funcionais: TP (tense phrase) e AgrP (agreement phrase). Cada uma dessas categorias ocupa uma 29 determinada por restrições de legibilidade, pois a presença de marcas de concordância careceria de correlato semântico nas línguas. Em Chomsky (1995), a concordância sujeito-verbo é explicada em termos de checagem de traços, numa posição estrutural de especificador-núcleo. O verbo inicialmente se move de sua posição de origem (núcleo de VP) para uma posição mais alta na estrutura, no caso TP, a fim de checar seus traços de tempo. TP, por sua vez, precisa de um elemento de uma dada categoria (com um traço D) em seu especificador, o que deflagra o movimento do sujeito para essa posição. T tem então seu traço D checado e apagado e o sujeito tem seu traço de caso checado por T. É nessa configuração de especificador-núcleo que se dá a checagem dos traços interpretáveis do sujeito com os traços não-interpretáveis do verbo. Em Chomsky (1999), que assume a idéia de valoração, a concordância entre sujeito-verbo é implementada via uma operação sintática chamada Agree, que permite o pareamento de traços de mesma dimensão entre uma sonda (probe) e um alvo (goal), numa configuração de c-comando. Quando a sonda e o alvo se combinam, os traços φ não-interpretáveis da sonda são valorados. O traço de caso do alvo é definido como reflexo dessa operação. No caso da concordância entre sujeito e verbo, o núcleo T da categoria TP é a sonda (probe), com traços φ nãointerpretáveis que precisam ser valorados. Essa sonda procura um alvo (goal) e encontra o sujeito com traços φ interpretáveis, o que permite que a valoração se efetue: Agree valora os traços não-interpretáveis de T e o traço de caso do sujeito passa a ser nominativo. Concomitantemente à atuação de Agree, ocorre o movimento do sujeito para a posição de especificador de T, em função de um traço EPP (extended projection principle). O verbo se move para T e lá recebe informação de tempo e número/pessoa. posição específica na estrutura sintática e há longos debates acerca de qual das categorias dominaria a outra –se TP dominaria AgrP, como propõe Polock ou se AgrP dominaria TP, como propõe Belletti (1990), para as línguas românicas. A especificação de informação relativa a número/pessoa e tempo do verbo nesse momento da teoria é resultante de um movimento do verbo de sua projeção máxima para os núcleos Agr e T. O sujeito, por sua vez, nasce em uma posição interna ao VP, na posição de especificador, onde recebe papel temático do verbo. O caso do sujeito, no entanto, não pode ser atribuído nessa posição, visto que o verbo só atribui caso a seu complemento. O sujeito então se move para projeções acima de VP a fim de receber caso. A concordância, portanto, não é relacional, pois ela não é resultante de um pareamento de informação de número/pessoa do sujeito e do verbo, estabelecida numa dada configuração sintática. 30 CP C’ C TP T’ T Tempo 3µPess. S µ Num EPP vP DP v’ 3ª pessoa Sing. µCaso VP V DP Fig. 4: Computação da concordância através da operação Agree. Ponto da derivação em que a sonda T tem seus traço não-interpretáveis de número e pessoa valorados pelos traços interpretáveis de mesma dimensão do alvo, o DP em especificador de vP. Um aspecto importante em relação à geração de sentenças no Minimalismo é que esta se faz por aplicações sucessivas de operações computacionais que devem exaurir uma numeração. Isto é, assume-se uma abordagem derivacional da geração de sentenças. A derivação estará completa quando todos os itens da numeração forem utilizados. Isso se torna ainda mais dinâmico no modelo de 1999, em que é adotada a noção de fase. A idéia é que a derivação procederia por blocos, definidos por sub-arranjos de itens lexicais disponibilizados na Numeração. Passa-se a assumir que haveria múltiplos Spell-Outs durante a derivação sintática, o que permitiria que os níveis de interface fossem alimentados dinamicamente. Cumpre ainda chamar a atenção para o pressuposto de que a sintaxe opera apenas com traços formais da língua. Traços fonológicos não são levados em conta pelas operações do sistema computacional. Isso é compatível com a idéia de que informação fonológica só seria inserida após a sintaxe.11 Conforme nota 11 A noção de inserção tardia de traços fonológicos já aparece indicada em Chomsky (1995, nota 10, p.381): “Indications of syllabic and intonational structure are not contained in lexical items. Nor is a good part of the output phonetic matrix: input and output are commonly quite different. Under the Distributed Morphology theory of Halle and Marantz (1993) and Marantz (1994), 31 Augusto (no prelo) a idéia de inserção tardia defendida pela Morfologia Distribuída (Halle & Marantz, 1993; Harley e Noyer, 1999) aplica-se bem ao modelo de 1999, em que traços não-interpretáveis entram na derivação sem valor definido. A idéia é que informação de natureza fonológica seria inserida após Spell-Out, através de Itens de Vocabulário, que seriam o conjunto de sinais fonológicos disponíveis em uma dada língua para a expressão de morfemas abstratos. A sintaxe estabeleceria uma relação entre o fragmento fonológico e uma posição sintática determinada. Assim, segundo Augusto, pode-se incorporar ao modelo de 1999 um componente morfológico flexional situado entre Spell-Out e PF. 3.2 Formulação sintática e derivação sintática Vimos na seção anterior que o sistema computacional das línguas humanas, embora faça interface com o sistema conceptual-intencional e com o sistema fonético-articulatório, não sofre interferência de informação proveniente desses sistemas cognitivos no curso da derivação de uma sentença; logo, um tratamento da concordância que busque integrar teoria lingüística e processamento deve assumir uma perspectiva modular do processo de produção de sentenças, com um formulador sintático que atue de forma autônoma. Os modelos de produção não-interativos parecem ser, em princípio, compatíveis com o modelo de língua assumido no Minimalismo. A seguir, considera-se essa possibilidade de compatibilização no que diz respeito ao processo de formulação de sentenças e, em particular, ao processamento da concordância. De acordo com modelos não-interativos que assumem uma arquitetura semelhante à de Levelt (1989), o processo de formulação sintática de um enunciado, em um modelo de produção, tem início com a concepção da mensagem, a que se segue a busca de representações lexicais com propriedades semânticas que possam servir para expressar as idéias pretendidas. No Minimalismo, a derivação sintática de uma sentença tem como ponto de partida uma dada Numeração (ou sub-arranjos de uma Numeração), a qual reúne os itens lexicais selecionados do Léxico. phonological features do not appear at all in the NÆλ computation, words being distinguished (say, dog vs. cat) only within the phonological computation”. 32 A concepção de item lexical como um conjunto de traços semânticos, formais e fonológicos é compatível com o tratamento dado aos itens lexicais em teorias de acesso lexical, que consideram a existência de três estratos lexicais: um estrato conceitual, que reuniria conceitos lexicais associados a uma dada palavra; um estrato dos lemas, em que estaria representada informação acerca de propriedades gramaticais dos itens lexicais, e um estrato da forma, que teria informação relativa a morfemas e segmentos fonêmicos, os quais constituem o lexema de um item lexical (cf. Levelt et al., 1989). Outro ponto de compatibilidade é a idéia de que existem dois tipos de traços formais (interpretáveis e não-interpretáveis) e que um deles só tem seu valor definido a partir de operações que ocorrem em um componente sintático. Conforme visto na seção 2, em Chomsky (1999) considera-se que os traços nãointerpretáveis, isto é, aqueles que apresentam uma função sintática pura, são valorados no curso da derivação sintática e eliminados antes de chegarem à Forma Lógica. Na proposta de Levelt et al. (1999), os lemas apresentam parâmetros diacríticos que precisam ser definidos. Alguns desses diacríticos têm seu valor estabelecido com base em informação proveniente de uma representação conceitual, como é o caso do traço de tempo expresso no verbo. Outros, por sua vez, são valorados durante a etapa de codificação gramatical, como o traço de número do verbo, o qual assume o mesmo valor do traço de número do sujeito. Em relação às etapas envolvidas no processo de codificação gramatical, é possível tentar caracterizá-las em termos das operações implementadas pelo sistema computacional da língua, que busca construir objetos sintáticos a partir de itens selecionados do léxico. A definição de Spell-Out como um ponto de envio de informação para os níveis de interface também parece ser compatível com a idéia de que, na produção de sentenças, o resultado da codificação gramatical é encaminhado para a codificação morfofonológica a fim de poder ser posteriormente articulado. Esse nível da codificação morfofonológica nos modelos de produção encontra um paralelo em um componente morfológico (ou morfofonológico), que estaria situado entre Spell-Out e PF no modelo de valoração de Chomsky (1999), o qual, conforme visto, é compatível com a idéia de inserção tardia de Itens de Vocabulário, nos moldes propostos pela Morfologia Distribuída. Esse componente morfológico lidaria com morfemas abstratos, resultantes de operações do sistema computacional, aos quais se associaria 33 conteúdo fonológico. Os Itens de Vocabulário seriam o conjunto de sinais fonológicos disponíveis em uma dada língua para a expressão desses morfemas abstratos. Nos modelos de produção, os chamados lexemas, recuperados do léxico no momento da codificação morfofonológica, podem ser tomados como elementos equivalentes aos Itens de Vocabulário. O quadro a seguir, reproduzido de Corrêa (submetido), permite visualizar as correspondências entre etapas envolvidas na produção e na derivação de sentenças: Produção 1 Intenção de fala / conceptualização de uma mensagem 2 Acesso a elementos de categorias funcionais e a elementos de categorias lexicais no Léxico Mental correspondentes a uma unidade de processamento 3 Manutenção de representações correspondentes ao lema dos elementos recuperados do léxico 4 Formulação sintática incremental (montagem de uma estrutura hierárquica) 5 Linearização (posicionamento dos constituintes hierarquicamente relacionados) 6 Recuperação de lexemas e codificação morfofonológica 7 8 Planejamento articulatório Realização da fala Derivação Constituição da Numeração a partir de elementos recuperados do léxico (matrizes constituídas por traços semânticos, fonológicos e formais) Numeração constituída – apenas os traços formais são relevantes para a derivação Computação sintática (em fases) Computação com operação de movimento Spell out (via sintática da bifurcação) Derivação que resulta em PF (via componente fonológico, os traços fonológicos passam a ser relevantes) Interface FP (com correspondente LF) Outro aspecto que aproxima o modelo de língua dos modelos de produção é a abordagem derivacional e a idéia de fases. No Minimalismo, adota-se uma abordagem derivacional de geração de frases, de acordo com a qual a sentença é o resultado de aplicações sucessivas de operações computacionais. No modelo de valoração, considera-se também que existem pontos de envio de informação para a Forma Fonética e que o material enviado corresponde ao que integraria uma dada fase computacional. Esse funcionamento do sistema computacional é compatível com a idéia de que a estrutura sintática da sentença vai sendo construída de modo incremental (ou moderadamente incremental) e com idéia de que haveria unidades de processamento mantidas em uma memória de trabalho. Uma fase equivale no modelo de língua a um domínio estrutural, em que relações temáticas seriam estabelecidas – o vP , ou a um domínio estrutural em que relações proposicionais são consideradas - o CP. Em que medida cada um desses 34 blocos corresponde a uma unidade de processamento é um ponto de investigação que vem sendo considerado tanto no desenvolvimento de alguns modelos psicolingüísticos que tratam de forma integrada a produção e a compreensão de sentenças (cf. Corrêa & Augusto, 2005) como também em modelos computacionais de parsing, que assumem uma computação sintática com sondas (probes) e alvos (goals), como no modelo de valoração de traços do Minimalismo (cf. Fong, 2004). Ainda quanto ao modo como transcorre uma dada derivação sintática, um aspecto a ser considerado é a direção em que se dá a montagem da estrutura sintática. No modelo proposto em Chomsky (95, 98, 99), a derivação sintática é bottom-up e a adição de novo material é feita no topo da árvore sintática. Assim, numa frase como Paulo comeu o bolo, primeiro há a formação do DP o bolo, que é concatenado ao verbo comer na posição de argumento interno desse verbo; depois disso, Paulo é concatenado ao conjunto comeu o bolo, em uma posição à esquerda desse sintagma.12 No entanto, quando se considera o processo tanto de produção quanto de compreensão de sentenças, verifica-se um outro direcionamento: as sentenças são formuladas e compreendidas da esquerda para a direita, de modo incremental. Phillips (1996) apresenta uma possível solução para esse ponto. Inserido em uma perspectiva gerativista de análise lingüística, Phillips busca especificar um sistema unificado para gramática e processamento e propõe que a gramática é um sistema de construção de estrutura que opera de modo incremental, da esquerda para a direita. Apresenta como evidências para sua proposta o exame de testes de constituência em inglês, incluindo movimento, elipse, coordenação, escopo e ligação. O autor parte da constatação de que os resultados de testes de constituência são muitas vezes conflitantes e mostra que a solução para o problema de constituência está em propriedades de construção de estrutura de modo incremental. Com a idéia de derivação da esquerda para a direita, Phillips aproxima o modo de funcionamento da gramática do processador, unificando-os em um único sistema. O problema dessa abordagem é que, ao se assumir uma integração gramática/processador, erros de concordância precisam ser relacionados a falhas no componente sintático da língua, e torna-se difícil 12 Note-se que apresentamos uma versão simplificada da composição da sentença Paulo comeu o bolo. Numa análise detalhada, seria necessário considerar projeções funcionais como TP e vP. 35 explicar, mantendo-se a idéia de sintaxe autônoma, a interferência de fatores semânticos e morfofonológicos. Um caminho alternativo para se discutir a relação gramática/processador é apontado por Corrêa (2005 a; submetido). Segundo a autora não se pode afirmar que gramática e processador são um sistema único, dado que a derivação envolve operações de movimento que não encontram correspondente em tempo real (estas seriam indicativas de processos bem iniciais da aquisição da linguagem quando parâmetros de ordem são fixados). A gramática seria uma entidade virtual, correspondente à capacidade computacional da língua, que teria como operação básica a concordância. Concordância, nesse sentido, tomada de forma genérica (Corrêa, 2005 b) assumindo Adger (2003), seria a operação que permitiria o pareamento de traços formais interpretáveis com seus homólogos não interpretáveis, de modo a atender o Princípio da Interpretabilidade Plena (Full Interpretation), o qual garante que expressões lingüísticas possam ser faladas e analisadas. Essa distinção parece bastante relevante, pois permite dar conta da produção e da compreensão e separar as operações do sistema computacional das ações do parser e do formulador, as quais têm propriedades específicas.13 Quanto aos erros de concordância, estes não ocorreriam durante a codificação gramatical, isto é, quando se dá propriamente a computação da concordância, mas sim seriam pré ou pós-sintáticos, mantendo-se, dessa forma, a autonomia do formulador sintático na produção de sentenças. Fong (2004) implementa computacionalmente um modelo de parsing que estaria dentro do “espírito” de Corrêa (2005 a; submetido) no que tange à relação entre gramática e processador. O autor assume uma perspectiva de parsing incremental, da esquerda para a direita, o que é compatível com o modo como as sentenças vão sendo percebidas, e assume que o parser, no processo de análise da estrutura sintática, valoraria traços formais dos itens lexicais a partir da operação Agree, que atuaria entre uma sonda e um alvo em uma dada configuração estrutural. A gramática não é o parser, visto que este possui um modo de funcionamento próprio, com mecanismos de armazenamento e recuperação de informação necessária à computação sintática da sentença. Além disso, diferentemente do que se assume para uma derivação sintática no Minimalismo, 13 Para uma visão detalhada da proposta de Corrêa, ver também Corrêa & Augusto (2005) e Corrêa (2005 a; submetido). 36 Fong propõe que a derivação é top-down, lançando mão para isso de representações de estruturas sintáticas elementares (conforme proposto no contexto das Tree Adjoining-Grammars14), que seriam ativadas no parsing. Logo, embora operações gramaticais implementadas pelo parser possam ser caracterizadas conforme vem sendo proposto no modelo de Chomsky (1999), não há uma identidade entre gramática e processador. No modelo de produção que será apresentado no capítulo 7 essa separação entre gramática e processador é assumida. Será visto como a computação sintática da concordância, passível de ser caracterizada em termos de valoração de traços formais, é implementada em um modelo de produção que incorpora um parsermonitorador. 14 Tree Adjoining-Grammar (TAG) é uma meta-linguagem formal que permite expressar generalizações sintáticas. Definida por Joshi e colegas (1975; 1985), é freqüentemente utilizada em Lingüística Computacional. A unidade sintática primitiva das TAGs são árvores elementares que consistem de um núcleo lexical e do(s) argumento(s) que o núcleo licencia. Estas árvores podem se combinar a outras por meio de operações específicas (chamadas substituição e adjunção), o que permite representar a estrutura das sentenças. Segundo Ferreira (1999),as TAGs instanciam análises sintáticas em uma dada notação formal, sendo, pois, possível empregar esse formalismo para diferentes abordagens teóricas – Minimalismo (Chomsky, 1995); Gramática Léxico-Funcional (Bresnan, 1982), etc. 37 4 A investigação de erros de produção no estudo do processamento da concordância sujeito-verbo Grande parte das pesquisas sobre produção da linguagem desde o trabalho seminal de Garrett (1975, 1980) tem se baseado no estudo de erros ou lapsos de fala/escrita A análise da natureza desses erros bem como das unidades afetadas tem permitido o desenvolvimento de modelos de produção da linguagem, em que são caracterizadas as unidades de processamento e as etapas envolvidas no processo de formulação de sentenças. Erros de atração no estabelecimento da concordância sujeito-verbo vêm sendo amplamente reportados na literatura em diferentes línguas, tanto no que se refere à produção oral (Bock & Miller, 1991; Bock & Cutting, 1992; Bock & Eberhard, 1993; Vigliocco & Nicol, 1998; Franck, Vigliocco & Nicol, 2002, entre outros), quanto no que diz respeito à produção escrita (Fayol et al. 1994). O estudo desses erros tem permitido a formulação de hipóteses acerca de como as relações de concordância são processadas, quais os fatores atuantes no processamento e em que momento do processo de formulação de sentenças a concordância é computada. Nesta seção, serão apresentados resultados experimentais acerca dos fatores que interferem no processamento da concordância. Como será visto em detalhes no capítulo 8, a tarefa empregada nos estudos sobre concordância é de produção induzida de erros e consiste na produção de uma frase com verbo flexionado que tem como sujeito um preâmbulo, o qual é apresentado por via oral ou escrita. A tarefa do participante é repetir oralmente o preâmbulo e completar a frase com um verbo. Os preâmbulos são sempre constituídos de um elemento nominal, que funciona como núcleo do sujeito, seguido de um núcleo nominal interveniente, também chamado de nome local, que aparece em um sintagma modificador do sujeito (ex.: O rótulo das garrafas). Nesses experimentos, o total de erros produzido por condição experimental é tomado como variável dependente15 e manipulam-se fatores de natureza semântica, sintática e morfofonológica. 15 Variável dependente é a variável observada em um experimento ou estudo cujas mudanças são determinadas pela presença ou intensidade de uma ou mais variáveis independentes (i.e. variáveis manipuladas no experimento). 38 4.1 Tipos de erros e fatores atuantes no processamento da concordância 4.1.1 Fatores semânticos Os trabalhos que se voltam para a investigação de fatores semânticos no processamento da concordância, em particular para a interferência de uma representação semântica de número, tomam como variáveis independentes16 a distributividade do DP sujeito e o número conceitual dos núcleos nominais do sujeito. No primeiro caso, busca-se verificar se informação acerca da referência, expressa pelo sujeito, pode interferir no processamento da concordância; no segundo caso, avalia-se em que medida uma situação de incongruência entre número conceitual e número gramatical de um dos termos do sujeito pode favorecer a ocorrência de erros de atração. A seguir, apresentam-se, separadamente, os resultados obtidos nessas duas frentes. 4.1.1.1 Distributividade Um primeiro trabalho a investigar um possível efeito de distributividade no estabelecimento da concordância verbo-sujeito foi realizado por Bock & Miller (1991), com falantes de inglês. No experimento, os pesquisadores solicitavam aos participantes que repetissem um fragmento de sentença (preâmbulo), apresentado auditivamente e, em seguida, que completassem a sentença. Entre as variáveis independentes, manipulou-se a distributividade do DP sujeito – se este fazia referência a uma instância única de um dado referente (single token): the bridge to the islands (a ponte para as ilhas), ou se permitia a referência a várias instâncias (multiple token): the picture on the postcards (a figura nos cartões-postais). Não se verificou diferença significativa na distribuição de erros entre os dois tipos de preâmbulos considerados, em nenhuma das condições. Os dois tipos de preâmbulos apresentaram um comportamento bastante semelhante, tendo se observado, em ambos os casos, apenas um efeito de incongruência de número entre o núcleo do sujeito e o nome local, com predomínio de erros nas condições núcleo do sujeito singular/nome local plural. 16 Variável independente é a variável manipulada em um experimento ou estudo cuja presença ou intensidade determina a mudança na variável observada, a variável dependente. 39 Vigliocco, Butterworth & Semenza (1995) identificaram um efeito de distributividade do DP sujeito para o italiano, em experimentos de produção induzida de erros envolvendo língua falada e língua escrita. O experimento de língua falada empregava exatamente a mesma técnica adotada por Bock & Miller (1991); o de língua escrita consistia na apresentação, por escrito, na tela de um computador, de um adjetivo seguido de um preâmbulo. A tarefa do sujeito era repetir o preâmbulo e produzir oralmente uma frase empregando o adjetivo que havia aparecido na tela. Foi manipulado o número do adjetivo, de modo a que ora houvesse congruência, ora incongruência em relação ao número do núcleo do sujeito. No caso de incongruência, os sujeitos deveriam alterar a forma do adjetivo para obter a concordância correta. Essa segunda técnica foi criada com o intuito de tentar induzir mais erros de concordância, uma vez que nos experimentos anteriores a magnitude do efeito de distributividade havia sido pequena. A análise de variância, por meio de ANOVA17, revelou um efeito principal18 tanto do número do adjetivo quanto de distributividade, com mais erros quando o núcleo do sujeito apresentava uma interpretação preferencial de multiple token, isto é, uma referência a várias entidades. Houve também uma interação significativa19 entre as duas variáveis, o que significa que a presença de um adjetivo com número incongruente em relação ao núcleo do sujeito aumentou a probabilidade de erro. Os autores atribuíram o efeito de distributividade obtido em italiano ao fato de esta ser uma língua de morfologia rica, com possibilidade de sujeito pós-verbal e também com possibilidade de sujeitos nulos. A hipótese considerada foi que, como nessa língua nem sempre informação gramatical acerca do número do sujeito estaria prontamente acessível (visto ser possível uma oração sem sujeito explícito e a ocorrência de sujeito após o verbo), o número do verbo seria 17 ANOVA é um método estatístico para comparação simultânea entre duas ou mais médias; um método estatístico que gera valores que podem ser testados de forma a determinar se existe uma relação de significância entre as variáveis. 18 Efeito principal: efeito da variável investigada, considerado independentemente da interação com qualquer outro fator examinado. 19 Efeito de interação: efeito do cruzamento de duas ou mais variáveis independentes de modo a se verificar se a direção das médias em cada condição, definida pela manipulação de cada variável, é diferente em função desse cruzamento. 40 especificado com base em informação conceptual, proveniente do nível em que a mensagem é concebida. Apenas num momento posterior, a concordância sintática entre o sujeito e o verbo seria computada. Note-se que, nessa proposta, a concordância é vista como uma operação de unificação da informação relativa a número presente no sujeito e no verbo. O efeito semântico seria, pois, determinado por uma interferência de número conceitual proveniente do nível da mensagem na computação da concordância. Vigliocco, Butterworth & Garrett (1996) também obtiveram um efeito de distributividade no estabelecimento da concordância em dois experimentos com falantes de espanhol, o que foi considerado como mais uma evidência de que fatores estruturais seriam responsáveis pelas diferenças entre as línguas examinadas. Com o intuito de verificar se realmente tais fatores poderiam explicar o comportamento distinto do espanhol e do italiano em relação ao inglês, Vigliocco et al. (1996) conduziram uma série de experimentos com francês e holandês, línguas que, em termos de suas propriedades estruturais, apresentam semelhanças com o inglês, por um lado, e com o espanhol/italiano, por outro. Em holandês, não é possível omitir o sujeito, mas este pode ocorrer em posição pós-verbal e as formas verbais são sempre marcadas para número. No francês, não é possível omitir o sujeito e não há ocorrência de sujeito em posição pós-verbal. Quanto à morfologia verbal do francês, a despeito de distinções relativas a pessoa e número só serem explicitadas na língua escrita, os autores consideraram que nesse aspecto o francês se aproximaria mais do espanhol e do italiano. A tabela a seguir, reproduzida de Vigliocco et al. (1996), permite visualizar melhor as diferenças estruturais entre as línguas examinadas, segundo análise dos autores. Italiano Espanhol Holandês Francês Inglês Sujeito nulo Sujeito pós-verbal + + - + + + - Morfologia verbal rica + + + + - Com base nas características estruturais de cada língua, as previsões foram as seguintes: caso a possibilidade de sujeito nulo fosse o fator crucial para explicar as diferenças obtidas, o francês e o holandês deveriam se comportar como 41 o inglês; caso a possibilidade de posposição do sujeito fosse o fator mais relevante, o francês deveria se comportar como o inglês, e o holandês como o espanhol e o italiano; por outro lado, se a riqueza da morfologia verbal fosse o fator determinante das diferenças, tanto o holandês quanto o francês deveriam apresentar comportamento semelhante ao do italiano e do espanhol e distinto daquele do inglês. Houve efeito de distributividade nos experimentos conduzidos tanto em holandês quanto em francês, resultado compatível apenas com a hipótese da riqueza da morfologia verbal. Difícil é, no entanto, relacionar esse efeito semântico ao fato de o verbo trazer marcas explícitas de distinções de número e pessoa. Segundo Vigliocco et al. (1996), como em inglês a morfologia verbal limita-se a uma distinção entre uma forma marcada (3ª pessoa do singular) e as outras formas, pode-se dizer que na maior parte das vezes ela não porta qualquer informação acerca do número de participantes existentes no cenário descrito pela sentença. Já nas outras línguas analisadas, a morfologia verbal seria altamente informativa, o que é interpretado como indicativo de que a informação de número do verbo é definida diretamente do nível da mensagem. Nessas línguas, portanto, o efeito de distributividade seria decorrente de uma incongruência entre informação gramatical de número do sujeito e informação de número no verbo. Em inglês, o efeito de distributividade não induziria erros de concordância porque a informação de número do verbo seria herdada diretamente do sujeito da sentença. Experimentos posteriores realizados por Eberhard (1999) revelaram, contudo, um efeito de distributividade também para o inglês. Segundo a autora, esse efeito não havia sido observado antes em função do tipo de preâmbulo utilizado por Bock & Miller (1991). Os referentes expressos pelos preâmbulos eram pouco concretos, difíceis de serem ativados ou recuperados da memória, o que possivelmente reduziu a acessibilidade do número conceitual dos sintagmas. Para avaliar essa hipótese, Eberhard procurou ampliar o grau de concretude dos preâmbulos. Para garantir que os sintagmas receberiam a interpretação esperada (single token ou multiple token), foram apresentados, juntamente com os sintagmas, figuras dos referentes. Por exemplo, para o preâmbulo The picture on the postcard, era projetada, um segundo antes da apresentação auditiva do estímulo, a imagem de dois cartões-postais com a imagem de um mesmo navio. 42 Os resultados indicaram que mais erros de concordância no plural foram produzidos nas condições com sintagmas distributivos do que naquelas de referente único. Nenhum erro foi cometido nas situações controle, em que o termo local ficava no singular tanto para referentes distributivos quanto para referente únicos. Um segundo experimento foi feito para excluir a possibilidade de os resultados terem sido determinados pela presença das figuras. A condução do experimento 2 foi a mesma do experimento 1, exceto pelo fato de se apresentar uma tela vazia no lugar das figuras. Assim como no experimento 1, não foram registrados erros nas situações controle e ocorreram mais erros de concordância na condição referente-distributivo do que na condição referente-único. Também foi conduzido um terceiro experimento, empregando-se os mesmos preâmbulos experimentais de Bock & Miller (1991), mas com o procedimento do experimento 2. Não houve efeito de distributividade, o que foi tomado como indicativo de que a acessibilidade conceitual foi o fator responsável pelos resultados obtidos em 1. Além dos três experimentos, foram realizados ainda dois estudos com a finalidade de avaliar o grau de concretude dos sintagmas empregados. Por grau de concretude, Eberhard entendia a maior ou menor facilidade de um dado sintagma evocar uma imagem mental do seu referente. Foi verificada uma correlação positiva entre o grau de concretude atribuído aos sintagmas e o número de erros de concordância que esses sintagmas induziram: os sintagmas indicados como mais concretos foram os que levaram os sujeitos a cometer mais erros de concordância. Eberhard (1999) considerou esse resultado uma evidência adicional de que o acesso ao número conceitual na concordância está relacionado à facilidade com que a representação mental de um referente potencial pode ser ativada ou recuperada da memória. Logo, também para o inglês distributividade é um fator que pode atuar no processamento da concordância, ao contrário do que foi observado originalmente por Bock & Miller (1991). Cumpre observar que, em todos os experimentos reportados, os efeitos de distributividade não podem ser completamente dissociados de um efeito morfofonológico de número, visto que os sintagmas distributivos testados sempre possuíam um núcleo interveniente plural. Neste trabalho, avalia-se se um efeito de distributividade dissociado desse tipo de informação morfofonológica pode ser 43 obtido. Para isso, constrastam-se preâmbulos do tipo O volante dos carros x O volante de cada carro. Diferenças entre os dois tipos de sintagma e os resultados experimentais são comentados no capítulo 8, experimento 5. 4.1.1.2 Coletivos, bipartidos e pluralia tantum A informação gramatical de número associada aos nomes é, em geral, compatível com uma representação semântica, sendo poucos os casos de incongruência entre esses dois tipos de informação. Isso ocorre particularmente no caso de substantivos coletivos que, quando no singular, designam um conjunto de seres ou de objetos considerados como um todo, o que remete a uma pluralidade conceitual (ex. manada), e no caso de alguns substantivos de número privativo plural, que são empregados em referência a um objeto único (ex. óculos). Caso informação semântica de número codificada no item lexical venha a interferir na concordância, pode-se esperar um maior número de erros com preâmbulos em que tais substantivos compareçam. Não há, contudo, evidências conclusivas nessa direção no que tange à concordância verbal. Quando apenas o número nocional de substantivos coletivos está em jogo, não há efeito de atração: os verbos tendem a concordar com o número gramatical do núcleo do sujeito, independentemente da posição do coletivo (a manada do elefante; o elefante da manada). No entanto, quando o coletivo está no plural (os rebanhos da fazenda; o pastor dos rebanhos), verificase uma diferença entre preâmbulos com coletivos e não-coletivos no total de erros de atração (Bock & Eberhard,1993; Greth, 1999; Bock, Nicol & Cutting, 1999; Bock et al. 2001; Bock, Eberhard & Cutting, 2004). A possibilidade de preâmbulos com coletivos induzirem erros de atração foi investigada por Bock & Eberhard (1993). Os autores manipularam o número do termo local (singular vs. plural) e o tipo de termo local (coletivo vs. não-coletivo). Entre os termos não-coletivos, foram selecionados dois tipos de substantivos: substantivos semanticamente relacionados aos coletivos (ex. soldier “soldado” para o coletivo army “exército”) e substantivos cuja freqüência de uso fosse a mesma dos coletivos. Os resultados obtidos revelaram apenas um efeito da variável número do termo local, tendo ocorrido mais erros após termos locais no plural do que no singular, o que foi interpretado como ausência de efeito semântico no processamento da concordância. Note-se, porém, que, embora não 44 tenha sido significativa, houve uma tendência de substantivos coletivos no plural (The condition of the fleets) induzirem mais erros de concordância do que substantivos não-coletivos dos dois tipos – semanticamente relacionados (The condition of the ships) ou de mesma freqüência (The condition of the pans).20 Greth (1999), em experimento realizado com falantes de espanhol, obteve resultados semelhantes. Embora tenha ocorrido apenas um efeito principal da variável número do termo local, quando se examina a distribuição dos erros nas condições com termo local plural, verifica-se que houve aproximadamente quatro vezes mais erros após substantivos coletivos (La fuerza de los ejércitos) do que após substantivos não-coletivos (La fuerza de los soldados), o que também parece indicar algum tipo de efeito semântico associado a um fator morfofonológico. A interpretação dada pela autora para esses resultados foi a de que os termos locais coletivos com valor de plural seriam duplamente marcados em relação à pluralidade e isso aumentaria a possibilidade de erros. De acordo com Greth (1999), a marca de pluralidade nocional, contudo, seria menos proeminente do que a de pluralidade gramatical e, por isso, não teria efeito no caso de substantivos coletivos no singular. Outra possibilidade que podemos considerar é a de que os participantes do experimento tenham atribuído uma leitura distributiva aos preâmbulos com substantivos coletivos no plural.21 Note-se que, nesse caso, embora o efeito continue sendo semântico, ele não pode ser atribuído a propriedades lexicais dos coletivos, mas sim à leitura distributiva do DP sujeito e só se manifestaria quando associado a um fator morfofonológico. Quanto à diferença entre coletivos e nãocoletivos plurais, é possível que alguns preâmbulos com os substantivos nãocoletivos (ex. La foto de los jugadores “a foto dos jogadores”) tenham recebido 20 Bock et al. (2001, experimento 3) replicaram o experimento de Bock & Eberhard (1993) e também não obtiveram efeito de número nocional, nem mesmo quando se avaliou a interação desta variável com o número do termo local. Diferentemente de Bock & Eberhard, contudo, não se observa uma tendência de maior número de erros para os coletivos. Cabe notar, no entanto, que nas respostas do tipo miscelânea (que reúne as situações em que houve erro na repetição do preâmbulo), o total de verbos no plural é maior para os coletivos do que para os não-coletivos. É possível que, ao repetir preâmbulos com coletivos (ex. A força dos exércitos), os participantes tenham colocado o núcleo do sujeito no plural (ex. As forças dos exércitos), o que indicaria uma possível leitura distributiva do sujeito. 21 Comparem-se os preâmbulos La fuerza del ejército (a força do exército) e La fuerza de los ejércitos (a força dos exércitos). Embora nos dois casos esteja presente um substantivo coletivo na posição de nome local, apenas no segundo é possível distribuir a idéia de força por cada exército, o que poderia levar os participantes a produzir o verbo no plural. 45 uma leitura preferencial não-distributiva, o que pode ter se refletido no total de erros de atração obtido. 22 Bock, Nicol & Cutting (1999) realizaram experimentos com coletivos, a fim de verificar o impacto de informação nocional na concordância verbal e também na retomada de antecedentes por pronomes. Diferentemente do experimento de Greth, o coletivo foi empregado apenas no singular, na posição de núcleo do sujeito e manipulou-se o número do nome local – The cast in the soap opera (O elenco na novela) x The cast in the soap operas (O elenco nas novelas). Os erros após preâmbulos com coletivos foram comparados aos erros após preâmbulos cujo núcleo era um substantivo não-coletivo, no singular ou no plural, acompanhado de nome local singular ou plural – The actor(s) in the soap opera(s) (O(s) ator(es) na(s) novela(s)). Foi verificado que os verbos tendem a refletir o número gramatical do coletivo, enquanto os pronomes tendem a refletir o número nocional. Especificamente em relação à concordância verbal, é interessante reportar alguns contrastes entre coletivos e não-coletivos . Foi verificado que, quando seguidos de nome local plural, os coletivos induziram um número significativamente maior de erros de atração do que os nãocoletivos (The cast in the soap operas vs. The actor in the soap operas). Também merece registro o fato de que, embora tenha havido uma preferência por verbo singular na condição coletivo + nome local singular (The cast in the soap opera), esta condição também induziu erros de atração - 1/3 do total de verbos foi flexionado no plural. No primeiro caso, talvez a interferência possa ser explicada pela atribuição de uma leitura distributiva ao DP sujeito, visto que é possível imaginar, para o exemplo em questão, ‘um elenco específico para cada novela’. No segundo caso, é possível que, por limitações da memória de trabalho, seja mantida uma representação semântica do NP correspondente ao núcleo do sujeito, representação essa que poderia vir a interferir no processamento da concordância.23 22 Em La foto de los jugadores (a foto dos jogadores), pode-se imaginar tanto uma foto para cada jogador, como uma foto única em que todos os jogadores aparecem reunidos, possivelmente esta última a leitura preferencial. Já em La foto de los equipos (a foto das equipes), a leitura preferencial parece ser a distributiva, de uma foto de cada equipe. Nesse contraste específico, caso distributividade seja um fator relevante, seria esperado maior número de erros com o segundo preâmbulo. 23 Como e em que momento essa interferência ocorreria, será discutido no capítulo 9. 46 Bock, Eberhard & Cutting (2004, experimentos 2 e 4) também investigaram possível interferência de número nocional de coletivos na concordância verbal e na retomada pronominal. Em um dos experimentos, manipularam o tipo (coletivo vs. não-coletivo) e o número (singular vs. plural) do nome local: The record of the player(s) / The record of the team(s), tendo sido obtido um efeito principal de tipo e número do nome local, bem como uma interação entre as duas variáveis na análise por participantes. Tanto para os verbos quanto para os pronomes, a condição que induziu o maior número de erros de atração foi aquela com o coletivo no plural The record of the team(s). No outro experimento, foram manipulados o tipo de núcleo do sujeito (coletivo vs. não-coletivo) e o número do nome local (singular vs. plural): The player with the commercial contract(s)/ The team with the commercial contract(s). Houve um efeito significativo da variável tipo de núcleo do sujeito, mas claramente determinado pelo percentual de erros nas condições em que foi examinada a retomada pronominal. Também houve um efeito principal de número do nome local, com mais erros para o plural tanto com verbos quanto com pronomes. Quanto à interação entre as variáveis, verificou-se uma diferença significativa entre verbos e pronomes, para nomes locais no singular e no plural com sujeito coletivo. Isso significa que o preâmbulo The team with the commercial contracts (vs. The team with the commercial contract) afetou muito mais o processamento no caso de concordância verbal do que no caso de retomada pronominal. Bock et al. (2004) atribuem esse efeito à possibilidade de se realizar uma leitura distributiva do preâmbulo. Na retomada pronominal, essa diferença não se manifestaria tão forte, visto que o fator que parece ser mais relevante para a definição do número do pronome é o número nocional do antecedente (no caso, o coletivo). Quanto à interação entre as variáveis, verbos e pronomes exibiram resultados distintos para as condições singular e plural, quando o núcleo do sujeito era um substantivo coletivo. Enquanto para os verbos o preâmbulo com nome local plural (The team with the commercial contracts) induziu mais erros de atração que o preâmbulo com nome local singular (The team with the commercial contract), para os pronomes praticamente não houve diferença entre as condições. Bock et al. (2004) atribuem o resultado relativo aos verbos à possibilidade de se 47 realizar uma leitura distributiva do preâmbulo com nome local plural. No caso dos pronomes, a diferença entre as condições não se manifestaria tão forte, visto que o fator mais relevante para a definição do número do pronome seria o número nocional do antecedente (no caso, o coletivo). Ainda quanto a uma possível interferência de informação nocional de um dos termos do sujeito no processamento da concordância, cabe reportar resultados experimentais com nomes bipartidos e com substantivos pluralia tantum, obtidos por Bock et al. (2001). Os autores investigaram, em um conjunto de experimentos, aplicados a falantes de inglês e de holandês, se congruência entre informação gramatical e conceitual de número relativa ao sujeito poderia afetar a produção da concordância verbal. Em um experimento foram investigados substantivos bipartidos, os quais denotam objetos de partes simétricas (ex. óculos) e são empregados normalmente como plural em inglês e singular em holandês.24 Estes foram contrastados com substantivos de plural regular, isto é flexionáveis em número, a fim de verificar se os falantes das duas línguas associavam aos bipartidos uma idéia de multiplicidade25 ou uma idéia de singularidade (visto que denotam um objeto único), e como essa representação poderia afetar a computação da concordância. Os resultados obtidos foram os seguintes: em inglês, os bipartidos (que são gramaticalmente plural) induziram mais erros do que substantivos no singular, porém menos erros de atração do que as formas regulares de plural; no holandês, os bipartidos (que são gramaticalmente singular) não induziram praticamente 24 No português acontece um fenômeno bastante interessante em relação aos chamados bipartidos. Muitos deles têm deixado de ser empregados exclusivamente com determinantes no plural e passam a co-ocorrer na língua acompanhados de um determinante singular. O “s” final dos bipartidos, por sua vez, ora é analisado como uma marca flexional (ex.: minhas calças/minha calça), ora como parte do radical (ex. meus óculos/meu óculos). Tanto num caso como no outro, quando acompanhados de determinante no plural, também servem para designar mais de um objeto bipartido. Assim, emprega-se a expressão “meus óculos” para se referir tanto a um objeto único quanto a mais de um objeto do mesmo tipo. Exceção a esses exemplos é o substantivo “costas”, sempre empregado no plural em referência à parte posterior do tórax. O emprego exclusivo com determinante plural se deve ao fato de a forma singular “costa” expressar outro sentido, o de acidente geográfico. No inglês, embora Bock, Eberhard & Cutting. (2004) afirmem que os substantivos bipartidos são sempre empregados no plural, a consulta a dicionários vernáculos indica que também há registro de uso no singular para alguns dos bipartidos testados nos experimentos. Logo, as conclusões a que chegam os autores devem ser vistas com cautela. 25 Sobre a possibilidade de se atribuir uma idéia de plural a nomes bipartidos, os autores remetem a Reid, W. (1991) Verb and nou number in English. London: Longman. 48 erros de atração, tendo se comportado como a forma singular de substantivos flexionáveis. Considerados em conjunto, esses resultados sugerem que os falantes associam uma idéia de singularidade aos bipartidos; não fica, claro, contudo, porque no inglês os bipartidos induziram menos erros do que as formas regulares de plural, visto que ambos são gramaticalmente plural. Uma possibilidade seria que o número conceitual singular dos bipartidos geraria algum grau de interferência no processamento da concordância, reduzindo seu potencial de induzir erros de atração. Outra explicação seria a de uma interferência de natureza morfofonológica, relacionada à representação de informação gramatical de número em bipartidos e plurais regulares. Segundo Bock et al. (2001), o fato de não haver uma contraparte singular no caso dos bipartidos poderia reduzir o potencial que esses nomes teriam de induzir erros de atração.26 A fim de checar essas possibilidades, os autores conduziram um segundo experimento em inglês empregando substantivos pluralia tantum.27 Esse tipo de substantivo, assim como os bipartidos, é gramaticalmente plural em inglês, porém tende a ser concebido como múltiplo do ponto de vista nocional. Constituem, pois, em princípio, a situação apropriada para verificar se de fato foi um fator semântico, no caso a idéia de singularidade, que teria levado os falantes a produzirem menos erros de concordância com bipartidos do que com substantivos flexionados no plural. Se houver interferência semântica no processamento da concordância, a previsão é que não ocorra diferença quanto ao total de erros de atração induzidos por substantivos pluralia tantum e por substantivos flexionados, já que ambos são semanticamente plural. No entanto, se o tipo de plural gerar interferência, isto é, se informação gramatical associada à natureza do traço de número for relevante, é esperado que os pluralia tantum se comportem como os bipartidos, já que ambos são inerentemente marcados para número. 26 Não fica claro, no entanto, exatamente como isso se daria. Na seção 4.1.3, sobre fatores morfofonológicos, analisamos a diferença entre bipartidos e plurais regulares em termos de diferenças de traço de número (intrínseco e opcional) e em termos da realização morfofonológica dos traços de número. 27 Pluralia tantum é uma expressão tradicional da gramática latina que significa “apenas plural” . Em português são exemplos desse tipo de substantivo: afazeres, anais, arredores, bodas, condolências, confins, esponsais, fezes, exéquias, núpcias, parabéns, pêsames, primícias, víveres. 49 Os resultados obtidos são compatíveis com esta última hipótese: embora tanto plurais regulares quanto os pluralia tantum tenham induzido mais erros de atração do que os substantivos flexionáveis na forma singular, os pluralia tantum induziram menos erros do que os substantivos flexionados, numa réplica ao que se obteve com os bipartidos, o que parece indicar que não é informação de natureza semântica a responsável pela diferença obtida.28 Sintetizando, pode-se dizer que, em relação à concordância verbal, não há evidências de uma interferência direta do número nocional dos coletivos; no entanto, um efeito de distributividade parece atuar no processamento. Esse efeito se manifesta particularmente em preâmbulos cujo nome local é plural. No caso de nomes de número privativo plural, o fato de terem sido obtidos resultados semelhantes para bipartidos e substantivos pluralia tantum, a despeito de apresentarem representações conceptuais distintas quanto a numerosidade, sugere que o número conceitual de um item lexical não pode, isoladamente de outros fatores, interferir no processamento da concordância. O fato de tais substantivos induzirem menos erros do que os substantivos flexionáveis na forma de plural aponta para uma interferência de natureza morfofonológica. Logo, pode-se concluir que tanto o resultado referente a coletivos quanto o resultado referente a nomes de número privativo (bipartidos e pluralia tantum) sugerem que informação semântica de número afeta o processamento da concordância quando associada a uma interferência morfofonológica. Esse aspecto será examinado no experimento 5 da presente tese. 4.1.2 Fatores sintáticos A pesquisa acerca dos fatores sintáticos atuantes no processamento da concordância têm se detido basicamente na investigação de duas fontes de 28 Não se pode excluir completamente um efeito semântico com base no contraste entre bipartidos e pluralia tantum, por dois motivos: primeiro porque, como comentado em nota anterior, alguns bipartidos também são usados no singular, o que pode interferir no contraste entre estes e os plurais regulares; segundo, porque é possível que nem todos os falantes associem uma idéia de multiplicidade aos pluralia tantum. Considere-se, por exemplo, o substantivo annals, correspondente ao português “anais”. Esse substantivo pode ter a acepção de publicação periódica de um conjunto de trabalhos, não sendo, pois, necessariamente visto como semanticamente plural. Ressalte-se, contudo, que nos dois experimentos os substantivos passaram por uma avaliação prévia quanto ao número conceitual a eles associado. Um grupo de voluntários repondeu a um questionário com perguntas do seguinte tipo: If you were thinking about the_____, would you be thinking about one thing or more than one thing? (Se você estivesse pensando sobre _____, você estaria pensando sobre uma coisa ou mais de uma coisa?). Com base nessas respostas, foram montados os preâmbulos testados. 50 interferência: a distância linear entre o verbo e núcleos nominais do DP sujeito (núcleo do sujeito e núcleos intervenientes) e posição hierárquica do núcleo nominal de um modificador29 na estrutura do DP. Nesta seção resultados experimentais relativos a esses fatores são comentados e apresenta-se uma rediscussão de alguns desses resultados a partir da aplicação das noções de precedência linear e c-comando na análise das estruturas em que ocorrem os erros de atração. Ao final, são tecidas considerações acerca de interferência de informação léxico-sintática no processamento da concordância. A partir de evidências experimentais de que o processador faz uso de informação de natureza lexical relativa à estrutura argumental de um dado núcleo durante o parsing, considera-se a relevância desse fator para o processo de formulação de sentenças. 4.1.2.1 Distância linear 4.1.2.1.1 Distância linear entre o núcleo do sujeito e o verbo Não é recente a hipótese de que a distância entre o núcleo do sujeito e o verbo pode afetar o processamento da concordância. Jespersen (1924) observou que o verbo quando está muito afastado do sujeito pode não possuir “energia mental” suficiente para recuperar informação de número necessária à concordância. Na literatura psicolingüística mais recente, Bock & Miller (1991) foram os primeiros a investigar esse fator. Eles conduziram um experimento de produção induzida de erros, com falantes de inglês, no qual manipularam o tamanho dos preâmbulos a partir da colocação de uma média de dois adjetivos pré-nominais no modificador. Eles também variaram o tipo de modificador do núcleo do sujeito - sintagma preposicionado e oração relativa - e o número tanto do núcleo do sujeito quanto do núcleo nominal do modificador de modo a obter condições de congruência e incongruência de número entre os núcleos nominais. Não foi obtido um efeito de tamanho do modificador. Houve, não obstante, um efeito de congruência de número, com maior número de erros na condição 29 O termo modificador nesse contexto inclui qualquer constituinte relacionado sintaticamente com o SN do sujeito, seja numa relação de adjunção seja numa relação de complementação. A natureza dessa relação sintática não é, de modo geral, tomada como variável a ser controlada. 51 incongruente, em que o núcleo do sujeito era singular e o nome local, plural. O tipo de modificador também se mostrou relevante, tendo ocorrido mais erros de atração quando o modificador era um PP com núcleo nominal plural do que quando era uma oração relativa. Bock & Cutting (1992), em experimento semelhante, envolvendo modificadores preposicionais e oracionais, obtiveram um efeito do número do nome local, do tipo de modificador e também do tamanho do modificador. Houve também um efeito da interação entre número do nome local e tipo de modificador e de tipo e tamanho do modificador. A condição que induziu mais erros foi aquela com modificadores do tipo PP, em que o nome local era plural. Para os modificadores oracionais, não foi significativa a diferença entre as condições modificador longo e curto. Esses resultados foram tomados como evidências na direção da hipótese do “empacotamento oracional”, segundo a qual informação de número de um núcleo interveniente teria menos chance de induzir erros de atração quando estivesse em uma oração porque a oração funcionaria como uma espécie de “ilha” que isolaria o núcleo interveniente do núcleo do sujeito, dificultando qualquer tipo de interferência no estabelecimento da concordância. No caso de núcleos intervenientes em PPs, estes estariam dentro do domínio da oração em que a concordância é computada e, por isso, o tamanho do modificador poderia vir a afetar o processamento, aumentando a chance de erros de atração. Os autores comparam estes resultados aos obtidos por Bock & Miller (1991) e argumentam que o conflito é aparente, pois quando se consideram isoladamente as condições com PPs modificadores, observa-se uma tendência de mais erros de atração após modificadores longos do que após modificadores curtos. Notam, inclusive, que um efeito de tamanho do modificador pode ter sido anulado porque o número erros após modificadores oracionais longos decaiu levemente à medida que o número de erros após modificadores preposicionais longos aumentou levemente. Resultados de compreensão por meio de monitoramento do olhar (eyetracking) obtidos de falantes de hebraico (Deutsch, 1998) sugerem que o comprimento do sujeito, ou seja, a distância linear entre o núcleo do sujeito e o verbo, variada com a interpolação de um modificador, é um fator que afeta a detecção de erros de concordância de número e de gênero no verbo (dado que o 52 verbo concorda em número e em gênero com o sujeito em hebraico). Os erros foram mais facilmente detectados na condição em que essa distância era curta. Considerando-se que a “energia mental” necessária para se recuperar informação de número do sujeito pode ser afetada pela sobrecarga a recursos de memória, é interessante também considerar os resultados de Almor et al. (1998), em experimento conduzido com pacientes portadores de síndrome de Alzheimer e um grupo-controle de idosos falantes de inglês. Os autores utilizaram uma tarefa de produção bi-modal, na qual um preâmbulo foi apresentado oralmente, seguido da apresentação visual de uma forma verbal congruente ou incongruente em número com o sujeito, correspondendo às condições gramatical e agramatical. O tempo de leitura em voz alta do verbo foi tomado como medida da percepção do erro de concordância. Os resultados sugerem que sobrecarga a recursos de memória pode ser um fator que afeta a detecção de erros de concordância sujeitoverbo por ambos os grupos, ainda que a direção das médias sugira que os pacientes Alzheimer são menos sensíveis ao fator congruência na condição longa, assim como particularmente incapazes de detectar erros de concordância pronominal independentemente de distância, como constatado em experimento subseqüente. É interessante observar que, nesse estudo, as médias obtidas no grupo de controle na condição gramatical mostraram maior tempo de leitura na condição longa, como previsto, enquanto que, na condição agramatical, o efeito foi obtido na direção inversa. Ou seja, o tempo de leitura dos verbos incongruentes em número na condição distância curta foi maior do que na condição distância longa. Verificou-se que o material lingüístico processado na condição distância longa agramatical pode ter induzido um efeito não previsto de atração, em função da presença de núcleos nominais no plural entre o núcleo do sujeito e o verbo30. Desse modo, o tempo mais rápido de leitura na condição distância longa agramatical pode refletir um processamento do verbo em relação a um núcleo nominal plural interveniente, o qual parece ser tomado equivocadamente como elemento controlador da concordância. Esse efeito parece indicar que a distância linear entre o núcleo do sujeito e o verbo favorece a ocorrência de erros de atração. 30 Exemplo de sentença utilizada em Almor et al. (1998), na condição longa: The old lady, who searched very carefully through everyone of those old trash cans behind the stores, was/were. 53 Pearlmutter (2000) observa que, ao se analisarem os resultados relativos à distância linear entre o núcleo do sujeito e o verbo, é importante considerar como foi variada essa distância. É possível que o dado relevante não seja, por exemplo, tamanho do modificador em termos de número de palavras, mas sim em termos do número de elementos intervenientes cuja informação de número seja passível de interferir no processamento da concordância. Segundo Pearlmutter, isso explicaria por que Bock & Miller (1991) não obtiveram um efeito de tamanho do modificador em seus experimentos: foram inseridos adjetivos para construir as condições longas e estes provavelmente não são processados para a definição de número do sujeito. De todo modo, não se pode descartar que a distância linear é um fator que afeta a manutenção de informações pela memória. Talvez essa sobrecarga somada ao custo de processamento gerado pela “natureza” do elemento interveniente enquanto potencial atribuidor de número ao verbo possam, conjuntamente, afetar a concordância. No experimento 1 do presente estudo, investiga-se o papel de tipo de modificador (PP e Relativa) e de distância linear entre o núcleo do sujeito e o verbo. Conforme será visto, os resultados apontam para um efeito principal apenas da variável distância linear, o que, por um lado fortalece a idéia de que distância linear é considerada no processamento, mas, por outro, coloca em questão a hipótese de “empacotamento oracional”. 4.1.2.1.2 Distância linear do núcleo interveniente em relação ao verbo Um possível efeito de distância linear do núcleo interveniente em relação ao verbo é em geral investigado em contraposição a um efeito relacionado à distância sintática desse mesmo elemento interveniente em relação ao núcleo do sujeito. Duas hipóteses são contrastadas em relação a esses fatores: a hipótese da distância linear x a hipótese da distância hierárquica. A primeira prevê que quanto mais próximo o núcleo interveniente estiver do verbo, maior será a chance de provocar interferência na concordância. A segunda prevê que quanto mais próximo o elemento interveniente estiver do núcleo do sujeito – elemento mais alto na hierarquia do DP, maior será sua interferência. Optou-se neste trabalho por discutir cada hipótese separadamente, visto que a hipótese da distância linear considera a relação do núcleo interveniente em relação ao verbo, tratando o erro de concordância em termos de um possível 54 efeito de recentidade, enquanto a hipótese da distância hierárquica considera a posição estrutural do núcleo interveniente em relação ao núcleo do sujeito, buscando especificar, portanto, falhas no âmbito da definição do número do DP sujeito, as quais, por sua vez, acabam por se refletir no verbo. Os primeiros experimentos sobre erros de atração não permitiam dissociar distância linear e distância sintática porque o preâmbulo era construído com um único núcleo interveniente e o verbo era produzido imediatamente após o preâmbulo: O editor dos livros Verbo. Vigliocco & Nicol (1998) buscaram testar separadamente a questão da distância linear entre o núcleo do sujeito e o verbo em dois experimentos de produção induzida, conduzidos com falantes de inglês. Nesses experimentos, um adjetivo era apresentado visualmente na tela de um monitor e, em seguida, o participante ouvia um preâmbulo. No primeiro experimento, a tarefa consistia na produção de uma frase afirmativa que reproduzisse o preâmbulo como sujeito e incorporasse o adjetivo como predicativo; com isso, o verbo (cópula) apresentaria informação relativa à concordância de número. No segundo experimento, o participante deveria formular uma pergunta a partir do preâmbulo ouvido, o que o levaria a produzir o verbo antes do preâmbulo a ser tomado como sujeito da sentença. O número do núcleo do sujeito e o do nome local foram as variáveis manipuladas. A variável dependente foi o número de erros de concordância na formulação do verbo. Em ambos os experimentos, os preâmbulos eram formados de um nome modificado por um sintagma preposicional (ex.The helicopter for the flights). A distribuição dos erros foi semelhante nos dois experimentos, sendo que um maior número de erros foi obtido na condição núcleo do sujeito singular nome local plural. Os dados dos dois experimentos, quando explicitamente contrastados, não evidenciaram efeito da tarefa experimental, tomada como fator grupal. Não foi, portanto, verificada a previsão de um efeito de ordem linear do núcleo interveniente em relação ao verbo, o que permite questionar a idéia de que o elemento mais próximo do verbo interfere na concordância. Franck et al.(2003/2005) rediscutem a questão de ordem linear, a partir de uma análise que incorpora certos pressupostos do Minimalismo, e apresentam resultados compatíveis com um efeito de precedência linear. 55 Os autores assumem uma abordagem derivacional para a computação de sentenças, de acordo com a qual haveria uma multiplicidade de representações intermediárias que refletiriam a derivação cíclica da sentença. Importante para a análise dos autores é que, embora as representações intermediárias tenham um formato de árvore que especifica relações hierárquicas entre os nós sintáticos, elas também envolvem diferentes ordens lineares. Assim, cada nó (seja uma palavra ou um sintagma) estaria envolvido tanto em relações “verticais”, hierárquicas com outros nós (relações de dominância), como em relações “horizontais”, de precedência. Essas relações, por sua vez, seriam consideradas ao longo da construção da sentença, à medida que os constituintes se movessem.31 Partindo, pois, desse tipo de abordagem, Franck et al. (2003/2005) afirmam que não se pode excluir efeito de ordem linear com base apenas na ordem superficial da sentença; é necessário analisar a derivação da sentença de modo a verificar se em algum momento o núcleo interveniente não intervém linearmente entre o núcleo do sujeito e o verbo. Considerando esse aspecto os autores mostram que no experimento de Vigliocco & Nicol (1998) tanto nas declarativas quanto nas interrogativas haveria um momento da derivação (representado em (d)), em que o modificador plural (flights) ficaria entre o núcleo do sujeito e o nó de concordância: (a) ____ [AgrS] [ [The helicopter for the flights] be safe] ÆAGREE Æ (b)____ [AgrS 3s][[The helicopter for the flights] be safe]Æ movimento de V para AgrS Æ (c) ____ [AgrS is] [ [The helicopter for the flights] safe] Æ movimento do sujeito e verificação de Agr em uma configuração Spec-head Æ (d) [The helicopter for the flights] [AgrS is] [ t safe] 31 Franck et al. (submetido) observam que esse tipo de abordagem dinâmica de construção da sentença tem implicações cruciais para a Psicolingüística, pois permite que se trate a etapa de codificação gramatical da sentença como um processo complexo que envolve diferentes estágios. Consideram ainda que, dentro de uma perspectiva que assuma uma ligação bastante estreita entre gramática e processador, é possível, inclusive, traçar uma correspondência entre os diferentes passos derivacionais de uma sentença e a performance lingüística, inclusive no que diz respeito aos erros de atração. No capítulo 9, são tecidas algumas considerações acerca de uma possível articulação entre Teoria lingüística e Psicolingüística no estudo do processamento da concordância na produção de sentenças. Para uma discussão mais ampla acerca dessa articulação, ver Phillips (t1996, 2003), que propõe uma identidade entre Gramática e Processador, e Corrêa (submetido, 2005a e 2005b), que questiona a possibilidade de identificação entre gramática-parser-formulador sintático nos termos propostos por Phillips. 56 Nas interrogativas seriam seguidos os mesmos passos derivacionais, com acréscimo de movimento de AgrS para C, resultando em (e) [C is] [the helicopter for the flights] [AgrS t] [ t safe]? Segundo essa análise, portanto, o contraste de declarativas e interrogativas não permite excluir efeito de linearidade entendida em termos de precedência linear. Nos dois tipos de sentença haveria uma etapa da derivação em que o modificador iria intervir entre o núcleo do sujeito e o verbo. Nas representações propostas, chama a atenção o fato de a concordância já ter sido computada, através da operação Agree (ver representação (a)), antes de haver o movimento do sujeito para especificador de AgrS, posição em que o núcleo interveniente flights passa a preceder linearmente o nó da concordância. Isso parece ser inconsistente com a idéia de que precedência linear pode afetar a concordância. A pergunta que surge é a seguinte: Como pode haver um efeito de precedência linear na concordância se a concordância já foi definida? Para se responder a essa pergunta, é preciso, antes, apresentar em linhas gerais a visão de concordância que os autores subscrevem. Essa visão se apóia em 3 pontos principais: (i) a de que a concordância é um fenômeno configuracional, computada com base em relações hierárquicas; (ii) compreende AGREE e MOVE; (iii) AGREE quando associado a MOVE dá origem a uma manifestação morfológica da concordância mais estável do que quando apenas AGREE atua (cf. Guasti & Rizzi, 2002). Evidências para esse último aspecto surgem do contraste entre as construções (a) e (b). Em inglês coloquial, enquanto a concordância é obrigatória em (a), ela seria opcional em (b). Nessa última sentença, o sujeito não se moveria: (a) Many books are/*is on the table. (b) There are/ ´s many books on the table. O mesmo fenômeno de “afrouxamento” da concordância verbal é observado no francês – C´est les filles/ Ce sont les filles. São ainda citados exemplos de dialetos do italiano em que a concordância não é obrigatoriamente expressa em estruturas VS (Viene sing. le ragazze pl.), mas é sempre realizada em estruturas SV, em que o sujeito é alçado para o 57 especificador de AgrS (*Le ragazze pl. viene sing.). Também no Árabe Padrão a concordância de pessoa e número seria obrigatória apenas nas estruturas SV. Essa robustez da concordância em estruturas SV é atribuída a uma dupla checagem de compatibilidade de traços de pessoa e número no processo de derivação da sentença: na primeira vez, a checagem se faria através da operação AGREE, sem envolver movimento, e, na segunda vez, numa configuração Especificador-Núcleo, depois do movimento do sujeito. Nas estruturas VS, apenas se aplicaria a operação AGREE e a compatibilidade de traços seria verificada apenas uma vez. Voltando às sentenças do inglês, o que ocorreria seria o seguinte: embora na primeira vez em que a concordância é computada não haja qualquer problema de precedência linear do modificador do sujeito em relação ao nó AgrS (representação em a), na segunda vez, após o movimento do sujeito para AgrS, o núcleo interveniente (flights) precede linearmente o nó AgrS, podendo, então, de algum modo afetar a computação da concordância (representação em b): (a) ____ [AgrS] [ [The helicopter for the flights] be safe] ÆAGREE (b) [The helicopter for the flights] [AgrS is] [ t safe] Não há, contudo, diferença entre declarativas e interrogativas quanto à precedência linear e modo de computação da concordância, porque nos dois tipos de sentença os mesmos passos derivacionais estariam envolvidos até o ponto em que se daria a interferência do núcleo interveniente. Franck et al. buscam, então, outra estrutura para testar o efeito de precedência linear e a hipótese de dupla checagem de concordância em estruturas do tipo SV. Em italiano, existe um tipo de construção em que, embora a posição final do verbo seja antes do sujeito (como nas interrogativas do inglês), não há nenhum passo da derivação em que o modificador intervenha entre AgrS e o núcleo nominal do sujeito. Nessas construções, o sujeito permaneceria interno ao VP e não haveria possibilidade de um efeito de intervenção linear. Além disso, nessas construções a concordância envolveria apenas a checagem de traços via AGREE.A seguir apresenta-se a derivação proposta por Franck et al. para a derivação da sentença Telefonerà l`amica dei vicini. 58 (a) _____ [AgrS] [ [ l’amica dei vicini] telefonare] ÆAGREE Æ (b) _____ [AgrS 3s] [ [ l’amica dei vicini] telefonare] Æ movimento de V para AgrS Æ (c) _____ [AgrS telefonerà] [ [ l’amica dei vicini] t] Essa construção de ordem invertida (verbo-sujeito) ocorre no italiano em alternância a outra construção cuja ordem é sujeito-verbo -- L`amica dei vicini telefonerà. Esta, por sua vez, é derivada a partir do movimento do sujeito para o especificador de AgrS, havendo, pois, um momento da derivação em que o modificador do sujeito intervém em termos de precedência entre o núcleo do sujeito e AgrS: L`amica dei vicini telefonerà ( [... N ...Nmod ...]AgrS ) Além disso, a concordância com essas construções envolve dois momentos: checagem via AGREE e (re)checagem na configuração especificador-núcleo. Considerando-se um possível efeito de precedência linear, a previsão seria que apenas as construções na ordem SV (L`amica dei vicini telefonerà), derivacionalmente semelhantes às declarativas e interrogativas do inglês) gerassem erros de atração. As construções VS (Telefonerà l`amica dei vicini) não induziriam erros de atração, visto que em nenhum ponto da derivação sintática o modificador do sujeito (vicini) iria intervir entre o sujeito e o verbo. Assim, embora quanto à “ordem” superficial interrogativas do inglês (Is the helicopter for the flights safe? - VS) sejam semelhantes a construções na ordem VS, estas deveriam ter um comportamento distinto daquelas. Além da ordem de palavras na sentença a ser produzida, também foi tomada como variável independente o número do núcleo do sujeito.32 Grupos diferentes produziram sentenças em cada ordem. Os estímulos foram apresentados visualmente em uma tela de computador e, após cada preâmbulo, um verbo no 32 Exemplo de sentenças em por condição experimental Ordem de palavras Número do núcleo do sujeito e do elemento interveniente Sujeito - verbo Sing-pl Pl- sing Verbo- sujeito Sing-pl Pl-sing Preâmbulo a ser produzido L’amico delle sorelle (O amigo das irmãs) + V Gli amici della sorella (Os amigos da irmã) + V V + L’amico delle sorelle (O amigo das irmãs) V + Gli amici della sorella (Os amigos da irmã) 59 infinitivo era projetado. Os participantes eram instruídos a colocar o preâmbulo e o verbo em ordem de modo a criar uma sentença completa. Cada grupo era solicitado a produzir uma possibilidade de ordenação (suj-verbo; verbo-suj). Houve um efeito significativo da variável ordem, com mais erros na condição SV (L`amica dei vicini telefonerà) do que na condição VS (Telefonerà l`amica dei vicini). Esse resultado, somado ao obtido por Vigliocco & Nicol (1998) para o contraste declarativas/ interrogativas em inglês, é compatível com a hipótese de que ordem, entendida em termos de precedência linear (e não em termos de ordenação superficial), é fator que atua no processamento da concordância. Embora tanto nas interrogativas em inglês quanto nas construções de inversão livre em italiano a ordem superficial seja VS, elas apresentam comportamentos distintos no que tange à concordância. Logo, parece que o processador não se limita à informação superficial de ordem do constituintes. Se, no entanto, o que está em jogo é de fato informação relativa à precedência linear, trata-se de hipótese a ser melhor investigada, pois a interpretação dos resultados obtidos depende da aceitação de alguns pressupostos, como o de Agr como uma categoria funcional e de dois mecanismos responsáveis pela implementação da concordância.33 Outro resultado que merecer ser reportado é a ausência de efeito principal de número. Esse resultado conflita com o obtido em experimentos anteriores nos quais se observou uma assimetria entre singular e plural na indução de erros de atração (cf. Bock & Eberhard, 1993; Eberhard, 1997). Os autores não provêem 33 Franck et al. (2003/2005) assumem uma configuração estrutural da sentença, em que Agr tem status de categoria funcional, com um nó próprio na árvore sintática. No capítulo 3 foi visto que, no Minimalismo (Chomsky,1995), Agr não é mais tratado como categoria funcional. Pode-se, no entanto, argumentar que a assunção de que Agr é um nó sintático talvez não seja de fato um problema caso se considere que a categoria relevante para se caracterizar a questão da precedência linear seja TP (tense phrase), uma categoria interpretável na interface Forma-Lógica. No entanto, se assumirmos que a concordância é computada nos termos do que é proposto em Chomsky (1999), mediante uma operação Agree, que se estabelece entre uma sonda (probe) e um alvo (goal), há problemas para justificar os resultados das interrogativas, porque, como já foi apontado, a concordância já teria sido computada antes do movimento do sujeito para uma posição mais alta na árvore. Logo, não deveriam ocorrer erros de atração. Importante reforçar que Franck et al. assumem uma correlação entre derivação e formulação sintática e que tentam prover uma explicação para o erro tendo em vista os passos derivacionais da construção da sentença. O erro, nessa perspectiva, ocorreria durante a formulação sintática. Na presente tese, assume-se que os erros podem ser explicados não necessariamente como decorrentes de falhas no momento da computação da concordância, mas sim como falhas pré ou pós-sintáticas. No capítulo 7, apresentase em detalhes o modelo de produção aqui assumido. 60 uma explicação satisfatória para esse resultado; conjeturam que a obtenção ou não desse efeito pode estar associada à complexidade da morfologia verbal. É possível, não obstante, que a explicação esteja mais diretamente ligada à visibilidade da informação de número no DP sujeito. Na seção destinada a efeitos morfofonológicos este ponto será retomado. No capítulo 8, apresentamos resultados experimentais em que a questão da ordem linear do núcleo interveniente em relação ao verbo é manipulada. 4.1.2.2 Distância hierárquica A hipótese de que a distância hierárquica do núcleo interveniente em relação ao nó mais alto do sintagma sujeito pode afetar a concordância verbal foi explicitamente formulada no âmbito do modelo de percolação ascendente de traços, proposto por Vigliocco & Nicol (1995, 1996a, 1996b, 1998). De acordo com esse modelo, informação de número do núcleo interveniente percolaria ascendentemente para o nó nominal mais alto do sujeito, posição de onde poderia vir a interferir na definição de número do verbo. Diante de construções do tipo The editor of the books, nas quais o sujeito inclui dois núcleos nominais, o fato de o N2 apresentar um traço de número diferente do traço de número do N1 possibilitaria a definição equivocada do número do sujeito, ou seja, o traço de número do N2 percolaria ascendentemente para o núcleo nominal mais alto. N P pl T he editor PP P of NP the books Fig. 5: Esquema de percolação ascendente do traço de número do núcleo interveniente para o nó mais alto do sujeito. 61 Partindo dessa hipótese, Vigliocco & Nicol (1998) reinterpretaram os resultados experimentais de Bock & Miller (1991) e Bock & Cutting (1992), que apontavam para um efeito de tipo de modificador no número de erros de atração. Conforme já foi reportado, esses autores manipularam o tipo de modificador do núcleo do sujeito (PP e sintagma oracional), com vistas a testar a hipótese do “empacotamento oracional”, segundo a qual informação de número de um núcleo interveniente teria menos chance de induzir erros de atração quando estivesse em uma oração, visto que esta permitiria isolá-lo da outra oração, em que estaria o núcleo do sujeito. De fato, foi observado um número maior de erros nas condições em que o núcleo interveniente estava inserido em um PP. Vigliocco & Nicol (1998) vêem esse resultado como sugestivo de um efeito da altura do nó no qual o núcleo nominal interveniente estaria posicionado na estrutura do sintagma sujeito. O fato de maior número de erros ter sido obtido quando o modificador era um PP seria indicativo de que o núcleo nominal interveniente mais alto causaria maior interferência na concordância. As representações sintáticas a seguir, reproduzidas de Vigliocco & Nicol (1998), permitem visualizar a diferença de “distância hierárquica” do núcleo interveniente em relação ao NP, em sentenças cujo núcleo do sujeito é modificado por um PP e em sentenças em que é modificado por uma oração: (a) (b) S [+pl] S [+pl] NP [+pl] VP NP [+pl] NP1 NP1 S [+pl] PP Det Det VP N1 P N1 WH VP [+pl] NP2 [+pl] V det NP2 [+pl] N2 [+pl] DET The editor of the books was/were The editor N2 [+pl] who rejected the books was/were Fig. 6: Esquema de percolação ascendente do traço de número de núcleos intervenientes inseridos em PPs e em orações (cf. Vigliocco & Nicol, 1998) 62 É importante observar que, embora os resultados de Bock & Miller (1991) e Bock & Cutting (1992) possam ser interpretados em termos da posição hierárquica do núcleo interveniente, essa análise não exclui a possibilidade de um efeito de “empacotamento oracional”. É possível, inclusive, que tanto a estrutura em que está inserido o núcleo interveniente (hipótese do empacotamento oracional) quanto a posição sintática que este ocupa no DP sujeito (hipótese da distância hierárquica) sejam fatores relevantes para o processamento da concordância. Além disso, o contraste das estruturas investigadas por Bock e colegas também não permite distinguir entre um efeito de distância sintática e um efeito de distância linear, conforme visto na seção anterior. Assim, para se testar a hipótese da distância hierárquica dissociada da do empacotamento oracional, seria necessário verificar, em uma estrutura de mesmo tipo, o efeito do núcleo interveniente em diferentes posições hierárquicas. Por outro lado, para distinguir entre efeito sintático e efeito de linearidade, o núcleo interveniente deveria poder variar tanto na distância hierárquica em relação ao nó mais alto do sujeito quanto na distância linear em relação ao verbo. As estruturas examinadas por Franck, Vigliocco & Nicol (2002), em experimentos conduzidos com falantes de inglês e de francês, atendem a essas duas exigências. Nesses experimentos, os preâmbulos eram constituídos de um núcleo seguido de dois sintagmas preposicionais e o valor do traço de número de cada núcleo nominal foi variado, como no exemplo a seguir: The threat(s) to the president(s) of the company(ies) N1 N2 N3 O objetivo do estudo foi verificar em que medida a posição sintática de um elemento com número incongruente em relação ao número do núcleo do sujeito poderia interferir na produção de erros. De acordo com a hipótese da distância hierárquica, previa-se que quanto menor fosse a distância entre o elemento com traço de número incongruente (N2 ou N3) e o núcleo do sujeito (N1) mais erros ocorreriam. N2 induziria, portanto, mais erros do que o núcleo nominal imediatamente contíguo ao verbo (N3). 63 Os resultados obtidos para as duas línguas estão de acordo com essa previsão. Houve um efeito significativo da variável posição hierárquica. O núcleo intermediário N2, quando com número incongruente em relação ao número do núcleo mais alto (N1), induziu um número de erros de concordância maior do que quando o contrário. Nenhum tipo de efeito foi obtido para N3. Esses resultados sugerem, portanto, que não é distância linear curta entre o núcleo interveniente e o verbo a condição que torna um núcleo nominal interveniente mais apto a gerar um efeito de atração. A posição hierárquica que este elemento ocupa no sintagma parece ser o fator relevante na previsão de erros de atração: quanto mais alto na hierarquia do sintagma este elemento estiver, maior a chance de erros de atração serem obtidos. A despeito dessas evidências empíricas, é possível levantar alguns questionamentos ao modelo de processamento de percolação ascendente (cf. Corrêa & Rodrigues, 2005; Rodrigues & Corrêa, 2004). Primeiro, não é claro de que modo a percolação de um traço de número através de um núcleo preposicional seria explicada de um ponto de vista lingüístico.34 Também não é explicitado como informação de natureza morfofonológica poderia gerar interferência num componente sintático. Mesmo que se assuma um modelo de natureza integrativa, em que informações de diferentes níveis podem interagir, é difícil explicar que esse efeito esteja associado a um efeito de posição estrutural do núcleo interveniente. Por fim, pode-se dizer que o modelo de percolação ascendente não provê propriamente uma explicação para a causa do erro de atração; trata-se mais de uma caracterização de quando o núcleo interveniente gera mais erros. Não é claro, contudo, por que o traço de número do núcleo do sujeito deixaria de ser tomado como controlador da concordância nessas circunstâncias. Também ainda se pode objetar que o modelo de percolação não permite distinguir a situação de erro daquela em que a computação da concordância transcorre normalmente; o mesmo mecanismo está em jogo nas duas situações. 34 Essa percolação talvez fosse possível no caso de preposição funcionais, que introduzem PPs complementos, mas não no caso de preposições lexicais, que introduzem PPs adjuntos. A preposição presente em PPs argumentos, diferentemente daquela que introduz PPs adjuntos, não contribui para fixar o papel semântico do seu argumento; ela é inserida na sentença para prover o caso do DP argumento. Em função disso, talvez possamos pensar, tomando-se por base o aporte teórico da Morfologia Distribuída (Halle & Marantz, 1993), que a preposição nesses casos seja inserida apenas num momento posterior ao da computação sintática. Isso permitiria que o traço de número do núcleo interveniente pudesse percolar ascendentemente. 64 No cap. 8 são reportados resultados de experimento em português em que as mesmas variáveis examinadas por Franck, Vigliocco & Nicol (2002) são manipuladas. No cap. 7, apresenta-se o modelo proposto em Rodrigues & Corrêa (2004)/Corrêa & Rodrigues (2005) como uma alternativa ao modelo de percolação de traços. Considera-se a possibilidade de os erros serem resultado de uma interferência de uma representação do DP sujeito gerada pelo parser no momento da codificação morfofonológica do verbo. 4.1.2.3 Status argumental do sintagma modificador Um fator muito pouco explorado na investigação dos fatores responsáveis pela produção de erros de atração é o status argumental dos PPs modificadores do nome local. Os experimentos sobre erros de atração em geral não controlam se o núcleo interveniente está inserido em um PP argumento ou um PP adjunto35. Considerando-se que uma distinção entre argumentos e adjuntos pode ser traduzida em termos de diferenças quanto a posições estruturais na configuração sintática do DP sujeito, um modelo de produção que busque caracterizar o tipo de informação considerada pelo formulador sintático no processamento da concordância não pode deixar de investigar esse fator. Nesta seção, avalia-se, portanto, se status argumental do PP em que está inserido um núcleo interveniente é uma fonte de interferência potencial no processamento. Tendo em vista a quase inexistência de trabalhos sobre esse tópico nos estudos sobre a produção, buscam-se elementos para discutir essa distinção em estudos de compreensão, em particular nas pesquisas que investigam o papel de informação relativa à estrutura argumental de nomes e de verbos para a resolução de ambigüidades estruturais. A relevância desses trabalhos para os 35 O termo “argumento” foi empregado para fazer referência aos constituintes selecionados por um dado núcleo lexical na estrutura sintática. Nos experimentos reportados nesta seção, investiga-se especificamente o argumento que ocupa a posição de irmão do núcleo, o chamado complemento. O termo “adjunto” refere-se ao constituinte que não está previsto na estrutura argumental de um dado núcleo. O adjunto ocupa uma posição estrutural diferente da posição ocupada pelo complemento, cf. será visto em detalhes ao longo desta seção. Para fazer referência indistinta a PPs argumentos ou adjuntos, foi adotado o termo “modificador”. Importa ainda esclarecer que o termo “argumento” também tem sido usado em lingüística para designar os elementos que completam o sentido de um predicado. Embora haja uma correspondência entre argumento semântico e argumento sintático, é importante dissociar as duas noções visto que os argumentos semânticos podem apresentar comportamentos sintáticos diferenciados. Para uma discussão mais ampla a esse respeito, ver Cançado (2005). 65 objetivos da presente tese está no fato de procurarem avaliar em que medida decisões do parser baseadas em informação sobre estrutura argumental são de natureza puramente sintática (ou léxico-sintática) ou espelham a interferência de informação semântica ou mesmo de freqüência de uso das estruturas investigadas. Após a discussão dos trabalhos de compreensão, são tecidas algumas considerações a respeito de uma possível relação entre a acessibilidade de informação de número do núcleo interveniente e a posição estrutural de argumentos e adjuntos. Ao final, são comentados resultados de experimentos de produção induzida de erros que indicam a atuação do status argumental do PP modificador no processamento da concordância. 4.1.2.3.1 Resolução de ambigüidades estruturais e o papel de informação relativa à estrutura argumental de nomes e verbos Conforme foi dito na introdução desta seção, os principais trabalhos sobre a interferência de informação lexical relativa à estrutura argumental no processamento de sentenças têm sido produzidos no âmbito do estudo da compreensão de sentenças. Investiga-se se esse tipo de informação é utilizada pelo parser na resolução de ambigüidades sintáticas e em que momento tal informação atuaria. Duas hipóteses vêm orientando a condução de experimentos acerca dessa questão: a de que as decisões iniciais do parser seriam guiadas por informação lexical, com uma preferência pela aposição de argumentos na resolução de ambigüidades sintáticas (Abney, 1989) e a hipótese de que o parser seria orientado por princípios estruturais, como o da Aposição Mínima (Minimal Attachment) e o da Aposição Local (Late Closure) (Frazier & Fodor, 1978; Frazier, 1979; Frazier & Rayner, 1982). A distinção entre argumentos e adjuntos, caso viesse a atuar, seria levada em consideração em uma etapa posterior ao parsing, quando da integração com informação semântica. Antes de reportarmos os resultados experimentais, cumpre esclarecer o que são os princípios de Aposição Mínima (Minimal Attachment) e de Aposição Local (Late Closure). Esses dois princípios estruturais fazem parte da Teoria do Garden Path, um importante modelo de processamento de sentenças de base estrutural, que sustenta a idéia de um parser modular, serial, com funcionamento automático 66 e encapsulado (cf. Frazier & Fodor, 1978; Frazier, 1979; Frazier & Rayner, 1982). De acordo com esse modelo, o parser usaria apenas conhecimento de natureza gramatical na identificação de relações sintagmáticas, sem sofrer qualquer interferência de conhecimento de mundo. Dadas restrições de processamento e armazenamento impostas pela própria arquitetura do sistema de memória de trabalho, as decisões do parser seriam orientadas por dois princípios fundamentais: o da Aposição Mínima e o da Aposição Local. O princípio da Aposição Mínima especifica que o parser, com base nas regras de boa formação da língua, deveria construir um marcador frasal empregando o menor número possível de nós. O princípio da Aposição Local especifica que o parser deveria apor os itens lexicais que fossem sendo encontrados ao sintagma que estivesse sendo correntemente processado. 36 Com vistas a entender melhor o Princípio de Aposição Mínima, é relevante o contraste entre as representações sintáticas das sentenças (a) e (b) a seguir (cf. Frazier & Rayner, 1982): (a) The city council argued the mayor´s position forcefully. (b) The city council argued the mayor´s position was incorrect. S VP NP V NP adv (a) The city council argued the mayor’s position forcefully S VP NP S V NP (b) The city council argued the mayor’s position 36 VP was incorrect Reproduzem-se, a seguir, as definições apresentadas em Frazier & Rayner (1982), p. 180: Minimal Attachment: Attach incoming material into the phrase marker being constructed using the fewest syntactic nodes consistent with the well-formdness rules of the language. Late Closure: When possible, attach incoming lexical items into the clause or phrase currently being processed (i.e., the lowest possible nonterminal node dominating the last item analyzed). 67 Frazier & Rayner (1982) observaram uma diferença em termos de tempo de leitura entre a sentença (a) e a sentença (b). A sentença (a) foi lida mais rapidamente do que a sentença (b). Esses resultados podem ser explicados da seguinte maneira: guiado pelo princípio de menor número de nós, o parser atribuiria inicialmente à sentença (b) a estrutura de (a), mas ao encontrar o verbo “was” seria obrigado a refazer a análise e construir uma segunda estrutura, em que o sintagma “The mayor’s position” seria o sujeito do verbo da oração encaixada. Para exemplificar a aplicação de Aposição Local (Late Closure), considere-se a ambigüidade da oração a seguir: Someone shot the servant of the actress [who was on the balcony] A ambigüidade dessa sentença reside na possibilidade de se concatenar a oração relativa ao NP1 ou ao NP2. Como não há diferença entre as duas estruturas em termos do número de nós no marcador frasal, o parser aplica o Princípio de Aposição Local e concatena a oração relativa ao NP mais baixo, pois este seria o sintagma correntemente processado.37 Passemos agora aos resultados de experimentos que buscaram avaliar se informação argumental ou princípios estruturais orientam as decisões iniciais do parser. Clifton, Speer & Abney (1991) conduziram dois experimentos com falantes de inglês, para verificar diferenças relativas ao tempo de leitura de sintagmas preposicionais argumentos e adjuntos, concatenados a verbos e nomes. Foram empregadas duas técnicas experimentais – a de leitura auto-monitorada (selfpaced reading procedure) e de tempo de fixação do olhar, com emprego de equipamento de monitoramento do olhar (eyetracker). As condições experimentais testadas encontram-se exemplificadas a seguir38: 37 A universalidade desse Princípio do parser vem sendo questionada a partir de resultados experimentais reportados por Cuetos & Mitchell (1998), com falantes de espanhol, os quais apresentaram uma preferência por apor a relativa ao NP mais alto. Para trabalhos em português sobre Aposição Mínima e Aposição Local, ver artigos das seções I e II de Maia & Finger (2005). 38 A barra indica as regiões de segmentação utilizadas na apresentação dos estímulos no experimento 1 de leitura auto-monitorada . 68 C1: PP argumento de V: The saleswoman/ tried to interest/ the man/ in a wallet/during the storewide sale/ at Steigers. C2: PP adjunto de V: The man/ expressed/ his interest/ in a hurry/ during the storewide sale/ at Steigers. C3: PP argumento de N:The man/ expressed/ his interest/in a wallet/ during the storewide sale/ at Steigers. C4: PP adjunto de N: The saleswoman/ tried to interest/ the man/ in his fifties/during the storewide sale/ at Steigers. As previsões para a hipótese parser guiado por informação lexical e para a hipótese parser guiado por princípios estruturais estão apresentadas no quadro a seguir, adaptado de Clifton, Speer & Abney (1991), tabela 2: C1 VP-ARG C2 VP-ADJ C3 NP-ARG C4 NP-ADJ Parser guiado por informação lexical (preferência por argumentos) Parser guiado estruturais por Reanálise? Não Sim Não Sim Reanálise? Não Não Sim Sim Tempo Rápido Rápido Lento Lento Tempo Rápido Lento Rápido Lento princípios Os resultados de ambos os experimentos indicaram uma preferência inicial do parser por aposição do sintagma preposicionado ao verbo, visto que C1 e C2 foram lidas mais rapidamente do que C3 e C4. A condição C1 foi a que teve o menor tempo de leitura entre todas as condições. Observou-se uma diferença entre PPs argumentos e adjuntos apenas quando foram examinados os tempos de leitura na região seguinte à do PP, o que foi tomado como indicativo de que a informação relativa ao status argumental dos PPs modificadores só é levada em consideração após o parsing sintático. Nos momentos iniciais do parsing, o processador seria guiado pelos princípios estruturais de Aposição Mínima e de Aposição Local. Para que se possa compreender melhor a relação entre os resultados obtidos e a aplicação dos princípios de Aposição Mínima e Aposição Local, reproduzimos 69 a seguir as representações das sentenças de cada condição fornecidas pelos autores (fig. 3 de Clifton, Speer & Abney, 1991)39. (1) S NP (2) VP S NP VP V’ V (3) (4) NP VP V’ PP NP PP V S NP VP V’ NP D D S V N V’ NP D N’ V NP NP PP argumento de V PP adjunto de VP N PP D N PP argumento de N PP adjunto de NP A preferência por aposição inicial do PP ao VP (representações 1 e 2) é justificada com base no Princípio da Aposição Mínima (Minimal Attachment), pois a aposição ao NP exigiria a criação de um nó adicional – o nó N’ (representação 3) e o nó NP (representação 4). Quanto ao menor tempo de leitura de C1 em relação à C2, este é justificado com base no Princípio de Aposição Local (Late Closure), pois em C1 o PP seria concatenado ao sintagma que estaria sendo correntemente processado. Esses resultados foram bastante questionados, em particular por Schütze & Gibson (1999), tanto em função de problemas identificados na construção do material experimental como também em relação à visão de estrutura frasal assumida pelos autores, a qual admite, entre outras particularidades, ramificações ternárias (representação 1) e adjunção de constituintes como irmãos de X’ (representação 2). Pode-se ainda criticar o emprego não uniforme de uma representação para adjunção, visto que o adjunto de NP está concatenado a um segmento duplicado da categoria NP (representação 4) e o adjunto de VP não está (representação 2). A questão do tipo de estrutura frasal assumida é crucial quando se avalia se as decisões iniciais do parser são ou não tomadas com base em princípios 39 PP N Clifton, Speer & Abney (1991), embora sigam em linhas gerais a notação empregada na teoria X-barra, apresentam uma particular visão de estrutura frasal, a qual se distancia dessa teoria em relação a vários aspectos, como será comentado a seguir. 70 estruturais, visto que, dependendo da teoria adotada, é possível fazer previsões diferentes. Schütze & Gibson (1999) mostram que, se for adotada uma visão mais tradicional de X-barra (cf. Jackendoff, 1977), a hipótese de aplicação de Aposição Mínima (Minimal Attachment) faria prever que PPs argumentos de NPs seriam preferidos a PPs adjuntos de VPs. Como se pode observar pelas representações abaixo (cf. fig. 2, Schütze & Gibson, 1999), a representação em (2) envolve um nó adicional (o VP). Considerando-se essa argumentação, os resultados de Clifton, Speer & Abney (1991) não poderiam ser tomados como evidências a favor desse princípio. 40 S S (1) NP VP The man V’ V expressed D his (2) NP N’ N PP interest in a wallet PP argumento de NP NP VP The man VP PP in a hurry V’ V expressed NP D his N’ N interest PP adjunto de VP Em relação ao material experimental, além da falta de controle de certos fatores como total de palavras em pares contrastivos, quantidade de material 40 Um problema que se coloca ao se aplicar o Princípio de Aposição Mínima é o do que exatamente conta como nó adicional na estrutura. Será que, por exemplo, o VP da representação em 2 poderia ser considerado um nó adicional, já que ele representa um dos segmentos da categoria VP, sendo a duplicação do nó um recurso formal utilizado para poder diferenciar estruturas de adjunção na árvore sintática? E quanto às projeções intermediárias; será que do ponto de vista do processamento, elas são levadas em consideração? Também seria interessante repensar o Princípio da Aposição Mínima a partir da visão de estrutura frasal (bare phrase) adotada correntemente no Programa Minimalista, que elimina os níveis da teoria X-barra, em função de restrições impostas pela condição de Inclusividade (Inclusiveness Condition). De acordo com essa condição, novos objetos (índices, níveis da teoria X-barra) não podem ser adicionados no curso da computação sintática; qualquer estrutura formada pela computação deve ser constituída pelos elementos já presentes nos itens lexicais selecionados na numeração (Chomsky, 1995, p. 228). 71 contido no PP modificador, e emprego de PPs formados por expressões idiomáticas, um problema grave apontado por Schütze & Gibson (1999) diz respeito a erros na identificação do status argumental dos PPs empregados nos experimentos. Aplicados testes de diagnóstico, apenas 12 dos 16 itens teriam sido corretamente classificados. Boland & Blodgett (submetido) consideram ainda que alguns dos 12 itens teriam status argumental duvidoso.41 Diante dos problemas apresentados, Schütze & Gibson (1999) realizaram, então, dois experimentos de leitura auto-monitorada, a fim de verificar se de fato o status argumental dos PPs modificadores não causava qualquer interferência no parsing. Considerando que a distinção argumento/adjunto não pode ser tranquilamente estabelecida em termos de uma oposição binária, os autores propuseram um refinamento da hipótese de preferência por argumentos originalmente formulada por Abney (1989), em termos de uma Estratégia de Preferência por Argumento (Argument Preference Strategy)42. Em casos de ambigüidade, o parser selecionaria a aposição que maximizasse a relação argumental entre o sintagma modificador e o ponto de aposição. Como as condições críticas para se contrastar as duas hipóteses seriam “PP argumento de NP” e “PP adjunto de VP”, os autores se limitaram a verificar os tempos de leitura dessas duas condições vs. o tempo de leitura de uma condição controle, que foi diferente em cada experimento. Veja-se a seguir exemplo de sentença em cada condição. C1 : PP argumento de NP The company lawyers/considered employee demands/ for a raise/ but they/didn’t act until a strike seemed imminent. 41 Sem dúvida, a distinção entre PPs argumentos e adjuntos nem sempre é simples de ser estabelecida e nem todos os testes de diagnóstico fornecem resultados confiáveis. Parecem existir casos fronteiriços, como os PPs instrumentais, o que talvez sinalize que a distinção entre argumentos e adjuntos não tem uma natureza claramente binária. De todo modo, algum tipo de controle pode ser feito, buscando-se utilizar PPs que, com base em um número expressivo de testes, apresentem um padrão de comportamento mais associado a argumentos ou a adjuntos. Para um resumo dos principais testes de diagnóstico para PPs argumentos, ver o apêndice A de Schütze & Gibson (1999). Nesse apêndice, os autores também apresentam uma discussão acerca dos resultados fornecidos pelos testes e de como se pode manter a hipótese de que haveria uma preferência do parser por PPs argumentos, quando a própria distinção argumento x adjunto parece não ser sempre facilmente capturada. 42 “Argument Preference Strategy: In cases of attachment ambiguity, the parser prefers the attachment that maximizes the extent of the argument relation between the attaching phrase and the attachment site.” (Schütze & Gibson, 1999, p. 411). 72 C2: PP adjunto de VP:The company lawyers/considered employee demands/ for a month/ but they/didn’t act until a strike seemed imminent. Na região seguinte à de desambigüização (região de duas palavras após o PP)43, as sentenças com PPs argumentos de NPs foram lidas mais rapidamente do que aquelas com PPs adjuntos de VPs. Não houve diferenças significativas de tempo de leitura entre as condições nas regiões anteriores. Esses resultados foram interpretados como compatíveis com a hipótese de que a análise inicial do parser para estruturas ambíguas é afetada pela informação relativa ao status argumental do PP modificador.44 Não houve preferência por aposição a VPs como no experimento de Clifton, Speer & Abney (1991); logo, não há evidências de um efeito de Aposição Mínima. Speer & Clifton (1998), em experimentos de leitura (leitura automonitorada e monitoramento do olhar), também obtiveram resultados de que o status argumental do PP modificador é um fator que atua nas decisões iniciais do parser, havendo uma preferência por aposição de PPs argumentos na resolução de ambigüidades estruturais. Além desse fator, os autores também manipularam a plausibilidade de ocorrência do PP modificador em relação ao verbo (+ plausível vs. –plausível), com vistas a tentar distinguir um efeito de status argumental de um efeito de plausibilidade semântica.45 43 É importante notar que, embora o efeito de status argumental tenha sido observado na região após o PP modificador tanto no experimento de Clifton, Speer & Abney (1991) quanto no experimento de Schütze & Gibson (1999), neste a referida região compreende apenas duas palavras curtas, tendo sido pois possível verificar um efeito de status argumental num ponto anterior ao observado por Clifton et al. 44 Um resultado interessante, obtido no segundo experimento de Schütze & Gibson (1999) é a diferença de tempo de leitura entre a condição PP adjunto de VP e a condição controle, com PP não ambíguo: PP adjunto de VP: The company lawyers/considered employee demands/ for a month/ but they/didn’t act until a strike seemed imminent. PP não ambíguo: The company lawyers/considered employee demands/ after a month/ but they/didn’t act until a strike seemed imminent. O PP não ambíguo foi lido mais rapidamente do que o PP adjunto de VP, o que é indicativo de um efeito de garden path, no caso do PP adjunto de VP. A preposição do PP adjunto (for a month) seria inicialmente considerada introdutora de um argumento do NP (demands), levando a reanálise da sentença e a um aumento no tempo de leitura. 45 Para avaliar a plausibilidade dos itens experimentais, foi utilizado um pré-teste, em que os sujeitos, após completarem uma sentença com um PP, deveriam julgar os PPs que seriam usados no experimento utilizando para isso uma escala de 1 a 5 pontos, em que 1 simbolizava que o PP do experimentador era tão compreensível/ claro quanto aquele fornecido pelo participante e 5, que o PP do experimentador era sem sentido/absurdo. Com base nessas informações foram definidos os PPs dos experimentos quanto à plausibilidade. 73 Em relação à plausibilidade, também foi identificado um efeito principal desse fator nos dois experimentos, tendo, no entanto, esse efeito se prolongado mais do que o de status argumental. Quanto à interação entre as duas variáveis, esta foi significativa no experimento de leitura auto-monitorada apenas por sujeito, com uma preferência por aposição de argumentos nas condições com PPs pouco plausíveis. No experimento de monitoramento do olhar (eyetracking), não houve interação entre plausibilidade e status argumental; no entanto, uma análise em separado das fixações iniciais do olhar na região de desambigüização do PP indicam uma preferência por argumentos tanto para os itens pouco plausíveis quanto para os bastante plausíveis. Logo, embora plausibilidade seja um fator levado em consideração na leitura das sentenças, é o status argumental do PP o fator que parece atuar nos momentos iniciais do parsing. 46 Speer & Clifton (1998) afirmam que os resultados obtidos nos dois experimentos são compatíveis com o princípio de “Preferência por Argumento” (Abney 1989); consideram, porém, uma análise alternativa que permitiria explicar 46 Em relação a efeitos de plausibilidade, é interessante considerar resultados reportados em Maia et al. (2005), sobre a aposição de PPs adjuntos em sentenças do tipo O policial viu o turista com o binóculo, em que o PP com o binóculo pode tanto ser aposto ao verbo quanto ao nome. Em dois experimentos de leitura – um estudo de questionário e um experimento de leitura auto-monitorada, os autores testaram a Teoria do Garden Path, no que tange à atuação do Princípio de Aposição Mínima, e a influência de fatores semânticos, não estruturais no parsing. No estudo de questionário, manipulou--se o contexto anterior ao da sentença com o PP ambíguo: contexto – plausível: Havia um turista no parque. O policial viu o turista com o binóculo; contexto +plausível: Havia dois turistas no parque. O policial viu o turista com o binóculo. De acordo com o princípio da Aposição Mínima, deveria haver uma preferência por apor o PP ao verbo nas duas condições, visto que isso envolveria um menor número de nós no marcador frasal. De fato, nas duas condições houve uma preferência por aposição alta (viu com o binóculo). No entanto, quando se considerou isoladamente a condição + plausível, as diferenças foram menos acentuadas, com um número significativamente maior de aposições baixas (turista com o binóculo). Como as medidas nesse tipo de estudo são off-line, é possível que esse último resultado tenha refletido uma decisão de reanálise do processador. No experimento on-line, de leitura auto-monitorada, duas condições que forçavam uma leitura baixa foram acrescentadas às duas do primeiro experimento: contexto –plausível: Havia um turista no parque. O policial viu o turista com a ferida aberta; contexto +plausível: Havia dois turistas no parque. O policial viu o turista com a ferida aberta. Os resultados revelaram também uma preferência por aposição ao verbo, demonstrando que as decisões iniciais do parser são orientadas por princípios estruturais. Não houve também efeito principal de plausibilidade, nem interação entre aposição sintática preferencial do PP (alta ou baixa) e informação relativa à pressuposição pragmática (plausibilidade). Esses resultados sugerem que o efeito de plausibilidade obtido no primeiro experimento não deve ter ocorrido no parsing, mas sim na fase de integração com informação semântica. Logo, há evidências de que apenas informação de natureza estrutural seria relevante para o parsing. Seria interessante verificar se nas condições de aposição alta preferencial (O policial viu o turista com o binóculo), todos os PPs são do tipo “instrumento”, pois há evidências sintáticas e semânticas de que PPs instrumentais podem ser considerados argumentos (cf. Schütze & Gibson, 1999). De todo modo, os resultados de Maia et al. são compatíveis com os de Speer & Clifton (1998) no que diz respeito a um efeito tardio de plausibilidade. 74 uma interação entre plausibilidade e status argumental. No ponto de leitura do PP, o efeito de plausibilidade foi maior para sentenças com PPs adjuntos do que com PPs argumentos. Segundo os autores, esse efeito possivelmente reflete o fato de a interpretação de sintagmas adjuntos ser fortemente dependente de fatores ligados a conhecimento de mundo, diferentemente do que ocorre com sintagmas argumento, que seriam mais dependentes de informação gramatical. A informação gramatical seria processada de forma mais rápida e de modo mais homogêneo, resultando numa vantagem para os argumentos e numa redução do efeito de plausibilidade destes quando comparados a adjuntos. Essa possibilidade seria compatível com a Hipótese de Construal (Frazier & Clifton, 1996), uma revisão da Teoria do Garden Path, na qual se propõe uma distinção entre sintagmas primários e não-primários em termos de como seriam processados pelo parser. Os sintagmas primários seriam apostos ao marcador frasal, obedecendo aos princípios estruturais de parsing nos moldes propostos por Frazier para a Teoria do Garden Path (cf. Frazier & Fodor, 1978; Frazier, 1979; Frazier & Rayner, 1982). Já os sintagmas não-primários seriam “associados”, isto é, concatenados de forma “fraca”, sintaticamente subespecificada, e seriam interpretados usando-se informação adicional estrutural e não-estrutural. Adotando a hipótese de Construal na análise dos resultados experimentais, Speer & Clifton (1998) formulam a seguinte explicação: os PPs seriam inicialmente apostos à árvore sintática por serem sintagmas primários potenciais, o que resultaria em sua análise como argumentos. Apenas se interpretação posterior desconfirmasse essa análise, o PP seria tratado como sintagma não-primário, o que geraria uma reanálise do sintagma como adjunto. O reflexo disso seria a diferença de tempo de leitura entre sentenças com PPs argumentos e sentenças com PPs adjuntos. Considerando-se, pois, a hipótese de Construal, pode-se dizer que a preferência por argumentos seria, em última instância, um resultado da aplicação de princípios estruturais pelo parser e não simplesmente a aplicação do princípio de Preferência por Argumentos.47 47 A Hipótese de Construal foi formulada tendo-se em vista estruturas que não apresentavam um comportamento uniforme quando da aplicação dos princípios estruturais de parsing, como Aposição Mínima e Aposição Local. Entre as estruturas analisadas como não-primárias, que seguiriam o princípio de Construal, estão as orações relativas (A table of wood that was from Galicia), estruturas de predicação secundária (ex. John ate the broccoli raw/naked), XPs em estrutura de coordenação (ex. The nurse weighed John and Mary) e orações adverbiais em contextos específicos (ex. The doctor didn’t leave because he was angry) (cf. Clifton & Frazier, 75 Também tem sido proposto que a freqüência com que sintagmas ocorrem junto aos núcleos lexicais influenciaria nas decisões do parser (MacDonald et al, 1994). De acordo com esse tipo de abordagem, previsões acerca de dificuldades de processamento deveriam ser feitas em termos de preferências lexicais. Nesse sentido, os resultados que indicam que, em contextos de ambigüidade sintática, o parser privilegia a aposição de argumentos deveriam ser interpretados em termos de freqüência: a maior rapidez na leitura de PPs argumentos seria decorrente de estes ocorrerem com maior freqüência junto aos núcleos lexicais que os selecionam. Esperar-se-ia, considerando-se essa proposta, que as decisões iniciais do parser fosse afetadas por plausibilidade, a qual mantém uma relação com freqüência (visto que em geral o mais plausível corresponderia ao mais freqüente). No entanto, conforme reportado por Speer & Clifton (1998), na região do PP há uma preferência por argumento, independentemente de plausibilidade.48 Kennison (2002) testa especificamente se a freqüência de uso de um verbo como transitivo ou intransitivo poderia influenciar a análise de um NP pós-verbal como argumento ou adjunto. Os autores manipularam a freqüência de ocorrência dos verbos junto a NPs argumentos e adjuntos, o que deu origem a duas condições experimentais: uma com verbos de emprego preferencial como transitivos e outra com verbos de emprego preferencial como intransitivos. Também foi tomada como variável independente o status argumental do NP, se argumento ou adjunto, conforme exemplos a seguir (cf.tabela I, Kennison 2002): 1996, exs. (21), p. 43). Foge ao escopo desta tese avaliar em que medida essa teoria poderia ser estendida para dar conta das estruturas de adjunção envolvendo PPs modificadores de nomes e de verbos, em particular como seria feita a integração entre informação estrutural e semântica quando da interpretação de sintagmas não-primários. De todo modo, é importante sinalizar que a idéia de que certos tipos de sintagmas poderiam ser concatenados de forma diferenciada, de uma maneira menos determinística, expressa pela idéia de “associação”, apresenta-se como uma possibilidade interessante para dar conta da diferença entre argumentos e adjuntos.47 Ver Maia et Finger (2003), para considerações iniciais acerca de uma possível relação entre a distinção Set-Merge e PairMerge (Chomsky 2001) e as relações primárias e não primárias propostas no âmbito do modelo de Construal (Frazier & Clifton, 1996) e para um experimento com orações relativas em português, em que são confrontados dois modelos de processamento: o modelo de Construal (Frazier & Clifton, 1996) e a Hipótese da Prosódia Implícita (Fodor 1998, 2002). 48 Um dado interessante, para o qual infelizmente não foi realizada análise estatística, diz respeito ao tempo de leitura de PPs adjuntos em função da variável plausibilidade: os de alta plausibilidade são lidos mais rapidamente do que os de baixa plausibilidade. Esse resultado pode ser tomado como uma evidência a favor de Construal, que prevê uma diferença entre sintagmas primários e não-primários em termos de interferência de informação não-gramatical. 76 Status argumental Verbos de emprego + transitivo: Verbos de emprego – transitivo: Everyone knew that/ Meredith/ Everyone READ/every play/despite/her busy PERFORMED/every play/despite/her schedule./ busy schedule./ Everyone knew that/ Meredith/ Everyone READ/every week/despite/her busy PERFORMED/every schedule./ despite/her busy schedule./ do NP NP argumento NP adjunto knew knew that/ that/ Meredith/ Meredith/ week/ Foram realizados dois experimentos: um de leitura auto-monitorada e outro de monitoramento do olhar (através de eyetracker). Os resultados dos dois experimentos foram semelhantes: não houve diferença de tempo de leitura de NPs argumentos após verbos + ou – transitivos. Já para os NPs adjuntos, houve diferença: o tempo de leitura destes foi maior com verbos + transitivos do que com verbos – transitivos. Logo, só foi obtido um efeito de freqüência de uso do verbo (+ transitivo ou – transitivo) para os NPs adjuntos. Quando comparados NPs argumentos e NPs adjuntos, os primeiros foram lidos mais rapidamente do que NPs adjuntos após verbos + transitivos e não houve diferenças em relação aos verbos – transitivos. É importante observar que esses efeitos ocorrem relativamente tarde no processamento das sentenças. No experimento de monitoramento do olhar, eles só são detectados quando se considera o tempo total de leitura (definido como a soma de todas as fixações feitas na região analisada). Isso sugere que freqüência não é levada em consideração nas decisões iniciais do parser. Além disso, os resultados indicam que esta informação só é relevante para os NPs adjuntos. A título de síntese, vejamos o que os resultados de experimentos de compreensão nos permitem afirmar acerca do papel de status argumental do PP modificador no processamento de sentenças. Primeiro, foi visto que o parser é sensível à informação relativa ao status argumental, com uma preferência por aposição de argumentos à aposição de adjuntos em situações de ambigüidade sintática. Segundo, foi verificado que, embora plausibilidade seja um fator levado em conta no processamento, as decisões iniciais do parser são tomadas com base em informação relativa ao status argumental do PP modificador. Também foram obtidos efeitos de freqüência relativos ao uso de verbos com uso + ou – transitivo, mas um experimento de monitoramento do olhar indicou que esses 77 efeitos ocorrem relativamente tarde. Logo, pode-se concluir que a preferência pela aposição de argumentos não é determinada por fatores semânticos ou de freqüência de uso. Estes fatores atuam como elementos de um processo integrativo final, mas não são considerados no início do processamento da sentença. 4.1.2.3.2 Diferenças estruturais entre argumentos e adjuntos e questões de acessibilidade no processamento Foi visto na seção anterior que a Hipótese de Construal permite explicar preferências do parser pela aposição de argumentos na resolução de ambigüidades estruturais. De acordo com essa hipótese, os argumentos corresponderiam a sintagmas primários e seriam apostos de forma determinística à estrutura sintática, já os adjuntos corresponderiam a sintagmas não-primários e seriam apenas “associados” à árvore sintática, isto é concatenados de forma subespecificada, permitindo que fontes não-sintáticas determinassem sua interpretação. Esse tratamento diferenciado de argumentos e adjuntos é compatível com o modo como relações de complementação e de adjunção vêm sendo caracterizadas pela teoria lingüística gerativista. Argumentos e adjuntos podem ser distinguidos em termos de relações de continência e inclusão. Enquanto um argumento está contido e incluído na projeção máxima de um núcleo, um adjunto é um constituinte que está apenas contido. Considerem-se as definições e a representação sintática abaixo (cf. Mioto et al., p.66) Inclusão: α inclui β se e somente se todos os segmentos de α dominam β. Continência: α contém β se nem todos os segmentos de α dominam β. XP2 XP1 ZP2 X’ X ZP1 78 Tomando-se o ZP1 e o ZP2 como dois sintagmas que se relacionam com o núcleo X, pode-se dizer, com base nas definições dadas, que ZP1 está incluído na projeção máxima desse núcleo, dado que é dominado por cada segmento de XP (no caso, XP1 e XP2). Já o ZP2 não está incluído e sim apenas contido na projeção máxima do núcleo X, pois é dominado apenas por XP2, mas não por XP1. Esse tipo de representação de certo modo reflete a idéia de que os adjuntos são termos mais marginais, no sentido de menos diretamente vinculados ao núcleo sintático, o que é consistente tanto com a distinção semântica de argumentos e adjuntos como com o fato de que argumentos e adjuntos comportam-se diferentemente em relação a um conjunto de testes sintáticos, por exemplo o de extração de constituintes. Do ponto de vista do processamento, uma idéia a ser explorada é a de uma possível correlação entre acessibilidade de informações pela memória de trabalho e a relação estrutural de argumentos e de adjuntos com o núcleo sintático. Considerando-se que há evidências de que fatores estruturais podem determinar o grau de acessibilidade de uma informação na memória (Mathews & Chodorow, 1988) e que argumentos e adjuntos se diferenciam em termos de como se concatenam à árvore sintática, é possível prever que informação presente nesses modificadores também tenha grau de acessibilidade diferenciado. Sintagmas que em termos estruturais fossem mais fortemente vinculados à projeção máxima de um núcleo teriam um grau de acessibilidade maior do que aqueles com vínculo “menos forte”, isto é, que mantivessem apenas uma relação de continência com a projeção máxima do núcleo sintático. Assim, no processamento de PPs ambíguos, os tempos de leitura dos argumentos seriam menores do que os de adjuntos porque aqueles estariam mais prontamente acessíveis, visto que o núcleo (seja o verbo ou o nome) já traria informação se há ou não uma posição argumental na estrutura sintática em construção que precisa ser preenchida. 49 49 Outro ponto a se considerar é que as preposições dos PPs que introduzem argumentos não são do mesmo tipo daquelas que introduzem adjuntos. As primeiras são preposições funcionais; elas apenas atribuem caso ao sintagma que introduzem. O papel temático é atribuído pelo núcleo. Já as preposições que introduzem adjuntos, são lexicais, elas atribuem caso e também papel temático ao sintagma. Assim, também em termos temáticos, há uma ligação mais forte do núcleo com argumentos do que com adjuntos. 79 4.1.2.3.3 Erros de atração e o papel do status argumental de PPs modificadores Reportam-se a seguir alguns resultados referentes à produção de sentenças, que permitem discutir a relevância do status argumental de PPs modificadores para o processamento da concordância verbal. Na literatura sobre erros de atração, esse fator é pouquíssimo discutido. Há, não obstante, um conjunto de experimentos reportados em Solomon & Pearlmutter (2004) sobre o papel de integração semântica50 no planejamento sintático que permitem verificar se o tipo de PP (argumento/ adjunto) em que está inserido o núcleo interveniente pode levar à produção de erros de concordância. Os autores utilizam a técnica de produção induzida de erros, a partir da apresentação de preâmbulos por via visual na tela de um computador. Em 4 experimentos, os autores manipulam o grau de integração semântica variando o tipo de preposição que liga os sintagmas que compõem os preâmbulos experimentais. No primeiro experimento, o contraste é feito entre as seguintes estruturas: a. The drawing of the flower. b. The drawing of the flowers. c. The drawing with the flower. d. The drawing with the flowers. A idéia é que os sintagmas ligados pela preposição “of” seriam mais integrados do que aqueles com a preposição “with”. Os resultados obtidos foram os seguintes: houve efeito principal de número do termo local, com mais erros na condição nome local plural; efeito principal de tipo de preposição, com mais erros na condição com a preposição “of”, e também interação das duas variáveis. O efeito de incongruência entre 50 A integração semântica é definida como uma propriedade do nível da mensagem que diz respeito ao grau de ligação entre dois termos numa representação discursiva ou num modelo mental. Os autores exemplificam essa propriedade a partir do contraste entre as estruturas em (1a) e (1b). (1) a. The ketchup or the mustard. b. The bracelet made of silver. Em (1a), embora os termos ketchup e mustard sejam similares em termos de sentido, eles não seriam semanticamente integrados, porque (1a) não provê informação sobre como esses nomes se relacionam um ao outro. Já os termos bracelet e silver em (1b) seriam semanticamente integrados porque a expressão made off ofereceria informação específica sobre como esses dois nomes se relacionam no fragmento em questão. 80 número do N1 e número do N2 foi maior para os preâmbulos com “of” do que para os preâmbulos com “with”. O problema é que esse experimento confunde diferenças de integração semântica com a distinção argumento/adjunto. Logo, os resultados tanto podem ser indicativos de um efeito de integração entre os sintagmas quanto de um efeito de status argumental do PP modificador. Nos 3 experimentos seguintes, Solomon & Pearlmutter (2004) manipulam o grau de integração semântica apenas em PPs não-argumentos, de modo a tentar isolar um efeito provocado por essa variável de um efeito de status argumental. Os resultados obtidos revelaram que a incidência de erros de atração é maior após sintagmas semanticamente mais integrados. Não é claro, no entanto, em que medida os preâmbulos testados apresentariam todos a mesma estrutura e, nesse sentido, é questionável a conclusão de que integração semântica é o único fator que estaria afetando o processamento da concordância.51 Pode-se, pois, dizer que os resultados desses experimentos não permitem excluir um possível efeito de status argumental relativo ao PP em que está inserido o núcleo interveniente. O quinto experimento de Solomon & Pearlmutter (2004) busca contrastar diretamente a distinção argumento/adjunto e integração semântica. Para isso, emprega, após o núcleo do sujeito, PPs argumentos, orações relativas e orações completivas, conforme exemplos reproduzidos a seguir: a. The report of the nasty auto accident. b. The report of the nasty auto accidents. c. The report that described the traffic accident. d. The report that described the traffic accidents. e. The report that Megan described the accident. f. The report that Megan described the accidents. Segundo os autores, a oração completiva permitiria verificar se o efeito obtido no experimento 1 com PPs argumento poderia ser atribuído exclusivamente ao status argumental do modificador, visto que os nomes nas orações completivas 51 Avelar (2005a, 2005b) apresenta evidências de que, no português brasileiro, PPs tradicionalmente classificados como adjuntos adnominais podem se comportar de modo distinto tanto semântica quanto sintaticamente e propõe 3 padrões de adjunção para constituintes preposicionados na função de adjunto adnominal. Considerando-se a possibilidade de se estender essa análise para o inglês, é possível que os PPs examinados por Solomon & Pearlmutter (2004) correspondam a diferentes estruturas de adjunção e, nesse sentido, não seria possível atribuir os resultados obtidos apenas a uma diferença relativa à variável integração semântica. 81 são semanticamente independentes do núcleo do sujeito. A oração relativa, por sua vez, seria um adjunto ligado ao núcleo do sujeito por co-indexação, o que garantiria a integração semântica entre o nome local e o núcleo. Os resultados obtidos foram os seguintes: houve um efeito de estrutura, os PPs induziram mais erros do que as orações, e as orações relativas induziram mais erros do que as completivas. Também houve interação entre estrutura e número do nome local: o efeito de incongruência de número foi maior nas condições com PPs do que com orações. Não houve efeito de incongruência para as completivas e identificou-se um efeito intermediário para as relativas. A diferença entre relativas e completivas é apresentada como evidência de que o status argumental da estrutura contendo o nome local não influenciaria os processos envolvidos na concordância sujeito-verbo. Assim, o efeito observado no experimento 1 seria, segundo os autores, decorrente apenas de integração semântica. Uma diferença que não é satisfatoriamente explicada pelos autores é porque nomes locais de PPs induziram mais erros do que nomes locais nas relativas, já que em ambas as estruturas o nome local está integrado semanticamente ao núcleo do sujeito. Uma possibilidade por eles considerada é que, para haver integração semântica, não poderia existir fronteira oracional entre os sintagmas, visto que a oração deixaria a informação do nome local “insulada”, como proposto por Bock & Cutting (1992). Um aspecto que merece atenção no experimento 5 é que as oração classificada como completiva poderia ser temporariamente analisada como uma oração relativa de objeto, o que levaria o sujeito a um efeito de garden path quando encontrasse o nome local “accident(s)”. Os autores não fornecem a lista de preâmbulos experimentais utilizados; logo, não é possível julgar se isso se repete em todas as condições experimentais. De qualquer forma, trata-se de um problema que pode vir a ter afetado os resultados, tendo-se em vista que os preâmbulos eram apresentados na tela de um computador. Isso somado às críticas feitas aos experimentos 1 a 4 indica que os resultados de Solomon & Pearlmutter (2004) não podem ser tomados como conclusivos acerca do papel de status argumental do PP em que se encontra o núcleo interveniente e que este fator ainda carece de investigação. No capítulo 8, reportam-se os resultados de um experimento em que se investiga especificamente a interferência desse fator no processamento da concordância. 82 4.1.3 Fatores morfofonológicos Em relação à possível interferência de fatores morfofonológicos no processamento da concordância, resultados experimentais têm apontado de forma bastante consistente para uma assimetria entre o número do núcleo do sujeito e o de um núcleo interveniente, com maior ocorrência de erros na condição em que aquele é singular e este, plural (Bock & Eberhard, 1993; Fayol et al. 1994; Vigliocco, Butterworth & Semenza, 1995; Vigliocco, Butterworth & Garrett, 1996; Haskell & MacDonald, 2003, entre outros). Segundo Bock & Eberhard (1993), esse efeito seria decorrente do modo como informação de número é representada. Apoiados na visão de Jakobson (1957) de que todas as oposições lingüísticas refletem uma diferença em termos de posse de uma dada propriedade, os autores propõem que os nomes no plural apresentariam uma especificação para número, seriam marcados em relação a essa propriedade, enquanto aqueles no singular seriam destituídos dessa propriedade, seriam não-marcados. Partindo de uma proposta de ativação de traços, os autores explicam a assimetria singularplural no processamento da concordância dizendo que, em preâmbulos com N1 sing e N2 pl, o nome local, por ser plural, apresentar-se-ia particularmente ativado, podendo se sobrepor a N1, o que induziria um erro na seleção da forma verbal correta. Importante aqui distinguir marcação de número, enquanto uma propriedade de natureza mais abstrata, relativa a um traço formal da língua, relevante para a computação sintática, de uma realização fonológica de um traço formal de número. Essa distinção, conforme se verá adiante, tem implicações para o modelo de produção assumido na presente tese. Uma questão que se coloca ao se investigar um efeito de marcação é em que medida é possível dissociá-lo de um efeito meramente fônico. Resultados de experimento com falantes de inglês realizado por Bock & Eberhard (1993) não evidenciaram nenhum efeito da variável forma fônica do nome local. A forma fônica foi manipulada a partir do contraste entre nomes flexionados no plural e substantivos homófonos no singular, com a mesma terminação do afixo de plural: The gardener with the hoes (pl) vs. The gardener with the hose (sing.) (em que hose é homófono de hoes). Apenas os nomes flexionados no plural induziram erros de atração, o que indica que o efeito não é meramente fônico. O experimento 83 não permite, contudo, distinguir entre um efeito morfológico (relativo à presença de um traço formal de número) e morfofonológico. Esse aspecto será explorado no experimento 5 do presente trabalho, fazendo-se uso de formas invariantes em número como pires, no português. Bock & Eberhard (1993) investigaram se haveria uma diferença entre formas regulares e formas irregulares de plural em inglês, visto que nessa língua há algumas poucas palavras para as quais o plural não se forma pelo acréscimo de um afixo “s”. Alguns exemplos são os pares goose-geese, man-men, womanwomen, child-children, foot-feet, mouse-mice, tooth-teeth, ox-oxen. Os autores contrastaram esses pares a outros cuja forma de plural é regular: swan-swans, boyboys, lady-ladies, hand-hands, rat-rats, mouth-mouths, horse-horses. A variável “regularidade do nome local” não teve efeito significativo, isto é, plurais regulares e irregulares induziram erros de atração igualmente, o que foi interpretado como compatível com a idéia de que não é apenas a morfologia regular de plural que controla a concordância, mas uma especificação mais abstrata de número. Esse experimento foi replicado posteriormente por Haskell & MacDonald (2003), tendo sido obtidos resultados na mesma direção. É curioso observar que, na lista de plurais irregulares, alguns pares exibem uma certa “regularidade” entre a forma singular e a forma plural, regularidade essa relativa a uma mudança fônica ou no meio da palavra ou no final da palavra: goose-geese, foot-feet, tooth-teeth; man-men, woman-women, child-children, oxoxen. Tendo isso em vista, talvez se possa considerar que também nos plurais irregulares há uma informação de natureza fônica associada à informação abstrata de número que contribua para a produção de erros de atração. Nesse sentido, não se poderia descartar um efeito morfofonológico com base nesses dados. Em termos experimentais, cabe citar que Haskell & MacDonald (2003) observaram um efeito do tipo de plural no contraste de preâmbulos cujo núcleo era um coletivo (The family of the rats vs. The family of the mice). O resultado indicou um maior número de erros na condição plural regular.52 52 Haskell & MacDonald (2003) explicam esses resultados com base em um modelo de satisfação de condições. Nesse modelo, múltiplos fatores interagiriam para determinar a concordância; e efeitos de fatores sutis só emergeriam em condições nas quais fator(es) mais forte(s) também estivessem atuando. Assim, a presença de um substantivo coletivo (nocionalmente plural e gramaticalmente singular) seria uma condição que entraria em conflito com o problema da marcação morfofonológica de número, fazendo com que a distinção plural regular x irregular apresentasse um efeito na concordância. Quanto à maior ocorrência de erros com plurais regulares, 84 Outro tipo de dado relevante para se pensar a natureza da interferência associada à marcação de número são os nomes que apresentam um traço de número privativo plural, sem uma forma singular correspondente. Retomam-se aqui os resultados experimentais com substantivos bipartidos e pluralia tantum examinados na seção 4.1.1.2, referente a efeitos semânticos. Foi visto que esses substantivos comportaram-se de modo distinto dos plurais regulares em termos de indução de erros de concordância. Tanto os bipartidos (trousers, scissors), como os pluralia tantum (accommodations, annals), embora tenham induzido mais erros de atração do que substantivos no singular, eliciaram menos erros de atração do que formas regulares de plural. Esse resultado parece sinalizar que o processador leva em conta também a natureza do traço de número53 e possivelmente a presença de uma marca aberta claramente associada a número. Questões associadas à visibilidade da marcação de número no DP sujeito também precisam ser consideradas na análise de erros de atração. Vigliocco, Butterworth & Semenza (1995) reportam evidências de um efeito de marcação em experimento, conduzido com falantes de italiano, no qual manipularam o tipo de substantivo usado na posição de núcleo do sujeito e de nome local. Foram usados substantivos flexionáveis em número e substantivos invariantes em relação a uma forma de plural ou de singular.54 Verificou-se um maior número de erros com os substantivos invariantes em número do que com os substantivos flexionáveis. Esse resultado pode ser explicado em termos de visibilidade da informação de número no DP sujeito como um todo: nos sintagmas com substantivos invariantes, a informação de número só é expressa no determinante (artigos definidos, no caso do experimento analisado) e este, por sua vez, não apresenta Haskell & Mac Donald a atribuem à representação semântica de numerosidade associada a cada tipo de plural. Segundo eles, os sintagmas com nomes locais de plural regular seriam representados como sendo de algum modo mais plurais do que os sintagmas contendo nomes locais de plural irregular. Não deixam claro, contudo, que propriedade dos plurais regulares faria com que estes fossem representados de forma diferenciada dos irregulares. 53 A distinção entre bipartidos e pluralia tantum vs. plurais regulares pode ser capturada nos termos de Chomsky (1995) a partir do conceito de traço formal intrínseco e opcional. O traço intrínseco teria um valor já definido na representação do item lexical e o traço opcional teria seu valor especificado no momento em que o item entra na numeração, a qual é um conjunto de itens selecionados do léxico que serão empregados no curso de uma derivação sintática. Os bipartidos e pluralia tantum teriam um traço intrínseco de número (no caso, plural) e os plurais regulares teriam um traço opcional de número. 54 Em italiano substantivos como città, cinema são usados tanto acompanhados de determinantes no singular quanto no plural. A informação de número é dada apenas pelo determinante: la città (singular) vs. le città (plural); il cinema (singular) vs. i cinema (plural). 85 uma marca flexional exclusiva de número em italiano; além de informação de número, os determinantes especificam informação relativa ao gênero do substantivo e há muita variação em função disso. Há as seguintes formas de artigo definido: la (fem.sing); le (fem.pl.); il (masc.sing.); i (masc.pl.); lo (masc. sing.); gli (masc. pl.). Nos sintagmas com substantivos flexionáveis, por outro lado, a informação de número é dada tanto no determinante quanto no nome, o que a torna mais visível, no sentido de poder ser recuperada em dois pontos distintos. Ainda em relação a um efeito de marcação associado à visibilidade e regularidade da informação de número, são interessantes os resultados dos experimentos de Franck, Vigliocco & Nicol (2002), no qual foi manipulado o número do núcleo do sujeito (N1) e de núcleos intervenientes (N2 e N3), em estruturas envolvendo dois PPs: The threat(s)N1 to the president(s)N2 of the company(ies)N3. Os experimentos foram conduzidos com falantes de inglês e de francês. Dois resultados chamam inicialmente a atenção: primeiro, o fato de o total de erros (erros de concordância e de repetição do preâmbulo) ter sido maior no francês (27.7%) do que no inglês (16.3%); segundo, a ausência de efeito de número para os 3Ns no francês em comparação ao inglês, em que houve efeito de número do N1 e do N2. O primeiro resultado está de acordo com o de trabalhos anteriores, embora, no caso dos experimentos considerados, a diferença observada se deva apenas aos erros de repetição. Já o segundo resultado, no que diz respeito ao francês, está na direção contrária a resultados obtidos em experimentos anteriores, com preâmbulos do tipo N1 + N2. Nesses trabalhos houve uma assimetria entre singular/plural, com maior número de erros para quando o núcleo do sujeito era singular. Os autores explicam a diferença entre francês e inglês em termos de diferenças de complexidade da morfologia verbal de cada língua. É estabelecida a seguinte correlação: a probabilidade de se produzir um erro de concordância seria função da possibilidade de se fazer um erro relativo à escolha da forma verbal correta. A probabilidade de se produzir a forma verbal correta ao acaso seria menor quando houvesse muitas formas do que quando houvesse apenas uma. Como no francês a morfologia verbal é mais complexa e, por conseguinte, a produção da flexão verbal mais sujeita a erro, também mais erros de concordância poderiam ser produzidos. Além disso, no inglês as formas verbais de plural seriam morfofonologicamente mais simples do que as de singular. Em inglês o singular 86 envolve o acréscimo de um –s e, segundo os autores, a adição de flexão teria um custo computacional alto.55 Uma explicação bastante diferente desta permite dar conta dos resultados. Tomando-se como fator relevante a questão da “visibilidade” da informação de número no DP sujeito, pode-se atribuir a ausência de uma assimetria singular/plural em francês ao fato de nessa língua a distinção singular/plural não ser saliente nos nomes no caso da produção oral. Embora no experimento com falantes de francês o preâmbulo tenha sido apresentado visualmente (modalidade em que a distinção singular e plural é observada), os participantes deveriam ler e depois repetir o preâmbulo completando a sentença preferencialmente com o verbo être. Como na fala, a informação de número não é marcada nos nomes e os determinantes não apresentam uma marca individualizada de número, é possível que distinção singular/plural no francês não seja tão saliente quanto o é em outras línguas. Já no caso do inglês, a informação de número é claramente obtida no nome, o que justifica o menor número de erros de atração para as condições em que o núcleo do sujeito é plural. 56 55 A hipótese de custo computacional assumida pelos autores foi apresentada por Vigliocco & Franck (1999) para explicar resultados de experimentos em que investigaram a concordância de gênero entre sujeito e predicativo. Nesses experimentos, verificou-se que em comparação a falantes de italiano, os falantes de francês tinham uma particular tendência a produzir erros de concordância com nomes femininos. A justificativa fornecida foi que enquanto a forma de feminino de adjetivos em francês seria obtida pelo acréscimo de um morfema (ex. sourdmasc., sourdefem), em italiano ela seria resultante de uma variação vocálica [o] [a] (distrattomasc., distrattafem. ‘distraído(a)’). Independentemente da adequação desta hipótese para os dados de gênero – note-se que o “o” final é considerado uma marca de masc. no francês, não nos parece que o mesmo raciocínio possa ser aplicado aos verbos. Nos verbos regulares, o plural apresenta a mesma pronúncia do singular e, nos verbos irregulares, em particular no verbo être empregado no experimento com falantes de francês, as formas de singular e plural são totalmente distintas – est/sont. 56 Sobre essa assimetria singular/plural observada no inglês, é interessante reportar resultados de dois experimentos de compreensão, com a técnica de leitura auto-monitorada, realizados por Pearlmutter (2000). O autor testou o tempo de leitura para preâmbulos como The lamp near the painting of the house, manipulando, em cada experimento, o número dos núcleos nominais intervenientes (painting e house). No primeiro experimento, o número do N1 era sempre singular e, no segundo, plural. Para N1 sing, as condições em que N2 e/ou N3 eram incongruentes em relação a N1 induziram mais erros do que a condição neutra, porém não houve diferença em relação ao número de N2 e N3. Já para N1 plural, houve um efeito significativo do número de N2, com maior tempo de leitura para as condições em que este era singular, incongruente em relação ao número do núcleo do sujeito (The lamps near the painting of the houses; The lamps near the painting of the house). Não houve efeito de N3. A diferença entre o experimento 1 e o experimento 2 pode ser atribuída a um efeito de marcação. Segundo Pearlmutter, sendo o plural uma forma marcada, os DPS com núcleo do sujeito plural seriam resistentes à interferência de elementos intervenientes e apenas fatores efetivamente relevantes poderiam afetar a concordância com o núcleo do sujeito. Assim, segundo o autor, se houvesse uma diferença entre N2 e N3, ela deveria ter maior probabilidade de se manifestar com 87 O português, como veremos no experimento 2, apresenta-se como uma língua interessante para distinguir entre as duas hipóteses, visto que, embora a informação de número seja saliente como no caso do inglês, a morfologia verbal aproxima-se mais do francês. Logo, se de fato o que conta é a morfologia, o português deveria se comportar como o francês; se, no entanto, a “visibilidade” for o fator relevante, o português deverá apresentar resultados semelhantes aos do inglês. um núcleo do sujeito plural. A idéia é que o singular seria tão fraco que um elemento interveniente tanto em N2 quanto em N3 poderiam interferir no processamento, levando a uma redução no tempo de leitura. Já no caso do plural, sendo este mais forte, ele filtraria efeitos de elementos com menos possibilidades de gerar interferência, no caso, um efeito de N3. O autor não compara os dois experimentos no sentido de verificar se, no total, é significativa a diferença de tempo de leitura entre N1singular e N1 plural; de qualquer modo, os resultados apresentados sugerem que, assim como na produção, há uma assimetria entre singular e plural e um efeito de marcação no processamento da concordância. 88 5 Distinguindo casos de concordância licenciados pela gramática da língua de falhas de processamento – uma análise da concordância “facultativa” com construções partitivas Este capítulo tem como objetivo prover uma análise lingüística para as construções partitivas do tipo “A maioria de + DP” e “Uma parte de + DP”, as quais, além da concordância canônica entre sujeito e verbo, também licenciam em português a concordância com o segundo núcleo nominal do DP sujeito, como se observa em (1)57. (1) a. A maioria dos jogadores de futebol viajou ontem. b. A maioria dos jogadores de futebol viajaram ontem. Este tópico integra-se à discussão relativa aos erros de atração, pois permite diferenciar a concordância enquanto um processo sintático, decorrente de operações do sistema computacional sobre traços formais da língua, daquilo que seria uma falha resultante de algum tipo de interferência no processamento da concordância, como a que se verifica em (2b). (2) a. O treinador dos jogadores de futebol viajou ontem. b. *O treinador dos jogadores de futebol viajaram ontem. Partindo-se da hipótese de que cada alternativa de concordância em (1) corresponde a uma representação estrutural distinta da construção partitiva, buscase determinar o que explicaria a existência de duas representações diferentes e como seria cada uma delas. Considera-se inicialmente uma explicação baseada na pluralidade semântica das partitivas. Verifica-se, em seguida, uma possível associação entre leitura da partitiva (de grupo vs. distributiva) e o termo selecionado como controlador da concordância (primeiro ou segundo núcleo nominal do DP sujeito). Discute-se, então, a natureza categorial dos itens lexicais “maioria” e “parte” e avalia-se como uma distinção entre propriedades lexicais e funcionais associadas a esses itens poderia dar origem a estruturas sintáticas distintas, com conseqüente reflexo para a concordância. 57 Com o objetivo de facilitar a leitura, utilizou-se uma seqüência de numeração dos exemplos própria para o capítulo. 89 Também são apresentados, neste capítulo, os resultados de uma tarefa de julgamento de gramaticalidade, em que um grupo de falantes avaliou a concordância verbal (singular e plural) com construções partitivas e com DPs complexos, em sentenças semelhantes àquelas exemplificadas respectivamente em (1) e (2). Foi utilizado um procedimento psicolingüístico de testagem a fim de se poder examinar, de forma mais controlada, como os falantes julgam as referidas sentenças e determinar em que medida estes diferenciam as duas construções quanto ao processamento da concordância. 5.1 Análise lingüística 5. 1. 1 Concordância “ad sensum” e leitura de grupo vs. leitura distributiva No estudo das partitivas, uma primeira questão que se pode colocar é se a ocorrência do verbo no plural seria determinada pela atribuição de uma idéia de pluralidade ao sujeito, fenômeno tratado nas gramáticas tradicionais sob o rótulo de concordância ad sensum ou silepse. Assim, no lugar de estabelecer a concordância canônica com o núcleo do sujeito, o verbo concordaria com um número conceitual plural do sujeito. A esse respeito, é pertinente a observação de Peres & Móia (1995) de que não se pode atribuir ao sentido plural da expressão no seu todo o fato de o verbo vir flexionado no plural. Se assim o fosse, deveriam ser igualmente aceitáveis as sentenças a seguir: (3) *A maior parte do rebanho puseram-se a fugir. (Peres & Móia, 1995, ex.1603) (4) A maior parte das ovelhas puseram-se a fugir. (Peres & Móia, 1995, ex.1604) O fenômeno em exame é mais complexo e parece estar associado à escolha sintática de um dos núcleos nominais como o determinante da concordância verbal. Cumpre, pois, investigar o que determina a escolha do núcleo com o qual o verbo irá entrar em relação de concordância. 90 Gramáticas normativas da língua portuguesa (Cunha & Cintra, 1985; Lima, 1986; Bechara, 1999) sugerem que a definição do termo controlador da concordância dependeria de questões estilísticas: o verbo ficaria no singular quando o conjunto estivesse em destaque e, no plural, quando a ação verbal pudesse ser atribuída separadamente aos elementos que compõem o todo.58 Nesse sentido, esperar-se-ia que o português apresentasse um comportamento semelhante ao do espanhol em que, de acordo com Brucart (1997 apud Saab, no prelo a), haveria uma correspondência entre concordância verbal e leitura atribuída a expressões partitivas e pseudo-partitivas na posição de sujeito59. O verbo no plural estaria associado a uma leitura distributiva dessas expressões e o verbo no singular, a uma leitura de grupo. A sentença (a) abaixo é um exemplo de construção pseudo-partitiva e as outras, exemplos de construções partitivas. (5) a. Un grupo de senadores votó/votaron la ley. b. Un grupo de los senadores votó/votaron la ley. c. La mayoría de los senadores votó/votaron la ley. d. Una parte de los senadores votó/votaron la ley. O português, contudo, não se comporta como o espanhol. Em primeiro lugar, expressões pseudo-partitivas e partitivas encabeçadas pelo substantivo “grupo” não licenciam verbo no plural, como se pode observar nas sentenças (6a) e (6b) a seguir, correspondentes, respectivamente, às sentenças (5a) e (5b): (6) a. Um grupo de senadores votou/*votaram a lei. 58 A concordância do verbo com o substantivo plural das construções partitivas já se observa em textos quinhentistas. A esse respeito, ver Said Ali, M., Gramática Histórica da Língua Portuguesa. 8ª ed. rev. e atual. São Paulo: Melhoramentos: Brasília, DF: Editora Universidade de Brasília, 2001, p. 218, § 1453. 59 A distinção entre construções partitivas e pseudo-partitivas vem sendo estabelecida na literatura de orientação gerativista desde os trabalhos de Selkirk (1977) e Jackendoff (1977). Embora superficialmente a diferença entre essas construções pareça se limitar à ocorrência de um determinante no PP partitivo, elas apresentam comportamentos distintos em relação a um conjunto de fenômenos, tais como extraposição, modificação por adjetivo, s-seleção, stranding de preposição, anteposição do sintagma preposicionado, recursividade (cf. Selkirk, 1977; Deevy, 1999; Alexiadou, Haegman & Stavrou, 2003; Stickney, 2004). Para uma discussão do comportamento sintático de partitivas vs. pseudo-partitivas e de representações estruturais que vêm sendo propostas, ver Stickney (2004). 91 b. Um grupo dos senadores votou/*votaram a lei.60 Em segundo lugar, os falantes não parecem ter qualquer tipo de preferência por uma leitura de grupo ou distributiva em função da forma do verbo (singular ou plural) como ocorre com o espanhol.61 Antes, contudo, de se descartar uma possível correspondência entre concordância verbal e leitura da partitiva, foram examinados contextos sintáticos que poderiam licenciar apenas uma possibilidade de leitura da expressão partitiva, a fim de verificar se nesses contextos uma dada forma verbal seria privilegiada. Um primeiro contexto sintático examinado foi o de elipse nominal. Em espanhol, nomes que participam em construções de concordância ad sensum não podem sofrer elipse. Entre essas estruturas, estariam também as construções partitivas. De acordo com Saab (no prelo a; no prelo b), embora as sentenças com o verbo no singular sejam julgadas marginais, é possível ainda assim estabelecer um contraste entre estas sentenças e aquelas em que o verbo fica no plural. (7) a. ? La mayoria de los senadores votó a favor de la ley pero la mayoría de los diputados votó en contra. b. *La mayoria de los senadores votaron a favor de la ley pero la mayoría de los diputados votaron en contra. 60 Na aplicação do teste de julgamento de gramaticalidade, alguns falantes perceberam um contraste entre as sentenças em (6) quando o verbo estava no plural. Foi considerada menos marginal a concordância plural com a expressão pseudo-partitiva do que com a expressão partitiva. De todo modo, em ambos os casos houve uma clara preferência pelo verbo no singular. Quando se substitui o artigo indefinido “um” por um artigo definido ou por um demonstrativo, não há dúvidas quanto a agramaticalidade da concordância plural: O/Aquele grupo de senadores votou/*votaram a lei. É possível que essas diferenças de julgamento estejam associadas ao status categorial atribuído à palavra “grupo” em cada sentença. Quando numa construção pseudo-partitiva, antecedido pelo indefinido, o termo “grupo”, embora não perca seu status de nome, parece também funcionar com uma espécie de quantificador, o que, como veremos mais adiante, pode influenciar na concordância verbal. 61 Mesmo para o espanhol, ao contrário do que afirma Brucart (1997), nem sempre é clara a relação entre concordância verbal e leitura de expressões pseudo-partitivas. Saab (no prelo a) cita um exemplo de sentença em que um verbo no plural concorda com uma expressão pseudopartitiva a qual, dada a presença de um adjetivo, só pode ser atribuída uma leitura de “grupo”. Nesse caso, só deveria ser possível a concordância singular, no entanto a sentença é perfeita em espanhol: Un numeroso grupo de hombres, mujeres y ninõs formaron una extensa cola. 92 No português, em sentenças semelhantes, o julgamento dos falantes consultados não foi muito claro, tendo ocorrido um estranhamento quanto à própria elipse de “maioria”, independentemente da concordância verbal. De todo modo, assim como no espanhol, também é possível capturar um contraste entre as sentenças (8a) e (8b). (8) a. ?A maioria dos senadores votou a favor da lei, mas a maioria dos deputados votou contra. b. *A maioria dos senadores votaram a favor da lei, mas a maioria dos deputados votaram contra. Quando se verifica a aceitabilidade de sentenças com o partitivo “parte”, a elipse nominal não é possível, independentemente da concordância verbal. (9) a. *Uma parte dos senadores votou a favor da lei, mas uma parte dos deputados votou contra. b. *Uma parte dos senadores votaram a favor da lei, mas uma parte dos deputados votaram contra. Logo, parece que a recusa à elipse de nomes que integram as expressões partitivas analisadas não está relacionada ao valor do traço de número do verbo. Note-se que, mesmo quando questões de concordância não estão em jogo, tanto “maioria” quanto “parte” não podem ser elididos. (10) a. * Na festa do departamento, eu encontrei a maioria dos alunos, mas não a maioria dos professores. b. * Na festa do departamento, eu encontrei uma parte dos alunos, mas não uma parte dos professores. 93 Em português, portanto, o contexto de elipse não permite testar se a concordância verbal está associada a uma dada leitura da partitiva, visto que são marginais ou agramaticais as construções em que há elipse do nome partitivo.62 Excluído o contexto da elipse nominal, buscou-se verificar se era possível estabelecer alguma correlação entre classe aspectual do verbo e uma dada leitura da construção partitiva. A idéia de buscar essa correlação surgiu da leitura do trabalho de Nakanishi & Romero (2004) a respeito de propriedades semânticas de construções em inglês com “most”. Partindo das classes aspectuais de Vendler (1967)63, os autores mostram que a construção “most of the NPs” pode receber uma leitura coletiva com verbos de atividade e com verbos de accomplishment, mas não com verbos de achievement e verbos estativos. Nesse aspecto, as construções “Most of the NPs” se distanciam dos DPs definidos plural, os quais podem receber as duas interpretações independentemente da classe aspectual do verbo com que ocorrem, e se aproximam de DPs definidos com “all”, que apresentam exatamente o mesmo padrão, como pode ser observado no quadro a seguir: 62 Note-se que a elipse é possível quando o termo “maioria” é empregado na acepção de “grupo que, numa assembléia, reúne o maior número de votos” : O governo conseguiu o apoio da maioria dos deputados, mas não da dos senadores. Conforme veremos adiante, nesse caso “maioria” apresenta uma natureza claramente “lexical”, o que tem implicações estruturais relevantes. Será proposto que nos casos em que “maioria” é um elemento lexical, ela irá atuar como o termo controlador da concordância. É possível, pois, que na sentença (10a) a acepção de “grupo dominante” tenha interferido nos julgamentos, levando os falantes a preferirem o verbo no singular, concordando com “maioria”. O mesmo possivelmente se aplica ao espanhol para a sentença (9a). Na seção 5.1.2, este tópico será retomado. 63 Vendler (1967) propõe a classificação dos verbos em 4 classes para definir o que seria o esquema temporal subjacente do verbo, isto é, sua Aktionsart (modo de ação): verbos estativos, verbos de atividades, verbos de accomplishment e verbos de achievement. Os primeiros se caracterizam por não denotarem ações nem movimentos e por se manterem por um dado intervalo de tempo (Paulo ama Maria). Os verbos de atividades denotam um processo que não apresenta ponto de término definido (Paulo nada bem). A distinção entre os verbos de accomplishment e os verbos de achievement é determinada pela instantaneidade do evento. Ambos denotam eventos que apresentam um ponto final inerente, mas os de accomplishment correm em direção a esse ponto final (Paulo bebeu uma garrafa inteira de vodka) e os de achievement ocorrem em um momento único (O terrorista explodiu uma bomba). É importante, notar, contudo, que as propriedades de um predicado podem ser alteradas pela interação desse predicado com os objetos, os adjuntos e os outros elementos da oração. Logo, certos verbos podem ter um comportamento variável dependendo de sua realização na frase. Um verbo como correr, por exemplo, é classificado como de atividade na frase Paulo corre na Lagoa, mas como verbo de accomplishment na frase Paulo correu 5 km na maratona do Rio de Janeiro. O acréscimo da expressão “5km” ao verbo correr impõe um limite final intrínseco ao evento expresso pelo predicado determinando a mudança de classe aspectual. Assim, ao se considerar a interação entre o Aktionsart do verbo e a leitura do DP partitivo é preciso levar essa variabilidade em consideração. 94 Verbos de estado Verbos de atividade Verbos de The bottles are too The boys lifted the heavy to carry. piano. Coletiva / Distributiva All + DPs Verbos de achievement accomplishment The girls built a raft. The girls found a cat. Coletiva / Distributiva Coletiva / Distributiva Coletiva / Distributiva All the bottles are too All the boys lifted the All the girls built a raft. All the girls found a heavy to carry. piano. definidos *Coletiva / Distributiva Coletiva / Distributiva Coletiva / Distributiva ?Coletiva / Distributiva Most of + Most of the bottles are Most of the boys lifted Most of the girls built a Most of the girls found DPs too heavy to carry. the piano. raft. a cat. definidos *Coletiva / Distributiva Coletiva / Distributiva Coletiva / Distributiva ?Coletiva / Distributiva DPs definidos cat. Nakanishi & Romero (2004) observam que os verbos de achievement podem ser tomados como verbos de accomplishment quando se atribui algum processo a esses predicados. Isso explica a dúvida quanto à possibilidade de interpretação coletiva do sujeito de verbos de achievement. Assim, a única classe de verbos que parece licenciar uma única leitura da expressão “most of the NPs” é a dos estativos. Essa classe é, portanto, a que pode se mostrar relevante para se examinar a relação entre concordância verbal e leitura da expressão partitiva em português. 64 De fato, em português também se verifica a impossibilidade de leitura coletiva quando o verbo é de estado, conforme ilustram os exemplos a seguir, correspondentes aos do inglês: 64 Nakanishi & Romero (2004) explicam as diferenças entre DPs definidos plural e all the NPs e Most of the NPs a partir da análise de Brisson (1998, 2003). De acordo com esse autor, nos DPs definidos plural haveria um operador distributivo D que se aplicaria opcionalmente ao predicado verbal: [[ be. heavy]] geraria a leitura coletiva e [[D be.heavy]] geraria a leitura distributiva. Já all sinalizaria a presença de um operador distributivo. Além disso, Brisson considera que predicados que expressam atividades e accomplishments, mas não os predicados estativos e de achievements, seriam decompostos em 2 VPs: um VP mais baixo cujo núcleo seria um estado e um VP mais alto cujo núcleo seria um verbo abstrato DO. Esse verbo abstrato DO compreenderia um conjunto de ações ( um conjunto de doings) necessárias à realização da ação expressa pelo predicado em questão (p.ex., construir uma canoa envolveria um conjunto de Doings –pegar madeira, martelar, etc.). Haveria, pois, dois locais possíveis de inserção do operador D para verbos de atividade e de accomplishment. A leitura distributiva seria obtida a partir da inserção do operador distributivo no VP mais alto e a coletiva com a anexação do operador ao verbo abstrato DO. Assim, na sentença All the boys lifted the piano, a leitura distributiva significaria que para cada menino há um evento diferente de erguer o piano. Já, na leitura coletiva, para cada menino haveria um evento diferente de Doing que seria parte de um evento único coletivo correspondente a erguer. No caso dos predicados estativos e de achievement, como eles não apresentam um núcleo DO, só seria possível anexar o operador D ao VP mais alto, logo apenas a leitura distributiva seria gerada. Nakanishi & Romero estendem essa análise a most of the NPs, dado que essa construção apresenta o mesmo padrão que all of the NPs em relação às possibilidades de leitura associadas a cada classe aspectual do verbo. a . A tiv id a d e s , A c c o m p lis h m e n ts DV P d is trib u tiv o C o le tiv o DV A g e n te + D O b . E s ta d o s , A c h ie v e m e n ts d is trib u tiv o VP lift th e p ia n o , b u ild a ra ft DV P B e heavy 95 (11) a. A maioria das garrafas era muito pesada para carregar. (verbo de estado: *coletiva/distributiva) b. A maioria dos rapazes ergueu o piano. (verbo de atividade: coletiva/distributiva) c. A maioria das garotas construiu um bote. (verbo de accomplishment: coletiva/distributiva) d. A maioria das garotas achou um gato. (verbo de achievement: ?coletiva/distributiva) Isso não significa, contudo, que certos verbos pertencentes a outras classes aspectuais também não possam privilegiar uma dada leitura do DP ou até mesmo limitar a leitura do DP a uma dada interpretação. Um verbo de atividade como nadar, por exemplo, parece deflagrar uma leitura distributiva da partitiva: (12) A maioria dos alunos nada bem. Assim, embora seja interessante essa relação entre leitura da partitiva e classe aspectual, ela precisa ser vista com cuidado, considerando-se tanto a própria complexidade envolvida na definição da classe aspectual quanto particularidades semânticas relacionadas à possibilidade de a ação expressa pelo verbo ser realizada individualmente ou ser uma ação dependente de implementação coletiva. Retomando a questão da concordância verbal, buscou-se verificar, a partir de consulta informal a um grupo de falantes, se em sentenças com DPs partitivos na posição de sujeito de verbos estativos haveria uma preferência pela concordância plural, já que essa classe aspectual parece privilegiar uma leitura distributiva do partitivo e o verbo no singular estaria associado a uma leitura “coletiva”do sujeito: (13) a. A maioria das caixas era muito pesada para se carregar. a’. A maioria das caixas eram muito pesadas para se carregar. b. A maioria das crianças acredita em Papai Noel. 96 b’. A maioria das crianças acreditam em Papai Noel. c. Uma parte dos jogadores estava no hotel da concentração. c’. Uma parte dos jogadores estavam no hotel da concentração. d. Uma parte dos alunos gosta da aula de matemática. d’. Uma parte dos alunos gostam da aula de matemática. Embora alguns falantes expressem uma preferência pelo verbo no singular, possivelmente determinada por pressões do ensino formal, as sentenças dos pares acima são consideradas gramaticais, o que sugere ser necessário dissociar a questão da escolha da forma verbal de possíveis leituras atribuídas à construção partitiva. Ainda no sentido de tentar excluir uma possível relação entre concordância verbal e leitura da partitiva, procurou-se delimitar um contexto sintático que licenciasse apenas a leitura de grupo do DP partitivo. De acordo com Mioto & Negrão (2003, p.28), as sentenças clivadas em português apresentam foco identificacional e a posição de foco identificacional, de acordo com Kiss (1998), só pode ser ocupada por sintagmas denotadores de grupo. Isso explicaria o contraste entre as sentenças (14a) e (14b) abaixo, as quais têm a posição de foco ocupada respectivamente por um sintagma denotador de grupo e por um sintagma distributivo65: (14) a. Foram várias bolsas que Maria comprou naquela loja. b. *Foi cada bolsa que a Maria comprou naquela loja. Se a leitura distributiva ou de grupo da partitiva for determinada pela concordância verbal, podemos imaginar que apenas serão licenciadas na posição de foco da clivada as partitivas que estabelecerem concordância no singular com o 65 De acordo com Mioto & Negrão (2003), Kiss (1998) explica a agramaticalidade da sentença com o sintagma distributivo a partir da teoria sintática do escopo de sintagmas quantificados proposta por Beghelli & Stowell (1997), a qual é retomada por Szabolcsi (1997) para tratar da estrutura sentencial do húngaro. Para detalhes acerca da noção de foco identificacional, ver Mioto & Negrão (2003). 97 verbo da oração encaixada.66 No entanto não é isto o que se observa nas sentenças abaixo: (15) a. Foi a maioria dos alunos que elegeu o diretor. a’. Foi a maioria dos alunos que elegeram o diretor. b. Foi a maioria dos deputados que depôs o ministro. b’. Foi a maioria dos deputados que depuseram o ministro. c. Foi uma parte dos passageiros que empurrou a Kombi. c’. Foi uma parte dos passageiros que empurraram a Kombi. d. Foi uma parte dos funcionários que pediu aumento. d’. Foi uma parte dos funcionários que pediram aumento. A leitura coletiva do partitivo é assegurada independentemente da concordância verbal estabelecida entre a construção partitiva e o verbo da oração encaixada. Logo, assim como na situação dos verbos estativos que impõem uma leitura distributiva da partitiva, não parece haver relação entre concordância verbal e leitura da construção partitiva. 5.1.2 Estrutura das partitivas e dupla possibilidade de concordância Não há trabalhos em português que examinem especificamente a estrutura das construções partitivas e o problema da concordância verbal. Há, não obstante, estudos sob a perspectiva da Teoria da Variação Lingüística que fazem referência às construções partitivas na investigação da concordância verbal com sujeitos de estrutura complexa (Scherre & Naro, 1998; Naro & Scherre, 2000; Scherre, 2002). Sob esse rótulo são analisadas construções do tipo [núcleo + sintagma preposicionado], entre as quais se incluem, além das construções partitivas, 66 Para uma discussão acerca da estrutura de sentenças clivadas, ver Mioto & Negrão (2003). Neste trabalho duas estruturas são consideradas: uma em que o CP encaixado é relativo e uma small clause é o complemento da cópula (análise de Lopes Rossi, 1994, com base em Kato, 1993) e outra em que o CP encaixado é o complemento da cópula (Kiss,1998). Neste trabalho a adoção de uma ou outra estrutura não acarreta problemas para a questão considerada. 98 expressões que indicam percentual e DPs complexos não-quantitativos, como os analisados neste trabalho em experimentos de indução de erros de concordância. Partindo de dados de língua escrita de pessoas escolarizadas (jornais, revistas, livros, atas, prospectos), Scherre & Naro investigam os fatores responsáveis pela variação na concordância verbal. Os autores trabalham com a hipótese de que a concordância verbal não seria governada pelo sujeito da oração, mas sim por um conjunto de traços que se concentrariam primordialmente nessa posição sintática. Assim, quando esses traços estivessem concentrados em outra posição, o controle da concordância poderia ser assumido por outro sintagma que não ocupasse a posição de núcleo do sujeito. Logo, na existência de dois ou mais candidatos a assumir o controle da concordância verbal, a definição do elemento controlador da concordância seria feita a partir de uma hierarquia de traços, como o traço sintático de número [+-plural], o traço semântico [+-humano] e um traço ligado à saliência fônica da oposição desinencial das formas verbais [+-saliente]. Note-se que, nessa perspectiva, não haveria casos especiais de concordância; a concordância com o núcleo do sujeito ou a concordância com um elemento nominal do modificador seriam variantes lingüísticas tanto nas partitivas como nas demais estruturas. Essa visão não parece ser apropriada para pensar o processamento da concordância verbal, dado que a concordância plural com DPs complexos não-quantitativos é avaliada como agramatical pelos falantes da língua, a despeito de haver ocorrências dessa concordância tanto na fala quanto na escrita. Parece ser produtivo pensar nessas ocorrências como falhas de processamento e tentar determinar o momento em que tais falhas ocorreriam. Dentro do quadro teórico da Gramática Gerativa, as construções partitivas têm sido examinadas desde os primeiros momentos da teoria67. De acordo com Girbau (2003), as diferentes propostas acerca da estrutura das construções partitivas diferem quanto ao status e à posição atribuída aos quantificadores e também quanto à relação entre os quantificadores e o nome. São pontos de discussão se os quantificadores são categorias funcionais ou lexicais, se apresentam uma projeção QP (quantifier phrase) própria ou não, se agem como modificadores do nome ou como um núcleo que seleciona o nome. Também há 67 Ver Cardinaletti & Giusti (no prelo) para uma apresentação concisa das propostas mais representativas sobre construções partitivas desenvolvidas no quadro teórico da Gramática Gerativa nos últimos 40 anos. 99 posições divergentes quanto ao status e ao papel desempenhado pelo elemento preposicional – se atuaria como um marcador de caso ou como uma preposição. Neste trabalho, pretendemos contribuir para essa discussão, apontando aspectos das construções partitivas envolvendo “maioria” e “parte” que sugerem que estes nomes ora atuariam como núcleos lexicais, que selecionariam DPs definidos, ora atuariam como elementos funcionais, modificadores dos DPs definidos.68 Para que se possa entender melhor essa natureza ambígua de “maioria” e “parte”, é interessante recorrer à classificação semântica que Peres & Moia (1995) propõem ao analisar sujeitos de estrutura de quantificação complexa em português europeu, em estudo de orientação descritiva acerca da concordância verbal. Os autores dividem os sujeitos de estrutura de quantificação complexa em três subclasses semânticas: i) quantificadores de contagem, que servem para exprimir quantidades de objetos, sejam essas quantidades absolutas (um milhar de congressistas, uma dezena de empresas) ou relativas (metade dos alunos, um terço das provas; a maioria dos deputados; uma parte das pessoas); ii) quantificadores de medição, em que as expressões não são usadas para contagem, mas para indicar porções de objetos (uma parte do palácio; um troço da estrada); iii) nomes de referência dependente, que também não quantificam objetos, mas servem para referir coleções de objetos (um grupo de amigos; este conjunto de quadros). A noção de referência dependente advém do fato de essas expressões não poderem estabelecer referência de forma independente, elas precisam se combinar a nomes para indicar coleções de objetos; segundo os autores, tais nomes “funcionam de modo subsidiário na definição de entidades grupais”. Quanto à concordância, tanto no português europeu quanto no português brasileiro, os sujeitos com quantificadores de contagem admitem a concordância com o segundo nome. Já os sujeitos com termos de medição e com nomes de referência dependente apenas admitem a concordância com o primeiro nome. Voltando à análise específica das construções partitivas, considera-se neste trabalho a seguinte hipótese: “maioria” e “parte” apresentariam um status 68 Ao longo deste capítulo, empregou-se “primeiro nome” e “segundo nome” para fazer referência aos elementos que compõem as expressões partitivas, respectivamente, o termo partitivo e o substantivo plural definido. Trata-se de conveniência terminológica, pois, de acordo com a análise apresentada, o partitivo pode comportar-se como um quantificador. 100 categorial “ambíguo”. Ao lado de uma natureza funcional, que lhes permitiria realizar operações de quantificação sobre nomes, também apresentariam uma natureza lexical, com um comportamento semelhante ao de verdadeiros núcleos nominais. No primeiro caso, o nome plural modificado por “maioria” ou “parte” seria o termo controlador da concordância; no segundo caso, “maioria” e “parte” deteriam o controle da concordância. Em termos da terminologia de Peres & Moia (1995), poder-se-ia dizer que “maioria” e “parte”, além de “quantificadores de contagem”, também pertenceriam, respectivamente, às subclasses semânticas de “termos de referência dependente” e “quantificadores de medição”. Assim, o que a gramática tradicional denomina de concordância “facultativa” na verdade não teria nada propriamente de “facultativo” na medida em que cada alternativa de concordância corresponderia a uma dada representação sintática da expressão partitiva, a qual, por sua vez, seria função do status categorial de “maioria” e “parte”. A sentença com o verbo no singular e a sentença com o verbo no plural seriam geradas a partir de Numerações diferentes, com “maioria” e “parte” correspondendo a conjuntos distintos de traços em cada caso69. No entanto, como em geral a fronteira entre lexical e funcional para os termos “maioria” e “parte” fica “esmaecida”, tem-se a falsa impressão de que o emprego do verbo no singular ou no plural é apenas uma questão estilística. Contudo, como será visto a seguir, é possível encontrar contextos em que a distinção fique mais nítida. Um desses contextos é o de modificação dos termos “maioria” e “parte” por adjetivo. Considerando-se que adjetivos modificam elementos nominais, dever-seia esperar que a concordância verbal singular fosse favorecida em sentenças nas quais um adjetivo modificasse “maioria” e “parte”. (16) a. A grande maioria dos alunos reclamou/?*reclamaram da prova de matemática. b. A maioria inteligente dos alunos conseguiu/*conseguiram fazer o trabalho. 69 Uma questão que certamente carece de investigação é como seria a representação lexical dos termos “maioria” e “parte”. O fato de apresentarem comportamentos distintos quando atuando como elementos funcionais e como elementos lexicais justificaria a postulação de representações lexicais separadas ou seria mais adequado considerar a existência de elementos semi-lexicais (ou semi-funcionais), que poderiam apresentar um comportamento híbrido? 101 c.Uma grande/boa parte dos alunos reclamou/?*reclamaram da prova de matemática. d.Uma parte considerável dos alunos conseguiu/*conseguiram fazer o trabalho. O acréscimo do adjetivo parece favorecer a forma singular do verbo, em particular nos casos em que o adjetivo ocorre posposto a “maioria” e “parte”, como em (16b) e (16d). Quando o adjetivo ocorre anteposto ao termo “maioria”, como nas sentenças (16a) e (16c), é mais difícil fazer um julgamento tão claro, mas a forma singular é de todo modo melhor.70 Ainda em relação aos exemplos em (16), cumpre destacar o sentido de “maioria” na sentença (16b). Quando “maioria” é modificado por um adjetivo qualificativo, a acepção que parece estar em jogo é a de “grupo dominante”. Nessa acepção, o termo “maioria” pode, inclusive, ocorrer sem o sintagma preposicionado, em frases como “O Governo não conta com a maioria no Congresso”; “As meninas eram a maioria na festa”; “O líder da maioria/minoria no Senado”.71 Cumpre também retomar o que foi dito na nota 62 quanto à possibilidade de elipse de “maioria”. Quando este termo é empregado com a acepção de “grupo dominante” a elipse não parece alterar a boa-formação da sentença. Contraste-se a esse respeito a sentença (17a), que retoma o exemplo da nota 62, com a sentença (17b): (17) a. O governo conseguiu o apoio da maioria dos deputados, mas não da maioria dos senadores. b. ?O presidente cumprimentou a maioria dos deputados, mas não a maioria dos senadores. 70 É possível que essas diferenças de julgamento sejam um reflexo de uma distinção mais geral entre adjetivos que podem aparecer antes do nome em PB. A classe é bem restrita e envolve idiossincrasias de interpretação: homem grande/grande homem. Note-se, por exemplo, que “boa parte” não se refere a uma parte que é boa. 71 O Dicionário Houaiss da Língua Portuguesa apresenta ainda um sentido obsoleto de “condição do que é melhor; supremacia, primazia, excelência <sua obra, pela inequívoca maioria que manifestava sobre as demais, foi a premiada. < a maioria do desprendimento>. 102 A gramaticalidade de (17a) estaria ligada a um emprego de “maioria” como um nome e a marginalidade de (17b) estaria associada a um emprego de “maioria” como quantificador. Como será visto a seguir, outros nomes quantificativos exibem um comportamento bastante semelhante ao de “maioria”, sendo a elipse licenciada apenas nos casos em que apresentam um natureza claramente lexical. O termo “parte”, por sua vez, além de realizar quantificações sobre nomes, pode indicar uma porção de um objeto. Como quantificador, “parte” seria um modificador do nome plural e não poderia controlar a concordância. Já como termo de medição, ele seria o núcleo controlador da concordância e tomaria o DP definido como complemento. Observe-se que, no exemplo a seguir, “parte” foi empregado com a acepção de “área, espaço delimitado” e funciona como o controlador da concordância: (18) a. Uma parte do museu foi destruída. b. *Uma parte do museu foi destruído. Em relação a essa natureza “ambígua”, o termo “parte” apresentaria um comportamento semelhante ao de nomes quantificativos como “montón”, “pila” em espanhol, os quais podem assumir uma leitura quantificativa ou uma leitura descritiva (cf. Saab, no prelo a). Em espanhol, a sentença “Hay um montón de libros”, apresenta as seguintes leituras: Leitura quantificativa: Há muitos livros. Leitura descritiva: Há um objeto físico constituído por livros. Cada leitura, por sua vez, só pode ocorrer com um tipo de concordância: quando a leitura é descritiva, o verbo concorda com “montón” e fica no singular; quando é quantificativa, o verbo concorda com “libros” e fica no plural: (19) a. Se me cayó um montón de libros (apenas descritiva) b. Se me cayeron un montón de libros (apenas quantificativa) Saab (no prelo a) observa ainda que os nomes quantificativos, no contexto de elipse, apenas admitem uma leitura descritiva: 103 (20) a. Tengo una pila de camisas para planchar (leitura descritiva ou quantificativa) b. Tengo una pila de camisas y uma pila de pantalones para planchar (leitura descritiva) No português, verifica-se exatamente o mesmo padrão. Nomes quantificativos “monte” e “pilha” também são ambíguos entre uma leitura descritiva e uma leitura quantificativa e há uma correspondência entre concordância e leitura. Além disso, a elipse também deflagra apenas uma leitura descritiva: (21) Há um monte de livros sobre a mesa (leitura descritiva ou quantificativa) Um monte de livros caiu. (leitura descritiva) Um monte de livros caíram (leitura quantificativa) (22) Havia um monte de livros e um monte de revistas sobre a mesa. (leitura descritiva) Voltando à análise do nome partitivo “parte”, verificamos que, assim como os quantificativos, ele pode assumir leituras distintas, uma quantificativa e outra que se aproximaria da leitura descritiva, com a particularidade de expressar uma idéia de medição. Quanto à concordância, foi visto no exemplo (18a) que, quando “parte” tem o sentido apenas de “área”, isto é, só existe a leitura descritiva, a concordância é feita com o primeiro nome. Numa sentença em que tanto a leitura quantificativa quanto a descritiva podem ser atribuídas ao nome partitivo, o verbo no singular, concordando com o primeiro nome, permite ambas as leituras, como em (23a). Já quando o verbo está no plural, concordando com o segundo nome, como em (23b), apenas a leitura quantificativa é licenciada. (23) a.Uma parte dos presídios era ocupada por criminosos perigosos. (leitura descritiva ou quantificativa) b. Uma parte dos presídios eram ocupados por criminosos perigosos. (leitura quantificativa) 104 Em relação à elipse, foi visto no exemplo (10b), aqui retomado como (24a), que os falantes tendem a recusar as sentenças em que apenas uma leitura quantificativa pode ser atribuída ao nome “parte”. Na sentença (24b), em que “parte” admite uma leitura descritiva, a elipse é possível. Os julgamentos, contudo, não são tão claros como no caso de nomes como “monte” e “pilha”. Isso possivelmente ocorre porque, nas duas leituras, “parte” realiza algum tipo de delimitação sobre um dado conjunto, tanto é assim que na classificação de Peres & Móia (1995), “parte” pode ser classificado como um quantificador de contagem ou como um quantificador de medição. (24) a. * Na festa do departamento, eu encontrei uma parte dos alunos, mas não uma parte dos professores. (leitura quantificativa) b. O arquiteto está seguindo uma nova tendência de decoração nos apartamentos da Gafisa. Nos prédios do condomínio Novo Mundo, ele mandou azulejar só uma parte das cozinhas e uma parte dos banheiros. O restante será pintado. (leitura descritiva/ ?leitura quantificativa). Um último aspecto a ser observado em relação à ambigüidade de “parte” é o papel desempenhado pelo artigo indefinido que o antecede. Saab (no prelo a) nota que, quando o nome quantificativo tem como determinante um artigo definido ou um demonstrativo, só é possível a leitura descritiva. Assim, na frase a seguir, só é possível a leitura de “montón” como objeto físico: (25) Dame ese montón de libros. O mesmo se observa para o nome “parte”: (26) O setor dos presídios onde ficam os criminosos perigosos foi destruído nas últimas rebeliões. Essa parte dos presídios precisa de reforma urgente. 105 Sintetizando as idéias apresentadas, pode-se dizer que a análise de “maioria” e “parte” sugere que as duas alternativas de concordância com expressões partitivas estariam associadas à natureza “híbrida” do primeiro nome das partitivas. Este tanto poderia funcionar como um elemento lexical quanto como um elemento funcional. No primeiro caso, o verbo concordaria com “maioria” e “parte”; no segundo caso, com o segundo núcleo nominal. Essa idéia é compatível com análises que atribuem uma natureza semi-lexical (ou semifuncional) a termos de medida em expressões pseudo-partitivas (Alexiadou, Haegman & Stavrou, 2003; Stickney, 2004)72. 72 Alexiadou, Haegman & Stavrou (2003) propõe que o primeiro nome das expressões pseudopartitivas seria um núcleo semi-funcional que teria tanto traços funcionais quanto lexicais. Isso permitiria que esses termos apresentassem tanto propriedades associadas a nomes, quanto servissem como projeções funcionais. Essa natureza “híbrida” do primeiro termo de expressões pseudo-partitivas se reflete no modo como tais expressões se comportam em relação a restrições de seleção semântica de verbos e à modificação por adjetivos. Nos exemplos (1) e (2) a seguir, dependendo das restrições semânticas dos verbos, ou o primeiro ou o segundo termo da expressão pseudo-partitiva é selecionado: (1) a. Eu quebrei uma garrafa de vinho. b. Eu embrulhei uma caixa de bombons. (2) a. Eu bebi uma garrafa de vinho. b. Eu comi uma caixa de bombons. O fato de “garrafa” e “caixa” poderem ser selecionados semanticamente pelos verbos em (1) evidencia sua natureza nominal; já em (2) esses termos apenas modificam os núcleos nominais que são selecionados pelo verbo, no caso “vinho” e “bombons”. Em relação à modificação por adjetivos, observe-se o que ocorre quando se acrescenta, às sentenças em (2), um adjetivo modificador do primeiro nome: (3) a. Eu bebi uma garrafa de vinho pesada. b. Eu comi uma caixa de bombons amarela. A modificação pelo adjetivo requer a leitura lexical de “garrafa” e “caixa” e com isso há, em (3a), uma violação dos requerimentos de seleção do verbo “beber”, e em (3b), um estranhamento do ponto de vista pragmático. O mesmo não ocorre quando se acrescenta o adjetivo às expressões pseudo-partitivas em (1), pois nesses exemplos os traços nominais de “garrafa” e “caixa” estão ativos. (4) a. Eu quebrei uma garrafa de vinho pesada. b. Eu embrulhei uma caixa de bombons amarela. 106 5.1.2.1 Análise proposta Considerando-se a dupla natureza categorial dos nomes “maioria” e “parte”, duas possibilidades de representação sintática das expressões partitivas podem ser propostas. Como itens lexicais, “maioria” e “parte” seriam núcleos de um NP, o qual teria como complemento um sintagma preposicional contendo o DP definido plural. A representação a seguir ilustra a estrutura da construção partitiva: (27) DP D NP A N PP maioria P de DP os alunos Para os casos em que “maioria” e “parte” atuariam como quantificadores de nomes, propõe-se uma análise das construções partitivas em termos de uma estrutura de Small Clause, em que o quantificador ocuparia a posição de predicado da Small Clause e o DP definido, a posição de sujeito da Small Clause. As estruturas de Small Clause vêm sendo empregadas para caracterizar desde um conjunto de construções que expressam relações semânticas de posse alienável (o carro do menino), posse inalienável (o braço do menino), relações de continente/conteúdo (a garrafa de cerveja), até sintagmas que envolvem numerais preposicionais (acima de 100 crianças, entre 10 e 20 crianças) (Hornstein, Rosen & Uriagereka, 1994; Uriagereka, 1996; Castillo, 2001; Corver & Zwarts, 2004).73 73 As relações semânticas de parte/todo, conteúdo/continente, possuído/possuidor podem ser analisadas como manifestações de uma relação semântica mais geral, chamada relação R (cf. Hornstein, Rosen & Uriagereka, 1994; Uriagereka, 1996). De acordo com Uriagereka (1996), essas relações podem ser concebidas em termos de Espaços conceptuais delimitados topologicamente. Um dos elementos da relação R representaria o Espaço conceitual (Conceptual Space) e o outro elemento, a sua Apresentação (Presentation). O Espaço seria determinado de acordo com detalhes da Apresentação a ele imposta. No caso das relações de parte/todo, o Espaço 107 Parece-nos adequado recorrer a uma estrutura de Small Clause para caracterizar as partitivas, já que, por um lado, estas aproximam-se das construções de posse inalienável em termos de predicação semântica, pois expressam relação de parte/ todo, e, por outro, assemelham-se aos numerais preposicionais, visto que realizam uma espécie de operação de contagem sobre o conjunto expresso pelo DP definido. Neste trabalho, propomos para as partitivas em que “maioria” e “parte” funcionam como quantificadores uma estrutura semelhante a das construções com numerais preposicionais, apresentada por Corver & Zwarts (2004). Esses autores observam que os numerais preposicionais em holandês podem ocorrer tanto antes quando depois do nome: (28) a. Er staan getallen boven de 100 op het bord (Corver & Zwarts, 2004, ex. 50) ‘Há números acima de 100 no quadro-negro.’ b. Er staan boven de 100 getallen op het bord ‘Há acima de 100 números no quadro-negro.` Segundo Corver & Zwarts, o mesmo PP “boven de 100” predicaria sobre números individuais posnominalmente (caso (a)) e sobre a cardinalidade de conjuntos pré-nominalmente (caso (b)). O PP funcionaria como um predicador de primeira-ordem na primeira sentença e um predicador de segunda ordem no último caso, através de um operador de cardinalidade. O operador de cardinalidade estaria na base da posição pré-nominal. Supondo-se que cardinalidade esteja associada a uma posição configuracional específica, SpecNumP, o NUM atribuiria a propriedade de cardinalidade a um elemento em Spec,NumP. A idéia é que cardinalidade não seria uma propriedade semântica inerente de palavras ou sintagmas, mas uma das funções que expressões referentes a número podem assumir. Corver & Zwarts apresentam duas possibilidades de implementação dessa idéia: uma possibilidade seria que PPs seriam gerados na base, em Spec,NumP e receberiam sua corresponderia ao elemento que expressa a idéia de “todo” e a Apresentação, ao elemento que expressa a idéia de “parte”. Essa relação semântica seria mapeada sintaticamente na estrutura da Small Clause, com o Espaço na posição de sujeito e a Apresentação na posição de predicado. 108 interpretação cardinal de NUM. Nesse caso cardinalidade seria uma espécie de papel temático atribuído por NUM ao seu especificador, de modo similar ao que ocorreria na atribuição de papel de possuidor pelo marcador de possessividade “s” ao especificador em inglês. (29) [NumP[PP rond de 20] [Num’ NUM [NP kinderen]]] (Corver & Zwarts, 2004, ex.51b) ‘em torno de 20 crianças’ A outra alternativa é que o numeral preposicional em Spec,NumP começaria em um domínio lexical e seria movido para Spec,NumP para fins de checagem de um traço de cardinalidade [card]: (30) [NumP [PP rond de 20]i [Num’NUM [NP kinderen ti]]] (Corver & Zwarts, 2004, ex. 52b) ‘em torno de 20 crianças’ Essa mesma estrutura é proposta para os numerais cardinais, sendo que no lugar de um PP haveria um numeral: (31) [NumP [numeral 20]i [Num’ NUM [NP kinderen ti]]] (Corver & Zwarts, 2004, ex. 52a) ‘20 crianças’ Esse deslocamento dos numerais preposicionais e dos numerais cardinais para Spec,NumP seria uma instância de movimento de predicado interno ao DP, que também ocorreria nas construções de posse, de conteúdo/continente e de parte/todo. Um problema que se coloca para esse tipo de estrutura diz respeito à Minimalidade, pois, ao se mover para Spec,NumP, o numeral preposicional precisa passar por kinderen, o que parece se configurar como um movimento não local. Segundo Corver & Zwarts, esse movimento de predicado pode ser tomado como uma operação local se for adotada a noção de domínio mínimo estendido e de equidistância nos termos de Chomsky (1993). A idéia é que o predicado poderia cruzar por sobre o sujeito da Small Clause desde que ambos estivessem 109 tecnicamente eqüidistantes, isto é se estivessem dentro do mesmo domínio mínimo. Essa condição seria assegurada da seguinte maneira: o predicado deslocado seria originário de uma Small Clause interna ao DP. Nessa Small Clause, o predicado seria o complemento do núcleo e o sujeito seria o especificador. Acima da Small Clause haveria uma projeção funcional FP e o predicado se moveria para o especificador dessa projeção. Antes do movimento do predicado, contudo, haveria um movimento do núcleo da Small Clause para o núcleo da projeção funcional FP (no caso, NumP), o que teria como conseqüência a criação de um domínio mínimo estendido que passaria a conter tanto o predicado quanto o sujeito da Small Clause. Graças a essa operação, o numeral preposicional e o nome passariam a estar tecnicamente eqüidistantes do domínio de extração do predicado, o que licenciaria o movimento do predicado por sobre o sujeito da Small Clause, sem violação de minimalidade. A representação em (32) permite visualizar como seria a estrutura proposta: (32) FP F’ F XP kinderen X X’ rond de 20 É importante notar que, em algumas línguas, o resultado do Spell-out do núcleo complexo pode ser um morfema, uma espécie de cópula nominal. Isso se observa, por exemplo, nos numerais preposicionais em romeno, conforme exemplo abaixo reproduzido de Corver & Zwarts: (33) [[sub 20] de copii] Below 20 of children ‘menos do que 20 crianças’ (Cover & Zwarts, 2004, ex. 55a) 110 No exemplo (33), o “de” corresponderia ao Spell-out do núcleo complexo, resultante do movimento do núcleo X da Small Clause para o núcleo funcional F. A estrutura em (34) representa o movimento do predicado: (34) [FP [sub 20]j [F’ F+ Xi (=de) [XP copii [X’ti tj]]]] (FP=NumP) (Cover & Zwarts, 2004, ex. 55b) Em português, as construções partitivas com “maioria” e “parte” como quantificadores apresentariam uma estrutura bastante semelhante a dos numerais preposicionais. O termo “maioria” e “parte” seriam o predicado de uma Small Clause que teria como sujeito o DP plural. O núcleo da Small Clause se moveria para o núcleo de uma projeção funcional mais alta na estrutura, dando origem ao núcleo complexo (F+X); esse movimento criaria um domínio mínimo estendido que permitiria o movimento do predicado para o Spec,NumP. Adaptando-se a estrutura em (34) para as partitivas no português, teríamos a seguinte representação: (35) [FP [a maioria]j [F’ F+ Xi (=de) [XP os meninos [X’ti tj]]]]74 Uma questão que se coloca é o que deflagra o movimento do predicado nas construções partitivas. Enquanto nos numerais preposicionais, atribui-se o movimento à checagem de um traço não-interpretável de cardinalidade presente no núcleo da projeção funcional FP, esse movimento nas partitivas parece ser deflagrado pela necessidade de se checar (ou valorar) um traço de partitividade. O termo partitivo é que possuiria um traço [part] interpretável e, por isso, se moveria para o Spec, FP. 74 Uma estrutura semelhante é proposta por Girbau (2003) para dar conta de construções partitivas do tipo “three of the children”. Nesse texto, Girbau apresenta uma análise unificada de partitivas e do que ela chama de quantitativos, expressões do tipo “theree children”. O propósito do artigo é mostrar que é possível dar conta da estrutura das partitivas sem precisar recorrer a um nome vazio (three [e]N1 of the children N2), conforme originalmente proposto por Jackendoff (1977). Girbau, com base na hipótese do DP de Kayne (1994), propõe que o elemento quantitativo em ambas as construções seria gerado como um predicado em uma posição mais baixa na árvore e que o nome seria o sujeito dessa estrutura. O elemento quantitativo seria alçado para uma posição mais alta na árvore e atuaria como um determinante. Girbau sinaliza que as construções que denotam idéia de parte/todo possivelmente apresentam uma estrutura semelhante à das demais partitivas. Deixa, contudo, em aberto a discussão acerca dessas construções. 111 Em relação ao “de” que liga o quantificador ao DP definido, assumindo-se o quadro teórico da Morfologia Distribuída (Halle & Marantz, 1993), considera-se que este seria inserido após Spell-out, como resultado de uma operação morfológica. A preposição seria uma expressão fonológica do traço partitivo presente na projeção funcional FP. A esse respeito, cumpre notar que em português a preposição “de”, quando em domínios nominais, é semanticamente neutra, podendo expressar relações semânticas diversas. Segundo Avelar (2005a, 2005b, 2006a), a preposição “de” poderia ser considerada o exemplar mais funcional de sua categoria, não sendo possível atribuir-lhe um significado sem ancoragem num contexto determinado. Como evidências dessa neutralidade semântica da preposição “de”, Avelar menciona a possibilidade de substituí-la por outras preposições, sem aparente prejuízo de significado, e a possibilidade de inverter a ordem dos constituintes que são ligados por “de” sem que o papel semântico desses constituintes sofra alteração. Em relação à substituição por outras preposições, Avelar mostra que, enquanto a preposição “de” pode ocorrer em diferentes contextos, as outras preposições não são intercambiáveis entre si. Veja-se, a esse respeito, o conjunto de exemplos em (36), reproduzidos de Avelar (2005a): (36) a. Aquele rapaz de/com cabelos longos perguntou pela Ana b. O leite da/na geladeira é para fazer bolo. c. Roupa de/para criança custa caro. d.A notícia do/sobre o acidente vai ser um choque para a família da vítima. Quanto às possibilidades de inversão de constituintes relacionados por “de”, os exemplos em (37), também reproduzidos de Avelar (2005a), ilustram que a relação semântica expressa pelos constituintes é preservada a despeito de mudanças de ordem, diferentemente do que ocorre com outras preposições, em que a posição dos constituintes precisa ser fixa: (37) a. As praias famosas da cidade vão ficar lotadas no verão. b. A cidade das praias famosas vai receber muitos turistas no verão. c. As praias famosas *com/em/*p(a)ra a cidade vão ficar lotadas no verão. d. As cidades com/*em/*p(a)ra as praias famosas vai receber muitos turistas. 112 Há ainda um outro fato que constitui evidência para o vazio semântico da preposição “de” – o licenciamento de construções existenciais. De acordo com Avelar, vários trabalhos têm indicado a necessidade de essas construções lançarem mão de uma coda75 para serem licenciadas. Atribui-se a necessidade da coda ao fato de o verbo existencial consistir num item semanticamente fraco, que seria incapaz de estabelecer uma relação predicativa suficiente com o complemento. Assim, de modo a poder sustentar a predicação, tornando a sentença aceitável, a coda seria inserida. Considerando-se, pois, essa propriedade dos verbos de sentenças existenciais, dever-se-ia esperar que sintagmas nucleados pela preposição “de” não possam licenciar construções existenciais, dado o vazio semântico dessa preposição. E é o que ocorre, como ilustram os seguintes exemplos de Avelar (2005a): (38) a. *Tem uma calça. b. *Tem uma calça do Roberto. c. Tem uma calça (do Roberto) com o Pedro. d. Tem uma calça (do Roberto) na casa do Pedro. e. Tem uma calça (do Roberto) para o Pedro lavar. A coda nucleada por “de” não pode licenciar a sentença existencial (cf. 38b); é necessário uma ancoragem contextual para que a sentença possa ser considerada bem-formada (38c, d, e). Avelar (2005a) busca uma explicação para essa neutralidade da preposição “de” em termos do ponto da derivação da sentença em que este item seria inserido. O item “de” seria inserido pós-sintaticamente, após Spell-out e, em função disso, não teria efeito no componente semântico. Isto porque, na arquitetura da gramática assumida no Programa Minimalista (Chomsky 1995), o componente semântico não teria acesso às operações que ocorrem em um componente fonológico. No caso das demais preposições, que teriam uma 75 Convencionou-se chamar de coda, nesse contexto, a combinação de um DP (o complemento do verbo existencial) a um outro constituinte, como um PP, um AP, um CP relativo ou um VP gerundial. Os exemplos são de Avelar (2005a): a. Tinha muitas pessoas na praia. b. Tem muitos políticos brasileiros extremamente populistas. c. Tem muita mulher que odeia lavar roupa. d. Tinha um homem estranho olhando para a Maria. 113 natureza claramente lexical, estas já estariam previstas na sintaxe e, por isso, poderiam ser interpretadas em Forma Lógica. Essa análise é compatível com a idéia de que o “de” das construções partitivas na representação em (35) é a expressão morfofonológica do núcleo complexo F+X e não tem nenhum conteúdo semântico próprio. Logo, seria um elemento puramente gramatical. Quanto ao item “de” na representação sintática em (27), na qual “maioria” é um núcleo lexical que toma como complemento um PP, este seria de fato uma preposição, porém funcional, o que explicaria sua impossibilidade de selecionar semanticamente seu complemento. A preposição nesse caso seria o elemento responsável por atribuir caso oblíquo ao DP plural. Para finalizar esta seção, é importante observar que a idéia de que as construções partitivas apresentariam representações estruturais diferentes em função da natureza categorial do termo “maioria” e “parte” é compatível em essência com a análise que vem sendo apresentada por Saab (2004; no prelo a; no prelo b) para explicar o comportamento de epítetos (burro, bestia, gallina) em construções Det+N+de+SN, em espanhol. Saab observa que há uma relação entre o tipo de leitura atribuída ao epíteto (possessiva ou atributiva) e o modo como este se comporta em relação à elipse nominal e à concordância. Em relação à elipse, o autor verifica que, em contextos de elipse nominal, apenas uma leitura possessiva é possível: (39) El burro de Juan & el burro de Pedro (apenas possessiva = João tem um burro; Pedro tem um burro). Em relação à concordância, Saab nota que, nos casos de ambigüidade entre uma leitura possessiva ou atributiva, a concordância permitiria desambigüizar a interpretação do epíteto. Na sentença (40), quando o adjetivo concorda com o primeiro N, só permanece a leitura possessiva (a mulher tem um anjo); quando o adjetivo concorda com o segundo N, apenas a leitura atributiva permanece (a mulher é um anjo). (40) a. El angel de tu mujer está contento (leitura possessiva) b. El angel de tu mujer está contenta (leitura atributiva) 114 Para dar conta dessas diferenças, Saab propõe que o epíteto na leitura atributiva ocuparia uma posição pré-nominal, de especificador de uma projeção de número (NumP) e que, na leitura possessiva, ele seria o núcleo da projeção lexical do DP. A seguir, apresenta-se, em (41), a estrutura do DP proposta por Saab (no prelo a) e, em (42), as configurações atribuídas às construções Det+N+de+SN.76 77 (41) DP SNum D [p e s s o a ] Num Sn [s g /p l] n [g ê n e ro ] S√ (42) a. [DP el[NumP burro [nP de Juan n[male]]] (leitura atributiva) b. [DP el[NumP [nP n[male] burro de Juan]] (leitura possessiva) Saab propõe que essa mesma análise seja estendida a nomes quantificativos (montón, pila) e nomes partitivos e pseudo-partitivos (parte, maioria, grupo), visto que estes apresentariam um comportamento semelhante ao dos epítetos. No caso dos nomes quantificativos, foi visto, na seção anterior, que estes licenciam elipse apenas quando com leitura descritiva, e que há uma relação entre leitura e concordância: quando a concordância é com o primeiro nome, a leitura do DP só pode ser descritiva; quando a concordância é com o segundo nome, a leitura do DP só pode ser quantificativa. A seguir reproduzem-se os exemplos apresentados: (43) a. Tengo una pila de camisas para planchar (descritiva ou quantificativa) 76 Nessa estrutura, a projeção D codifica os traços de pessoa (e possivelmente caso) e NumP, os traços de número. A projeção n porta os traços de gênero e provavelmente alguns traços semânticos nominais (ex. [humano]) e o n corresponde a um categorizador em teorias que assumem a idéia de raízes nuas (Marantz 1997, Embick & Halle, no prelo). O símbolo √ representa a projeção que aloja as raízes. 77 É importante esclarecer que, para Saab, a concordância é um processo de cópia de traços morfossintáticos que só ocorre pós-sintaticamente, na estrutura morfológica (cf. Halle & Marantz, 1993). 115 b. Tengo una pila de camisas y uma pila de pantalones para planchar (leitura descritiva) (44) a. Se me cayó um montón de libros (apenas descritiva) b. Se me cayeron un montón de libros (apenas quantificativa) Para as construções pseudo-partitivas e partitivas, o quadro não é tão claro. Em princípio, dever-se-ia esperar que a concordância plural estivesse associada a uma leitura dessas construções (no caso uma leitura distributiva, cf. Brucart, 1997) e que a elipse do nome partitivo só fosse possível quando o verbo estivesse no singular e, por conseguinte, a partitiva tivesse uma leitura de grupo. No entanto, o julgamento dos falantes por vezes indica oscilações; há casos de concordância plural com construções partitivas que só admitem leitura de grupo78 e as sentenças com elipse de nomes partitivos são consideradas marginais, como foi visto no exemplo (7). Saab (no prelo a) afirma que diferenças entre nomes quantificativos e nomes partitivos e pseudo-partitivos deva ser buscada na natureza desses nomes. Segundo ele, os nomes partitivos, mesmo quando na leitura de grupo, não deixariam de ser um quantificador e isso explicaria por que poderia ser considerada gramatical uma concordância plural como um DP partitivo/pseudopartitivo com leitura de grupo. Nesse caso, o DP ocuparia uma posição de especificador na periferia esquerda do DP. Saab, contudo, não esclarece qual seria a diferença exata entre um nome partitivo/pseudo-partitivo numa posição prénominal e numa posição interna ao Sn. Na análise aqui proposta, mostrou-se que os falantes de português não associam concordância verbal e leitura (distributiva ou de grupo) da construção partitiva e que, portanto, uma explicação para a dupla alternativa de concordância não pode ser buscada em termos de uma análise semântica ou pragmática. A dupla concordância seria determinada por razões estruturais, relacionadas à posição sintática ocupada pelo nome partitivo (“maioria” e “parte”). Dada sua natureza categorial “híbrida” (lexical e funcional), este poderia atuar tanto como um verdadeiro nome quanto como uma espécie de quantificador. Dependendo, 78 Ver nota 61. 116 pois, das propriedades que estejam mais salientes – se lexicais ou funcionais, uma dada estrutura para o DP é gerada. Nesse sentido, talvez se possa buscar uma aproximação entre partitivas, epítetos e nomes quantificativos. 5.1.2.2 A dupla possibilidade de concordância Resta agora explicar a questão da concordância. Assumindo-se que haveria duas representações estruturais distintas para as construções partitivas, pode-se associar cada alternativa de concordância a uma das representações. A concordância verbal no singular estaria associada à representação em que “maioria” e “parte” são NPs que tomam como complemento um sintagma preposicionado contendo o DP definido. Algumas análises vêm sendo propostas para dar conta de como seria computada a concordância de número interna ao DP em estruturas desse tipo. Uma possibilidade seria assumir Chomsky (1999), que atribui a concordância interna ao DP a um mecanismo denominado Concord. Esse mecanismo implementaria a concordância via uma operação de Merge entre determinantes, que apresentariam traços não-interpretáveis de número, e nomes, que teriam traços interpretáveis de número. Outra possibilidade seria assumir, nos termos de Magalhães (2004), que a concordância seria implementada pela operação Agree, a partir de uma valoração de traços em cascata dentro do DP. Magalhães, diferentemente de Chomsky, considera que o traço de número seria nãointerpretável em N e interpretável em D. Uma terceira alternativa seria considerar a existência de um núcleo funcional independente para número, a projeção NumP (Number Phrase), a qual seria intermediária entre NP e DP (Ritter, 1991; Picallo, 1991)79. Augusto, Ferrari-Neto & Corrêa (submetido) propõe que NumP teria um traço interpretável de número e que a relação de c-comando estabelecida entre D, Num e N garantiria que a concordância fosse computada entre os elementos que integram o DP. 79 Augusto, Ferrari-Neto & Corrêa (submetido) afirmam que há evidências morfológicas, sintáticas e semânticas a favor da postulação de uma projeção NumP. Em termos morfológicos, constata-se a presença de um morfema de número independente em algumas línguas (ex. Yapese e Tagalog); em termos sintáticos, a projeção NumP permitiria explicar diferentes relações de ordem entre o adjetivo e o nome no DP (Cinque, 1994); em termos semânticos, a presença de NumP estaria relacionada a distinções entre nomes massivos e nomes contáveis (Vangsnes, 2001; Borer, 2005). 117 Foge ao escopo desta tese avaliar qual dessas propostas melhor explicaria a computação da concordância interna ao DP. O que é relevante é mostrar que, na estrutura proposta para quando “maioria” e “parte” são considerados verdadeiros nomes, o DP definido pl está inserido em um sintagma preposicionado complemento do primeiro nome, não podendo, pois, interferir na computação interna da concordância do DP partitivo. Nesse sentido, qualquer uma das explicações apresentadas poderia, em princípio, ser assumida. A segunda alternativa de concordância (verbo no plural) estaria associada à representação em que “maioria” e “parte” se comportam como elementos funcionais, modificando o DP definido plural. Nessa análise, esses termos funcionariam como quantificadores e a concordância verbal seria determinada pelo número do DP definido plural. Não é, contudo, trivial a implementação dessa idéia. Considerando-se a representação estrutural proposta em (45), uma possível explicação seria pensar que “maioria” e “parte”, quando funcionais, não teriam um traço formal de número a eles associado. Logo, o elemento que poderia valorar o traço não-interpretável de número de uma sonda T seria o DP definido plural.80 (45) TP T’ vP T [µ Num] DP v’ FP VP F’ A maioria F V XP DP os meninos [+plural] X 80 DP X’ QP Ver capítulo 3 para uma caracterização da concordância como processo de valoração de traços no Programa Minimalista. 118 Uma análise alternativa seria assumir que as construções partitivas apresentam uma estrutura de adjunção semelhante a que vem sendo proposta por Avelar (2005a; 2005b) para constituintes preposicionados nucleados por “de” (sintagmas-de). Avelar, a partir de um conjunto de evidências de que sintagmas-de comportam-se semântica e morfossintaticamente de forma distinta de outros constituintes preposicionados na função de adjuntos adnominal, propõe para aqueles uma configuração de adjunção de DP a DP, como a exemplificada em (46). VP com er DP DP um a [D P b o m b o m ] c a ixa Nesse tipo de configuração de adjunção, um DP com caso inerente genitivo seria adjungido a outro DP e apenas na morfologia é que um morfema associado seria conectado ao DP genitivo e realizado como “de” (cf. modelo de Morfologia Distribuída de Embick & Noyer, 2001). A configuração de adjunção de DP a DP permitiria explicar o comportamento diferente do sintagma-de em relação ao sintagma-com nas sentenças em (47): (47) a. A criança comeu uma caixa de bombom. b. #A criança comeu uma caixa com bombom. c. A criança roubou uma caixa de bombom. d. A criança roubou uma caixa com bombom. Nessas sentenças, o que está em jogo são as restrições selecionais do verbo “comer”. Segundo Avelar, a sentença b é semanticamente anômala porque, na configuração subjacente ao DP complemento, a preposição impede a interação do DP interno à preposição com o ambiente sintático externo a ele e, por isso, o verbo não pode selecionar semanticamente o DP do sintagma-com. No caso do 119 sintagma-de não haveria esse impedimento porque a preposição seria inserida apenas na morfologia, no caminho para PF, sem impactos, portanto, para a semântica.81 Veja-se, a esse respeito, as representações em (48), reproduzidas de Avelar (2005a): (48) a. b. VP VP comer comer DP DP DP DP [ DP bombom] uma uma [ PP com [ DP bombom]] caixa caixa Voltando à questão da concordância com expressões partitivas, vejamos se uma análise da partitiva em termos de uma estrutura de adjunção de DP a DP poderia explicar os casos de concordância plural com o DP definido. Considere-se a representação a seguir: TP (49) T’ vP T [µ N u m ] DP DP A 81 m a io ria v’ D P [+ p l] os m e n in o s VP V DP Avelar assume que o DP em si já constituiria uma fase (cf Boscovic, 2005), o que significa dizer que esse constituinte poderia ter sua projeção enviada para o componente fonológico tão logo seja formada. As diferenças entre os DPs poderiam ser atribuídas ao que estaria na margem da fase do sintagma adjungido. Considerando a discussão desenvolvida em Kato & Nunes (1998), Avelar explica que, tanto na representação em (42a) quanto em (42b), o elemento adjungido se encontraria no domínio mínimo de V. O verbo “comer” poderia, portanto, enxergar o sintagma adjungido nos dois casos: em (42a), o verbo conseguiria interagir semanticamente com o DP adjungido, satisfazendo seus requerimentos de ordem temática; em (42b), contudo, o mesmo não seria possível, dado que o PP nucleado por “com”, embora no domínio mínimo do verbo, não satisfaz seus requerimentos temáticos. 120 Nessa representação, poder-se-ia propor que o núcleo funcional T, que precisa valorar seu traço de número não-interpretável, busca um traço de mesma dimensão interpretável, numa configuração de c-comando. Como o DP pl, em posição de adjunção, está apenas contido pelo DP complemento (e não dominado), T pode enxergar o DP adjungido e valorar seus traços de número com esse DP. A preposição “de” seria inserida apenas na morfologia e estaria associada à expressão de partitividade. Um ponto que não é claro nessa análise é por que T não valora seu traço de número com o DP que inclui o termo partitivo, visto que este também estaria acessível para T. Uma possibilidade, considerando-se a idéia de categorias híbridas (semi-lexicais ou semi-funcionais), é que “maioria” não estaria com traços lexicais ativos e, portanto, não poderia entrar em concordância com T. A título de conclusão, cumpre esclarecer que os pontos discutidos nesta seção são um primeiro movimento na busca de um tratamento adequado para a concordância com expressões partitivas. Certamente, ainda há muito que se explorar em relação a essas estruturas, nomeadamente no que tange à idéia de se atribuir ao nome partitivo uma natureza semi-lexical. Também ainda precisam ser refinadas as estruturas aqui apresentadas. Para os propósitos desta tese, contudo, o importante é deixar claro que a concordância com as partitivas é resultante de um processo sintático, passível de ser capturado a partir da definição do elemento que carrega o traço interpretável de número no DP e de configurações específicas atribuídas à partitiva. Nesse sentido, diferenciam-se das construções em que a concordância com o segundo nome de um DP complexo constitui uma falha de processamento. 5.2 Experimento psicolingüístico de julgamento de gramaticalidade construções partitivas x DPs complexos A análise lingüística apresentada na seção anterior permitiu prover uma explicação para a concordância com as construções partitivas em termos de diferenças relativas à natureza categorial dos termos “maioria” e “parte”. Foi visto que a concordância plural é licenciada por uma representação estrutural em que os termos “maioria” e “parte” atuam como quantificadores, que modificam o segundo termo da expressão partitiva. Nesta seção, busca-se verificar, se em termos de processamento, os falantes i) distinguem as construções partitivas dos 121 DPs complexos responsáveis por erros de atração; e ii) se há uma preferência por uma forma de singular ou de plural das construções partitivas, em sentenças em que ambas as alternativas de concordância seriam possíveis. O experimento consistiu numa tarefa de julgamento de gramaticalidade. Como se sabe, a técnica de julgamento de gramaticalidade é bastante empregada nas análises realizadas dentro do quadro teórico do Gerativismo. Ela consiste basicamente na avaliação por parte de um falante nativo se uma dada sentença seria ou não considerada parte de sua língua. Esse julgamento não é sempre simples de ser obtido, e não são incomuns discordâncias entre os próprios lingüistas quanto à gramaticalidade ou não de uma dada sentença. Isso porque, ao se emitir um dado julgamento de gramaticalidade, é difícil dissociar esse julgamento de questões de interpretabilidade, do tipo de variante lingüística que se fala e até mesmo do conhecimento obtido via ensino formal. Isso, contudo, não impede que certas construções sejam claramente avaliadas como impossíveis numa dada língua, ou como bastante marginais, no sentido de que nenhum falante nativo as produziria. Nesta tese, buscou-se implementar uma tarefa psicolingüística que envolvesse julgamento de gramaticalidade. A idéia era buscar capturar de forma bastante imediata o julgamento do falante. Para isso, foi construído um experimento em que o participante era apresentado a sentenças cujas palavras eram projetadas uma a uma em um telão. Foi dito que as sentenças haviam sido produzidas por falantes estrangeiros e que a tarefa consistia em dizer se o estrangeiro dominava bem o português, no sentido de poder ser confundido com um falante nativo de português. Ele deveria marcar SIM ou NÃO em um bloco de respostas, da forma mais rápida possível, não dando margem, assim, a possíveis oscilações no julgamento, o que por vezes ocorre quando não se tem essa restrição de tempo. As variáveis independentes foram: a) tipo de DP sujeito: expressão partitiva e DP complexo não quantitativo. b) número do verbo: singular e plural A variável dependente foi o total de respostas SIM para a questão “O estrangeiro domina bem o português?” A seguir apresentam-se exemplos de sentenças por condição experimental: 122 Construção partitiva/ verbo no sing.: A maioria dos livros da estante QUEIMOU. Construção partitiva/ verbo no pl.: A maioria dos livros da estante QUEIMARAM. DP complexo / verbo no sing.: A pasta dos documentos do escritório RASGOU. DP complexo / verbo no pl.: A pasta dos documentos do escritório RASGARAM. Assumindo-se como pressuposto que a concordância verbal com as construções partitivas pode ser feita com o primeiro ou com o segundo nome das partitivas, e de que apenas a concordância com o primeiro nome é possível no caso de DPs complexos não quantitativos, previa-se que as primeiras fossem julgadas gramaticais tanto com o verbo no singular quanto no plural e que as últimas fossem julgadas agramaticais nos casos de verbo concordando com núcleo interveniente. Método Participantes: Participaram do experimento, como voluntários, 24 alunos de graduação da PUC-Rio, com idade média de 20 anos, sendo 13 mulheres. Material: Foram construídas 4 sentenças para a fase de treinamento e 48 para a fase de teste (16 experimentais, sendo 4 por condição, e 32 distratoras). As sentenças experimentais foram aleatorizadas e eram apresentadas a cada duas sentenças distratoras. As sentenças distratoras apresentavam, em geral, erros típicos cometidos por estrangeiros aprendendo português. As sentenças com erros foram adaptadas da dissertação de mestrado de Scherer (2002), sobre a produção lexical de falantes de português como língua estrangeira. Procedimento: O procedimento experimental consistiu na apresentação de sentenças em um telão, palavra por palavra, havendo um intervalo de dois slides na passagem 123 de uma sentença para outra. Para a projeção das sentenças foi utilizado um equipamento de data show. O experimento foi realizado por alunos da PUC-Rio, no espaço de sala de aula, com sessões envolvendo pequenos grupos de sujeitos (em torno de 8 pessoas). A apresentação tinha a duração de 10 minutos. Resultados: As respostas SIM do experimento foram submetidas a uma análise de variância por sujeitos com design fatorial 2x2, em que tipo de DP sujeito e número do verbo foram tomadas como medidas repetidas. Os resultados de aplicação do teste estatístico ANOVA indicaram um efeito principal significativo do tipo de DP sujeito: F(1,23) = 9.55, p < .005, com maior número de respostas SIM para as sentenças com construções partitivas. 5,71 6 4,62 5 médias 4 3 2 1 0 Construção partitiva DP complexo Gráfico 1: Médias de respostas SIM em função do tipo de DP sujeito Houve também efeito principal altamente significativo do número do verbo, com as médias apontando na direção do verbo no singular: F(1,23) = 35.88, p < .0001. 124 6,79 7,00 6,00 médias 5,00 3,54 4,00 3,00 2,00 1,00 0,00 Singular Plural Gráfico 2: Médias de respostas SIM em função do número do verbo A interação entre as variáveis tipo de DP sujeito e número do verbo foi significativa: F(1,23) = 10.18, p <.004. 3,5 3,5 3,29 3 2,42 Médias 2,5 2 1,5 1,13 1 Sing Plu 0,5 0 Part Compl Tipo de DP Gráfico 3: Médias de respostas SIM em função do tipo de DP sujeito e do número do verbo Também foi verificado, a partir da aplicação de teste-t, que há uma preferência pelo emprego de verbo no singular tanto no caso das construções partitivas (t(df23) = 2,27, p < .02), quanto no caso dos DPs complexos (t(df23) = 7,71, p < .0001). Discussão: O efeito principal de tipo de modificador, com maior incidência de respostas SIM para as sentenças com construções partitivas, é compatível com a visão de 125 que essas expressões licenciam tanto o verbo no singular quanto no plural. Assim, tanto sentenças do tipo A maioria dos livros queimou quanto sentenças do tipo A maioria dos livros queimaram foram julgadas gramaticais pelos participantes do experimento. O resultado relativo à variável número do verbo, com uma maior incidência de respostas SIM para verbos no singular, indica que foram consideradas gramaticais as sentenças em que, independentemente do tipo de DP sujeito, o verbo concordou com o primeiro núcleo nominal do sujeito. Logo, há, a despeito do tipo de sujeito, uma preferência pela concordância verbal singular. Em relação ao cruzamento das variáveis tipo de modificador e número do verbo, observa-se que há uma diferença entre partitivas e DPs complexos. Há uma maior incidência de resposta SIM para o verbo no plural com expressões partitivas (A maioria dos livros queimaram) do que para DPs complexos (A estante dos livros quebraram), o que sugere que os falantes rejeitam mais a concordância plural com o segundo tipo de DP. Cumpre notar, contudo, que, mesmo no caso das construções partitivas, há uma preferência pelo verbo no singular, situação em que o verbo concorda com o que seria analisado tradicionalmente como o núcleo do sujeito. Essa preferência nas partitivas talvez possa ser atribuída a uma interferência do ensino formal, em que a concordância canônica é avaliada como mais “correta” em termos prescritivos do que a chamada concordância estilística com o modificador do sujeito. Em suma, os resultados do experimento mostram que os falantes atribuem julgamentos diferentes para a concordância plural com sujeitos partitivos e DPs complexos. Isso ocorre mesmo quando a sentença com a partitiva não deixa evidente a natureza categorial dos termos “maioria” e “parte” (se lexical ou funcional)82. Logo, faz sentido considerar que no caso das expressões partitivas, a concordância plural está associada a uma dada representação sintática em que o segundo núcleo nominal funciona como o controlador da concordância e que nas 82 Deevy (1999) realiza experimentos em inglês com construções pseudo-partitivas as quais também admitiriam duas alternativas de concordância (A box of doghnuts was opened/A box of doughnts were eaten). Os resultados sugerem que uma estrutura para a partitiva já teria sido construída quando da apresentação do verbo. Logo, nos casos em que a concordância verbal é licenciada pela representação atribuída à partitiva, a sentença é julgada gramatical. Interessante seria manipular os tipos de sentenças em que as partitivas aparecem de modo a tentar evidenciar a natureza mais lexical ou mais funcional de “maioria” e “parte”, a fim de verificar se há diferenças de julgamento em experimento on-line. 126 sentenças com DPs complexos, a concordância com o modificador seria o resultado de uma falha de processamento. Nos capítulos 6 e 7 veremos como é explicado esse tipo de falha em modelos de produção de sentenças. 127 6 Modelos interativos e não-interativos diante dos erros de atração 6.1 Modelos interativos Na revisão da literatura acerca de erros de atração, foi visto que resultados de experimentos conduzidos com falantes de várias línguas indicam que fatores semânticos, sintáticos e morfofonológicos interferem no processamento da concordância, podendo levar o falante a produzir erros de atração. Em princípio, erros provocados pela manipulação de fatores semânticos e morfofonológicos parecem constituir evidência a favor de modelos interativos, visto que estes admitem o acesso a informações de tipos diferentes em cada momento do processo de formulação de sentenças. Vejamos como isso se daria. A interferência de informação semântica, relativa à distributividade do sujeito foi, por exemplo, explicada por Vigliocco e colegas (1995, 1996a, 1996b) como uma falha durante a codificação gramatical no processo de unificação de informação de número do sujeito e do verbo. De acordo com os autores, o verbo teria seu número gramatical definido a partir do nível da mensagem e, no momento da unificação dos traços deste com os do sujeito, falhas poderiam ocorrer gerando os erros de concordância. Quanto à interferência de informação morfofonológica, nos modelos que admitem upward feedback (Vigliocco & Hartsuiker, 2002; Vigliocco et al, no prelo), considera-se que a informação morfofonológica poderia interferir no nível anterior, o nível da codificação gramatical. O processamento da concordância seria vulnerável à interferência de pistas morfofonológicas disponíveis nas línguas e propriedades como a disponibilidade e a confiabilidade (padrões regulares) dessas pistas permitiriam prever a probabilidade de erros de concordância em cada língua. Não é claro nesses modelos, contudo, exatamente como se daria essa interferência. Entre os modelos interativos, há ainda propostas que eliminam completamente a idéia de níveis. Nesses modelos não há limites arquiteturais aos tipos de informação que podem ser acessados pelo processador, sendo que algumas condições podem favorecer a interferência de um ou outro tipo de informação. Haskell & MacDonald (2003), com base em um modelo de satisfação de condições - inicialmente aplicado a questões de compreensão, vêm sugerindo 128 que fatores sintáticos e não-sintáticos interagem durante o estabelecimento da concordância. De acordo com esse modelo, o resultado do processamento é determinado pela interação de informações de natureza distinta, com pesos diferentes. No caso da concordância sujeito-verbo, assume-se que haveria uma competição entre formas verbais alternativas e que certas condições favoreceriam a seleção de uma ou de outra forma verbal. Assim, por exemplo, o fato de o sujeito da sentença apresentar número conceitual e gramatical incongruentes poderia gerar uma competição entre formas verbais e induzir um erro de concordância. Da mesma forma, nomes com uma terminação típica de plural (ex. pires) poderiam reforçar uma forma verbal no plural e inibir uma forma verbal no singular. Várias fontes de interferência também poderiam atuar ao mesmo tempo e, dependendo do peso que tivessem na língua, uma poderia se sobrepor a outra. 6.2 Modelos não-interativos Para preservar a autonomia do formulador sintático no processamento da concordância, a solução encontrada pelos modelos seriais, não-interativos, é atribuir a interferência de fatores semânticos e morfofonológicos a estágios anteriores ou posteriores à computação sintática da concordância. Em relação a efeitos de ordem semântica, Bock et al. (2001) situam esses efeitos em um estágio anterior à computação da concordância. Os autores incorporam o modelo de produção apresentado em Bock & Levelt (1994), em que a codificação gramatical compreende duas etapas: uma de atribuição de função sintática (nível funcional) e uma de composição da estrutura sintagmática da sentença (nível posicional). O sistema de produção funcionaria da seguinte forma: com base em uma representação conceitual, seriam definidas as funções sintáticas (sujeito, objeto direto etc.) dos constituintes da sentença e, através de um processo chamado number marking, informação de ordem conceitual permitiria a especificação do valor do número da função sujeito. No nível posicional, o sintagma que receberia a função de sujeito seria construído com base em informação codificada nos lemas dos itens lexicais. Montado o sintagma, o traço de número do núcleo percolaria ascendentemente até o nó mais alto de modo a especificar o número do sintagma. Haveria, então, uma operação de unificação de informação de número definida a partir do nível da mensagem e do traço de número do núcleo do sujeito. Esse processo ocorreria durante o processo de 129 number morphing. Nos casos de incongruência entre o número conceitual e o número do núcleo do sujeito, poderia ocorrer erro na definição final do valor de número do DP sujeito. Assim, em preâmbulos com leitura distributiva, como em O rótulo nas garrafas, prevaleceria, no processo de unificação de traços, a informação de plural. Depois de definido o número do sujeito, também durante o processo de number morphing, o verbo teria seu traço de número especificado, porém por um processo de cópia do traço de número do NP sujeito. A concordância sujeitoverbo, portanto, seria resultante de um processo de cópia de traços que ocorreria durante a construção da estrutura hierárquica da sentença. Logo, no caso de erro relacionado a fator semântico, o verbo terminaria marcado como plural não por uma falha na computação da concordância sujeito-verbo, mas sim em decorrência de uma falha na definição final do número do sintagma sujeito. Logo, o erro seria pré-computação da concordância. Quanto à interferência de fatores morfofonológicos, estes são atribuídos à percolação ascendente do traço de número do nome local para o nó mais alto do NP sujeito. Também aqui o erro não ocorreria propriamente na computação sintática da concordância, visto que esta ocorreria depois, pelo processo de cópia do número do sintagma sujeito para o verbo. A seguir apresenta-se uma representação esquemática do processamento da concordância segundo Bock et al. (2001): M ensagem O telhado das casas... Número nocional: single token x multiple token M ARKING Sujeito [+pl] Objeto Nível Funcional Sentença [+pl] NP VP Nível unificação posicional N Léxico [-pl] cópia C o d i f i c a ç ã o g r a m a t i c a l M ORPHING Fig. 7: Operações de Number Marking e Number Morphing no processamento da concordância sujeito-verbo (adaptado de Bock et al., 2001) 130 O modelo de Bock et al. (2001), embora consiga manter a autonomia do formulador sintático, não permite explicar, contudo, diferenças no total de erros de atração provocados por nomes com um traço intrínseco de número plural e nomes cujo plural é resultado de processo flexional. Conforme foi visto, os bipartidos e os pluralia tantum, embora tenham induzido mais erros do que nomes flexionáveis no singular, produziram menos erros do que nomes flexionáveis no plural. Esse resultado não era previsto pelo modelo, pois a informação de número tanto num caso como no outro percolaria igualmente até o nó mais alto do DP sujeito. Esse tipo de interferência, portanto, parece colocar em xeque a idéia de um formulador sintático autônomo, que não sofre interferência de ordem morfofonológica. No próximo capítulo, veremos como no modelo de produção apresentado em Rodrigues & Corrêa (2004)/Corrêa & Rodrigues (2005) é possível explicar esse tipo de interferência bem como interferências semânticas, mantendo-se a autonomia do formulador sintático. 131 7 Modelo PMP – modelo de produção monitorada por parser Na seção anterior, foi visto que os modelos de processamento da concordância existentes não provêem uma explicação para efeitos ligados à distância linear entre o núcleo do sujeito e o verbo e para determinados efeitos de marcação morfofonológica. Esses modelos também não diferenciam o que seria a causa dos erros de atração das propriedades que fazem com que um dado núcleo interveniente venha a provocar interferências na concordância sujeito-verbo. Nesta tese, assume-se como alternativa a essas propostas um modelo de processamento da concordância serial, que incorpora um parser-monitorador – o modelo PMP - produção monitorada por parser (Rodrigues & Corrêa, 2004; Corrêa & Rodrigues, 2005), o qual tem acesso aos enunciados lingüísticos à medida que estes são produzidos pelo falante (cf. Levelt, 1989). A idéia é que o falante é ao mesmo tempo ouvinte de suas produções e realiza o parsing sintático dos enunciados a que tem acesso, o que lhe permite, em última instância, verificar se o resultado da formulação está de acordo com o que foi concebido no nível da mensagem. O modelo, conforme será visto, localiza os erros de atração após o parsing do DP sujeito, mantendo a autonomia do formulador sintático. O modelo, além de dar conta da interferência de fatores sintáticos, também permite explicar o efeito de distância linear entre sujeito e verbo e efeitos de ordem morfofonológica. Nesta seção será apresentada a primeira versão do modelo (Rodrigues & Corrêa, 2004; Corrêa & Rodrigues, 2005), que foi originalmente concebida com vistas a dar conta da interferência de fatores de ordem linear e morfofonológica no processamento da concordância. Serão comentadas as propriedades básicas do modelo e os procedimentos por ele implementados. No capítulo 8, serão reportados os resultados dos experimentos conduzidos com falantes de português e será avaliado o grau de cobertura do modelo considerando-se esses resultados e aqueles reportados na resenha da literatura. No capítulo 9, duas explicações alternativas para explicar os erros de concordância serão consideradas e será proposta uma versão revista e ampliada do modelo PMP. 132 7.1 Propriedades do modelo O modelo PMP apresenta 3 propriedades fundamentais, quais sejam: ¾ incrementalidade moderada; ¾ computação automática da concordância como processo de valoração de traços; ¾ monitoração concomitante à produção por parte de um parser. 7.1.1 Incrementalidade moderada A expressão “processamento incremental” foi proposta por Kempen & Hoenkamp (1987), no âmbito de uma teoria acerca da produção sintática de sentenças, que se pretendia fosse dotada de plausibilidade lingüística e estrutural – a Gramática Procedural Incremental (IPG – Incremental Procedural Grammar). Essa gramática buscava capturar uma das principais características da produção humana de sentenças: a incrementalidade, que diz respeito ao fato de o processo de articulação de sentenças poder ser iniciado antes de o falante ter concluído o planejamento completo da sentença que deseja expressar. Na IPG, a formulação de sentenças se dá paulatinamente (piecemeal), isto é, a sentença é vista como compreendendo uma série de unidades e, enquanto se está articulando uma dessas unidades, a unidade seguinte já está sendo planejada. Tão logo um fragmento de conteúdo conceptual esteja disponível, é transmitido ao formulador sintático que procura traduzi-lo em um fragmento de sentença, o qual é então articulado. Enquanto isso, o processamento de outros fragmentos estaria sendo realizado. Nesse sentido, pode-se dizer que há um certo grau de processamento paralelo na produção da linguagem, o que, é importante esclarecer, não implica interação entre os componentes responsáveis pelo processamento de cada tipo de informação: tão logo um componente conclua seu trabalho, a representação desse componente é transmitida a outro que dá continuidade ao processo de formulação da sentença. A idéia de incrementalidade foi incorporada por Levelt (1989) a um modelo psicolingüístico de produção da linguagem. No que diz respeito à estruturação sintática da sentença, Levelt propõe que, assim que um elemento nominal inicial é 133 ativado, ele projeta não apenas nós do tipo N e NP, mas também o nó da própria sentença. Não é claro, no entanto, se quando o NP sujeito é enviado para a codificação fonológica a concordância verbal já teria sido computada. O modelo de produção aqui assumido é dotado de incrementalidade moderada. Diferentemente do que propõe Levelt (1989), considera-se que uma relação sintática teria de ser estabelecida entre o DP sujeito e o verbo antes da codificação morfofonológica e a articulação daquele. Evidências empíricas a favor dessa idéia são discutidas em Ferreira (1999). De acordo com a autora, a codificação de um conceito como sujeito da sentença dependeria de propriedades do verbo. Ferreira reporta resultados experimentais que apontam nessa direção (cf. Lindsley, 1975; Kempen & Huijbers, 1983; Ferreira, 1994; Meyer, 1996 apud Ferreira, 1999). Destaca-se um experimento no qual foi investigado se a escolha de uma estrutura de ativa ou de passiva seria influenciada por propriedades do verbo da sentença (Ferreira, 1994). Nesse estudo, foi verificado que os participantes tratam diferentemente verbos do tipo like e do tipo frighten quanto à escolha de uma estrutura de passiva para construir a sentença. Partindo da idéia de que existiria uma hierarquia de papéis temáticos (cf. Kintsch, 1974; Jackendoff, 1972, 1987, 1990), em que os papéis de “agente” e “experienciador” ocupariam o topo da hierarquia e os papéis de “paciente” e “tema” estaria na base, a autora propõe que seria selecionada para cada verbo a estrutura sintática que permitisse posicionar “agentes” e “experienciadores” em uma posição sintática proeminente, o sujeito da sentença. Com verbos do tipo like, o sujeito da ativa deve ser uma expressão nominal com papel de “agente” ou de “experienciador”; com verbos do tipo frighten, a posição de sujeito da ativa é ocupada por uma expressão com papel de “tema” e a posição de objeto, por um “experienciador” (The thunder frightened Tom – O trovão assustou Tom). Logo, com verbos como frighten, é a estrutura de passiva que permite posicionar o elemento com papel de “experienciador” na posição de sujeito, a mais proeminente da sentença. Logo, esperava-se que houvesse uma diferença no total de passivas entre as condições com verbos do tipo like e do tipo frighten, com maior emprego de passivas com verbos do tipo frighten. Essa previsão foi confirmada. O resultado obtido foi tomado como evidência de que a decisão se um dado referente conceptualizado vai ser ou não tomado como o sujeito da sentença depende do verbo, isto é, 134 depende da identificação de propriedades do verbo, o que, por sua vez, é compatível com a idéia de produção moderadamente incremental. Resultados experimentais com falantes de odawa, uma língua indígena norte-americana, também são indicativos de que propriedades do verbo são verificadas antes de o sujeito ser efetivamente articulado (Christianson & Ferreira, 2005). O odawa é uma língua cujos principais constituintes podem ser livremente ordenados, o que permite que os falantes comecem uma dada sentença com qualquer referente conceptualizado que esteja mais acessível. Assim, um NP com qualquer função sintática pode ocorrer no inicio da sentença, independentemente da forma verbal usada, sem que para isso seja necessário o falante recorrer a padrões entonacionais específicos, como se observa em construções de topicalização em outras línguas. Há, no entanto, três formas verbais distintas cujo uso está associado ao papel temático e à função sintática do elemento que funciona como tópico, o que, como será visto, permite que hipóteses relativas à incrementalidade sejam testadas. As três formas são as seguintes: forma direta usada quando o tópico é o sujeito e tem papel temático de agente; forma inversa – usada quando o tópico é o objeto e tem papel temático de paciente; forma passiva – usada quando o tópico é o sujeito e tem papel temático de paciente. A forma direta é a mais freqüente nessa língua. Tendo em vista essas características, podem ser feitas as seguintes previsões para uma língua como o odawa quanto à incrementalidade: se a produção de sentenças for radicalmente incremental, independentemente do tópico da sentença ser um agente ou um paciente, os falantes possivelmente privilegiarão a forma direta, porque ela é a forma mais freqüente na língua. Se, no entanto, a produção for moderadamente incremental, será privilegiada a forma do verbo em que o tópico for o sujeito: se o tópico tiver papel de agente, será usada a forma direta; se o tópico tiver papel de paciente, será usada a forma passiva. A forma inversa não será usada porque, embora nessa forma verbal o tópico deva ser um NP com papel de paciente, a função sintática que desempenha é de objeto. As duas hipóteses puderam ser confrontadas a partir de um experimento de apresentação de figuras seguido de perguntas de 3 tipos, cada uma correspondendo a uma condição experimental. Uma das perguntas colocava um “agente” como tópico (PA) - ex.: O que o menino está fazendo?; outra, o paciente 135 (PP) - ex.: O que aconteceu com o menino?, e uma terceira pergunta funcionou como controle (PG) - ex.: O que está acontecendo aqui? Os resultados obtidos foram os seguintes: enquanto nas condições com pergunta “geral” e pergunta “agente” a forma direta do verbo foi a mais empregada, nas perguntas “paciente” a forma passiva do verbo foi a privilegiada.83 Logo, a despeito de a flexibilidade de ordem em odawa permitir que um referente conceptualizado possa ser imediatamente produzido tão logo se torne acessível, sem que nenhuma propriedade do verbo seja levada em consideração, os falantes preferiram a forma passiva (mesmo esta sendo menos freqüente que a forma direta). A escolha da forma de passiva significa que propriedades do verbo foram levadas em consideração. Nesse sentido, pode-se dizer que os falantes de odawa se comportaram de modo semelhante aos falantes de inglês do experimento de Ferreira (1994), o que pode ser tomado como indicativo de que a produção é moderadamente incremental. Um dos pressupostos do modelo de produção apresentado nesta tese é que a concordância entre sujeito e um núcleo funcional com traço não interpretável de número (no caso, T de TP) seria computada antes de o DP sujeito ser enviado para a codificação morfofonológica. Isso só é possível se for assumida a idéia de incrementalidade moderada. Importante observar que o fato de a concordância ter sido computada não significa que a codificação morfofonológica do verbo esteja concluída. Isso abre a possibilidade de essa codificação sofrer interferência de uma representação gerada pelo parser quando o DP sujeito é emitido. A seguir, veremos como a concordância é computada e que tipo de informação vai para o componente onde a codificação morfofonológica é realizada. 7.1.2 Computação automática da concordância como processo de valoração de traços Neste tese a computação da concordância de número entre sujeito e verbo é caracterizada em termos de um processo de valoração de traços formais da língua 83 Cumpre observar que as perguntas do tipo PP também favoreceram respostas com o verbo na forma inversa (em que o tópico é “paciente”, mas tem função de objeto), embora o efeito tenha sido pequeno. 136 e o resultado desse processo é encaminhado a um componente morfofonológico84. Conforme visto no capítulo 3, essa concepção da concordância é compatível tanto com o que vem sendo proposto para explicar a codificação gramatical em modelos de produção (cf. Levelt et al. 1999), quanto com o que vem sendo assumido correntemente no âmbito do Programa Minimalista (Chomsky, 1999). Na modelo de produção de Levelt, foi visto que os lemas dos verbos têm um diacrítico de número valorado durante a etapa de codificação gramatical, a partir do número especificado no lema correspondente ao núcleo do sujeito; no modelo de língua minimalista, o traço não-interpretável de número do verbo tem seu valor especificado no curso da derivação sintática, também em função do traço de número (interpretável) do DP sujeito. Nos dois domínios teóricos, há também uma separação entre o que seria uma representação abstrata de número e sua realização morfofonológica. No modelo de processamento de Levelt, isto se materializa em termos de uma distinção entre os conceitos de lema e de lexema; no modelo de língua, em termos de uma distinção entre traços formais e traços fonológicos. Essa separação é fundamental, pois permite que se pense no erro de concordância como resultante de uma interferência apenas na codificação morfofonológica do verbo, não afetando a concordância em si. 7.1.3 Monitoração concomitante à produção por parte de um parser A idéia de que a produção da fala é monitorada por um parser é uma das características fundamentais do modelo proposto, pois permite explicar efeitos de linearidade e de marcação morfofonológica na computação da concordância, mantendo-se a autonomia do formulador sintático. De acordo com Levelt (1989), o falante usa seu sistema de compreensão para monitorar a própria fala, o que lhe permite identificar e corrigir os erros produzidos. Considerando-se a natureza incremental da fala, pode-se assumir que o parser segmenta e analisa o material produzido tão logo este é disponibilizado para a codificação fonética, antes mesmo, inclusive, de ter sido efetivamente articulado. 84 Nesta tese, a assunção de um mecanismo de valoração de traços para a computação da concordância restringe-se à idéia de que o verbo teria seu traço de número especificado no curso da derivação sintática, numa configuração de c-comando. 137 No modelo PMP, foi proposto que o parser atuaria de forma bottom-up, no sentido de que, no processo de parsing, o DP inicialmente produzido só poderia ser integrado em uma estrutura sintática na função de sujeito quando o verbo fosse efetivamente emitido. Esse DP inicial seria mantido num nível temporário de memória até que o verbo fosse identificado e seu lema acessado. Só nesse momento uma relação sintática do verbo com o DP inicial seria estabelecida e este poderia ser identificado como o sujeito da sentença. Considerando-se que o parser está sujeito a limitações de processamento e de armazenamento de informações pela memória de trabalho, a representação temporária do DP poderia sofrer um processo de esvaecimento progressivo, o que viria a afetar a computação da concordância entre sujeito e verbo. Conforme veremos no capítulo 9, também é possível imaginar que uma estrutura sintática top-down já comece a ser projetada tão logo o DP seja produzido, e que o DP seja analisado como um possível sujeito para a sentença. Tanto numa alternativa quanto em outra, contudo, ambas as representações do DP geradas pelo parser estariam sujeitas a esvaecimento, o que poderia ter reflexo na especificação do número do DP sujeito. 7.2 Procedimentos implementados pelo parser monitorador e explicação dos erros de atração. Os procedimentos implementados pelo modelo podem ser descritos da seguinte forma: o falante, em função de uma intenção de fala, que leva em conta fatores pragmáticos relacionados ao interlocutor e às condições de produção, conceptualiza uma mensagem. Há uma seleção, no léxico mental, de itens cujos lemas correspondem aos conceitos que se deseja expressar. A informação dos lemas, entendida como um conjunto de traços categorias e formais, é acessada e utilizada na montagem da árvore sintática. Uma operação de valoração de traços permite o pareamento de traços entre o DP sujeito e o verbo e a concordância é computada. Tão logo a concordância é computada, o DP passa a um processo de codificação morfofonológica que permitirá sua emissão antes da codificação morfofonológica do verbo. A representação fonética do DP é gerada, a fim de o DP poder ser articulado. Essa representação fonética (ou aquela decorrente da 138 articulação da representação fonética do DP) é submetida às operações do parser monitorador (segmentação, reconhecimento e acesso lexical e criação de um marcador frasal). A representação do DP gerada pelo parser é então mantida numa memória temporária para que possa ser integrada ao restante da sentença que está sendo produzida em paralelo. Quando o verbo vai ser codificado morfofonologicamente, a representação morfofonológica do DP ainda pode estar mantida na memória e nesse momento pode gerar uma interferência no processo de codificação do verbo. Poder-se-ia pensar nessa interferência em termos de uma espécie de resíduo fônico dos traços lexicais (correspondentes à informação em PF) que afetaria a codificação morfofonológica do verbo, com reflexos na sua representação fonética e posterior articulação. No modelo proposto, considera-se que determinados fatores podem contribuir para um maior ou menor grau de acessibilidade dos elementos que integram a representação do DP sujeito. Entre esses fatores, estariam a marcação morfofonológica dos núcleos nominais (que está associada à proeminência fônica) e posição hierárquica dos núcleos intervenientes85. Assim, o modelo faria prever que haveria uma diferença em termos de acessibilidade entre núcleos nominais no singular (não-marcado; fonicamente menos proeminente) e no plural (marcado; fonicamente mais proeminente). Também o modelo faria prever uma diferença entre núcleos intervenientes em função da posição hierárquica por eles ocupada. Quanto mais próximo um núcleo interveniente estivesse do nó mais alto do DP sujeito, maiores as chances de este núcleo gerar interferência. Considerando-se também as restrições de processamento e o armazenamento de informações pela memória de trabalho, seria esperado que o fator distância linear sujeito/verbo viesse a afetar a concordância, pois quanto mais distante estivesse o núcleo do sujeito do verbo, menos acessível se tornaria e mais erros poderiam ocorrer. A figura a seguir apresenta uma caracterização esquemática do modelo: 85 Para uma discussão de fatores associados ao grau de acessibilidade de uma representação na memória de trabalho, ver Arial (1994) e Matthews & Chodorow (1998) e Corrêa (2000). 139 Processamento da concordância na produção (Corrêa & Rodrigues, 2005) Conceptualização Traços semânticos Acessolexical Lemas (traçosformais) Codificação gramatical Valoração de traços Spell out Codificação morfofonológica do DP sujeito Codificação fonética Enunciado Parser monitorador Spell out Codificação morfofonológica do verbo Interferência Codificação fonética Representação do DP sujeito ERRO Fig. 8: Modelo PMP de processamento da concordância na produção de sentenças Para finalizar esta seção, deve-se esclarecer que, diferentemente do que vem sendo assumido (Vigliocco & Nicol, 1998; Bock et al., 2001), o erro não seria gerado por falhas em operações do sistema de produção, mas sim por questões de acessibilidade da representação do DP sujeito gerada pelo parser e mantida na memória de trabalho. Nesse sentido, não haveria propriamente um erro de concordância, visto que o “erro” não ocorreria na computação sintática da concordância, mas sim num momento posterior, após o parsing do DP sujeito. Outro ponto importante do modelo é que ele consegue explicar efeito de marcação associado a efeito sintático, sem precisar postular a interferência de um nível morfofonológico em um nível sintático, isto é, sem precisar recorrer à idéia de retro-alimentação. Tanto efeitos sintáticos (posição hierárquica) quanto efeitos morfofonológicos (marcação) podem ser atribuídos à representação do DP gerada pelo parser, a qual seria vulnerável a esvaecimento progressivo. Mantém-se, assim, a idéia de um formulador sintático autônomo, encapsulado. 140 8 Experimentos de produção induzida de erros Neste capítulo serão reportados os resultados de 5 experimentos de produção induzida de erros, construídos com o intuito de verificar os três tipos de interferência que vêm sendo investigados na literatura sobre processamento da concordância: interferência sintática, semântica e morfofonológica. Nos dois primeiros experimentos, procura-se dissociar as condições que favorecem o erro das propriedades que levam um dado núcleo interveniente a afetar o processamento da concordância. Assim, busca-se verificar se i) distância linear entre o núcleo do sujeito e o verbo e ii) tipo de modificador em que está inserido o núcleo interveniente são condições necessárias para o erro e se iii) a posição hierárquica de um dado núcleo interveniente na estrutura do DP sujeito pode tornar esse núcleo um candidato a afetar a concordância. O segundo experimento também tem por objetivo verificar os fatores responsáveis por um efeito de marcação -- se a complexidade da codificação morfofonológica do verbo, como sugerido em Franck, Vigliocco & Nicol (2002), em estudo comparativo envolvendo falantes de francês e de inglês, ou se a visibilidade da marca de número no DP, conforme previsão do modelo de produção aqui considerado. O terceiro experimento tem por objetivo avaliar se a natureza argumental do PP que contém o núcleo interveniente é fator de geração de erros de atração. Examina-se se o fato de um PP modificador funcionar sintaticamente como adjunto ou complemento do núcleo do sujeito afeta o processamento da concordância. No quarto experimento, tanto fatores semânticos quanto morfofonológicos são investigados. Procura-se i) dissociar um efeito de distributividade puramente semântico (O volante de cada carro) de um efeito de distributividade associado à marcação de número (O volante dos carros); ii) avaliar se erros de atração podem ser atribuídos exclusivamente à forma fônica (s final) do nome local plural (ônibus vs. carro) e se diferenças relativas à codificação morfofonológica de número no núcleo interveniente em DPs locais plurais são consideradas na computação da concordância em português (O volante dos ônibus vs. O volante dos carros) 141 O quinto e último experimento busca testar se um efeito de distributividade com DPs complexos pode ser ampliado pela adição de um segundo PP modificador, na medida em que este torna o DP mais pesado e amplia a distância entre o núcleo do sujeito e o verbo (O volante dos carros de corrida). Nos cinco experimentos foi utilizada a mesma técnica experimental – a produção induzida de erros, tendo sido todos os experimentos realizados no LAPAL (Laboratório de Psicolingüística e Aquisição da Linguagem), vinculado ao Departamento de Letras, da PUC-Rio. A fim de que se possa entender como os experimentos foram conduzidos, faz-se a seguir uma apresentação da técnica empregada, antecedida de uma breve discussão acerca de questões metodológicas no estudo da produção da linguagem. 8.1 Questões metodológicas no estudo da produção da linguagem e a tarefa de indução de erros Livros introdutórios de Psicolingüística apontam questões de ordem metodológica como justificativa para o maior número de pesquisas voltadas ao estudo da compreensão do que ao estudo da produção da linguagem, em particular no que diz respeito ao planejamento sintático (cf. Garman, 1990; Carroll, 1994; Harley, 1997). A dificuldade de controlar o input na produção é um dos fatores que torna mais difícil a sua investigação. Enquanto na compreensão se pode facilmente manipular o material a ser analisado e compreendido, o que permite o controle das variáveis que se deseja testar, no estudo da produção essa manipulação direta não é possível, sendo necessário ou obter os dados a partir de situações naturais de produção ou criar tarefas que possam induzir a produção do que se deseja investigar. Erros cometidos em situação de fala espontânea ou induzidos em situação experimental têm sido a principal fonte de informação sobre os processos envolvidos na produção da linguagem. Esses erros funcionam como “pistas” que permitem ao pesquisador formular hipóteses acerca desses processos. O erro abre uma janela para que se possam investigar unidades de processamento e estágios da produção da linguagem, demandas cognitivas dos processos envolvidos, natureza da informação utilizada por cada componente da arquitetura do sistema de produção e possíveis fontes de interferência em cada estágio. 142 No âmbito dos estudos psicolingüísticos, portanto, os erros são elementos altamente informativos acerca de como o falante processa linguagem e, nesse sentido, se afastam do conceito usual de erro, que remete à idéia de desvio da norma culta da língua, a ser corrigido com base nas prescrições da gramática tradicional. Trabalhos pioneiros como o de Garrett (1975; 1980) com lapsos produzidos em situação de fala espontânea permitiram a criação dos primeiros modelos sobre a arquitetura do sistema de produção (cf. Bock, 1996). Investigação baseada em fala espontânea exige, contudo, uma ampla coleta de dados, e nem sempre possibilita o controle das variáveis que se pretende investigar. Nesse cenário, o emprego de técnicas experimentais se apresenta como uma alternativa mais interessante, visto que permite que o estímulo que desencadeia o processo de produção seja o mesmo para todos os participantes, viabiliza a manipulação das variáveis que se deseja investigar bem como o controle da própria situação de produção. No estudo da concordância verbal, a principal técnica utilizada é a de produção induzida de erros. Essa técnica consiste na apresentação de preâmbulos experimentais que contêm alguma fonte de interferência para o processamento, levando à produção de erros. Utilizam-se em geral sintagmas complexos, em que um núcleo nominal é modificado ou por um sintagma preposicional ou por um sintagma oracional que apresente outro núcleo nominal (o chamado termo local) com um traço de número incongruente em relação ao primeiro (exs.: o técnico dos jogadores/ o técnico que convocou os jogadores). A tarefa experimental consiste na repetição do preâmbulo, apresentado por via auditiva ou por escrito, e na formulação de uma continuidade para a sentença. Em geral, a produção do verbo e do restante da sentença são livres, mas há variantes dessa tarefa em que o experimentador fornece um verbo no infinitivo com o qual o falante deve completar a frase ou, ainda, um adjetivo que deverá ser combinado a um verbo cópula. O participante recebe a instrução de que a tarefa deve ser feita da forma mais rápida possível, sendo o preâmbulo repetido tão logo termine a apresentação do mesmo, não havendo intervalo entre a repetição e a continuidade da sentença. A variável dependente é o total de erros de concordância que são produzidos. Quanto maior o número de erros maior o potencial de interferência do(s) fator(es) manipulado(s). 143 A representação a seguir indica os passos envolvidos na tarefa de produção induzida de erros: O tecido das cortinas do teatro rasgou/ rasgaram Apresentação do preâmbulo por via auditiva Apresentação visual de verbo Produção da frase Uma crítica feita a este tipo de tarefa é que ela poderia ser “contaminada” pela compreensão prévia do estímulo. De fato não há como evitar esse tipo de interferência, mas alguns controles permitem minimizar um efeito desse fator. Primeiro, busca-se uma entonação “neutra” para o preâmbulo, isto é, ele não recebe uma leitura ascendente típica de início de sentença, nem uma entonação de tópico. Além disso, a tarefa é bastante rápida – tão logo ouve o preâmbulo, o participante já deve repeti-lo e completar a sentença. Mais importante é que o tipo de erro produzido nesse tipo de experimento bem como a distribuição desses erros são similares ao que se obtém em situação natural de produção. 8.2 Experimentos Foram realizados, no total, 6 experimentos para a presente tese. Para facilitar o acompanhamento deste capítulo, optou-se por apresentar uma numeração própria para os experimentos de produção induzida. O experimento de julgamento de gramaticalidade está reportado no capítulo 5. 8.2.1 Experimento 1 - distância linear sujeito-verbo e tipo de modificador O presente experimento tem como principais objetivos verificar se a distância entre o núcleo do sujeito e o verbo é fator que afeta a ocorrência de erros de atração e se esse efeito interage com um efeito de tipo de modificador As variáveis independentes foram: a) distância linear entre o núcleo do sujeito e o verbo: curta e longa; b) tipo de modificador: PP e oração relativa. 144 A tarefa experimental foi de produção induzida bi-modal. Um preâmbulo foi apresentado por via auditiva para ser posteriormente repetido mediante a apresentação visual de um verbo no infinitivo, o qual deveria ser flexionado dando continuidade ao preâmbulo. A variável dependente foi o número de erros na formulação do verbo. A hipótese de que distância linear entre o núcleo do sujeito e o verbo afeta a concordância faz prever um maior número de erros na condição distância longa. Os resultados de Bock & Cutting (1992) fazem prever uma interação significativa entre distância linear e tipo de modificador, com maior número de erros na condição distância longa quando o modificador é um PP. Neste experimento, distância linear foi manipulada por meio da introdução de um PP modificador do núcleo nominal interveniente. Apresentam-se abaixo as condições experimentais dos experimento: C1: distância linear curta e modificador PP O diretor arrogante dos funcionários C2: distância linear curta e modificador Oração Relativa O jornalista que falou dos empresários C3: distância linear longa e modificador PP O instrutor calmo dos pilotos de avião C4: distância linear longa e modificador Oração Relativa O ator que discordou dos críticos de teatro Método Participantes: Participaram do experimento, como voluntários, 31 alunos de graduação e de pós-graduação da PUC-Rio, sendo 18 do sexo feminino, e a idade média foi de 22 anos. Material: 145 Foram construídos 48 preâmbulos, sendo 16 experimentais (4 por condição) e 32 distratores. Além desses, foram criados 4 preâmbulos para a fase de treinamento. Cada preâmbulo foi acompanhado de um verbo no infinitivo. Os preâmbulos experimentais e os distratores foram aleatorizados, fixando-se, contudo, a posição dos distratores. O número de sílabas métricas dos preâmbulos experimentais foi controlado de modo a que todos os estímulos tivessem o mesmo tamanho, o que gerou a necessidade de se incluir um adjetivo entre o núcleo do sujeito e o sintagma preposicional modificador do núcleo. Também foi controlada a animacidade dos núcleos nominais: o núcleo do sujeito e o núcleo interveniente apresentaram traço [+animado] enquanto que o traço de animacidade do núcleo nominal do PP adicionado na condição distância linear longa foi sempre [animado]. O aparato experimental consistiu de um PC de 900MHz, um monitor Syncmaster 550v, fones de ouvido, microfone para registro da produção, uma caixa-de-botões conectada ao computador, arquivos de som com os preâmbulos especialmente gravados com entonação o mais neutra possível. O experimento foi programado por meio do software LabView. Procedimento: Os participantes foram testados individualmente em uma cabine acústica do LAPAL, na qual o monitor, a caixa de botões, os fones de ouvido e o microfone se encontravam situados. O participante era orientado, pelo experimentador, para utilizar os fones de ouvido e o microfone e as instruções da tarefa lhe eram antecipadas oralmente. A sessão era iniciada pelo experimentador, no computador situado do lado de fora da cabine. Instruções para a tarefa foram apresentadas por escrito, na tela do monitor, uma vez iniciada a sessão experimental. As instruções informavam que a tarefa consistia em repetir o início de uma sentença ouvida nos fones e completá-la com o verbo apresentado no centro da tela do monitor. Em seguida à leitura das instruções, o participante era submetido a uma fase de treinamento, que poderia ser repetida à sua vontade. A emissão dos preâmbulos por áudio era iniciada mediante a pressão no botão C (Continuar) da caixa-debotões pelo participante. Concomitantemente à projeção do preâmbulo, um verbo no infinitivo era apresentado. Cada verbo permanecia na tela por 1500ms e a passagem de um item para outro era controlada pelo sujeito-experimental, com o 146 uso da caixa-de-botões. A duração de cada sessão experimental foi de aproximadamente 10 minutos. Resultados Foram obtidos 37 erros de atração num total de 496 sentenças produzidas a partir dos preâmbulos experimentais (16 itens x 31 sujeitos), o que corresponde a 7.4% desse total. Esses erros foram submetidos a uma análise de variância por sujeitos, tomando-se como medidas repetidas distância linear entre o núcleo do sujeito e o verbo e tipo de modificador, num design fatorial (2x2). O efeito de distância linear entre o núcleo do sujeito e o verbo foi significativo: F (1,30) = 6.45, p< 0.02. Não houve efeito significativo de tipo de modificador -- F (1,30) = 1.69 , p = 0.2, nem da interação entre distância linear e tipo de modificador -- F (1,30) = 0.3, p =0.6. A Tabela 1 apresenta as médias obtidas e o gráfico permite visualizar o efeito da variável distância linear. Tabela 1 Média de erros de concordância por condição experimental (máx. score = 4) Distância linear sujeito-verbo Tipo de modificador Curta Longa PP 0,23 0,52 Oração relativa 0,13 0,32 Média Total 0,18 0,42 Gráfico 4: Médias de erros de concordância em função do tipo de modificador e da distância entre o núcleo do sujeito e o verbo 0,6 0,5 médias 0,4 0,3 0,2 PP 0,1 Relativ 0 Curta Longa Distância entre o núcleo do sujeito e o verbo 147 Observa-se, na tabela 1 e no gráfico, que houve maior número de erros na condição distância longa, irrespectivamente ao tipo de modificador. Nas duas condições definidas por distância linear, houve um maior número de erros com modificador PP, ainda que o efeito de tipo de modificador não tenha atingido o nível de significância estipulado. Discussão Em primeiro lugar, cumpre comentar que tanto o percentual de erros quanto a média de erros por condição experimental são compatíveis com o que vem sendo reportado na literatura. O falante comete poucos erros de concordância, mesmo quando está realizando uma tarefa construída para induzir falhas, o que aponta para a robustez do sistema computacional da língua.86 Em relação às variáveis manipuladas, os resultados obtidos sugerem que a distância linear entre o núcleo do sujeito e o verbo, definida pela interpolação de modificadores, é um fator que favorece a ocorrência de erros de atração, o que é compatível com os resultados de Bock & Cutting (1992). Quanto à variável tipo de modificador, os resultados não revelaram um efeito significativo desse fator, diferentemente do que foi encontrado por Bock & Miller (1991) e Bock & Cutting (1992), em que foram obtidos mais erros de atração com PPs do que com modificadores oracionais.87 Também não houve interação entre as variáveis testadas (distância linear e tipo de modificador): tanto as condições com modificadores PPs quanto aquelas com modificadores oracionais foram afetadas pela variável distância linear, com mais erros quando o núcleo do sujeito estava distante do verbo. Esses resultados também diferem dos obtidos por Bock & Miller (1991) e Bock & Cutting (1992), 86 Em experimentos conduzidos com falantes de inglês, em que o falante deve completar livremente a sentença após repetir o preâmbulo, o percentual de erros reportado é mais baixo, pois não é possível distinguir entre uma forma de singular e uma forma de plural quando os verbos são conjugados no passado. 87 É importante observar que no presente experimento o número de sílabas (métricas) foi controlado, ao contrário de Bock & Miller (1991). Além disso, é possível que diferenças de acessibilidade relativas à posição do núcleo interveniente nas relativas tenha de algum modo influenciado os resultados: enquanto no presente experimento, os núcleos intervenientes eram PPs complementos de verbos de orações relativas de sujeito (O jornalista que falou dos empresários), nos experimentos com falantes de inglês, o núcleo interveniente podia ser tanto o sujeito (The soldier that the officers accused) quanto o complemento direto do verbo (The boy that liked the snakes) da oração relativa. 148 em que as condições com modificadores oracionais não foram afetadas pela variável distância linear, o que foi tomado como evidência a favor da hipótese do “empacotamento oracional”. É possível que diferenças no material de teste expliquem os resultados conflitantes. No presente experimento, o fator distância linear foi manipulado pela adjunção de um PP ao núcleo crítico dos dois tipos de modificadores, enquanto que, em Bock & Cutting (1992), a distância linear foi ampliada por um adjetivo pré-nominal. Conforme discutido na resenha da literatura, é possível que a natureza do elemento adicionado apresente demandas diferenciadas no processamento de um sujeito longo (cf. Pearlmutter, 2000). Em suma, os resultados obtidos indicaram um efeito de distância linear no processamento da concordância sujeito-verbo, efeito esse que não encontra explicação nos modelos de produção que situam o erro de concordância na produção da linguagem. Um efeito de distância é, contudo, compatível com o modelo que incorpora um parser monitorador, pois este faz prever que a ampliação da distância entre o núcleo do sujeito e o verbo viria a afetar a manutenção da representação do DP sujeito gerada pelo parser, levando a uma possível perda ou dificuldade de recuperação da informação de número do núcleo do sujeito, o que, por sua vez, se refletiria na codificação morfofonológica do verbo. 8.2.2 Experimento 2 – posição linear vs. posição hierárquica do núcleo interveniente e marcação morfofonológica Este experimento explora especificamente o contraste entre posição linear e posição hierárquica do núcleo nominal interveniente, de modo a verificar qual dessas propriedades faz prever erros de atração em condições favoráveis à sua ocorrência. Além disso, busca verificar se o valor do traço de número do núcleo do sujeito é um fator que afeta a concordância, como sugerido na literatura. Comparam-se os resultados do português com os obtidos em Franck, Vigliocco & Nicol (2002) para o francês e inglês, a fim de verificar o que seria responsável por um efeito de marcação – se a complexidade da morfologia verbal, como propõem esses autores, ou se a visibilidade da marca de número no DP sujeito. A tarefa experimental foi a mesma do Experimento 1. Contudo, diferentemente daquele, somente modificadores do tipo PP foram utilizados, dado seu maior potencial de indução de erros. Além disso, pseudo-verbos foram criados 149 de modo a evitar uma eventual interferência do significado do verbo na determinação do elemento nominal que viesse afetar a concordância, como sugerido nos dados de Thornton & MacDonald (2003). As variáveis independentes foram: Número do N1 (singular/plural); Número do N2 (singular/plural); Número do N3 (singular/plural). N1, N2 e N3 referem-se, respectivamente, aos núcleos nominais que integram um DP complexo do tipo: A tinta do cartucho da impressora N1 N2 N3 O número do N1 foi tomado como fator grupal88 e o número do N2 e do N3 são medidas repetidas89. A manipulação do número do N1 permite que se verifique se o núcleo do sujeito plural torna a concordância menos vulnerável a erro. A manipulação do número do N2 e do número do N3 permite contrastar posição linear e posição hierárquica como fatores determinantes de erros de atração. Além disso, essa manipulação permite verificar se a presença do morfema de número em um núcleo interveniente (N2 e N3 na condição plural) interage com posição linear ou posição hierárquica. O número de erros de concordância no verbo foi tomado como variável dependente. Os preâmbulos abaixo ilustram as condições experimentais: Grupo N1 singular: N2sing N3sing: A tinta do cartucho da impressora N2sing N3pl: A chave do cofre dos documentos N2 pl N3sing: A propaganda dos produtos da loja N2pl N3pl: A fábrica das grades das janelas Grupo N1 plural: N2sing N3sing: As cortinas do palco do teatro 88 Fator grupal: Variável cujos níveis são distribuídos por grupos de sujeitos pareados, ou seja, assumidos como semelhantes para os propósitos do teste. 89 Medida repetida: variável cujos níveis são apresentados a um mesmo indivíduo, de modo que cada sujeito funciona como seu próprio controle nas diferentes condições decorrentes da manipulação da variável. 150 N2sing N3pl: As prateleiras do armário dos sapatos N2 pl N3sing: Os preços dos pratos do restaurante N2pl N3pl: As maçanetas das portas dos carros As evidências empíricas disponíveis permitem prever um maior número de erros para N1 singular do que para N1 plural. A hipótese de que a posição hierárquica é fator determinante da probabilidade de ocorrência de erros de concordância, associada à previsão acima, permite antecipar um maior número de erros na condição N2 plural. A hipótese da posição linear do núcleo crítico em relação ao verbo faria prever um maior número de erros na condição N3 plural. Método Participantes: Participaram do experimento, como voluntários, 34 alunos de graduação e de pós-graduação da PUC-Rio (17 para cada grupo de preâmbulos), sendo 24 mulheres e 10 homens, e a idade média foi 24 anos. Material: Para cada grupo (N1singular/ N1plural), foram construídos 48 preâmbulos, sendo 12 experimentais (3 por condição) e 36 distratores. Além desses, foram criados 6 preâmbulos para a fase de treinamento. Os pseudo-verbos criados para os preâmbulos experimentais foram todos dissílabos de 1a conjugação (ex.: pubar, bopar, tebar). O tipo de preposição do primeiro sintagma preposicional dos preâmbulos experimentais foi variado, tendo se mantido constante, no entanto, a função sintática desse sintagma (no caso, adjuntos adnominais). Apenas nomes com o traço [-animado] foram utilizados como núcleos nominais dos preâmbulos experimentais. O número de sílabas métricas desses preâmbulos foi controlado. O aparato experimental utilizado foi o mesmo do Experimento 1. Procedimento: O mesmo procedimento adotado no primeiro experimento foi utilizado. A única alteração feita foi em relação ao tempo de permanência do verbo na tela do monitor. Diferentemente do Experimento 1, em que os verbos permaneciam na 151 tela por 1500ms, optou-se por manter o verbo na tela durante todo o tempo de produção da sentença em questão, visto tratar-se de pseudo-verbos, cuja memorização poderia dificultar a realização da tarefa. O tempo médio de duração do experimento foi o mesmo do Experimento 1, em torno de 10 minutos. Resultados Foram obtidos 28 erros de concordância nas 408 frases produzidas a partir dos preâmbulos experimentais (12 itens x 34 sujeitos), o que corresponde a 6.86% desse total. Esses erros foram submetidos a uma análise de variância por sujeitos com design fatorial (2x2x2) em que o número de N1 foi tomado como fator grupal e o número de N2 e o número de N3 foram medidas repetidas. A variável Número do N1 apresentou um efeito significativo: F(2,32) = 12.46, p = 0.001. A direção das médias indica que esse efeito se deu na direção prevista. A variável Número do N2 teve um efeito quase significativo: F(2,32) =3.79, p=0.06, com maior incidência de erros na condição N2 plural. Esse efeito deveuse à interação significativa entre Número do N1 e Número do N2: F(2,32)=4.95, p<0.04. Como mostra direção das médias na Tabela 2, o número de erros para N1 singular aumenta quando N2 é plural enquanto que o número de erros não se altera, e é desprezível, quando N1 é plural. A variável Número do N3 não teve efeito significativo (p=.5) e não houve efeito significativo de qualquer interação com este fator. O gráfico facilita a visualização dos resultados que foram significativos: Tabela 2 Média de erros de concordância em função de Número de N1 e Número de N2 (máx. score = 3) Número de N1 Número de N2 Singular Plural Singular 0,18 0,03 Plural 0,61 0 Média Total 0.39 0.02 152 Gráfico 5: Médias de erros de concordância em função do número de N1 e do número de N2 0,7 0,6 médias 0,5 0,4 N2 sing 0,3 N2 plural 0,2 0,1 0 N1 sing N1 plural Número do núcleo do sujeito (N1) Discussão Os resultados obtidos são compatíveis com a hipótese de que a posição hierárquica do núcleo nominal interveniente é a propriedade que permite fazer prever erros de atração no processamento da concordância sujeito-verbo. Comparando-se esses resultados aos do Experimento 1, considera-se que o efeito de posição hierárquica deve se manifestar mais expressivamente nas condições mais favoráveis ao erro de atração, quais sejam: quando a distância linear entre o núcleo do sujeito e o verbo é longa, quando o núcleo do sujeito é singular e o núcleo interveniente mais alto é plural. Quanto ao efeito de marcação, os resultados obtidos aproximam o português do inglês. Comparando-se os resultados deste experimento com os reportados em Franck, Vigliocco & Nicol (2002), verificou-se que para o português, assim como para o inglês, houve um efeito principal do número do N1, com mais erros quando o núcleo é singular. Isso indica que o fator responsável pelos erros de atração é a visibilidade da marca de número no DP sujeito e não a complexidade da morfologia verbal, como sugeriram as autoras. Uma diferença importante, no entanto, há entre o português e o inglês no que tange à marcação de número no DP sujeito. No inglês, o número é explicitamente marcado no nome, não sendo o determinante informativo sobre o valor do traço (se singular ou plural). Já no 153 português, a informação de número é explicitamente marcada tanto no nome quanto no determinante. Nos DPs, a informação relevante está no determinante. No nome, o morfema de número é uma marca redundante. Podem ser tomados como evidências nessa direção o fato de em certos dialetos do português brasileiro não haver marca de número no nome (Scherre, 1988), e também resultados experimentais que indicam que crianças em fase inicial de aquisição da linguagem se baseiam mais na informação morfofonológica de número codificada no determinante do que no nome para identificação de um referente como múltiplo (Corrêa, Augusto & Ferrari-Neto, no prelo)90. Quanto ao francês, conforme comentado na revisão da literatura, a informação de número do DP sujeito não é tão visível. Na língua falada, a diferença entre singular e plural não é observável nos nomes e, em relação aos determinantes, eles apresentam formas diferentes (le (sing. masc.) ; la (sing. fem.) ; les (pl. independentemente de gênero). É possível, pois, que esse aspecto tenha algum tipo de impacto nos resultados, visto que a assimetria singular/plural no francês não é tão explícita como no inglês e no português. Em síntese, os resultados experimentais revelam tanto um efeito de posição hierárquica quanto um efeito de marcação morfofonológica do núcleo do sujeito. O efeito de posição hierárquica é compatível com resultados obtidos em Vigliocco & Nicol (1998). Em relação à marcação, os resultados do português coincidem com os do inglês e se distanciam dos do francês, o que contraria a hipótese de Franck, Vigliocco & Nicol (2002) de que diferenças entre línguas quanto a um efeito de marcação deveriam ser atribuídas a particularidades da morfologia verbal. Os resultados do português sugerem, portanto, que é a visibilidade da 90 Crianças de 2 anos deveriam responder a um teste de identificação de figuras inventadas, a partir de estímulos com pseudo-nomes em que a expressão morfofonológica de número do DP foi manipulada, dando origem a duas condições experimentais: gramatical e agramatical. Integravam a condição gramatical dois tipos de DP: um em que tanto o determinante quanto o nome apresentavam marca de número (os dabos) e outra em que apenas o determinante apresentava marca de número (os dabo). Na condição agramatical, também havia dois tipos de DP: um em que apenas o nome apresentava um s final (o dabos) e um em que um s final era inserido no meio da palavra como uma espécie de infixo (o dasbo). Havia ainda uma condição singular controle (o dabo). No experimento, as crianças deveriam indicar para um fantoche chamado Dedé qual a figura correspondente ao comando dado (ex.: Mostra o dabo pro Dedé). A variável dependente foi o número de respostas em que a criança apontava para uma imagem com referente múltiplo. Houve um efeito significativo do tipo de DP, com mais repostas indicando referente múltiplo para as condições com DP gramatical . Uma segunda análise aplicada às condições com DP gramatical não detectou diferenças entre o DP correspondente ao dialeto padrão (os dabos) e o DP correspondente ao dialeto não-padrão (os dabo). As crianças trataram, portanto, indistintamente os dois tipos de DP da condição gramatical, o que sugere que a informação crucial relativa a número é extraída do determinante. 154 informação de número do DP sujeito que é relevante para o processamento da concordância. Esse resultado, por sua vez, só pode ser explicado a partir de um modelo de produção que leva em consideração um parser monitorador, o qual gera uma representação do DP sujeito cujos elementos constituintes podem ter sua acessibilidade afetada tanto por fatores sintáticos quanto morfofonológicos. 8.2.3 Experimento 3 – status argumental do PP modificador O experimento 3 foi conduzido com o objetivo verificar se a natureza argumental do PP que contém o núcleo interveniente no DP sujeito pode ser fator de interferência no processamento da concordância. A primeira motivação para a aplicação deste experimento foi de natureza metodológica. Observou-se que não havia um controle do status argumental do PP modificador na elaboração do material de testagem utilizado nos experimentos de indução de erros91. A segunda motivação foi de natureza teórica: desejava-se verificar se diferenças estruturais entre PPs argumentos e adjuntos se refletiriam no modo como estes são processados. Evidências de que argumentos e adjuntos são processados de modo distinto foram reportadas na resenha da literatura. Na compreensão, há uma série de experimentos que indicam uma preferência do parser pela aposição de argumentos na resolução de ambigüidades estruturais. Na produção, os resultados do primeiro experimento realizado por Solomon & Pearlmutter (2004) (cf. seção 4.1.2.3.3), sugerem um efeito de status argumental, com maior número de erros de atração após PPs argumentos do que PPs adjuntos. A interpretação que os autores fazem desses resultados é, contudo, diferente. Eles consideram que aquilo que se apresentaria como um efeito de status argumental naquele experimento seria na verdade um efeito de integração semântica e buscam dissociar os dois efeitos a partir de um conjunto de experimentos. As estruturas por eles testadas não permitem, no entanto, eliminar a possibilidade de fatores estruturais estarem afetando os resultados e, por conseguinte, é provável que os resultados do 91 Exemplos de preâmbulos que indicam ausência de controle do tipo de PP modificador (cf. Vigliocco & Nicol, 1998, apêndice A, p. B27): The discussion about the topic/ The threat to the president (PPs argumentos) x The museum with the picture/ The statue in the garden (adjuntos). 155 primeiro experimento desses autores de fato indiquem um efeito do status argumental do PP modificador. Justifica-se, pois, um experimento que busque avaliar a interferência dessa variável. A variável independente no presente experimento é o status argumental do PP que contém o núcleo interveniente: PP adjunto x PP complemento. A variável dependente é o erro de concordância. A tarefa experimental foi de produção induzida bi-modal, idêntica à realizada no experimento 2. Apresenta-se, abaixo, um exemplo de preâmbulo para cada condição experimental92. Condição 1: PP complemento: O consumo de alimentos estragados. Condição 2: PP adjunto: O parque de cachoeiras naturais. Método Participantes: Participaram do experimento, como voluntários, 23 alunos de graduação da PUC-Rio, com idade média de 22 anos, sendo 15 mulheres. Material: Foram construídas 6 frases para fase de treinamento e 48 para fase de teste 12 experimentais (6 por condição) e 36 distratoras. As frases experimentais foram aleatorizadas e apresentadas sempre após 3 distratoras. Conforme discutido na resenha da literatura, a distinção entre argumentos e adjuntos não é fácil de ser estabelecida, havendo, inclusive, alguns autores que pensam nessa distinção mais em termos de uma gradação do que propriamente de uma polarização (cf. Schütze & Gibson, 1999). A montagem de experimentos que investiguem esse fator não é, pois, tarefa trivial. Utilizou-se aqui o seguinte critério para verificar se os PPs modificadores selecionados apresentavam o status argumental desejado (argumento ou adjunto): na condição PP argumento, o núcleo do sujeito selecionado era sempre uma forma nominalizada deverbal e o PP, um sintagma com papel de tema; na condição PP adjunto, o núcleo era sempre 92 O acréscimo de um adjetivo às condições experimentais foi feito com o intuito de ampliar o tamanho do DP sujeito e, dessa maneira, tentar magnificar o efeito de atração. Não se entra no mérito do modo como o adjetivo é processado no DP. 156 um substantivo concreto acompanhado de um PP de natureza restritiva. Foram também aplicados testes sintáticos envolvendo coordenação e deslocamento de PPs para estabelecer a distinção entre argumentos e adjuntos. Procedimento: Foi utilizado o mesmo procedimento do experimento 2, inclusive no que diz respeito ao emprego de pseudo-verbos. O tempo médio de duração do experimento foi de 10 minutos. Resultados: Foram obtidos 56 erros de concordância nas 276 frases produzidas a partir dos preâmbulos experimentais (12 itens x 23 sujeitos), o que corresponde a 20.3% desse total. A aplicação de teste t aos erros de concordância nas duas condições experimentais revelou um efeito significativo da variável status argumental do PP que contém o núcleo interveniente: t(df22) = 2.9 p < .005, com mais erros de concordância após PPs argumentos do que após PPs adjuntos. A tabela a seguir apresenta a média de erros dos sujeitos por condição experimental e o gráfico representa a diferença entre PPs argumentos e PPs adjuntos. Tabela 3 Média de erros de concordância em função do status argumental do PP que contém o núcleo interveniente (máx. score = 6) PP argumento PP adjunto 1,7 0,74 Gráfico 6: Médias de erros de concordância em função do status argumental do PP modificador. 1,8 1,6 1,4 m édias 1,2 1 0,8 0,6 0,4 0,2 0 PP argumento PP adjunto 157 Discussão: Os resultados obtidos são compatíveis com a hipótese de que a informação relativa ao status argumental do modificador em que está inserido o núcleo interveniente é um fator que atua no processamento da concordância. Essa interferência pode ser explicada em termos do grau de acessibilidade diferenciado de informação no PP argumento e no PP adjunto. O grau de acessibilidade seria função da posição estrutural do PP na projeção máxima do NP. Os PPs argumentos fazem parte da estrutural argumental do núcleo do NP; logo, quando o lema do núcleo é acessado, já está prevista uma posição a ser preenchida. Quanto ao adjunto, este não está previsto na estrutura argumental do núcleo. Isso é mapeado na sintaxe em termos de posições estruturais diferenciadas para argumentos e adjuntos. O PP argumento é o nó irmão do núcleo e o PP adjunto é concatenado a um dos segmentos da projeção máxima do núcleo. Assim, enquanto o PP argumento está incluído no NP, o PP adjunto está apenas contido no NP. Considerando-se que fatores estruturais podem determinar o grau de acessibilidade de representações na memória (Matthews & Chodorow, 1988), essa diferença de posição estrutural faria com que PPs argumentos, por estarem mais fortemente vinculados à estrutura sintática, ficassem mais acessíveis na memória, permitindo que a informação de número do núcleo interveniente viesse a afetar o processamento da concordância. Os núcleos intervenientes em PPs adjuntos teriam menos chance de afetar o processamento porque os adjuntos ocupariam uma posição mais “marginal” na estrutura e, em função disso, a informação neles contida ficaria menos ativada na memória de trabalho. Essa distinção está de acordo com a Hipótese de Construal, de Frazier & Clifton (1996), que diferencia sintagmas primários e não-primários. Os sintagmas primários são apostos de forma determinística a árvores sintática e os sintagmas não-primários são apenas “associados” à estrutura, isto é, concatenados de forma “fraca”, sintaticamente subespecificada. No modelo de produção PMP, a interferência do status argumental do PP modificador seria posterior à computação da concordância na formulação. Ocorreria após o parsing do DP sujeito pelo parser monitorador. A informação de número do núcleo interveniente, quando este estivesse inserido em PPs 158 argumentos, poderia se manter particularmente ativada num nível de memória temporária, vindo a afetar a codificação morfofonológica do verbo. 8.2.4 Experimento 4 – distributividade e marcação morfofonológica Este experimento tem 3 objetivos principais: i) verificar se distributividade atua no processamento da concordância e se pode ser dissociada de um efeito de marcação; ii) verificar se informação puramente fônica, mais especificamente o “s” final do núcleo interveniente, pode deflagrar erros de atração; iii) verificar se diferenças relativas à codificação morfofonológica de número no núcleo interveniente em DPs locais plurais são consideradas na computação da concordância em português. Para isso, foram manipuladas as seguintes variáveis: a) Distributividade do DP sujeito: distributivo e não-distributivo b) Número do DP do nome local: singular ou plural c) Tipo de nome local quanto à realização morfofonológica: substantivo flexionável; substantivo de forma invariante. A seguir, são fornecidos exemplos de preâmbulos por condição experimental: C1: Sujeito distributivo, DP local singular, nome local flexionável: O trinco de cada porta C2: Sujeito distributivo, DP local singular, nome local invariante: A roda de cada ônibus C3: Sujeito distributivo, DP local plural, nome local flexionável: A maçaneta das portas C4: Sujeito distributivo, DP local plural, nome local invariante: O volante dos ônibus C5: Sujeito não-distributivo, DP local singular, nome local flexionável : A lata do biscoito C6: Sujeito não-distributivo, DP local singular, nome local invariante: A prateleira do pires C7: Sujeito não-distributivo, DP local plural, nome local flexionável: O armário dos sapatos 159 C8: Sujeito não-distributivo, DP local plural, nome local invariante: O estojo dos lápis. Conforme visto na resenha da literatura, distributividade parece ser um fator semântico que gera interferência no processamento da concordância de número em várias línguas. Em todos os experimentos, contudo, sempre se verifica um efeito de distributividade com preâmbulos em que há um núcleo interveniente plural. Logo, nesses experimentos, distributividade está sempre associada a um efeito de marcação. Neste experimento procuramos testar não apenas se a concordância sujeito-verbo no português é sensível a efeitos de distributividade, mas também se sintagmas cuja leitura distributiva não estivesse associada à presença de um núcleo interveniente plural poderiam afetar a concordância. Para isso foi empregado o operador “cada” nas condições experimentais C1 e C2. O contraste entre essas condições e as condições C3 e C4 permite testar esse ponto. Quanto ao papel de informação fônica, foi visto que esta apenas tem capacidade de produzir interferência se estiver associada a um traço formal de número, isto é, se for de natureza morfofonológica. O contraste entre as condições com nome local flexionável x invariante (carro vs. ônibus), inseridos em DP singular, permite testar essa questão. Será verificado, portanto, a diferença entre as condições C1 (O trinco de cada porta) e C5 (A lata do biscoito) X as condições C2 (A roda de cada ônibus) e C6 (A prateleira do pires). Um último ponto a ser considerado é se diferenças relativas à codificação morfofonológica de número no núcleo interveniente em DPs locais plurais podem ser verificadas em português. Para isso, contrastam-se as condições com nomes locais flexionáveis C3 (A maçaneta das portas) e C7 (O armário dos sapatos) e as condições com nomes locais de forma invariante C4 (O volante dos ônibus) e C7 (O estojo dos lápis). A hipótese é que, no português, o traço de número do determinante já provê a informação de número necessária à computação da concordância e, por conseguinte, não deve haver diferenças entre os DPs com nomes flexionáveis e nomes invariantes. Conforme comentado no experimento 2, a idéia de que no português a informação crucial de número do DP é extraída do determinante é corroborada tanto pela existência de dialetos que marcam número apenas no nome como por dados de aquisição da linguagem (cf. Corrêa, Augusto & Ferrari-Neto, no prelo). 160 Método Participantes: Participaram do experimento, como voluntários, 20 alunos de graduação e de pós-graduação, sendo 13 do sexo feminino, e a idade média foi de 22 anos. Material: Foram organizadas duas listas de frases experimentais – uma para nome local singular e outra para nome local plural. Para cada lista, foram construídos 48 preâmbulos, sendo 16 experimentais (4 por condição) e 32 distratores. Além desses, foram criados 6 preâmbulos para a fase de treinamento. Procedimento: mesmo procedimento adotado no experimento 2. Resultados: Os erros de concordância foram submetidos a uma análise de variância por sujeitos com design fatorial (2x2x2) em que o número do DP do nome local (singular ou plural) foi tomado como fator grupal e distributividade do DP sujeito (distributivo e não-distributivo) e tipo de nome local (substantivo flexionável e substantivo invariante) foram medidas repetidas. A variável Número do DP do nome local apresentou um efeito significativo: F(2,18) = 6.18, p = 0.023. A direção das médias indica que esse efeito se deu na direção prevista, com mais erros nas condições em que o DP do nome local era plural e, portanto, incongruente em relação ao número no núcleo do sujeito. Tabela 4 Média de erros de concordância em função do número do DP do nome local (máx. score = 4) Número do DP do nome local Condições experimentais Singular Plural Suj. distributivo; nome local flexionável Suj. distributivo; nome local invariante Suj. não-distributivo; nome local flexionável Suj. não-distributivo; nome local invariante Média Total 0,2 0,2 0,1 0,1 0,15 1,2 1,1 0,8 0,9 1 161 Gráfico 7: Médias de erros de concordância em função do número do DP do nome local 1 1 médias 0,8 0,6 0,4 0,15 0,2 0 singular plural Número do DP do nome local Não houve efeito principal da variável tipo de nome local (substantivo flexionável e substantivo invariante), nem da interação dessa variável com número do DP do nome local. A média de erros de concordância nas condições DP local singular e DP local plural foi bastante semelhante para os substantivos flexionáveis e os invariantes, Com base nos dados da tabela 4 acima, pode-se dizer que a diferença entre substantivos invariantes no singular (o pires) e no plural (os pires) faz parte de um efeito principal de número. Não houve efeito principal da variável distributividade nem de sua interação com número do DP do nome local. Quando, no entanto, se examina o efeito do tipo de expressão lingüística de distributividade, observa-se uma diferença significativa entre DP com o operador cada (O trinco de cada porta) e DP com nome local plural (A maçaneta das portas). Os últimos têm mais chances de induzir erros de atração: (t(df18) = 2,70 p < .01). A tabela abaixo apresenta a média de erros de cada tipo de expressão. Tabela 5: Média de erros de concordância em função do tipo de expressão lingüística de distributividade (máx. score = 4) DP com operador “cada” DP com nome local plural 0,4 2,3 162 Gráfico 8: Médias de erros de concordância em função do tipo de expressão lingüística do DP distributivo 2,5 médias 2 1,5 1 0,5 0 DP operador "cada" DP nome local plural A aplicação de teste-t apenas a DPs distributivos e não-distributivos com nome local plural não revelou, contudo, efeito de distributividade (p = .12). A direção das médias, contudo, foi no sentido esperado, com mais erros após distributivos do que após não-distributivos. Discussão: O efeito da variável número do DP local, com mais erros para DP plural do que para DP singular é compatível com os resultados reportados na literatura que revelam haver uma assimetria singular-plural na indução de erros de atração. Foi verificado também que a diferença entre singular e plural tanto nos DPs com substantivos invariantes quanto nos DPs com substantivos flexionáveis faz parte de um efeito principal de número. Logo, não foi detectado um efeito fônico do “s” final dos substantivos invariantes – isto é, não há diferença entre pires e carro em termos de erros de atração. Um efeito principal de número, independente de tipo de nome local, é compatível com a hipótese de que a informação de número dos DPs no caso do português é especificada pelo determinante; a marca flexional no nome seria, nesse sentido, uma informação redundante. Em relação à questão da distributividade, embora não se tenha obtido efeito principal desta variável, foi verificado que o tipo de expressão lingüística afeta as chances de um DP distributivo vir a induzir erros de atração: há mais erros de atração para DPs com nome local plural do que para DPs com o operador “cada”. Esse resultado sugere que a interferência semântica de distributividade só se 163 manifesta após o parsing do primeiro DP, quando informação morfofonológica está disponível para o processador. No próximo experimento aumenta-se o tamanho do DP com vistas a tentar obter um efeito de distributividade. Na discussão, os resultados relativos à expressão lingüística da distributividade serão retomados. 8.2.5 Experimento 5 - distributividade Este experimento teve por objetivo verificar se um efeito de distributividade poderia ser obtido com a ampliação do tamanho do DP sujeito. No experimento anterior, não houve resultados significativos para essa variável; no entanto, quando os DPs com núcleo interveniente plural foram analisados separadamente, as médias obtidas foram na direção esperada, com mais erros após DPs distributivos do que após DPs não distributivos. Logo, partindo-se dos resultados do experimento 1, que indicaram que a distância linear entre o núcleo do sujeito e o verbo é um fator que pode afetar o processamento da concordância, buscou-se aumentar o tamanho do DP distributivo com o acréscimo de um segundo PP, a fim de tentar ampliar o total de erros de atração. A seguir exemplifica-se cada condição experimental. Note-se que para ampliar o DP foi acrescentado um segundo sintagma preposicionado aos preâmbulos. C1: Sujeito distributivo: A alça das xícaras de porcelana C2: Sujeito não-distributivo: A lata dos biscoitos de polvilho Método Participantes: Participaram do experimento, como voluntários, 22 alunos de graduação, sendo 17 do sexo feminino, e a idade média foi de 23 anos. Material: Foram organizadas duas listas de frases experimentais – uma apenas com DPs distributivos e outra com DPs não distributivos. Para cada lista, foram 164 construídos 48 preâmbulos, sendo 16 experimentais e 32 distratores. Além desses, foram criados 6 preâmbulos para a fase de treinamento. Procedimento: Foi utilizado o mesmo procedimento adotado no experimento 2, com o acréscimo de uma recomendação para que os verbos fossem conjugados no passado (perfeito). Essa instrução tinha por objetivo evitar que o preâmbulo fosse usado para fazer uma referência genérica não-distributiva, o que poderia ser favorecido pelo emprego de verbo no presente (ex.: O volante dos carros de corrida é feito de borracha especial). Resultados: A aplicação de teste t aos erros de concordância nas duas condições experimentais revelou um efeito altamente significativo da variável distributividade: t(df20) = 6.71 p < . 0005, com mais erros de concordância após DPs distributivos. A tabela e o gráfico abaixo indicam a média de erros por condição experimental. Tabela 6: Média de erros de concordância em função da distributividade do DP sujeito (máx. score = 16) DP distributivo DP não-distributivo 6,91 0,45 Gráfico 9: Médias de erros de concordância em função da distributividade do DP sujeito 7 6 médias 5 4 3 2 1 0 DP distributivo DP não-distributivo Além dos erros de concordância, também foram analisados os erros de repetição de preâmbulo que envolveram a produção do N1 no plural, como em “As alças das xícaras de porcelana”, no lugar de “A alça das xícaras de porcelana”. Aplicação de teste t indicou ser significativa a diferença entre as duas 165 condições no que diz respeito a esse fator: t(df20) = 3,18 p < .005 . Houve mais erros de repetição de preâmbulo após os DPs distributivos do que após os DPs não-distributivos, o que revela que, já ao ouvir o preâmbulo, alguns participantes fizeram uma leitura distributiva do mesmo e produziram o N1 no plural. A tabela e o gráfico abaixo apresentam as médias de erros de repetição por tipo de DP sujeito. Tabela 7: Média de erros de repetição do preâmbulo em função da distributividade do DP sujeito (máx. score = 16) DP distributivo DP não-distributivo 3,1 0,45 Gráfico 10: Médias de erros de repetição do DP sujeito 3,5 3 médias 2,5 2 1,5 1 0,5 0 DP distributivo DP não-distributivo Discussão: Os resultados obtidos no experimento 5 estão de acordo com o que vem sendo reportado na literatura para falantes de várias línguas: distributividade é um fator que pode interferir no processamento da concordância. Note-se, contudo, que em português um efeito dessa variável só foi obtido quando foi ampliada a distância entre o núcleo do sujeito e o verbo. Além disso, foi visto, no experimento anterior, que DPs distributivos com nome local plural têm significativamente mais chance de induzir erros do que DPs distributivos com operador “cada”. Logo, uma explicação para esse efeito semântico de distributividade não pode ser localizada em um momento pré-sintático, quando da codificação da mensagem em termos de traços lexicais. A explicação proposta por Bock et al. 166 (2001) de que a interferência semântica se daria em um momento de number marking não se sustenta. Segundo esses autores, a especificação de número do DP sujeito se faria a partir de um processo de unificação da informação de número proveniente do nível da mensagem e aquela proveniente do lema do núcleo do sujeito. Nenhuma dessas representações de número seria de natureza morfofonológica. Logo, pode-se dizer que o modelo de Bock et al. (2001) não consegue explicar por que apenas DPs com um núcleo interveniente plural são capazes de gerar erros de atração. O modelo de Bock et al. (2001) também não consegue explicar porque esse efeito de distributividade só se manifesta, no caso do experimento em português, quando se amplia o tamanho do DP. Uma explicação para esses resultados deve ser buscada em termos de uma interferência provocada por uma representação gerada pelo parser monitorador, nos termos do que é proposto no modelo PMP. Em sua 1ª versão, contudo, não havia previsões específicas quanto a possíveis efeitos semânticos. Estes serão considerados numa versão revista e ampliada do modelo, apresentada no capítulo 9. 167 9 Modelo de produção PMP revisto e ampliado O Modelo PMP (produção monitorada por parser) foi concebido com vistas a explicar a interferência de fatores não sintáticos no processamento da concordância, nomeadamente efeitos de distância linear entre sujeito e verbo e efeitos de marcação morfofonológica dos núcleos nominais do DP sujeito. Efeitos desse tipo permitem questionar a hipótese de um formulador sintático autônomo, não sujeito à interferência de outros componentes do sistema de produção, e parecem, em princípio, favorecer a idéia de interação entre níveis de processamento e de retroalimentação (upward feedback) no fluxo de informações. Nesse contexto, o modelo apresenta-se como uma alternativa entre os modelos de natureza serial para explicar tanto interferências de fatores sintáticos como de fatores não-sintáticos. A incorporação de um parser monitorador à arquitetura do sistema de produção permite unificar a explicação para todos os efeitos em termos de acessibilidade de uma representação do DP sujeito gerada pelo parser. O erro deixa de ser atribuído a falhas no curso da formulação sintática do enunciado (a codificação gramatical) e passa a ser associado a limitações de processamento e armazenamento de informação pela memória de trabalho. Nesta seção, apresenta-se uma versão revista e ampliada do modelo, na qual são consideradas três alternativas de explicação para os erros de concordância, a partir da hipótese de uma escala de acessibilidade das representações geradas pelo parser. 9.1 Erros de atração e escala de acessibilidade das representações geradas pelo parser Em estudos relativo à acessibilidade de formas pronominais na produção e na compreensão de sentenças, Corrêa (1993; 2000) explica a possibilidade de recuperação de um dado referente por uma forma anafórica a partir de uma escala de acessibilidade desse antecedente. Essa explicação tem como um de seus pressupostos teóricos a idéia de que o processamento da sentença no discurso é dependente de um sistema de memória de trabalho, o qual compreenderia pelos 168 menos dois níveis distintos de processamento, que poderiam ser caracterizados em termos de subsistemas de memória. O primeiro subsistema, correspondente a uma memória de curto-prazo, manteria representações de natureza literal (envolvendo itens lexicais) ou quase literal (envolvendo informação de natureza gramatical depreendida dos itens lexicais). O segundo sub-sistema manteria de forma mais estável representações conceptuais abstraídas das primeiras, possivelmente já de natureza semântica ou proposicional.93 Se considerarmos que as representações do DP sujeito geradas pelo parser estão sujeitas a essa escala de acessibilidade e que a acessibilidade de uma informação na memória é função tanto do próprio material lingüístico quanto de limitações individuais de memória, 3 possibilidades de explicação podem ser formuladas para dar conta dos erros de atração: Explicação 1: Esta explicação para os erros de atração corresponde exatamente à apresentada na primeira versão do modelo (cf. Rodrigues & Corrêa (2004); Corrêa & Rodrigues (2005)). Nesta versão, assumia-se que o parser monitorador atuaria de forma bottom-up. Considerava-se que o primeiro DP emitido só seria analisado pelo parser como o sujeito da sentença quando o verbo fosse produzido. A memória manteria, num componente temporário, informação de natureza morfofonológica associada aos traços de número dos núcleos nominais que integram a representação do DP sujeito gerada pelo parser-monitorador. No caso de DPs com núcleo do sujeito singular, questões de acessibilidade associadas à saliência fônica da marca de número fariam com que um núcleo interveniente (plural) mais alto na estrutura hierárquica desse sintagma (ou num PP argumento) fosse tomado como elemento definidor do número do DP sujeito como um todo. No momento em que fosse ocorrer a codificação morfofonológica do verbo, uma espécie de resíduo morfofonológico associado à representação do DP gerada pelo parsing poderia ainda estar presente na memória e vir a gerar interferência nessa 93 Haveria ainda um nível de memória mais alto, relacionado ao processamento do discurso, Este nível manteria em ativação constante a representação dos elementos em torno dos quais o discurso como um todo se organiza bem como o planejamento de natureza pré-textual, o qual seria passível de alteração a partir da produção dos enunciados (van Dijk & Kintsch, 1983). Neste trabalho, como está sendo analisada a concordância sujeito-verbo em sentenças isoladas, não será discutido o processamento de informações nesse nível de memória. 169 codificação do verbo. No caso de DPs com N1 plural, não ocorreria erro porque a informação de número associada ao núcleo do sujeito seria menos suscetível a esvaecimento. Para uma representação do modelo, ver esquema apresentado ao final do capítulo 7. Explicação 2: Diferentemente do que foi proposto na primeira versão do modelo, nesta segunda explicação considera-se que o parser poderia analisar o DP enviado da formulação como o sujeito da sentença e gerar uma árvore top-down para a sentença. Com base na informação referente ao número do DP sujeito, o parser já poderia antecipar (em termos de expectativa) qual seria a flexão do verbo. Vejamos, em detalhes, como isso se daria. A representação do DP gerada pelo parser manteria ativa informação de natureza morfológica, associada à informação de número extraída dos núcleos nominais do DP sujeito. Nesse caso, a informação de número teria uma natureza menos “literal”, em termos de um morfema abstrato de número, o qual poderia vir a afetar a codificação morfofonológica do verbo da seguinte maneira: O DP, tão logo é disponibilizado pelo sistema de produção, dentro de uma estrutura prosódica específica94, é analisado pelo parser, que, após o acesso aos itens lexicais, começa a construir o esqueleto funcional da sentença. Partindo-se da idéia de que, na compreensão de sentenças, o número do verbo (que irá aparecer no afixo verbal) já pode ser antecipado com base em informação de número do DP sujeito, pode-se propor que esta informação ficaria ativa na memória de trabalho e poderia vir a afetar a codificação morfofonológica do verbo. Paralelamente ao parsing do DP sujeito, o processo de codificação morfofonológica do restante da sentença estaria ocorrendo. Quando, no componente morfofonológico, o verbo fosse ser concatenado a um morfema abstrato de número resultante da computação da concordância na produção, dois morfemas de número estariam disponibilizados – aquele resultante da 94 Nessa explicação, considera-se que o parser poderia levar em conta informação prosódica ao segmentar o continuum da fala e que essa informação já daria indicações acerca da natureza do DP emitido, fazendo com que este fosse analisado como potencial sujeito da sentença. Assim, o esqueleto funcional começaria a ser projetado paralelamente ao reconhecimento de elementos do léxico em uma janela de processamento. 170 concordância na produção e aquele resultante da “previsão” estabelecida com base no número do DP sujeito. Haveria, então, uma espécie de competição entre dois possíveis morfemas. No caso de identidade entre os morfemas, o resultado seria uma forma verbal cujo afixo de número espelharia o número do DP sujeito. No caso de não-identidade, o erro poderia ocorrer.95 Note-se que essa situação seria semelhante àquela que pode ocorrer quando há o processamento da fala de outra pessoa: o DP inicial seria analisado como o sujeito da sentença e uma previsão acerca do número e a pessoa do verbo seria estabelecida. Se um erro de concordância é produzido, o ouvinte pode imediatamente perceber o erro, visto que há uma quebra de expectativa em relação à informação inicial. O erro, assim como na explicação 1, estaria associado a questões de acessibilidade e manutenção, na memória de trabalho, da informação de número da representação do DP sujeito gerada pelo parser. Quando o sujeito é um DP complexo, a informação de número do núcleo, em função de questões de distância linear e de marcação, pode ter sua acessibilidade afetada, levando a que se tome como informação de número aquela codificada em um segundo núcleo nominal mais acessível. A acessibilidade desse outro núcleo será função de questões de sua posição estrutural e de marcação morfofonológica. É, portanto, com base na informação do núcleo interveniente que o processador pode “antecipar” qual será o número do verbo que está prestes a ser produzido. Um dado interessante que pode ser tomado como evidência a favor da idéia de competição entre os morfemas são as correções feitas pelo falante: é relativamente comum que o falante, tão logo produza o erro, corrija o que disse; muitas vezes, a correção tem início antes mesmo de o verbo ter sido concluído (ex.: O tecido das cortinas do teatro rasgaram/rasgo). Também ocorre de o falante começar com a forma correta e substituir pela forma errada (ex. O tecido das cortinas do teatro rasgou/rasgaram). O quadro a seguir ilustra como se daria o processamento da concordância e o ponto em que ocorreria o erro: 95 Nessa proposta, assume-se que o radical verbal é representado separadamente de sua flexão. Essa separação entre morfema lexical e morfema flexional vem sendo atestada desde os primeiros trabalhos sobre erros produzidos na fala espontânea (Garrett, 1975, 1980). Erros como o da frase “A menina caixou a guarda” (no lugar de “A menina guardou a caixa”) são tomados como evidência de que os morfemas flexionais seriam representados separadamente dos radicais ou morfemas lexicais. 171 CP C’ Formulação sintática TP T’ DP vP T v’ Concordância como valoração v de traços VP V Codificação morfofonológica Morfema abstrato Pessoa e número 3ª SING Morfema abstrato Radical + {3ª Pessoa e número 3ª PL Recuperação de lexemas correspondentes aos morfemas abstratos Articulação O treinador dos jogadores de futebol CP C’ Monitoração por parser TP T’ DP T viajaram / viajou ontem vP v’ v PL ou 3ª SING?} VP V Fig. 9: Modelo PMP revisto e ampliado (explicação 2) – Em vermelho, morfema abstrato de número gerado pelo parser a partir de previsão feita com base em informação de número do DP analisado como sujeito da sentença. Explicação 3: A representação do DP gerada pelo parser, uma vez interpretada e integrada com informação prévia, daria origem a uma representação semântica/conceptual, a qual seria retomada na forma de um elemento pronominal nulo. Esse elemento pronominal, por sua vez, teria seu traço de número especificado a partir dessa representação semântica do DP. A idéia de atribuir a interferência de fatores semânticos/contextuais na concordância à retomada do DP por um elemento pronominal nulo foi originalmente proposta por Corrêa (2005b; 2006) para explicar efeitos semânticos na concordância de gênero sujeito-predicativo. Nesses trabalhos, Corrêa investiga a possibilidade de o DP inicial, processado como tópico, ser fechado como uma unidade semanticamente independente antes de o verbo ser introduzido na formulação, o que iria requerer a introdução de um elemento pronominal que retomasse seu referente como sujeito do verbo. Esse elemento pronominal nulo recuperaria, então, os traços semânticos do referente do DP inicial fechado como uma unidade semanticamente autônoma e a concordância procederia, sem problemas, com o predicativo concordando com o sujeito nulo recém incorporado à formulação do enunciado. Uma vez que o predicativo concordaria com o sujeito 172 nulo, o resultado soaria como um erro de concordância entre este e o DP processado como tópico. Assim, por exemplo, no caso de erros de concordância em sentenças com DPs com leitura distributiva, o que seria retomado pelo elemento pronominal nulo sujeito do verbo seria a idéia de pluralidade do referente do DP inicial, levando a um aparente erro de concordância. É possível que também com DPs não-distributivos a concordância verbal se estabeleça com um pronome nulo. Isso ocorreria toda vez que o DP inicial fosse tomado como um tópico e que a representação mantida na memória fosse de natureza conceptual, correspondente ao DP “fechado”. Como nos DPs nãodistributivos (o engradado das garrafas), o que seria retomado seria um referente singular, esse processo não seria evidenciado na forma verbal, que seria singular. Conceptualização da mensagem [O rótulo das garrafas de cerveja] [rasgar] CP C’ Formulação sintática DP TP T’ Pronome nulo 3ª pl vP T v’ Concordância como valoração de traços V Codificação morfofonológica Radical + 3ª O rótulo das garrafas de cerveja Monitoração por parser VP v DP pl rasgaram Representação conceptual do DP semanticamente interpretado/integrado com conhecimento de mundo Fig.10 : Modelo PMP revisto e ampliado (explicação 3) – Retomada da representação conceptual do DP resultante do parsing através de pronome resumptivo e computação da concordância. Os colchetes indicam representação de natureza conceptual. 173 9.2 Modelo PMP e Programa Minimalista: considerações acerca de um tratamento unificado para a computação sintática da concordância Para fechar a seção, cumpre fazer algumas observações acerca da compatibilidade entre o tratamento da concordância sujeito-verbo no modelo PMP e a computação sintática da concordância no modelo de língua proposto no Programa Minimalista. Em primeiro lugar, cabe notar que, embora no modelo PMP, assuma-se a idéia de valoração de traços formais para caracterizar a computação da concordância, não há um comprometimento com uma implementação específica da computação da concordância desenvolvida no âmbito do Programa Minimalista. Isso significaria tomar a derivação sintática no modelo formal de língua como idêntica à derivação on-line da sentença, o que pode ser problemático em termos de dois aspectos básicos: i) a direcionalidade da derivação sintática x formulação sintática; ii) questões de ordem associadas a movimento sintático. Em relação ao primeiro ponto, tem-se apontado como dificuldade para um tratamento unificado da derivação/formulação de sentenças, o fato de a derivação sintática no Programa Minimalista ser bottom-up (ascendente), da direita para a esquerda, enquanto a formulação de sentenças seria top-down (descendente), da esquerda para a direita (cf. Phillips, 1996, 2003). Corrêa (2005a, submetido) observa que, em termos estritamente formais, no momento em que o Minimalismo passa a assumir uma abordagem relacional para a caracterização de nós sintáticos (bare phrase), não é mais tão claro o quão crucial é a direção da derivação sintática. Nesse sentido, talvez seja possível buscar uma compatibilidade entre derivação em termos formais e derivação em tempo real. Corrêa propõe que a derivação em tempo real se daria tanto numa direção top-down quanto numa direção bottom-up. O esqueleto funcional, que permite a explicitação da força ilocucionária da sentença e a indicação de informação temporal acerca do evento descrito seria derivado top-down, e a concatenação de categorias lexicais, que permitem expressar o conteúdo propriamente dito da mensagem (a partir das relações argumentais), seria feita bottom-up. Um modelo de processamento que incorpore uma derivação on-line do formulador sintático nos termos propostos por 174 Corrêa precisará, portanto, acoplar uma derivação top-down com uma derivação bottom-up.96 Em relação ao segundo ponto – a questão do movimento sintático, Corrêa (2005 a, submetido) argumenta que uma teoria que proponha identificação entre derivação lingüística e processamento precisaria distinguir dois tipos de movimento sintático: movimentos que descrevem processos pertinentes ao posicionamento de elementos na ordem canônica com que se apresentam na língua (ex. movimento de núcleo e movimento de DP para posição A) e movimentos que descrevem processos que alteram essa ordem canônica, com vistas a adequar a fórmula do enunciado lingüístico a um particular contexto discursivo (ex. Movimento WH, Topicalização, e Focalização). Segundo Corrêa, o primeiro tipo de movimento estaria associado ao processo de aquisição da língua e poderia ser visto como uma descrição do tipo de operação envolvida quando da fixação de parâmetros de ordem. Esse movimento corresponderia, pois, a um processo bem inicial na aquisição da língua e possivelmente estaria “gravado” no cérebro, o que tornaria sua condução automática quando os parâmetros correspondentes estivessem fixados. Já o segundo tipo de movimento seria determinado por ajustes do enunciado a propósitos comunicativos específicos e, nesse sentido, seria decorrente de cada emissão/compreensão e ocorreria durante o processamento dos enunciados. Essas diferenças se refletiriam em termos de custos computacionais: enquanto o primeiro tipo deveria ser isento de custo, dada sua natureza automática, o segundo deveria ter um custo determinado por demandas específicas de processamento. Logo, uma aproximação entre derivação lingüística e processamento precisaria levar em conta essa distinção, o que possivelmente teria impactos no 96 “ [...] o acesso a elementos de categorias funcionais do léxico na produção partiria de relações de interface entre o sistema da língua e “sistemas intencionais”, viabilizadas pelos traços semânticos/pragmáticos dos mesmos e os elementos recuperados seriam tomados como projeção máxima. O acesso a elementos de categorias lexicais, por sua vez, partiria de relações de interface entre o sistema da língua e “sistemas conceptuais”, viabilizadas pelos traços semânticos desses elementos. Torna-se necessário, pois, dissociar os chamados sistemas C-I (Conceptuais intencionais), quando se considera computação em tempo real. Os sistemas conceptuais interagiriam com elementos de categorias lexicais, enquanto que os intencionais com elementos de categorias funcionais, cada um dos quais dando início, possivelmente em paralelo, a derivações/computações com direcionalidades distintas, as quais se acoplam, uma vez que verbo e tempo se relacionam numa única estrutura hierárquica.” (Corrêa, 2005a) 175 que tange aos mecanismos formais usados para a caracterização da derivação sintática da sentença. Não é claro, por exemplo, em que medida a computação sintática da concordância na produção/compreensão poderia ser caracterizada em termos de um sistema de Probe-Goal, implementado pela operação Agree. Nesse sistema, a valoração de traços se dá a partir de uma relação de c-comando, que se estabelece entre um núcleo mais alto (probe- sonda) cujos traços são não-interpretáveis e precisam ser valorados e um núcleo mais baixo (goal – alvo), com traços interpretáveis. Se, como propõe Corrêa, o DP inicial já se encontra na sua posição estrutural final, definida no processo de fixação de parâmetros, não haveria como o traço não-interpretável de número de T ser valorado. Isso só seria possível se imaginássemos que uma cópia do DP estaria nessa posição mais baixa, como uma forma de estabelecer uma relação temática entre o DP e o verbo da sentença. Em suma um tratamento unificado da computação sintática concordância ainda carece de investigação mais aprofundada. De todo modo, a despeito de o modelo PMP não se comprometer com um sistema específico da implementação da concordância, pode-se dizer que é compatível com a idéia de que a derivação sintática transcorreria automaticamente. Isso porque o modelo explica os “erros de atração” não como falhas no processo de formulação sintática, mas sim em termos de uma interferência de uma representação gerada pelo parser, a qual estaria sujeita a limitações da memória de processamento. Outro ponto interessante do modelo é que ele permite explicar diferenças entre línguas em termos da visibilidade de como informação de número é expressa, o que também é compatível com a idéia de que as línguas se diferenciam em relação a seus traços formais e a como estes são realizados. 176 10 Síntese e considerações finais A questão da autonomia do formulador sintático é um dos temas centrais para as teorias psicolingüísticas voltadas à investigação do processamento de sentenças. Nesse cenário, erros de concordância entre sujeito-verbo se apresentam como um caminho para se examinar em que medida processos sintáticos podem sofrer interferência de informação diferente da que pode ser codificada como traços formais do léxico em um modelo de língua. Nesta tese, buscou-se examinar qual a natureza dos erros de atração e o momento do processamento em que tais erros atuariam. Também foi objetivo do estudo diferenciar erros de atração de casos de concordância licenciados pela gramática da língua. Assumiu-se como hipótese de trabalho a idéia de que o formulador sintático é autônomo e funciona de modo encapsulado, sem sofrer interferência de outras fontes de informação durante o processamento. Buscou-se, nesta tese, uma aproximação com a teoria gerativista nos seus desenvolvimentos mais recentes – o Programa Minimalista, o qual assume que o sistema cognitivo da língua deve atender a condições de legibilidade impostas pelos sistemas de desempenho com os quais a língua faz interface. Pontos de compatibilidade entre o que seria a derivação de uma sentença nesse modelo de língua e a derivação de sentenças em tempo-real foram apresentados e questões relativas a uma integração entre o modelo de língua proposto no Minimalismo e modelos de processamento foram discutidas. Com vistas a distinguir estruturas responsáveis por erros de atração de construções que admitem a concordância com um nome plural de um PP modificador, realizou-se uma análise lingüística das chamadas construções partitivas, as quais permitem tanto a concordância com o termo que designa a parte quanto com o termo que designa o todo. Propôs-se que cada alternativa de concordância seria função da natureza “hibrida” (lexical e funcional) dos termos partitivos “maioria” e “parte”. Duas representações estruturais distintas para a construção partitiva foram, então, consideradas, associando-se cada estrutura a uma alternativa de concordância. Um experimento de julgamento de gramaticalidade indicou diferenças entre construções partitivas e DPs complexos, tendo sido consideradas gramaticais as sentenças com construções partitivas, 177 independentemente da concordância verbal. Também foi verificado que há menor rejeição à concordância plural com as partitivas. A revisão da literatura acerca de erros de atração revelou que fatores sintáticos, semânticos e morfofonológicos podem atuar no processamento da concordância. Os fatores sintáticos que induziram erros foram a distância linear entre o núcleo do sujeito e o verbo; o tipo de modificador e a posição hierárquica de um núcleo interveniente no DP sujeito. Entre os fatores semânticos, destaca-se a distributividade do DP sujeito. Quanto a efeitos morfofonológicos, houve efeito de marcação associado ao número do núcleo do sujeito e número do nome local. Também foi verificado que as línguas podem exibir diferenças quanto a uma assimetria entre singular e plural na indução de erros de atração. Experimentos conduzidos em inglês mostraram ser possível dissociar um efeito morfofonológico de um efeito meramente fônico. Foi visto que explicações fornecidas por modelos interativos e nãointerativos não dão conta de efeitos de ordem linear entre o núcleo do sujeito e o verbo e de diferenças entre línguas quanto a efeitos morfofonológicos. O modelo de produção monitorada por parser (PMP) (Rodrigues & Corrêa, 2004; Corrêa & Rodrigues, 2005) apresenta-se como uma alternativa a esses modelos. As principais propriedades deste modelo são a produção moderadamente incremental e o monitoração concomitante à fala por um parser, que atua de forma bottom-up. A idéia de uma produção moderadamente incremental é compatível com a hipótese de que a concordância verbal (entendida como processo de valoração de traços formais da língua) seria computada antes de o DP sujeito ser enviado para a codificação morfofonológica com vistas a sua articulação. A proposta de um parser monitorador permite manter a autonomia do formulador sintático e explicar efeitos de distância linear e efeitos morfofonológicos no processamento da concordância. Neste modelo, os erros são atribuídos a uma interferência na codificação morfofonológica do verbo provocada por uma representação do DP sujeito gerada pelo parser. Os resultados de cinco experimentos de produção induzida de erros conduzidos com falantes de português revelaram a interferência dos seguintes fatores: 178 i) Distância linear entre o núcleo do sujeito e verbo: a incidência de erros foi maior nas condições em que a distância linear entre núcleo do sujeito era longa. ii) Posição hierárquica do núcleo interveniente no DP sujeito: em preâmbulos do tipo A tinta do cartucho da impressora, houve mais erros de concordância quando o núcleo interveniente era o N2 do que o 3, isto é, núcleos próximos do nó mais alto do DP sujeito induziram mais erros do que aqueles numa posição linear adjacente ao verbo. iii) Status argumental do PP modificador: núcleos intervenientes inseridos em PPs argumentos induziram mais erros do que aqueles inseridos em PPs adjuntos. iv) Número do núcleo do sujeito: a incidência de erros de atração foi maior quando o núcleo do sujeito era singular (não-marcado); não houve erros após núcleos do sujeito plural. v) Número do DP do nome local: houve mais erros quando o número do DP do nome local era plural do quando era singular. Esse efeito se observou independentemente da realização morfofonológica do nome local: se este era um substantivo flexionável (os carros) ou um substantivo de forma invariante (os ônibus). vi) Tipo de DP distributivo: DPs com núcleo interveniente plural (a maçaneta das portas) induziram mais erros de atração do que DPs distributivos com o operador “cada” (a maçaneta de cada porta). vii) Distributividade: foi obtido um efeito de distributividade, quando se ampliou o tamanho do DP distributivo com núcleo interveniente. O total de erros de atração foi muito maior após DPs distributivos (a sola dos sapatos de couro) do que após DPs não-distributivos (o armário dos sapatos de couro). Efeitos de distância linear entre o núcleo do sujeito e o verbo podem ser explicados a partir do Modelo PMP que incorpora um parser monitorador. No processo de parsing, representações mantidas na memória de trabalho estariam sujeitas a esvaecimento progressivo. Na condição distância linear longa, haveria possível perda de informação de número codificada no núcleo do sujeito, o que favoreceria a interferência de informação de número de um núcleo interveniente. Efeitos de posição hierárquica e de número do DP do nome local também 179 são compatíveis com a proposta de um parser monitorador, pois uma representação gerada pelo parser conteria informação relativa à posição hierárquica dos elementos do léxico reconhecidos, bem como informação relativa aos traços morfofonológicos identificados. A acessibilidade do traço de número de um núcleo interveniente seria função de sua posição hierárquica e de marcação: quanto mais próximo um núcleo interveniente marcado (plural) estivesse do nó mais alto do DP sujeito mais acessível seria sua informação de número e maior a chance de esta vir a causar interferência. Um efeito do status argumental do PP em que está inserido o núcleo interveniente também pode ser explicado em termos da manutenção, na memória, dos elementos que integram a representação gerada pelo parser. O núcleo interveniente que estivesse inserido em um PP argumento ficaria mais acessível do que aquele inserido em um PP adjunto, porque os argumentos estariam mais estreitamente associados à projeção do NP do que os PPs adjuntos. Estes seriam mais “marginais” na estrutura; logo, menos acessíveis. Daí o maior numero de erros de atração provocados por núcleos intervenientes em PPs argumentos. O modelo PMP também permite explicar o efeito de número do núcleo do sujeito e por que o português apresenta um comportamento semelhante ao do inglês (e diferente do francês) em relação a essa variável. De acordo com o modelo, a marcação de número do núcleo do sujeito afeta a manutenção, na memória, da representação do DP sujeito gerada pelo parser, a qual, por sua vez, pode interferir na codificação morfofonológica do verbo. Considerando-se que as línguas apresentariam diferenças quanto à visibilidade da informação de número do DP sujeito, haveria mais chance de se obter efeito da variável número do núcleo do sujeito naquelas línguas em que a informação de número do sujeito fosse mais visível. O português é bastante semelhante ao inglês em relação a essa propriedade; em ambas as línguas a informação de número é bastante visível (um afixo –s no final dos nomes, no inglês; um afixo –s no final dos determinantes e dos nomes, em português). No francês, por outro lado, a informação de número é menos visível, visto que na fala a informação de número não é marcada nos nomes e os determinantes não apresentam uma marca individualizada de número. Isso explica, portanto, por que em português e inglês apenas o singular induz erros de atração. Nessas línguas, nos preâmbulos com N1plural, a informação morfofonológica de número estaria mais saliente e, por conseguinte, menos 180 vulnerável a esvaecimento, o que dificultaria a ocorrência de erros nessa condição. Ainda em relação a fatores morfofonológicos, também é possível explicar a partir do modelo PMP por que não há diferenças em termos de erros de atração entre preâmbulos cujo nome local é um substantivo flexionável (os carros) ou um substantivo de forma invariante (os ônibus). Em português, a informação de número relevante é aquele codificada no determinante do DP do nome local; logo, o parser, ao extrair a informação de número desse DP, leva em consideração o traço de número do determinante, independentemente de informação expressa no nome local. Quando o número do determinante é plural (marcada), fica mais acessível na memória e tem maiores chances de prevalecer sobre a informação do núcleo do sujeito. O modelo PMP, em sua primeira versão, foi concebido com vistas a explicar particularmente efeitos sintáticos e morfofonológicos no processamento da concordância. Para explicar efeitos semânticos, como o de distributividade, bem como para tentar distinguir interferências provocadas por informação morfológica de número daquelas provocadas por informação morfofonológica, uma versão revista e ampliada do modelo foi proposta. Nessa versão, buscou-se integrar 3 possibilidades de explicação para o erro tendo em vista uma escala de acessibilidade, na memória de trabalho, da representação do DP sujeito gerada pelo parser. Uma das explicações do modelo ampliado corresponde exatamente ao proposto na primeira versão do modelo PMP. Após o parsing do DP, informação de natureza literal (envolvendo itens lexicais) ou quase literal (envolvendo informação de natureza gramatical depreendida dos itens lexicais) seria mantida numa memória temporária para que pudesse ser integrada ao restante da sentença que está sendo produzida em paralelo. Quando o verbo fosse ser codificado morfofonologicamente, uma espécie de resíduo morfofonológico resultante do parsing do DP produzido, ainda mantido na memória, poderia interferir no processo de codificação do verbo, com reflexos na sua representação fonética. Importante notar que nesta versão o parser atua de forma bottom-up e o DP inicialmente produzido só é integrado em uma estrutura sintática, na função de sujeito, quando o verbo é efetivamente emitido. Outra possibilidade, no entanto, precisa ser considerada, a de que o parser comece a construir o esqueleto da sentença de modo top-down e que o DP inicial 181 seja identificado como o sujeito da sentença. Essa possibilidade é que levou a ampliação do modelo PMP. Nessa segunda explicação para os erros, considera-se que informação de número de natureza menos literal, associada a um morfema abstrato de número do DP sujeito seria mantida na memória. Com base nessa informação, o falante poderia antecipar, em termos de expectativa, qual seria o morfema abstrato de número do verbo, que seria expresso por meio de um sufixo no caso do português. Paralelamente ao parsing do DP sujeito, o processo de codificação morfofonológica do restante da sentença estaria ocorrendo. Assim, quando, no componente morfofonológico, o verbo fosse ser concatenado a um morfema abstrato de número resultante da computação da concordância na produção, dois morfemas de número estariam disponibilizados – o morfema de número resultante da concordância na produção e o morfema “antecipado” a partir de uma expectativa do número do verbo. Quando por questões de acessibilidade houvesse perda de informação relativa ao traço de número do núcleo do sujeito, a “previsão” feita com base na representação do DP sujeito gerada pelo parser seria incongruente em relação ao resultado da computação sintática na produção. Nesse caso, dois morfemas abstratos de número não idênticos estariam competindo no momento da codificação morfofonológica do verbo e poderia ocorrer uma associação do verbo ao morfema resultante da “expectativa” gerada no processo de parsing, fazendo com que parecesse ter ocorrido um erro de concordância. A terceira explicação considera que uma representação semântica do DP sujeito, tomado como tópico da sentença, poderia ser retomada na forma de um elemento pronominal nulo e que seria com base na informação de número desse elemento pronominal que a concordância sujeito-verbo seria computada. O elemento pronominal codificaria informação de número associada à representação semântica do referente do DP sujeito, o que explicaria efeitos de distributividade no processamento da concordância. Note-se que, de acordo com essa explicação, a valoração do traço de número do verbo seria feita com base no traço de número do pronome e, nesse sentido, não haveria uma falha ou um erro de concordância. Com base, pois, nas explicações do modelo PMP ampliado é possível sustentar a idéia de que a computação sintática da concordância na produção não seria em si afetada por informação de natureza semântica ou morfofonológica. Os erros seriam decorrentes de questões de acessibilidade, na memória, da 182 representação do DP sujeito gerada pelo parser e, nesse sentido, o erro seria posterior ao parsing do DP sujeito. Logo, pode-se dizer que os resultados da presente pesquisa dão suporte à hipótese da autonomia do formulador sintático. Vários tópicos de pesquisa podem ser desenvolvidos como desdobramentos do presente trabalho. Em termos mais amplos, tem-se a articulação entre modelos de processamento e modelos de língua, em particular o modelo desenvolvido no âmbito do Programa Minimalista. Foi visto, ao longo da tese, que a relação gramática e processador não pode ser estabelecida em termos de uma relação de identidade plena e que especificidades do processamento on-line de sentenças precisam ser consideradas ao se procurar estabelecer uma aproximação entre o que ocorre na produção/compreensão de sentenças e o modo como se dá a derivação formal destas em modelos de língua. Nesse cenário, questões ligadas a movimento sintático e direcionalidade da derivação se apresentam como pontos de investigação (cf. Corrêa 2005a, submetido). Em termos do tratamento da concordância sujeito-verbo na produção, seria interessante explorar em que medida os mecanismos formais de implementação da concordância no modelo de língua (checagem, valoração no sistema de Agree) estariam de acordo com a implementação da concordância em um modelo de processamento da produção. Em termos mais específicos, a tese abre para uma investigação de tópicos tanto em Teoria Lingüística quanto em Psicolingüística. Em Lingüística, a análise da estrutura das construções partitivas indicou que ainda há muito o que se explorar quanto à questão da natureza semi-lexical dos itens que entram na derivação sintática da sentença. A computação da concordância de número interna ao DP no caso de DPs complexos também é uma área bastante promissora em termos de pesquisa. Questões de representação de adjuntos e de argumentos e seu impacto para a computação sintática é outro ponto que merece ser investigado. Em Psicolingüística, há vários aspectos do processamento da concordância a explorar. Seria interessante, por exemplo, comparar resultados de compreensão com os de produção. Não são muitos os trabalhos em compreensão nesta área e certamente há bastante o que ser examinado, em particular quanto à hipótese de que o parser atuaria baseado em “expectativas” geradas a partir da análise do material lingüístico em processamento. No estudo específico da produção, a distinção entre concordância de gênero e número, passível de ser observada em estruturas com adjetivos ou com particípios, também merece ser investigada. 183 Nesta tese, foram identificados erros em que uma forma de particípio concordava em número com o núcleo do sujeito e em gênero com o nome local (O depósito das armas de fogo foi desativada; A prateleira dos livros de história estava quebrado), o que sugere que haveria diferenças em termos de como o processador lida com informação de número e informação de gênero no DP sujeito. Quanto às estruturas responsáveis por erros de atração, foram examinados em detalhes DPs modificados por PPs. Cumpre ainda verificar o que ocorre com modificadores oracionais em termos de indução de erros de atração. Em que medida, como propõe Bock & Nicol (1993), a oração de fato insularia informação de um núcleo interveniente nela inserido é um ponto a ser explorado. Também em termos metodológicos, há bastante o que se desenvolver. É preciso buscar metodologias experimentais alternativas que permitam induzir erros de atração, sem que seja necessário o falante partir de um preâmbulo apresentado pelo experimentador. Em suma, há muito trabalho a ser feito e, nesse cenário, a presente tese pretende ter contribuído com elementos que possam servir como ponto de partida para pesquisas futuras sobre o processo de produção de sentenças, área em que ainda há poucos trabalhos em português. 184 11 Referências bibliográficas ABNEY, S. A Computational Model of Human Parsing. Journal of Psycholinguistic Research, v.18, p. 129-144, 1989. __________. The English noun phrase in its sentential aspect. Tese de doutorado, Cambridge, Mass: MIT, 1987. ADGER, A. Core Syntax: A minimalist approach. Oxford: Oxford University Press, 2003. ALEXIADOU, A.; HAEGEMAN, L.; STAVROU, M. Semi-functional categories the Pseudopartitive construction. MS Chapter: Universitãt Stuttgart, university of Thessaloniki, 2003. ALMOR, A.; KEMPLER, D.; MACDONALD, M.; ANDERSEN, E. Long Distance Number Agreement in Alzheimer’s Disease. Brain and Language, v. 65, p. 19-22, 1998. ARIAL, M. Interpreting anaphoric expressions: a cognitive versus a pragmatic approach. Linguistics, v.30, p.3-42, 1994. AUGUSTO, M.R.A. As Relações com as interfaces no quadro minimalista gerativista: uma promissora aproximação com a Psicolingüística. In: MIRANDA, N.; NAME, M.C.L. (Orgs.). Lingüística e Cognição. Juiz de Fora: Editora da UFJF, no prelo. __________.; CORRÊA, L.M.S. Marcação de gênero, opcionalidade e genericidade: processamento de concordância de gênero no DP aos dois anos de idade. Revista Lingüística, v.1, n.2, 2005. __________.; FERRARI-NETO, J. ; CORRÊA, L. S. . Explorando o DP: a presença da categoria NumP. 2005. Revista de estudos lingüísticos da UFMG (submetido) AVELAR, Juanito Ornelas de. Adjuntos locativos preposionados no português brasileiro. Projeto de Doutorado em andamento, Iel/UNICAMP-FAPESP, 2006a. __________. Constituintes preposicionados, derivação por fase e critérios de interpretação temática. Trabalho apresentado no GEL-2005, Universidade federal de São Carlos, em julho/2005, 2005a. __________. Sobre PPs adnominais no português brasileiro. Trabalho apresentado no X Seminário de Teses em Andamento realizado no IEL/UNICAMP, em outubro de 2005, 2005b. __________. Posse, estado e existência em português brasileiro: subsídios para uma abordagem unificada. Tese de doutorado, Universidade Estadual de Campinas 2004. 185 BECHARA, E. Moderna gramática portuguesa. 37a ed. ver. e ampl., Rio de Janeiro: Lucerna, 1999. BELLETTI, Adriana. The case of Unaccusatives. Linguistic inquiry, v,19,1988. __________. Generalized verb movement – On some differences and similarities between Italian and French. Torino: Rosenberg and Sellier, 1990. BERG, T. The resolution of number conflicts in English and German agreement patterns. Linguistics, v. 36, p. 41-70, 1998. BEGHELLI, F.; STOWELL, T. Distributivity and negation: the syntax of each and every. In: SZABOLCSI, Anna (Ed.). Ways of Scope taking. Dordrecht/Boston/London: Kluwer Academic Publishers, 1997. p. 71-107. BOCK, J. K. Language Production: Methods and Methodologies. Psychonomic Bulletin & Review, v.3, n. 4, p. 395-421, 1996. __________. et al. Some attractions of verb agreement. Cognitive Psychology, v. 43, p. 83-128, 2001. __________.; CUTTING, J.C. Regulating mental energy: performance units in language production. Journal of Memory and Language, v. 31, p. 99-127, 1992. __________.; EBERHARD, K. M. Meaning, sound and syntax in English number agreement. Language and Cognitive Processes, v. 8, p. 57-99, 1993. __________.; __________.; CUTTING, C. Producing number agreement: How pronouns equal verbs. Journal of Memory and Language, v.51, n.2, p.251-278, 2004. __________.; __________.;__________.; MEYER, A.; SCHRIEFERS, H. Some attractions of verb agreement. Cognitive Psychology, v.43, p. 83-128, 2001. __________.; LEVELT, W.J.M. Language production: grammatical encoding. In: GERNSBACHER, M. A. (Ed.). Handbook of Psycholinguistics. San Diego, CA: Academic Press, 1994, p. 945-984. __________.; MILLER, C. A. Broken Agreement. Cognitive Psychology, v. 23, p. 45-93, 1991. __________.; NICOL, J.; CUTTING, J.C. The ties that bind: Creating number agreement in speech. Journal of memory and language, v.40, p, 330-346, 1999. BOLAND, J.; BLODGETT, A. Argument Status and PP-Attachment. Michigan University. Submetido. BOSKOVIC, Z. On the locality of left branch extraction and the structure of NP. Studia linguistica, v.59, n.1, p.1-45, 2005 186 BRESNAN, J. The Mental Representation of Grammatical Relations. Cambridge, Mass: MIT Press, 1982. BRISSON, Christine. Plurals, all, and the nonuniformity of collective predication. Linguistics and Philosophy, v.26, p. 129-184, 2003. __________. Distribitivity, maximality, and floating quantifiers. Tese de Doutorado, Rutgers university, 1998. BRUCART, Josep M. Concordancia ad sensum y partividad en español. In: M. ALMEIDA; J. DORTA (Eds.). Contribuciones al studio de la lingüística hispânica Homenaje al profesor Ramón trujillo, v.1, Tenerife: Montesins, 1997. p. 157-183. CANÇADO, M. Argumentos: Complementos e Adjuntos. 2005 (Manuscrito distribuído em palestra na USP e na Oficina de Semântica/NUPES/POSLIN/UFMG). Disponível em: <http://www.letras.ufmg.br/marciacancado/Argumentos%20Complementos%20e %20Adjuntos.pdf > CARDINALETTI, Anna; GIUSTI, Giuliana. The syntax of quantified phrases and quantitative clitics. 2002. Disponível em: <http://www-uilots.let.uu.nl/syncom/uiltjes/case_131_qcon.htm > CARROLL, David W. Psychology of Language. 2ª ed., Pacific Grove, California: Brooks/Cole Publishing Company, 1994. CASTILLO, J. C. Thematic relations between nouns. Tese de doutorado, University of Maryland, 2001. CHOMSKY, N. On Nature and language. Cambridge: Cambridge University Press, 2002. __________. Beyond explanatory adequacy. MIT Occasional Papers in Linguistics, v.20, 2001. __________. Derivation by Phase. MIT:WPL, 1999. __________. Minimalist inquiries: the framework. MIT Occasional Papers in Linguistics, v.15, 1998. [Reimpresso In: MARTIN, R., D. MICHAELS, J. URIAGEREKA (Eds.). Step by step: essays in minimalist syntax in honor of Howard Lasnik, Cambridge, Mass: MIT Press, 2000. p. 89-155]. __________. The minimalist program. Cambridge, Mass: MIT Press, 1995. __________.; LASNIK, H. The theory of principles and parameters. In: J. JACOBS et al. (Eds.). Syntax: an International Handbook of Contemporary Research, v. 1, Berlin: Mouton de Gruyter, 1993. p. 506-569. 187 CHRISTIANSON, K. T. Sentence Processing in a “Nonconfigurational” Language. Tese de Doutorado, Michigan State University, 2002. CHRISTIANSON, K.; FERREIRA, F. Planning in sentence production: Evidence from a free word-order language (Odawa). Cognition, v.98, p. 105-135, 2005. CINQUE, G. On the evidence for partial N-movement in the Romance DP. In: CINQUE, J. Koster; J.-Y. POLLOCK; L. RIZZI; ZANUTTINI (Eds.). Paths towards universal grammar. Washington DC: Georgetown University Press, 1994. p. 85-110. CLIFTON, C. Jr.; SPEER, S.; ABNEY, S. P. Parsing arguments: phrase structure and argument structure as determinants of initial parsing decisions. Journal of Memory and Language, v. 30, p. 251-271, 1991. CORRÊA, L.M.S. Conciliando processamento lingüístico e teoria de língua no estudo da aquisição da linguagem. In: __________. (Org.). Aquisição da Linguagem e Problemas do Desenvolvimento Lingüístico. Rio de Janeiro: Editora da PUC - Rio, no prelo a (em circulação desde 2002) __________. Possíveis diálogos entre Teoria Lingüística e Psicolingüística: questões de processamento, aquisição e do Déficit Específico da Linguagem. In: N. MIRANDA; NAME, M.C.L. (Orgs.). Lingüística e Cognição. Juiz de Fora, no prelo b. __________. Relação processador gramática em perspectiva: problemas de unificação em contexto minimalista (submetido). __________. Do Sex and syntax go hand in hand? An alternative to semantic and contextual effects in the processing of grammatical gender agreement. In: Abstract The 19th Annual CUNY Conference on Human Sentence Processing , 2006. __________. Processamento Lingüístico e Derivação Minimalista: Compatibilidade ou Identidade. In: Boletim da ABRALIN, 2005a. on-line. __________. Questão de Concordância: Uma Abordagem interpretada para Processamento, Aquisição e Déficit Específico de Linguagem. Lingüística, v.1, n.1, p. 111-145, 2005b. __________. Explorando a relação entre língua e cognição na interface: o conceito de interpretabilidade e suas implicações para teorias do processamento e da aquisição da linguagem. Veredas, v.6, n.1, p.113-129, 2002. __________. Acessibilidade diferenciada e fatores estruturais na produção e na compreensão de formas pronominais. Palavra, v. 6, p. 134-153, 2000. __________. Restrições ao pronome livre na linearização do discurso. Palavra, v.1, p.75-95, 1993. 188 __________.; AUGUSTO, M.R.A.; FERRARI-NETO, Jose. The Early Processing of number Agreement in the DP: Evidence from the Acquisition of Brazilian Portuguese. In: BUCLD 30th, no prelo. __________.; AUGUSTO, M. R. A. . Possible loci of SLI from a both linguistic and psycholinguistic perspective. In: Abstracts IX EUCLDIS Conference, ParisRoyaumont, 2005. __________.; RODRIGUES, E. Erros de atração no processamento da concordância sujeito-verbo e a questão da autonomia do formulador sintático In: MAIA, Marcus; FINGER, Ingrid (Orgs.). Processamento da Linguagem. Pelotas: EDUCAT, 2005. p. 303-336. CORVER, Norbert; ZWARTS, Joost. Prepositional numerals. Trabalho apresentado no Workshop on numerals in the World’s language, no periodo de 29 – 30 de março de 2004, Leipzing, alemanha, 2004. Disponível em: <http://www.let.uu.nl/users/Joost.Zwarts/personal/Papers/prepnums.pdf > CUETOS, F.; D.C. MITCHELL. Cross-linguistic differences in parsing: Restrictions on the use of the Late Closure strategy in Spanish. Cognition,v.30, p.73-105, 1988. CUNHA, C.; CINTRA, L. Nova Gramática do Português Contemporâneo. 2a ed. Rio de Janeiro: Nova Fronteira, 1985. DE SMEDT, K.J. IPF: An incremental parallel formulator. In: DALE, R.; MELLISH, C.; ZOCK, M. (Eds.) Current research in natural language generation. London: Academic Press, 1990. p.167-192. __________.; HORACEK, H.; ZOCK, M. Architectures for Natural language generation: problems and perspectives. In: ADORNI, G.; ZOCK, M. (Eds.). Trends in natural language generation: An artificial intelligence perspective. Berlin: Springer, 1996. p. 17-46. DEEVY, Patricia L. Agreement Checking in Comprehension: Evidence from Relative Clauses. Journal of Psycholinguistic Research, v.29, n.1, 2000. __________. The Comprehension of English Subject-verb agreement. Tese de doutorado, University of Massachusetts, Amherst, 1999. DELL, G. S. A Spreading activation theory of retrieval in sentence production. Psychological Review, v.93, p.283-321, 1986. DEUTSCH, A. Subject-Predicate Agreement in Hebrew: Interrelations with Semantic Processes. Language and Cognitive Processes, v. 13, n. 5, p. 575-597, 1998. EBERHARD, K. The Accessibility of Conceptual Number to the Processes of Subject-Verb Agreement in English. Journal of Memory and Language, v. 41, p. 560-578, 1999. 189 __________. The marked effect of number on subject-verb agreement. Journal of Memory and Language, v. 36, p. 147-164, 1997. EMBICK, D.; HALLE, MORRIS. Word formation:aspects of the latin conjugation in distributed morphology. Mouton de Gruyter, no prelo. __________.; NOYER, R. Movement operations after syntax. Linguistic inquiry,v.4, n.32, p. 555-595, 2001. FAYOL, M.; LARGY, P.; LEMAIRE, P. Cognitive Overload and Orthographic Errors: When Cognitive Overload Enhances Subject-Verb Agreement Errors. A Study in French Written Language. Quarterly Journal of Experimental Psychology, v. 47, p. 437-467, 1994. FERREIRA, F. Syntax in Language Production: an Approach Using Treeadjoining Grammars. In: L. WHEELDON (org.) Aspects of Language Production. East Sussex: Psychology Press, 1999. __________. Choice of passive voice is affected by verb type and animacy. Journal of memory and language, v.33, p. 715-736, 1994. FERREIRA, Victor S. Is it better to giver than to donate? Syntactic flexibility in language production. Journal of memory and language,v.35, p.724-755, 1996. FODOR, Janet Dean. Learning to parse? Journal of Psycholinguistic Research, v.2, n. 27, p. 285-319, 1998. FONG, Sandiway. Computation with Probes and Goals: A parsing perspective. In: DI SCIULLO, A. M.; R. DELMONTE (Eds.). UG and external systems. Amsterdam: John Benjamins, 2004. FRANCK, Julie. La Régulation des flux d’information lors de l’encodage grammatical de la phrase. L’accord comme outil d’investigation. Tese de Doutorado, Université Catholique de Louvain, 2000. __________.; LASSI, G.; FRAUENFELDER, U. H.; RIZZI, L. Agreement and movement: a syntactic analysis of attraction, 2003. Cognition, Available online 15 December, 2005. Disponível em: <http://www.unige.ch/fapse/PSY/persons/frauenfelder/Julie/agree&move%20sub mitted.pdf > __________.; VIGLIOCCO, G.; NICOL, J. Subject-verb agreement in French and English: the role of syntactic hierarchy. Language and Cognitive Processes, v. 17, n.4, p. 371-404, 2002. FRAZIER, L. On Comprehending sentences: Syntactic parsing strategies. Tese de doutorado. University of Connecticut: Indiana University linguistics Club, 1979. __________.; CLIFTON, JR., C. Contrual. Cambridge, Mass: MIT Press, 1996. 190 __________.; FODOR J.D. The sausage machine: A new two-stage parsing model. Cognition, v.6, p. 291-326, 1978. __________.; PACHT, J.; RAYNER, K. Taking on semantic commitments, II: collective versus distributive readings. Cognition, v.70, p.87-104, 1999. __________.; RAYNER, K. Making and correcting errors during sentence comprehension; Eye movements in the analysis of structurally ambiguous sentences. Cognitive Psychology, v.14, p.178-210, 1982. FROMKIN, V.A. Speech errors as linguistic evidence. Mouton: The Hague, 1973. __________. The non-anomalous of anomalous utterances. Language, v.47, p. 2752, 1971. GARMAN, Michael. Psycholinguistics. Cambridge, New York: Cambridge university Press, 1990. GARRETT, M. F. Processes in language production. In: NEWMEYER, F.J. (Ed.). Linguistics: The Cambridge survey: III. Language: Psychological and biological aspects. Cambridge: Cambridge University Press, 1998. p. 69-96. __________. Levels of processing in sentence production. In. B. BUTTERWORTH (Ed.). Language Production, v.1, Orlando, FL: Academic Press, 1980. __________. The analysis of sentence production. In: G. BOWER (Ed.). Psychology of learning and motivation, v.9, New York: Academic Press, 1975. GERNSBACHER, Morton Ann (Ed.). Handbook of Psycholinguistics. London: Academic Press, 1994. GIRBAU, Núria Martí. Partitives: one or two nouns? Apresentação no XXIX Encontro de Gramática Gerativa, Urbino, 13/02 a 15/02 de 2003. Disponível em : <http://seneca.uab.es/ggt/Reports/IGG2003paper.pdf > GORELL, P. Syntax and parsing. New York; Cambridge University Press, 1995. GREENE, J.; D´OLIVEIRA, M. Learning to use statistical tests in psychology. 2a ed. Buckingham/Philadelphia: Open University Press, 1999. GRETH, Delia. How many cows are there in a herd? A look at notional number in Spanish subject-verb agreement. Proceedings of VEXTAL 99. Venezia, San Servolo, V.I.U, 1999. GUASTI, M. T.; L. RIZZI. Agreement and tense as distinctive syntactic positions. Evidence from acquisition. In: G. CINQUE. Functional structure in DP and IP: The Cartography of Syntactic Structures. New York: Oxford University Press, 2002. p.167-194. 191 HALLE, M.; MARANTZ, A. Distributed Morphology and the Pieces of Inflection. In: HALE, K.; KEYSER, J. (Eds.). The View from Building 20. Cambridge, Mass.: MIT Press, 1993. p. 111-176. HARLEY, H.; NOYES, R. Distributed Morphology. Glot international, v.1,n.1, p.3-9, 1999. HARLEY, Trevor A. The Psychology of Language: from data to theory. UK: Psychology Press, 1997. HARTSUIKER, R. J.; SCHRIEFERS, H., BOCK, J. K.; KINSTRA. Morphophonological influences on the construction of subject-verb agreement. Memory and Cognition, v.31, n.8, p.1316-1326, 2003. HASKELL, T. R.; MACDONALD, M.C. Conflicting cues and competition in subject-verb agreement. Journal of Memory and Language, v. 48, p. 760-778, 2003. HAUSER, Marc; CHOMSKY, Noam; FITCH, W. Tecumseh. The faculty of language: what is it, who has it, and how did it evolve? Science, v.298, p. 15691579, 2002. HORNSTEIN, N.; NUNES, J.; GROHMANN, K. Understanding minimalism. Cambridge: Cambridge University Press, 2005. __________.; ROSEN, S.; URIAGEREKA, J. Integrals. In: J. NUNES; E. THOMPSON; VARLOKOSTOVA (Eds.). University of Maryland Working Paper in Linguistics 2, College Park: Department of Linguistics. 1994. p. 70-90. JACKENDOFF, R.S. Semantic structures. Cambridge, Mass: MIT Press, 1990. __________. The status of thematic relations in linguistic theory. Linguistic Inquiry, v.18, p.369-412, 1987. __________. X’ Syntax: A study of phrase structure. Cambridge, Mass.: MIT Press, 1977. __________. Semantic interpretation in generative grammar. Cambridge, Mass: MIT Press, 1972 JAKOBSON, R. Shifters, verbal categories and the Russian verb. Selected Writings II: Word and Language, The Hague: Mouton, p.130-147, 1957, impressão em 1971. JESPERSEN, Otto. The Philosophy of Grammar. London: George Allen & Unwind, 1924. JOSHI, A.K.; LEVY, L; TAKAHASHI, M. Tree Adjunct Grammars. Journal of the Computer and System Sciencies, v. 10, p. 136-163, 1975. 192 __________. How much context-sensitivity is required to provide reasonable structural descriptions: Tree adjoining grammars. IN: DOWTY, D; KARTUNNEN, L; ZWICKY, A (Eds.). Natural Language Parsing: Psychological, Computational, and Theoretical Perspectives. Cambridge: Cambridge University Press, 1985. KAAN, E. Investigating the effects of distance and number interference in processing subject-verb dependencies: an ERP study. Journal of Psycholinguistic Research, v. 31, n. 2, p.165-193, 2002. KATO, M. A. Recontando a história das relativas. In: ROBERTS, I.; M. A. KATO (Orgs.). Campinas: Editora da UNICAMP, 1993. __________.; NUNES, J. Adjunction configurations and structural ambiguity. Ms, 1998. KAYNE, Richard S. The Antisynmetry of Syntax. Cambridge, Mass.: MIT Press, 1994. KEMPEN, G.; HOENKAMP, E. An incremental procedural grammar for sentence formulation. Cognitive Science, v. 11, p. 201-258, 1987. __________.; HUIJBERS, P. The lexicalization process in sentence production and naming: indirect election of words. Cognition, v.14, p.185-209, 1983. __________.; VOSSE, T. Incremental syntactic tree formation in human sentence processing: A cognitive architecture base don activation decay and simulated annealing. Connection science, v.3, p.273-289, 1989. KENNISON, S. M. Comprehending noun phrase arguments and adjuncts. Journal of Psycholinguistic Research, v. 31, n. 1, 2002. KIMBALL, J. Seven principles of surface structure parsing in natural language. Cognition, v. 2, p.15-47, 1973. KINTSCH, W. The representation of meaning in memory. Hillsdale, NJ: Erlbaum, 1974. KISS, K. Identificacional focus versus information focus. Language, v.74, n.2, p.245-273, 1998. LEVELT, W. J. M. Speaking: From Intention to Articulation. Cambridge, Mass: MIT Press, 1989. __________. Monitoring and self-repair in speech. Cognition, v.14, p.41-104, 1983. __________.; ROELOFS, A.; MEYER, A. S. A theory of lexical access in speech production. Behavioral and Brain Sciences, v. 22, p. 1- 75, 1999. 193 LIMA, C. H. da R. Gramática normativa da língua portuguesa. 27a ed. Rio de Janeiro: José Olympio, 1986. LINDSLEY, J.R. Producing simple utterances: How far ahead do we plan? Cognitive Psychology, v.7, p. 1-19, 1975. LOPES-ROSSI, M.A. Proposta de análise das construções clivadas no português, Ms, UNICAMP, 1994 MACDONALD, M. C.; PEARLMUTTER, N. J.; SEIDENBERG, M. S. The Lexical nature of syntactic ambiguity resolution. Psychological Review, v.101, n.4, p.676-703, 1994. MAGALHÃES, T. A valoração de traços de concordância dentro do DP. DELTA, v. 20, n. 1, p. 149-170, 2004. MAIA, M.; FINGER, I. Processamento da Linguagem. Pelotas: EDUCAT, 2005. __________.; ALCANTÂRA, S.; BUARQUE, S.; FARIA, F. O Processamento de concatenações sintáticas em três tipos de estruturas frasais ambíguas em português. In: MAIA, M.; FINGER, I. Processamento da Linguagem. Pelotas: EDUCAT, 2005. p. 223-261. __________.;FINGER, I. Efeitos de referencialidade e de domínio temático na compreensão de orações relativas curtas e longas em português. Trabalho apresentado no GT de Psicolingüística da Anpoll, 2003. MARANTZ, A. No Scape from Syntax: Don’t try morphological analysis in the privacy of your own lexicon. U. Penn. Working Papers in Linguistics. v. 4, n.2, p.202-225, 1997. MARCUS, M. P. A Theory of Syntactic Recognition for Natural Language. Cambridge,Mass.: MIT Press, 1980. MATTHEWS, A.; CHODOROW, M.S. Pronoun resolution in two-clause sentences: effect of ambiguity, antecedent location and depth of embedding. Journal of Memory and Language, v.27, p.245-260, 1988. MATTHEWS, P. H. Oxford concise dictionary of Linguistics. Oxford/ New York: Oxford University Press, 1997. MEHLER, J. The role of syllables in speech processing: Infant and adult data. Philosophical Transactions of the Royal Society, London, p.333-352, 1981. MEYER, A.S. Lexical access in phrase and sentence production: Results from picture-word interference experiments. Journal of Memory & Language, v.35, p. 477-496, 1996. 194 MILLER G. A. & MCKEAN, K.O. Chronometric study of some relations between sentences. Quartely Journal of Experimental Psychology, v.16, p.297308, 1964. MIOTO, C.; NEGRÃO, E. V. As sentenças clivadas não contêm uma relativa. Texto apresentado no Encontro do GT de Teoria da Gramática, realizado na USP, 2003. MORSELLA, E.; MIOZZO, M. Evidence for a cascade model of lexical access in speech production. Journal of Experimental Psychology: Learning Memory and Cognition, v.28 n.3, p.555-563, 2002 NAKANISHI, Kimiko; ROMERO, Maribel. Two constructions with Most and their semantic properties. In: The Proceedings of the 34rd Conference of the North East Linguistic Society, 2004. NEGRÃO, E. V. As relações entre sintaxe e semântica. Texto apresentado no GT de Teoria da Gramática, no XIX ENANPOLL (Encontro da Associação Nacional de Pós-graduação e Pesquisa em Letras e Lingüística), realizado em Maceió-AL, 2004. NUNES, Jairo; URIAGEREKA Juan. Cyclicity and Extraction Domains. Syntax, v.3, n.1, p.20-43, 2000. PEARLMUTTER, N. J. Linear versus Hierarchical Agreement Feature Processing in Comprehension. Journal of Psycholinguistic Research, v. 29, n. 1, p. 89-98, 2000. PERES, J. A. ; MÓIA, T. Áreas Críticas da língua Portuguesa. Lisboa: Editorial Caminho, 1995. PHILLIPS, C. Linear order and constituency. Linguistic Inquiry, v.34, p.37-90, 2003. __________. Linguistics and linking problems. In: M. RICE; W. WARREN (Orgs.). Developmental Language Disorders: From Phenotypes to Etiologies. Mahwah, N.J.: Lawrence Erlbaum, 2003. __________. Order and Structures. Tese de Doutorado, Cambridge, Mass: MIT Press, 1996. PICALLO, C. Nominals and nominalization in Catalan. Probus, v.3, n.3, p.279316. POLLOCK, Jean-Yves. Verb movement, universal grammar and the structure of IP. Linguistic Inquiry, v.20,1989. POSTMA, Albert. Detection of errors during speech production: a reviem of speech monitoring models. Cognition, v.77, p.97-131, 2000. 195 REID, W. Verb and noum number in English. London; Longman, 1991. RITTER, E. Where’s gender? Linguistic Inquiry, v.24, p. 795-803, 1993. __________. Evidence for number as a nominal head. In: GLOW Newletter. Paper presented at GLOW-14, 1991. RODRIGUES, E. dos S.; CORRÊA, L.M.S. Linear and hierarchical hypotheses reconciled: grammatical formulation and ongoing parsing in the production of subject-verb agreement errors. In: The 17th Annual CUNY Conference on Human Sentence Processing, p.80, 2004 SAAB, Andrés L. Concordancia ad sensum y elipsis nominal en español. Revista de Lingüística y Literatura: Universidad Nacional del Comahue, no prelo. __________. On Morphological Sloppy Identity in Spanish Nominal Ellipsis. In: Andrés SALANOVA; Cristina SHMITT (Eds.). MITWPL: Proceedings of EVELIN ‘04. Cambridge, Mass: MIT Press, no prelo. __________. Epítetos Y elipsis nominal. RASAL v.1, p.31-51, 2004. SAID, Ali M. Gramática histórica da língua portuguesa. 8º Ed.rev. e atual por Mário Eduardo Viaro, São Paulo: Companhia Melhoramentos: Brasília, DF: Editora Universidade de Brasília, 2001. SCHERER, Martine. Uma questão de vocabulário: considerações sobre o campo lexical no ensino de português para estrangeiros. Dissertação de mestrado Pontifícia Universidade Católica do Rio de Janeiro, 2002. SCHERRE, M. M. P. Uma reflexão sociolingüística sobre o conceito de erro. In: BAGNO, Marcos (org.). Lingüística da Norma. São Paulo: Loyola, 2002. __________. Reanálise da concordância nominal em português. Tese de Doutorado. Rio de Janeiro, FL/UFRJ. 554p. mimeo, 1998. __________.; NARO, A. J. A hierarquização do controle da concordância no português moderno e medieval: o caso de estruturas sujeito simples. In: GROBE, Sybille; ZIMMERMANN, Klaus. (Eds.). O português brasileiro: pesquisas e projetos. TFM: Frankfurt am Main, v.17, 2000. p. 135-165. __________.; NARO, A. J. Restrições sintáticas e semânticas no controle da concordância verbal em português. Fórum Lingüístico, v. 1, p. 45-71, 1998. SCHÜTZE, C. T.; GIBSON, E. Argumenthood and English Prepositional Phrase Attachment. Journal of Memory and Language, v. 40, p. 409-431, 1999. SELKIRK, E.O. Some remarks on noun phrase struture. In: AKMAJIAN, A.; CULICOVER, P.; WASOW, T. (Eds.). MSSB-UC Irvine Conferene on the Formal Syntax of natural Language. p.285,316, 1977. 196 SMYTH, R.; NICOLAU, L. Markedness or Overtness? Agreement Errors in Romanian and English. Poster apresentado no 13th CUNY Conference on human sentence processing, CA: La Jolla, 2000. SOLOMON, E. S.; PEARLMUTTER, N. J. Semantic integration and syntactic planning in language production. Cognitive Psychology, v.49, p. 1-46, 2004. SPEER, S. R.; CLIFTON, C. Jr. Plausibility and argument structure in sentence comprehension. Memory & Cognition, v. 26, n. 5, p. 965-978, 1998. STEMBERGER, J.P. An interactivew activation model of language production. In: A.W. ELLIS (Ed.). Progress in the psychology of language production.v.1,Hillsdale, New Jersey: Lawrence Erlbaum, 1985. STICKNEY, Helen. The pseudo partitive and its illusory projections. Ms, UMASS. 2004. Disponível em: <http://people.umass.edu/hstickne/index_files/StickneyPsp3_Dec_2004.pdf > SZABOLCSI, A. Strategies for Scope Taking. In: SZABOLCSI, A. (Ed.). Ways of scope taking. Dordrecht: Kluwer, 1997. THORNTON, R.; MACDONALD, M.C. Plausibility and grammatical agreement. Journal of Memory and Language, v. 48, p. 740-759, 2003. URIAGEREKA, J. From Being to Having. In: J. C. CASTILLO, V. MIGLIO; J. MUSOLINO (Eds.). University of Maryland Working Paper in Linguistics, v.4. College Park: Department of Linguistics, 1996. p.152-172. Van DIJIK, T.; KINTCH, W. Strategies of discourse comprehension. New York: Academic Press, 1983. VANGNES, O.A. Substantivos portugueses não flexionam em gênero. Palavra, n.12, p.193-209, 2004. VENDLER, Z. Linguistics in phylosophy. Ithaca/London: Cornell University Press, 1967. VIGLIOCCO, G.; FRANK, J.; ANTÓN-MENDEZ, I.; COLINA, S. Syntax and form in language production: an investigation of gender agreement in romance languages, no prelo. __________.; HARTSUIKER, R. J. The interplay of meaning, sound and syntax in sentence production. Psychological Bulletin, v. 128, n. 3, p. 442-472, 2002. __________.; NICOL, J. Separating hierarchical relations and word order in language production: Is proximity concord syntactic or linear? Cognition, v. 68, B13-B29, 1998. 197 __________.; BUTTERWORTH, B.; GARRETT, M. Subject-verb agreement in Spanish and English: Differences in the role of conceptual constraints. Cognition, v. 61, p. 261-298, 1996. __________.; HARTSUIKER, R.J.; JAREMA, G.; KOLK, H.J. One or More Labels on the Bottles? Notional Concord in Dutch and French. Language and cognitive processes, v.11, p.407-442, 1996. __________.; _________.; SEMENZA. Constructing Subject-Verb Agreement in Speech: The Role of Semantic and Morphological Factors. Journal of Memory and Language, v. 34, p. 186-215, 1995. ZAMPARELLI, Roberto. Layers in the Determiner Phrase. Tese de doutorado, University of Rochester (hypertext version), 1995. WANNER, E. & MARATSOS, M. An ATN approach to comprehension. EmM. Halle, J. Bresnan & G. A. Miller. (Orgs) Linguistic Theory and Psychological Reality. Cambridge, Mass.: MIT Press, 1978. WEINBERG, Amy. Modularity in the Syntactic Processor. In: GARFIELD, Jay. (Ed.). Modularity in Knowledge Representation and Natural Language Understanding. Cambridge, Mass: MIT Press, 1987. p. 259-276. 198 12 Apêndice - FRASES E PREÂMBULOS EXPERIMENTAIS Experimento de julgamento de gramaticalidade Construção partitiva + verbo no singular A maioria dos livros da estante queimou. A maioria dos quadros da galeria empenou. Uma parte das plantas do jardim brotou. Uma parte dos carnes da escola extraviou. Construção partitiva + verbo no plural A maioria das roupas da lavanderia mancharam. A maioria das cadeiras da sala desmontaram. Uma parte dos alimentos da geladeira estragaram. Uma parte das árvores da escola morreram. DP complexo não-quantitativo + verbo no singular: A pasta dos documentos do escritório rasgou. O baú dos brinquedos da creche quebrou. A maleta das ferramentas da oficina enferrujou. O isopor das bebidas da festa virou. DP complexo não-quantitativo + verbo no plural: O álbum das fotos do casamento sumiram. A caixa dos remédios da enfermaria desapareceram. O armário das panelas do restaurante caíram. O cesto dos brindes do aniversário desarmaram. Experimentos de produção induzida de erros Experimento 1- distância linear sujeito-verbo e tipo de modificador PP/ Distância linear curta 1 O diretor arrogante dos funcionários (voltar) 2 O treinador experiente dos atletas (criar) 3 O empresário competente dos jogadores (lembrar) 4 O advogado desonesto dos banqueiros (comprar) Oração/Distância linear curta 5 O jornalista que falou dos empresários (chegar) 6 O assaltante que escapou dos policiais (entrar) 7 O enfermeiro que cuidou dos acidentados (tirar) 8 O síndico que suspeitou dos faxineiros (chamar) 199 PP/ Distância linear longa 9 O gerente honesto dos chefes de seção (ganhar) 10 O instrutor calmo dos pilotos de avião (usar)11 O chefe novo dos locutores de rádio (pensar) 12 O cliente antigo dos agentes de viagem (pagar)Oração/Distância linear longa 13 O aluno que riu dos professores de história (falar) 14 O engenheiro que zombou dos mestres de obra (mandar) 15 O ator que discordou dos críticos de teatro (parar) 16 O ciclista que fugiu dos guardas de trânsito (morar) Experimento 2 – posição linear vs. posição hierárquica do núcleo interveniente/ número dos NPs Grupo 1 - N1singular N2sing N3sing 1. A lenda sobre o mapa do tesouro PUBAR 2. A tinta do cartucho da impressora TEBAR 3. A sacola com a roupa do casamento BOPAR N2sing N3pl 4. O relatório sobre o custo das obras DEGAR 5. A chave do cofre dos documentos BETAR 6. A pasta com o questionário das turmas MOCAR N2pl N3pl 7. O artigo sobre as dívidas dos estados VOMAR 8. A fábrica das grades das janelas LUPAR 9. A gaveta com os cheques das empresas VECAR N2spl N3sing 10. O filme sobre as favelas do bairro RIGAR 11. A propaganda dos produtos da loja FUVAR 12. A bandeja com as bebidas da festa RUPAR Grupo 2 - N1 plural N2pl N3pl 1. As fotos sobre as enchentes das cidades PUBAR 2. As maçanetas das portas dos carros TEBAR 3. Os arquivos com as provas do concursos BOPAR N2pl N3sing 4. Os anúncios sobre as ofertas da loja DEGAR 5. Os preços dos pratos do restaurante BETAR 6. As caixas com os convites do aniversário MOCAR 200 N2sing N3sing 7. Os panfletos sobre a festa da igreja VOMAR 8. As cortinas do palco do teatro LUPAR 9. As garrafas com o refresco do lanche VECAR N2sing N3pl 10. Os boatos sobre a fraude das urnas RIGAR 11. As prateleiras do armário dos sapatos FUVAR 12. As fichas com o resultado das vendas RUPAR Experimento 3 – status argumental do PP modificador PP argumento O cancelamento de consultas médicas O rompimento de contratos antigos A recuperação de dados bancários A restauração de quadros valiosos A compra de medicamentos genéricos O consumo de alimentos estragados PP adjunto A blusa de desenhos engraçados O álbum de páginas amareladas A janela de grades enferrujadas O apartamento de cômodos pequenos O parque de cachoeiras naturais A casa de muros eletrificados Experimento 4 – distributividade e marcação morfofonológica Sujeito distributivo, DP local singular, nome local flexionável : O trinco de cada porta A tampa de cada pote O teto de cada casa O colchão de cada cama Sujeito distributivo, DP local singular, nome local invariante: A roda de cada ônibus A capa de cada Atlas A luz de cada cais A forma de cada vírus 201 Sujeito distributivo, DP local plural, nome local flexionável: A maçaneta das portas A tampa das garrafas O telhado das casas O encosto das cadeiras Sujeito distributivo, DP local plural, nome local invariante: O volante dos ônibus A legenda dos Atlas A plataforma dos cais O tamanho dos vírus Sujeito não-distributivo, DP local singular, nome local flexionável : A lata do biscoito O armário do sapato A pasta do documento A caixa da ferramenta Sujeito não-distributivo, DP local singular, nome local invariante: A prateleira do pires O estojo do lápis A região do oásis A vitrine do tênis Sujeito não-distributivo, DP local plural, nome local flexionável: A lata dos biscoitos O armário dos sapatos A pasta dos documentos A caixa das ferramentas Sujeito não-distributivo, DP local plural, nome local invariante: A prateleira dos pires O estojo dos lápis A região dos oásis A vitrine dos tênis Experimento 5 – distributividade Grupo 1 – DP distributivo O volante dos carros de corrida A grama dos campos de futebol A caçamba dos caminhões de lixo A sola dos sapatos de camurça O tecido das roupas de mergulho A tampa das panelas de pressão A capa dos livros de matemática O encosto das cadeiras de balanço 202 O tecido das barracas de praia O rótulo das garrafas de suco O cadeado das malas de viagem A agulha das máquinas de costura A maçaneta das portas de madeira O telhado das casas de veraneio A cabeceira das camas de casal A alça das xícaras de porcelana Grupo 2 – DP não-distributivo A lata dos biscoitos de polvilho A vitrine dos vestidos de noiva A prateleira dos livros de história O armário das louças de porcelana A gaveta dos talheres de prata O baú dos brinquedos de madeira O depósito das armas de fogo A seção dos produtos de limpeza A loja dos doces de chocolate A sala dos estofados de couro A bandeja dos sanduíches de queijo O vestiário dos armários de metal O cinema das cadeiras de veludo O palácio dos lustres de cristal A rua das lojas de decoração A sacola dos brindes de aniversário 203 BANCA EXAMINADORA Professora Doutora Letícia Maria Sicuro Corrêa (PUC-Rio) – orientadora Professor Doutor Jairo Morais Nunes (USP-SP) – co-orientador Professora Doutora Eneida do Rego M. Bomfim (PUC-Rio) Professor Doutora Margarida Maria de Paula Basílio (PUC-Rio) Professor Doutor Marcus Antônio Rezende Maia (UFRJ) Professora Doutora Mary Aizawa Kato (UNICAMP-SP) Professor Doutor Humberto Peixoto Menezes (UFRJ) – suplente Professora Doutora Marina Rosa Ana Augusto (PUC-Rio/ LAPAL)- suplente