Projeto Temático A LÍNGUA PORTUGUESA NO TEMPO E NO ESPAÇO: contato linguístico, gramáticas em competição e mudança paramétrica Resumo: Este projeto visa a revisitar a história do português do século XV ao século XXI, em Portugal e no eixo Brasil-África, dentro de uma abordagem comparativa baseada na noção de parâmetros, tal como é formulada na Teoria de Princípios e Parâmetros de Chomsky (1985, 2008), em particular nos seus últimos desdobramentos no quadro do Programa Minimalista. Para atingir esse objetivo, pretende-se usar os textos anotados disponíveis no Corpus Tycho Brahe, nos quais é possível fazer buscas automáticas de construções sintáticas. Faz parte deste projeto alargar a base de textos sintaticamente anotados para 1.500.000 palavras em textos portugueses, 600.000 palavras em textos brasileiros, e 150.000 palavras em documentos africanos, além de elaborar um analisador sintático automático (parser) para o português. 1 I. Apresentação do problema O português é uma língua que oferece um terreno particularmente fértil para os estudos históricos, uma vez que a sua história se desenvolve em três continentes e mostra, em seus desdobramentos recentes, mudanças de diversos tipos. As variedades do português que vêm emergindo em países como Angola e Moçambique, por exemplo, representam um caso de evolução linguística que não se dá a partir de uma única fonte (como nas representações encontradas no modelo clássico em árvore), mas são produzidas pelo encontro de diferentes línguas, por meio do processo de aquisição do português como L2 por falantes nativos de línguas níger-congo. Considerando os milhões de africanos (em sua maioria, falantes nativos de línguas bantas) trazidos como escravos para o Brasil entre os séculos XVI e XIX, o cenário linguístico que hoje observamos nos referidos países africanos deve guardar semelhanças significativas com o que marcou a emergência de variedades do português brasileiro. Isso justifica, em grande medida, a afirmação feita em Petter (2009), de acordo com quem “são tantas as semelhanças compartilhadas pelas três variedades de português [brasileira, angolana e moçambicana] nos três níveis de organização linguística selecionados (fonológico, lexical e morfossintático) que fica difícil defender que tais fatos sejam casuais, resultantes de uma deriva natural do português ou decorrentes da manutenção de formas antigas do português europeu” (pp. 171-172). Semelhanças como as observadas por Petter podem, nesse sentido, resultar do fato de que, tanto no Brasil como na África, em diversos momentos do séc. XV ao séc. XXI, variantes do português foram adquiridas por falantes de línguas africanas e depois transmitidas para as gerações subsequentes, dando origem a outras variedades que se afastaram, em muitos aspectos, do que hoje chamamos de português europeu. Paralelamente à formação dessas variedades, segmentos da sociedade de origem europeia continuaram a veicular a língua portuguesa nas duas regiões, na sua forma transmitida regularmente via aquisição de primeira língua. Em Portugal, nesse mesmo decorrer de tempo, a língua escrita, já afastada dos padrões medievais do galego-português inicial, passa por uma fase de fixação ao longo dos séculos XVI e XVII. Em seguida, nos autores nascidos no primeiro quarto do século XVIII, observamos uma nova mudança, refletida em numerosos aspectos gramaticais. É a emergência do português europeu moderno, tal como o conhecemos hoje. A história do português em Portugal e fora de Portugal oferece assim dois conjuntos de mudanças gramaticais que parecem estar radicadas em causas bem distintas, a saber: 1) um conjunto que abarca mudancas cujas causas parecem ser exógenas, com uma forte história de contato linguístico na base de alterações que contribuíram para afastar as variedades 2 brasileiras e africanas da língua daquelas faladas em Portugal, configurando um caso, senão de crioulização, pelo menos de reestruturação parcial (Baxter, 2002; Holm, 2004; Lucchesi et al., 2009) 2) um conjunto que abarca mudanças cujas causas parecem ser endógenas, uma vez que, pelo menos aparentemente, nenhum fenômeno externo de contato ou de substituição de um dialeto por outro está na base das modificações observadas. Esses dois tipos de mudança abrem espaço para refinar a teoria de parâmetros tal como vem se desenvolvendo recentemente no quadro do modelo minimalista da teoria gerativa (cf. Baker, 2008; Biberauer et al., 2010). Com efeito, o primeiro conjunto de mudanças afeta a língua num sentido “macroparamétrico” (ver a seção III.2), e pode ser caracterizado por abarcar mudanças que remetem a alterações de base tipológica, uma vez que o PB adquiriu feições que são bastante incomuns no conjunto das línguas indo-europeias (a presença de propriedades largamente encontradas em línguas orientadas ao discurso, por exemplo, pode ser um reflexo dessas alterações (cf. Pontes, 1987)). No segundo caso, encontramos uma mudança bastante frequente na história das línguas românicas e germânicas, que afeta a posição do verbo na oração finita: a perda do fenômeno V2. Essa mudança, por sua vez, remete a diferenças de natureza ‘microparamétrica’, uma vez que diz respeito à modificação dos traços associados a determinadas categorias funcionais. Um quadro interessante para discutir essa diferença surge de trabalhos como os de Roberts (2010, a sair). Esse autor desenvolve um modelo no qual os parâmetros são organizados hierarquicamente em árvores, cujo topo expressa diferenças tipológicas ou macroparamétricas (ver seção III.2), enquanto a base caracteriza diferenças cada vez mais localizadas, ou microparamétricas. Os dois referidos conjuntos de mudança possibilitam, além do mais, trabalhar com a questão de como as dinâmicas de mudança se projetam nos textos, o que nos leva a indagar sobre o encadeamento de fenômenos de vários tipos, bem como sobre a evolução desses fenômenos em termos espaciais e temporais e a datação da origem de cada um deles. A história da língua portuguesa é rica em dados capazes de sustentar empiricamente, e refinar conceitualmente, uma noção que mudou nosso olhar para a dinâmica da mudança nos textos: a noção de competição de gramáticas, proposta por Anthony Kroch (Kroch, 1994, 2001). Em Portugal, dois momentos fornecem elementos indicativos de forte competição gramatical nos textos. São eles o séc. XV, período tradicionalmente chamado de “português médio” (Cardeira, 2005; Castro, 2006), que vê a tensão entre a gramática do galego-português e a gramática do português clássico, e o séc. XVIII, durante o qual vai se impondo a gramática moderna (Galves et al., 2005, 2006; Paixão de Sousa, 2004). No Brasil, os documentos escritos no séc. XIX fornecem uma ilustração espetacular da competição de gramáticas. Carneiro (2005) e Carneiro & Galves (2010) mostram que, nos 3 documentos por elas analisados, não são duas, mas três as gramáticas em presença, uma vez que, ao lado do reflexo da emergência do português brasileiro, observamos também o reflexo da mudança em Portugal, com 100 anos de atraso em relação às gerações portuguesas. O trabalho de Martins (2010) mostra o mesmo fenômeno em peças de teatro escritas nos séculos XIX e XX em Santa Catarina. Avelar (2005) também observa um caso de competição de gramáticas na manifestação de propriedades das construções possessivo-existenciais em textos brasileiros dos séculos XIX e XX, nos quais a substituição de haver por ter é marcada pela sobreposição de marcas gramaticais do português brasileiro e do português europeu. O português da África oferece um novo e vasto território para o trabalho em torno da noção de competição de gramáticas, com a presença ainda viva das línguas africanas. Lá, claramente, é possível flagrar o desencadeamento de uma série de mudanças que poderão ou não se consolidar nas variedades linguísticas em emergência. Trabalhos como os de Figueiredo (2010), Gonçalves (2010), Inverno (2011), e Jon-And (2011) que abordam aspectos resultantes da aquisição de português como língua segunda por falantes de línguas bantas ou crioulas, trazem novas luzes para a compreensão das mudanças gramaticais induzidas por contato. O cenário atual para a aquisição e difusão do português em Angola, Moçambique, ou Guiné-Bissau é, nesse sentido, um profícuo laboratório para a verificação da validade de hipóteses atreladas à noção de competição de gramáticas, uma vez que, paralelamente à emergência de novas variedades linguísticas, o português europeu padrão continua a ser veiculado em diferentes esferas da vida social e cultural desses países. Adicionalmente, surge a questão de saber qual é o estatuto das gramáticas envolvidas em cada caso de competição, a saber: os estados de língua encontrados nos textos correspondem, em todos os casos, a variedades vernáculas (ou seja, a gramáticas efetivamente adquiridas como línguas maternas) ou podem ser variedades representativas de um dialeto essencialmente literário? Recentemente, Ana Maria Martins (Martins, 2011) lançou o debate para o português europeu, argumentando em favor da existência de duas gramáticas distintas do português coexistindo na época: "A gramática proclítica, a que poderíamos chamar "pan-ibérica", era a das classes social e culturalmente dominantes (tipicamente, alfabetizadas e produtoras de escrita), a gramática mais especificamente portuguesa era a das classes populares (tipicamente, não alfabetizadas e com acesso muito limitado à produção escrita). São fatores socioculturais os que determinam que no português quinhentista (e também quatrocentista e seiscentista) seja extremamente reduzida a visibilidade da gramática em que a ênclise se terá mantido estável ao longo do tempo." Desse ponto de vista, não haveria, no séc. 18, propriamente uma mudança para uma nova gramática, mas o reaparecimento do vernáculo nos textos,. Essa tese questiona as análises baseadas no Corpus Tycho Brahe (Galves, Britto & Paixão de Sousa, 2005; Galves, Namiuti & Paixão de Sousa, 2006; e os trabalhos subsequentes), que, sem menosprezar a questão do contato com o castelhano (cf. Paixão 4 de Sousa, 2004), argumentam em favor da existência, nos textos clássicos, de uma gramática subjacente ao vernáculo, distinta tanto da gramática antiga como da gramática moderna. Frente a esse conjunto de questões que envolvem as noções de mudança paramétrica e competição de gramáticas, em adição às considerações sobre contato linguístico, o presente projeto tem como questão central a natureza da relação entre as diversas vertentes da língua portuguesa, tanto na diacronia como na sincronia. Na diacronia, se discute a filiação entre um estado de língua e outro. Examinaremos criticamente, tanto de um ponto de vista teórico quanto empírico, a noção de deriva, muito recorrente na tradição dos estudos do português brasileiro (cf. Silva Neto, 1950) e recentemente enfaticamente retomada por Anthony Naro e Marta Scherre (cf. Naro e Scherre, 2007), ao mesmo tempo em que levaremos em conta o papel das dinâmicas de contato interlinguístico na formação de variedades brasileiras e africanas do português. Da perspectiva sincrônica, é preciso integrar aos modelos propostos o papel do contato interno à própria língua portuguesa, ou seja, o contato das suas diversas variantes, e o efeito desse contato na dinâmica da língua (cf., por exemplo, o processo de convergência da língua popular e da língua culta na história do português brasileiro, enfatizado por Dante Lucchesi (cf. Lucchesi, 2003 e Lucchesi et al., 2009). Essas diversas questões não podem ser enfrentadas sem uma base empírica extensa e confiável. Dispomos do Corpus Tycho Brahe, elaborado em projetos anteriores. É preciso estendê-lo e diversificar a tipologia dos textos, não somente no que diz respeito à sua procedência geográfica, mas a seus gêneros e às suas condições de produção, incluindo, inclusive, dados de fala dos séculos XX e XXI. É preciso também ampliar a anotação sintática, imprescindível para a recuperação rápida e consistente de dados, bem como continuar a desenvolver ferramentas computacionais que são essenciais para as tarefas de construção e utilização de grandes corpora. II. Resultados esperados - Equiparação do Corpus Tycho Brahe aos grandes corpora sintaticamente anotados do inglês e do francês, com a ampliação da anotação sintática a 2 milhões de palavras e a inclusão de textos de gêneros mais diversificados, inclusive textos não literários, produzidos em Portugal, no Brasil e na África; - Anotação sintática de textos orais representativos de variedades do português brasileiro e do português africano dos séculos XX e XXI, na linha do que já vem sendo desenvolvido pelo CordialSIN, com a utilização de ferramentas computacionais do Tycho Brahe; - Produção de um analisador sintático (parser) automático para o português; - Criação de novas ferramentas estatísticas para extrair informações sobre a mudança sintática e fonológica nos textos; 5 - Emergência de uma nova geração de pesquisadores em linguística histórica, capazes de articular teoria linguística com trabalho filológico, de usar métodos computacionais modernos e de operar com ferramentas estatísticas; - O reforço das redes de pesquisadores, dentro do Brasil, e no eixo Brasil-Portugal-África, visando a articular o trabalho filológico (edição de documentos) e o trabalho de análise; - Publicação de um livro pela Oxford University Press, na nova coleção Series in Diachronic and Historical Syntax, propondo uma história do português revisitada, baseada na descrição e análise da gramática instanciada nos textos dos sécs. XV a XVII e de sua evolução para o português europeu moderno e para o português brasileiro; - Um ou mais livros sobre a formação do português brasileiro (editoras ainda não definidas), elaborados em parceria com grupos brasileiros envolvidos na edição, descrição e análise de documentos produzidos no Brasil ao longo de sua história; - Um novo manual de história do português, que privilegie uma abordagem integrada da história da língua em Portugal, no Brasil e na África, visando a um público mais largo de alunos de graduação e professores de português no nível secundário; - Artigos em revistas internacionais e comunicações em congressos baseados no uso de dados sincrônicos e diacrônicos da história do português, visando à elaboração conjunta com outros grupos de pesquisa de um modelo formal de mudança associado ao modelo de árvores paramétricas. III. Detalhamento do projeto O projeto será desenvolvido em torno de três frentes de trabalho, a saber: - Descrição comparativa de fenômenos sintáticos do português ao longo de sua história (do século XV ao século XXI) - Análise das dinâmicas da mudança à luz de modelos paramétricos - Ampliação e consolidação do Corpus Tycho Brahe Cada uma dessas frentes será apresentada a seguir, focalizando-se o estado da arte e as novas etapas que nos propomos a percorrer. III.1 A descrição sincrônica das gramáticas envolvidas III.1.0 As gramáticas na história do português 6 Ao longo da sua história, o português apresenta fenômenos sintáticos constitutivos de suas diversas gramáticas, fenômenos esses de grande interesse tanto do ponto de vista sincrônico-comparativo quanto do ponto de vista diacrônico da dinâmica da mudança. Nesta seção, apresentamos os fenômenos que serão estudados neste projeto numa ótica comparativa, bem como as questões que eles levantam para a teoria sintática. Esta parte do projeto, além do seu interesse intrínseco para a história do português e para a teoria gramatical, constitui a base indispensável da parte seguinte, sobre a dinâmica da mudança (cf. III.2). O conceito central comum a essas duas partes é o de parâmetro, uma vez que, além da descrição e análise dos fenômenos, se procura entender as gramáticas subjacentes aos sucessivos e paralelos estados linguísticos representados nos corpora históricos. Na teoria de Princípios e Parâmetros, essas gramáticas são definidas pela fixação de um certo número de parâmetros. Note-se que os trabalhos desenvolvidos nos projetos anteriores sustentaram a hipótese de que a história do português europeu pode ser dividida em três fases, correspondendo a três gramáticas distintas (cf. Galves, Namiuti & Paixão de Sousa 2006; Galves (2012)). Desse ponto de vista, o português clássico apresenta uma gramática própria, distinta tanto da gramática do português antigo quanto da do português moderno. Articulando nossos resultados com trabalhos sobre o português médio (cf. Cardeira, 2005), podemos afirmar que a gramática do português clássico tem seu início no período quatrocentista, num processo de competição com a gramática do português antigo, e seu declínio se dá a partir da primeira geração de autores nascidos no século XVIII. Paixão de Sousa (2004) traz, além disso, evidências de que a mesma gramática é subjacente aos bilhetes da inquisição do séc. XVII editados por Rita Marquilhas (cf. Marquilhas, 2001). Esse fato é crucial para caracterizar a gramática do português clássico como pertencente a uma variedade vernácula. Com efeito, os bilhetes em questão foram escritos por pessoas semianalfabetas, chamadas por Marquilhas de “mãos inábeis”, que não passaram pela aquisição sistemática de uma gramática normativa. O debate sobre a natureza do português clássico, bem como sobre as mudanças que levaram à emergência do PE, foi recentemente relançado em um texto de Ana Maria Martins (cf. Martins, 2011), no qual a autora propõe que o que se vê nos textos é o reflexo da língua das classes “social e culturalmente dominantes (tipicamente, alfabetizadas e produtoras de escrita)”; porém, segundo a autora, uma outra gramática, “a das classes populares (tipicamente, não alfabetizadas e com acesso muito limitado à produção escrita)”, se apresenta na mesma época. Martins acrescenta: “São fatores socioculturais os que determinam que no português quinhentista (e também quatrocentista e seiscentista) seja extremamente reduzida a visibilidade da gramática em que a ênclise se terá mantido estável ao longo do tempo” (op. cit. p.86). Martins encontra nas peças de Gil Vicente a base empírica para sua hipótese, uma vez que a sintaxe das personagens populares é mais enclítica 7 do que as personagens ocupando uma posição alta na escala social. Desse ponto de vista, o decréscimo da ênclise (que começa no século XIV), a forte predominância da próclise nos séculos XVI e XVII e o retorno da ênclise no século XVIII não são senão momentos diferentes de uma competição entre duas gramáticas: a do vernáculo popular, enclítica, e a da linguagem culta, “panibérica”, proclítica. Isso tem como consequência dizer que o que acontece no século XVIII não é propriamente uma mudança gramatical, mas a inversão entre o peso das duas gramáticas em competição, que favorece a gramática do vernáculo popular. A análise de Martins (2011) é parcial, uma vez que se limita à análise da colocação de clíticos. Paixão de Sousa (2004) mostra que, apesar de terem mais ênclise do que os textos literários, os documentos das “mãos inábeis” (Marquilhas, 2000) se comportam de maneira idêntica no que diz respeito à posição do sujeito. A sintaxe dos clíticos, apesar de particularmente saliente nos textos, não pode, portanto, ser tomada como único traço distintivo da gramática do PCl (entendido como o estado de língua que se expressa a partir do século XV e, de maneira bastante consolidada, nos textos escritos por escritores nascidos nos séculos XVI e XVII). Essa fase da língua ainda tem muito para revelar do seu funcionamento gramatical e dos condicionamentos discursivos que regem o uso das construções produzidas por sua gramática. Os trabalhos realizados no âmbito dos projetos anteriores se concentraram na sintaxe dos clíticos e na posição do sujeito, em correlação com o fenômeno V2. Nesta nova fase da pesquisa, toda a sintaxe da ordem será investigada, de modo a permitir inferências mais precisas sobre as estruturas subjacentes aos diferentes padrões oracionais e a natureza das categorias funcionais ativadas na instanciação desses padrões. III.1.1 A sintaxe V2 do português clássico As teses de Torres Morais (1995), Paixão de Sousa (2004), Gibrail (2010) e Antonelli (2011), trouxeram evidências de que a sintaxe do português clássico é de tipo V2. Como nas fases antigas de outras línguas românicas, trata-se de um V2 diferente das línguas germânicas como o alemão, uma vez que co-existe com ordens V1 e V3 frequentes. Trabalhando no quadro da cartografia de Rizzi (1997, 2004), Antonelli argumenta que no PCl o verbo sobe para a categoria Fin (Finitude) e seus traços-phi satisfazem os traços EPP de Fin. Isso explica por que não é obrigatória a presença de sintagma na posição de especificador de Fin. Antonelli argumenta que os sintagmas antepostos ocupam o especificador de outras categorias compondo a camada CP, atraídos por traços de natureza discursiva, como Tópico e Foco. Isso produz uma grande liberdade na ordenação dos sintagmas, criada pela superposição de diferentes processos de movimento associados a efeitos discursivos. Dentre os fatos relevantes, podemos citar os três seguintes: (a) extração de NP, com abandono de modificador (cf. (1)); (b) extrações não-canônicas, em que o vestígio do elemento 8 extraído se encontra numa oração adjunta (cf. (2)); e (c) flutuação de quantificadores para posições pré-verbais, em presença de um tópico (cf. 3). (1) Papagaios há nestas partes muitos de diversas castas, e muito formosos, como cá se vêem alguns por experiência. (Gândavo, nascido em 1502) (2) e apertando o capitão-mor outra vez de novo com eles, prove a Nosso Senhor que viraram as costas, e se recolheram com muita desordem, como gente já vencida, o que vendo os nossos, os seguiram até dentro da sua tranqueira, onde eles de novo nos tornaram a fazer rosto, (Fernão Mendes Pinto, nascido em 1510) (3) Os homens n’aquella primeira infancia do mundo todos vestiam de pelles, (Vieira, nascido em 1608) Neste projeto, como mencionado acima, a sintaxe V2 do PCl será estudada na dimensão mais geral da ordem dos sintagmas na frase e sua relação com a organização da informação. A investigação sobre a ordem será também estendida às orações não-finitas. O exemplo seguinte, extraído de Gândavo (n. 1502), evidencia que as infinitivas também podem mostrar diferentes ordenações de palavras, como VSO, SVO, além dos casos com sujeito nulo. Construções desse tipo ilustram como a organização da informação dirige a ordem, em particular no que tange à posição de sujeito. No enunciado em questão, o tópico é outros (macacos); por isso, os Índios, como referente não-tópico, é realizado em posição pós-verbal. (4) Outros há perto maiores que estes, que tem barba como homem: os quais são tão atrevidos, que muitas vezes acontece flecharem os Índios alguns, e eles tirarem as flechas do corpo com suas próprias mãos, e tornarem a arremessá-las a quem lhes atirou. III.1.2 A topicalização não-V2 do português moderno No português europeu e brasileiro modernos, a topicalização V2 do PCl deixa de existir, e surge a topicalização não-V2 (cf. Duarte, 1987), em que , quando o elemento topicalizado é o objeto direto do verbo, a posição argumental fica sem realização fonética. Faz parte deste projeto estudar essa construção, que não existe nas outras línguas românicas, em textos portugueses e brasileiros do século XIX e da primeira metade do século XX. Coloca-se a questão de saber qual é a propriedade, por hipótese diferente no PE e no PB, que legitima uma construção ausente das outras línguas da mesma família. No PB, a hipótese de partida é que está associada às diversas características que compõem sua natureza de língua orientada para o tópico (cf. Pontes, 1987; Galves, 1987, 1998; 9 Negrão, 1999; Duarte & Kato, 2008; Modesto, 2008). No que diz respeito ao PE, a situação é mais complexa. Note-se que se trata de maneira geral de uma língua que traz vários desafios à teoria gramatical, dadas as suas numerosas particularidades sintáticas. Do ponto de vista da Língua-E, podemos dizer que é uma língua conservadora, uma vez que preservou características associadas, nas outras línguas românicas, às fases antigas, como a ênclise nas orações finitas. Essa propriedade levou muitos estudiosos a apontar para propriedades especiais da periferia esquerda, codificadas numa categoria funcional alta considerada forte (cf. Martins, 1994; Uriagereka, 1995; Costa & Martins, 2004; Raposo & Uriagereka, 2005, entre outros). Para muitos autores, por outro lado, a ênclise está associada a uma posição externa do sujeito em relação às fronteiras da oração. Essa análise, inicialmente proposta por Rouveret (1987), foi particularmente explorada nos trabalhos de Pilar Barbosa (cf. Barbosa, 1996, 2000, 2008, entre outros), na esteira de outros estudos que investiram no argumento de que o sujeito realizado das línguas pro-drop ocupa uma posição deslocada. Contudo, essa análise não é consensual, e muitos autores argumentam que o sujeito do PE ocupa uma posição interna à frase (cf. a discussão em Galves & Sandalo, 2012). Esses autores procuram derivar a existência da ênclise a partir de uma arquitetura oracional na qual o verbo e o clítico não ocupam o mesmo núcleo na computação sintática (cf. Rouveret, 1999; Shlonsky, 2004; Ouhalla, 2004). Rouveret (1987) também deriva a topicalização sem retomada pronominal, bem como a construção de objeto nulo (cf. próxima seção), da estrutura em que o sujeito está em posição externa. Raposo (1986) argumenta que a categoria vazia objeto nessa construção é uma variável ligada por um tópico nulo. Curiosamente, isso aproximaria o PE do chinês, tal como analisado por Huang (1984), ou seja, o objeto nulo, nessa análise, recoloca para esta língua a questão da proeminência do tópico. Recentemente, João Costa minimizou a questão da diferença entre o PB e o PE no que tange ao estatuto de proeminência de tópico (cf. Costa, 2010). Segundo ele, todas as construções usadas para argumentar que o primeiro é uma língua orientada para o tópico, desde o trabalho pioneiro de Pontes (1987), existem também no segundo. A única diferença, segundo o autor, diz respeito às construções em que o verbo concorda com o tópico que não corresponde ao sujeito lógico da oração, possíveis no PB, mas não no PE (ver seção III.1.4). Segundo Naro & Scherre (2007), o que mais aproximaria o PE do PB seria a ausência de concordância nominal e verbal. Os exemplos apresentados por esses autores são retirados de dialetos não-padrão de Portugal, em que frases como as seguintes são registradas: (5) A cedrera é muito bom para chá (op. cit., p. 75) (6) As querenguelas só presta para pescar (op. cit., p. 98) 10 A análise de Naro & Scherre levanta a seguinte questão: será que em (5)-(6), o sintagma pré-verbal é, de fato, o sujeito do verbo? Uma análise alternativa seria a de que tal sintagma é, na verdade, o tópico da frase, retomado por um sujeito nulo de caráter genérico – o equivalente do ça encontrado no francês. É tentador ligar ambas propriedades (de objeto nulo e de sujeito nulo genérico) à noção de operador nulo. Como já mencionamos, essa possibilidade já foi explorada por Raposo (1986) para o objeto. O operador nulo é, em termos intuitivos, o que permite a identificação referencial de uma categoria vazia independentemente de uma relação de concordância. Recuperamos aí a noção de variável, em oposição à noção formal de pronome: o pronome necessita de traços-phi para a sua identificação; a variável, ao contrário, não necessita desses traços. Esta, contudo, requer um antecedente identificável no discurso, o que ocorre no caso do objeto nulo. No caso contrário, resta a interpretação genérica. A questão seguinte é como expressar a noção de operador nulo no quadro atual do Programa Minimalista. Essa será uma questão abordada no decorrer do projeto, e as possibilidades de resposta dependerão de detalhes da derivação sintática que será assumida. É natural, em princípio, atrelar o operador nulo a um traço de tópico associado a Comp (ou, no quadro da cartografia de Rizzi 1997, 2004, a uma das categorias funcionais da camada Comp), que não desencadeia movimento visível, mas é capaz de ligar uma categoria vazia. Nesse novo projeto, daremos mais ênfase a um período do português europeu pouco estudado nos projetos anteriores – que privilegiaram a emergência da nova gramática no séc. XVIII. Trata-se do séc. XIX. Ele é importante para o estudo da consolidação das novas formas de topicalização, e também porque se podem vislumbrar nos textos escritos nessa época elementos de variação dialetal que prenunciam a variação encontrada no séc. XX entre dialeto padrão e dialeto não-padrão (cf. Magro, 2008, a respeito do fenômeno da interpolação). III.1.3 Objeto nulo no PE e no PB Diferentemente de uma língua como o inglês, tanto o PE quanto o PB têm a possibilidade de não realizar fonologicamente os complementos diretos dos verbos na ausência de um tópico expresso. Tem-se então uma interpretação referencial específica que se assemelha à dos pronomes. É o fenômeno tradicionalmente chamado de “objeto nulo”. Para o PE, Raposo (1986), seguindo o trabalho seminal de Huang (1984), e dentro da tipologia das categorias vazias de Chomsky (1982), argumenta que se trata de variável. Contrapondo os argumentos para o PE aos fatos do PB, Galves (1989) conclui que nesta língua se trata de um pronome nulo, pro. Esta análise encontra alguns problemas empíricos discutidos em seguida por vários autores (Farrell, 1990; Bianchi & Figueiredo, 11 1994; Galves, 1997). Nesse quadro, e a partir de um estudo diacrônico, Cyrino (1997) propõe que o objeto nulo do PB é, na realidade, resultado de elipse de NP/DP e Cyrino (2011) sustenta que o objeto nulo do PB é diferente do permitido em outras línguas, justamente por razões diacrônicas. De fato, várias línguas permitem vários tipos de objeto nulo, mas o objeto nulo do PB apresenta certas características: tem preferencialmente antecedente não-animado, não permite correferência com o sujeito da matriz, ocorre em ilhas sintáticas. É pertinente a este projeto notar que línguas bantas como o kinande também permitem o objeto nulo. Authier (1988) mostra que tal língua permite objetos nulos definidos, mesmo com antecedentes animados, como mostram os seguintes exemplos: (7) na- abiri- SM TNS anza [e] love I have come to love (her/him/them) (Authier, 1988:21) A correferência com o sujeito da matriz, no entanto, não é permitida: (8) Arlettei a- ka- lengekanaya ati na- abiri- anza [e]j/*[e]i A. TNS think SM TNS SM that love Arlettei thinks that I have come to love (herj/*i) (Authier, 1988:23) Authier argumenta que o objeto nulo em kinande é uma variável (não pode ocorrer em ilhas), e o considera o vestígio do movimento de um operador nulo para o especificador de CP. No entanto, seria diferente do objeto nulo do PE, uma vez que em kinande os sintagmas topicalizados se moveriam para o especificador de CP na sintaxe, ao passo que, em PE, eles seriam gerados na base, em uma posição de tópico distinta de CP. Neste projeto, voltaremos a discutir, comparativamente, a natureza do objeto nulo no PE e no PB, em correlação com as outras construções estudadas, não só no âmbito da frase, como também no âmbito do sintagma nominal (cf. III.1.6). III.1.4 Morfologia de aspecto e tempo e posição do verbo na frase A questão sobre a existência de movimento de verbo em PB vem sendo discutida a partir de Galves, (1994, republicado como capítulo 6 em Galves, 2001). Nesse artigo, a autora argumenta que o PB tem um AGR “fraco”, e, portanto, à primeira vista, não deveria ter movimento de verbo. Mas há argumentos (posição de advérbios, por exemplo) que demonstram que o verbo deve deixar o VP em 12 PB. A autora propõe que um outro elemento em INFL atrai o V: Tempo. No PB, a restrição do movimento de V para T é, portanto, desencadeada pelas propriedades de T. Biberauer & Roberts (2010) propõem que a existência de movimento de verbo estaria relacionada à riqueza de marcação temporal. Cyrino (2010, 2011), porém, argumenta que a marcação morfológica de tempo não necessariamente leva ao movimento de verbo – BP é uma língua em que essa morfologia é somente aparentemente rica. Da mesma forma que Galves (1994), Cyrino (2010, 2011) assume que o verbo deixa o VP em PB e não sobe para uma categoria funcional alta. Assumindo duas categorias para Tempo, T1 e T2 (cf. Giorgi & Pianesi, 1997; Julien, 2001), a autora propõe que o verbo é alçado para T2, uma categoria relacionada a Aspecto. A proposta é baseada na perda das formas sintéticas, especialmente do mais-que-perfeito e do futuro do presente. As formas sintéticas existentes, como o passado simples, não estão restritas a interpretações estritamente temporais: (9) Só faltou cerveja nesta festa! Em PB, ao contrário de PE, a sentença (9) pode ser usada quando a festa ainda não acabou. Da mesma forma, sentenças como (10), em que a morfologia de passado remete à interpretação (aspectual) resultativa, são possíveis em PB, mas não em PE: (10) Você virou na Rua 7, e chegou na universidade. Este projeto pretende aprofundar a questão da relação entre a morfologia verbal (tempo e aspecto) e a posição do verbo na frase dentro de uma perspectiva comparativa. III.1.5 Posição de sujeito e proeminência de tópico em PB Tendo em vista os estudos recentes, desenvolvidos por membros do projeto, sobre paralelismos e contrastes entre o PB e as línguas africanas, o projeto irá pôr foco no estatuto de “proeminência de tópico” (ou “orientação ao discurso”) que vem sendo relacionado ao PB. Um dos temas que merecerá particular atenção no desenvolvimento do projeto diz respeito ao tipo de elemento que pode ocorrer na chamada posição de sujeito e desencadear concordância com a flexão verbal em PB. Nessa língua, ao contrário da tendência observada entre as línguas indo-europeias, termos com interpretação locativa (quase sempre interpretados como tópicos) que não equivalem a um sujeito lógico (ou semântico) do verbo podem concordar com a flexão verbal, como ilustrado em (11) (12). Os casos apresentados em (a) foram extraídos de blogs publicados no Brasil e mostram 13 construções em que um termo equivalente tradicionalmente analisado como adjunto adverbial ocorre em posição pré-verbal e concorda com o verbo. A correspondência com a função de adjunto adverbial é facilmente observada nas paráfrases em (b), nas quais o termo locativo passa a ser obrigatoriamente antecedido da preposição em. (11) a. “algumas concessionárias tão caindo o preço [do carro]” b. O preço do carro tá caindo em algumas concessionárias. http://forum.carrosderua.com.br/index.php?showtopic=122656 (12) a. “Minhas amígdalas tavam saindo sangue” b. Estava saindo sangue das minhas amígdalas. http://www.fotolog.com.br/jees_siica/39442608f Bastante comuns na fala dos brasileiros, as construções em (a) de (11)-(12) causam estranhamento quando apresentadas a portugueses (Costa, 2010) ou a falantes de outras línguas românicas. Não é simples explicar a emergência dessas construções no português brasileiro por meio da hipótese da deriva, uma vez que não foram, pelo menos até aqui, detectadas no português europeu e nas demais línguas românicas. Curiosamente, construções com o padrão observado em (11)-(12) são generalizadas em línguas do grupo banto. Essas construções, exemplificadas em (13)(14) a seguir com dados de línguas bantas, têm sido agrupadas entre o que se pode considerar um tipo específico de inversão locativa (Salzmann, 2004), no qual um constituinte interpretado como lugar ou direção estabelece, em vez do sujeito lógico, concordância com o verbo. De acordo com Baker (2008), padrões oracionais dessa natureza não são usuais nas línguas indo-europeias, mas bastante comuns nas línguas nigero-congolesas, entre as quais se incluem as do grupo banto. (13) KINANDE (Baker 2003: exemplo 25) Omo-mulongo mw-a-hik-a (?o-)mu-kali LOC.18-village 18S-T-arrive-FV (AUG)-CL1-woman.1 ‘At the village arrived a woman’ (14) KIMBUNDO (http://www.linguakimbundu.com/index3.html) a. Mu njibela muala ni kitadi? (No bolso tem dinheiro?) b. Bu kibuna kiami buala o kamba rienu? (No meu banco está o vosso amigo?) c. Ku ‘nzo ié kuala ni ndenge? (Na tua casa tem criança?) Nos dados de (13)-(14), vale chamar a atenção para as construções do quimbundo, que, ao lado do quicongo e do umbundo, é apontado como língua materna da maioria dos africanos de origem banta trazidos para o Brasil. Na sua Grammatica elementar do kimbundo ou língua de angola (1888/89), Heli Chatelain faz menção ao fato de a sintaxe quimbunda permitir a concordância locativa, salientando que, “quando, por inversão, o locativo acontece preceder o verbo, este concorda com elle, tomando-o como prefixo. Na inversão, o sujeito logico perde toda influencia 14 sobre o verbo, de modo que não importa a qual cl. sing. ou pl. o sujeito pertença, comtanto que seja de 3a pessoa” (p. 89). Considerando a similaridade entre o português brasileiro e as línguas do grupo banto no que tange à inversão locativa, é plausível indagar sobre a possibilidade de estarmos diante de um reflexo do contato do português com línguas do grupo banto, por conta da entrada maciça de africanos (em sua maioria, falantes nativos de línguas pertencentes a esse grupo) em território brasileiro no decurso de quase quatro séculos. Na linha dos estudos apresentados em Lucchesi et al. (2009), uma hipótese a ser aventada é a de que o processo de transmissão linguística irregular desencadeado pela aquisição do português como L2 por milhares de africanos, que produziram grande parte do input daqueles que passavam a adquirir o português como L1, tenha levado à transferência de padrões oracionais comuns às línguas africanas (no caso, o padrão de inversão locativa) para variedades emergentes do português brasileiro. A ampla ocorrência dessas construções em dados de escrita extraídos de blogs publicados no Brasil em pleno século XXI seria, nesse sentido, resultado de um processo que teria se iniciado séculos antes, com a aquisição do português como L2 por falantes de línguas africanas, produzindo construções que se difundiram (em um modus operandi que ainda precisa ser melhor compreendido em termos temporais, geográficos e sócio-demográficos) por diferentes variedades do português brasileiro. III.1.6 O sintagma nominal nas gramáticas do português O projeto também se deterá sobre a sintaxe do sintagma nominal, que é um aspecto ainda pouco estudado no PCl e obviamente envolve uma comparação entre o PE e o PB contemporâneo e também, em certos casos, uma comparação com línguas crioulas de base lexical ibérica (como, por exemplo, o papiamento). Especificamente o segmento do projeto dedicado ao sintagma nominal tem dois objetivos empíricos complementares: (i) descrever aspectos da estrutura e distribuição de vários tipos de sintagmas nominais no português clássico, tendo em vista determinar as diferenças entre o PE e PB e o PCl. (ii) utilizar a distribuição de certos tipos de sintagmas na oração para determinar propriedades da estrutura informacional da oração, o que pode auxiliar no entendimento da sintaxe oracional do português clássico. Os estudos recentes sobre a estrutura dos DPs na sintaxe gerativa mostram que é praticamente impossível examinar as propriedades das frases nominais sem levar em conta propriedades semânticas e pragmáticas dos próprios DPs e da posição que ocupam. Se por um lado isto faz o estudo do sintagma nominal mais complexo, por outro, abre um caminho para se usar a distribuição dos vários tipos de DP como diagnóstico de propriedades sintáticas ligadas ou não à estrutura informacional tanto do próprio DP quanto da oração. Desde o trabalho seminal de Milsark (1974), 15 sabemos que sintagmas nominais 'fracos', (não pressuposicionais), mas não sintagmas nominais "fortes", são aceitáveis em construções existenciais. Esta mesma distinção entre SNs fracos e fortes é utilizada para restringir os tipos de sintagmas nominais que podem aparecer na posição de sujeito ou podem ser deslocados. Sabe-se também que certos tipos de predicados forçam/restringem a interpretação de sintagmas nominais em várias posições (cf. Carlson, 1977; Diesing, 1992; Kratzer, 1995 etc). Do ponto de vista do movimento, sabe-se que é "mais fácil" extrair de sintagmas nominais indefinidos/nus do que definidos (ver Boskovic, 2008; a sair, para uma versão bastante extrema desta observação). Dadas essas observações, cabem duas perguntas: (i) há mudanças importantes entre o PCl e o PB e PE no que diz respeito ao sintagma nominal e sua distribuição? e (ii) em que medida se podem relacionar certas propriedades do DP no português clássico a uma ordem mais livre de palavras do que no PB, por exemplo? No que diz respeito ao português, sabemos que os determinantes são menos empregados no PCl do que no PE. Gibrail (2003) observou que a frequência dos determinantes aumenta no decorrer do século XVIII, quando diminui a frequência do acusativo preposicionado. Vê-se também um aumento do uso do artigo com os possessivos, também no século XVIII (cf. Floripi, 2008), que desembocará na generalização total desse uso. O uso do artigo com o quantificador universal plural ‘todos’ também não é categórico no português clássico, como se vê na frase em (15), que fecha a Gramática da linguagem portuguesa de Fernão de Oliveira, ou ainda na frase em (16), do tratado Da pintura antiga de Francisco de Holanda. (15) Todas coisas têm seu tempo e os ociosos o perdem. (16) E não dou eu, certo, menos louvor ao vosso saberdes-vos apartar comvosco e fugir das nossas inuteis conversações, e a vosso saber não pintar a todos principes que vo'lo pedem, que ao pintar uma só obra em toda a vida, como tendes feito . Nas línguas modernas, o uso do determinante é menos frequente no PB do que no PE, se aproximando nisso o PB mais do PCl, como se pode ver na frase (17), do Corpus de Cartas brasileiras de Carneiro (2005). (17) É ele muito distinto sob todos pontos de vista, e, além disto, um correligionário nosso que, em todas as circunstâncias tem se imposto, por sua lealdade e serviços, à nossa estima e reconhecimento. E aqui se coloca a questão de saber a origem das diferenças entre o PB e o PE e o PCl, devendose levar em conta também propriedades de certas línguas crioulas que têm uma distribuição de nomes sem determinante muito parecida com a do PB. Estudaremos a estrutura e distribuição dos nomes nus, definidos e indefinidos. Em relação aos indefinidos com determinante, concentraremos a atenção nas propriedades dos sintagmas indefinidos com 'um/uns' e 'algum/alguns' tanto em contextos afirmativos como negativos, onde aparecem diferenças interessantes entre o PB e o PCl (cf. o uso em Gândavo, por exemplo, da 16 expressão "outra coisa alguma", sempre sob o escopo da negação). Quanto aos nomes nus, à guisa de exemplo, considere-se o caso dos nomes nus contáveis em posição argumental. Assim como os nomes nus plurais no inglês, os nomes nus singulares contáveis podem ter, no PB, uma leitura genérica ou existencial. No PE, os nomes nus contáveis têm uma distribuição muito restrita, similar ao espanhol, sendo aceitos só como complementos de verbos que têm um componente possessivo (ter, comprar, etc). Assim, enquanto (18a) e (18b) são naturais no PB, no PE, (18a) é inaceitável. Essa distribuição mais liberal dos nomes nus no PB está correlacionada à possibilidade de modificação por ''muito" com leitura contável, como exemplificado em (19). No PE, (19a) é inaceitável e (19b) só é aceita com uma leitura predicativa em que “O Pedro tem um carro fantástico”, sugerindo diferenças estruturais. (18)a. b. (19)a. b Jogador Tem carro, tem Muito jogador ganha O Pedro tem muito carro. ganha muito dinheiro. casa, tem telefone, tem filho. dinheiro com campanha publicitária. Para dar conta da existência de nomes nus em posição argumental no PB, Schmitt (1996), Munn & Schmitt (1999) e Schmitt & Munn (2003) argumentam que no PB esses nomes nus são DPs com um D nulo. A distribuição restrita dos nomes nus é associada a ausência ou a restrições a um D nulo nas línguas românicas. Para Dobrovie-Sorin & Bleam (2006) e Espinal & McNally (2009), os nomes nus em (18a) no espanhol são simplesmente NPs em contextos de certos predicados (ver também Cyrino & Espinal 2011, sobre essa proposta para o PB ). Cabe então perguntar em que momento se estabelecem as diferenças entre o PE e o PB e onde essas diferenças estão localizadas. O que acontece nos períodos anteriores do português? O que leva a estas diferenças? E aqui devem-se levar em consideração não só propriedades do PCl mas também propriedades de línguas crioulas de base ibérica como o papiamento (Schmitt & Kester, 2005; Kester & Schmitt, 2007), por exemplo, que têm uma distribuição de nomes nus contáveis quase idêntica à do PB, inclusive nas restrições discursivas aos nomes nus contáveis em posição de sujeito. Compararemos também com propriedades dos sintagmas nominais no português africano (cf. Inverno (2005) e do português afro-brasileiro (cf. Lucchesi et al., 2009) III.1.7 A variação sintática no português brasileiro A variação dialetal no português brasileiro, pelo menos no que diz respeito ao nível sintático, precisa ser melhor descrita e entendida. Em seu desenvolvimento, o projeto se aterá à variação entre as variantes do português brasileiro mais marcadas pelo contato, o português 'afro-brasileiro' (cf. Lucchesi et al., 2009), ou ‘étnico’ (cf. Santos, 2011), e a língua que varia, tanto geograficamente quanto socialmente e ainda individualmente, num eixo que vai do PB culto falado (cf. a série de volumes do Projeto para a Gramática do Português Falado) para o PBV, português brasileiro vernacular (Holm, 2004) ainda chamado de português popular brasileiro (PPB) por outros autores 17 (entre outros Mattos e Silva, 2004). Nesse sentido, uma importante vertente do projeto está na anotação sintática de corpora orais representativos dessas variedades, na linha do que já vem sendo desenvolvido para dos documentos escritos que compõem o Tycho Brahe (cf. Seção III.3.1). A anotação sintática de corpora do português brasileiro contemporâneo permitirá não apenas mapear contrastes sintáticos entre variedades dialetais, mas também refinar a observação da variação interna aos indivíduos, que pode ser explicada, no quadro teórico que estamos adotando, de duas maneiras, não mutuamente exclusivas: (i) a variação é desencadeada pela competição de gramáticas que nasce da tensão entre a aquisição natural da língua e sua aprendizagem por meio do ensino formal, essencialmente via escola. Um dos exemplos canônicos dessa variação se encontra na sintaxe pronominal, em particular no uso e colocação de pronomes clíticos, adquiridos em meio escolar (cf. Correa, 1991). (ii) a variação resulta da própria natureza da fixação dos parâmetros na língua. A hipótese em (ii) ocupará um lugar central dentro do projeto: a natureza híbrida de certos fenômenos morfossintáticos do PB derivaria da própria fixação de um (ou mais) parâmetros, que, por sua vez, decorreria da sua história de contato de línguas tipologicamente muito diferentes (ver a seção III.1.3.1). Se essa hipótese estiver correta, será possível afirmar que não há diferença gramatical entre dialetos com pouca (ou nenhuma?) concordância e dialetos com muita (ou integral?) concordância, porque concordar ou não seria uma escolha permitida pela fixação do próprio parâmetro (cf. Avelar e Galves, 2011). Desse ponto de vista, só a frequência é que seria o reflexo de uma maior ou menor instrução formal. Em conjunção com essa ideia, uma outra hipótese de base paramétrica que o projeto irá defender a respeito do português brasileiro é a seguinte: apesar de manter uma morfologia de tipo indoeuropeu, a sua sintaxe sofreu uma mudança tipológica (ou, nos termos de Baker (1996, 2008, 2010, 2011), uma mudança de natureza macro-paramétrica), ao passar a fixar o parâmetro da concordância não mais como as línguas indo-europeias, mas como as línguas níger-congo. Em linhas gerais, se essa hipótese for validada, o estatuto de proeminência de tópico e as particularidades da posição de sujeito (como as que dizem respeito à inversão locativa, tratadas em III.1.5) poderão ser tratados como resultantes dessa mudança paramétrica. III.2.8 A variação sintática no português europeu A micro-variação entre a língua padrão urbana de Lisboa e os dialetos do interior de Portugal (cuja sintaxe pode ser agora facilmente estudada graças ao projeto Cordial-SIN, implantado por Ana Maria Martins no Centro de Linguística da Universidade de Lisboa) é um contraponto importante para a comparação entre o PB, o PE e seu antepassado comum, o PCl. O método 18 preconizado por Naro e Scherre (2007) para procurar as raízes do PB popular no PE popular será reinterpretado neste projeto no quadro de uma outra concepção da linguagem. Nesta, a língua não é um organismo que muda por si só, conduzido por uma deriva interna própria. A mudança gramatical se deve à seleção de uma gramática por uma geração G, diferente da gramática selecionada pela geração anterior G-1, fornecedora do input que serve de base à aquisição da língua pela geração G. Desse ponto de vista, a língua é um objeto mental que só tem realidade no cérebro/mente de cada falante. Contudo, os dialetos podem nos dizer muito sobre as possíveis variações em torno de um mesmo tema, para retomar a metáfora da tese de Catarina Magro (Magro, 2008), nos ajudando a entender os parâmetros em jogo (ver Seção III.2 adiante). III.1.9. As variedades africanas do português Para cumprir os objetivos previstos pelo projeto, será importante acompanhar o resultado de investigações que vêm sendo feitas sobre fatos morfossintáticos identificados em variedades do português faladas na África, particularmente em Angola e Moçambique. Como já destacado na seção 1, Petter (2009) chama a atenção para a existência de um continuum afro-brasileiro do português que precisa ser levado em conta na tentativa de explicar as propriedades particularizadoras do português brasileiro frente ao português europeu. Visando a abordar esse continuum, o projeto irá investir no mapeamento de convergências e contrastes entre variedades do português faladas no Brasil e na África. Uma das convergências está nas propriedades de concordância inerentes ao sintagma nominal, como mostrado no trabalho de Inverno (2011) para o português angolano e de Jon-And (2011) para o português moçambicano. Tal como no português brasileiro, variedades emergentes do português em Angola e Moçambique mostram um alto grau de variação na realização da marca de número no elemento nominal (como em os livro vs. os livros). A redução do paradigma flexional dos verbos também pode ser incluída entre as convergências. Trabalhos como os de Lipski (2008) destacam exemplos como os que se seguem em (20) para mostrar a redução do paradigma flexional no português angolano, com a forma verbal de terceira pessoa do singular se generalizando para todas as demais. O autor destaca que a terceira pessoa do singular também é empregada como forma verbal invariável em um dialeto afro-hispânico da Bolívia, falado por um grupo de negros descendentes de escravos africanos, como exemplificado em (21). (20) PORTUGUÊS ANGOLANO (Lipski, 2008: 88) a. “Os home já amarrou” 19 b. “Hoje os tempo tá mudado” c. “[eu] sabe não” d. “sim, eu namorô, mas já dexô muito tempo” e. “Os tropa vai no mato e negro fica sozinho” (21) DIALETO AFRO-HISPÂNICO DA BOLÍVIA (Lipski, 2008: 87) a. “Nojotro tiene [tenemos] jrutita” b. “Yo no entende [entendo] eso de vender jruta” c. “Yo creció [crecí] junto com Angelino” d. “Nojotro creció [crecimos] loh do” e. “Nojotro trabajaba [trabajábamos] hacienda” Um outro aspecto que parece ter lugar no continuum afro-brasileiro está no fenômeno da inversão locativa, abordado em III.1.3.1. Gonçalves & Chimbutane (2004) mostram que o português falado como L2 por moçambicanos dá lugar a construções em que sintagmas nominais preposicionados introduzidos por “em”, com interpretação necessariamente locativa, ocorrem em uma posição pré-verbal que pode ser identificada como sendo a posição gramatical do sujeito, como em construções do tipo Na nossa zona era fértil (com o mesmo sentido de A nossa zona era fértil). De acordo com os autores, construções desse tipo são transferências de padrões oracionais bastante comuns nas línguas faladas como L1 por moçambicanos, em que sintagmas preposicionados com interpretação locativa podem ocorrer em posição de sujeito. Estudos como os de Avelar & Cyrino (2008) e Avelar (2011) observam que o mesmo tipo de inversão locativa também é possível no português brasileiro, em construções como as que seguem em (22a)-(26a), encontradas em blogs brasileiros. Os dados em (22b)-(26b) mostram que a preposição pode ser eliminada, sem resultar em qualquer alteração aparente no sentido da sentença ou no papel temático atribuído ao constituinte em posição pré-verbal. Avelar & Cyrino (2008) propõem que, tal como sugerido por Gonçalves & Chimbutane (2004) para o português africano, as construções em (22a)-(26a) do português brasileiro também trazem sintamas locativos preposicionados em posição de sujeito. (22) a. “na minha escola aceita cartão de crédito” b. a minha escola aceita cartão de crédito twitter.com/giiovannaflores/status/18219596304 (23) a. “no meu computador imprime a etiqueta corretamente” b. o meu computador imprime a etiqueta corretamente http://www.suportegas.com.br/portal/topic.asp? (24) a. “no curso ensina a fazer impressão de cartão de visita” b. o curso ensina a fazer impressão de cartão de visita 20 produto.mercadolivre.com.br/MLB-127398826-curso-de-serigrafia-silk-screen-em-2-dvds-_JM (25) a. “na loja vende o produto separadamente do Tampo” b. a loja vende o produto separadamente do Tampo www.reclameaqui.com.br/.../troca-negada-dentro-do-prazo-de-sete-dias-e-nao-atendimento/ (26) a. “na bula recomenda usar [o remédio] imediatamente após abrir” b. a bula recomenda usar o remédio imediatamente após abrir http://www.npng.com.br/forum/topic.asp?TOPIC_ID=72805 Enquanto a sintaxe da inversão locativa permite aventar a hipótese da transferência de padrões estruturais por meio de contato interlinguístico, não nos parece, pelo menos a priori, que o mesmo tipo de hipótese possa ser estendido para o enfraquecimento da concordância, seja no caso do português brasileiro, seja no das variedades africanas do português. Cabe destacar que, em termos de distinção flexional, o paradigma flexional das línguas bantas é tão ou mais rico que o do português europeu. Os fatos em questão podem, contudo, ser o resultado de erosão morfológica provocada pelo aprendizado português como L2. À luz dessa hipótese, a erosão morfológica do paradigma flexional teria se difundido (no caso do português brasileiro) ou estaria em amplo processo de difusão (no caso do português angolano e moçambicano) para as variedades do português em formação, então adquiridas como L1. Essa ideia está delineada, embora não exatamente nos mesmos termos, nas considerações de Lucchesi (in Lucchesi et al. 2009: 182) a respeito do lugar ocupado pelas mudanças relacionadas ao parâmetro do sujeito nulo no que caracteriza como “uma formação polarizada do português brasileiro”. Para o autor, o nível de erosão da morfologia flexional observado atualmente na comparação de variedades do português brasileiro foi “determinado pela intensidade diferenciada dos processos de transmissão linguística irregular em sua formação”. O ponto relevante para este projeto será o de saber se, frente ao desenvolvimento de um paradigma flexional que mostra paralelos com o das variedades do português brasileiro, as variedades africanas do português exibem propriedades de língua parcialmente pro-drop (com sujeitos nulos referencialmente definidos tendendo à realização morfológica, enquanto os referencialmente indefinidos podem ser apagados), na linha do tratamento que o parâmetro do sujeito nulo vem recebendo em trabalhos como os de Biberauer et al. (2010). A esse respeito, é importante ressaltar que as línguas banto são do tipo pro-drop, havendo, na literatura sobre essas línguas, registros de sujeitos nulos referencialmente definidos e indefinidos. Não é claro, contudo, qual é o seu estatuto quanto ao caráter canônico (como no português europeu) ou parcial (como no português brasileiro) relativo à marcação desse parâmetro. O projeto pretende se ocupar dessa questão, tendo em vista a possibilidade de propriedades atreladas ao parâmetro do sujeito nulo nas línguas banto se refletirem nas variedades africanas do português e/ou mostrarem pontos em comum com os fatos relevantes do português brasileiro. 21 Para cumprir com esse objetivo, uma importante ferramenta do projeto será a anotação sintática de corpora orais representativos de variedades africanas do português. O projeto irá, em especial, se debruçar sobre o corpus utilizado por Jon-And (2011) em seu estudo sobre a concordância variável de número em sintagmas nominais do português moçambicano. Esse corpus, que dispõe de um total de 12 horas de entrevistas com moçambicanos falantes de português como L2, foi disponibilizado para a equipe do projeto e será sintaticamente anotado, para compor o acervo do Tycho Brahe. Com isso, o projeto irá contribuir, tanto em termos teóricos quanto empíricos, para uma maior aproximação entre as investigações sobre contato interlinguístico e as abordagens formais que se ocupam de mudança gramatical. O projeto também irá se debruçar sobre o resultado de estudos em andamento voltados ao contato do português com línguas africanas baseados em documentos escritos, como os de Alkmim (2001, 2002, 2008) e Álvarez-López (2006, 2007, 2008), assim como os publicados em Lobo & Oliveira (2009). III.2 O modelo paramétrico e a dinâmica da mudança O estudo da dinâmica da mudança tem como objetivo, no desenvolvimento do projeto, entender como, quando e por quê o PCl muda para o PE por um lado e para o PB por outro. Igualmente relevante será explicar as convergências entre variedades brasileiras e africanas do português, em contraste com propriedades do PE. Para atingir esses objetivos, devemos primeiro realizar descrições quantificadas da mudança dos fenômenos no tempo, com base nos dados extraídos do corpus. Essas descrições nos permitem verificar correlações entre evoluções temporais de propriedades morfossintáticas distintas, apontando para sua correlação na gramática, através, por exemplo, da noção de taxa constante de Kroch (1989). Também nos servem de base para determinar quando se inicia uma mudança. O corpus e o acesso direto aos textos na sua integralidade nos permitem também realizar estudos na interface da gramática e do texto, particularmente importantes para a compreensão de fenômenos de ordem. A anotação morfossintática tem um papel essencial no uso de grandes quantidades de dados, na reprodutibilidade das descrições, e na interrogação do corpus a partir de hipóteses. As descrições quantificadas constituem a base empírica para as análises da mudança dentro da teoria linguística, mas também na modelagem estocástica que tem caracterizado os projetos anteriores, e continuará sendo realizada neste projeto, uma vez que constitui um complemento importante para trazer elementos de resposta a perguntas essenciais da mudança linguística. Consideraremos sucessivamente essas duas abordagens. III.2.1. A dinâmica da mudança do ponto de vista da teoria linguística 22 Dentro da teoria gramatical atual, a mudança está intimamente ligada à aquisição, e o instrumento teórico para abordar ambas é a teoria de parâmetros. Depois de ter ficado um tempo no limbo, essa teoria está atualmente muito fortemente reavivada, com os trabalhos do grupo de Cambridge (cf., entre outros, os livros Syntactic variation - the dialects of Italy; Parametric variation, null subjects in Minimalist Theory, e The limits of syntactic variation.) Como já mencionado acima, os modelos paramétricos com os quais trabalharemos para a discussão das gramáticas envolvidas têm correlatos para a questão da mudança. A discussão recente dessa teoria gira em torno das noções de macro e microparâmetros. Para certos autores, como Kayne (2005), todos os parâmetros são microparâmetros, e “apparently macroparametric differences might all turn out to dissolve into arrays of micro-parametric ones (i.e., into differences produced by the additive effects of some number of micro-parameters)” (Kayne, 2005: 284). Já Baker atribui aos macro-parâmetros uma natureza que não se deixa reduzir à adição de microparâmetros. Para ele, os primeiros não são associados às propriedades de categorias funcionais, como na proposta conhecida como “Borer-Chomsky conjecture” (BCC), mas à aplicação de diferentes princípios gerais da gramática. Desse ponto de vista, os macroparâmetros definem o que Sapir chamou de “gênio estrutural das línguas” (“This type or plan or structural genius of the language is something much more fundamental, much more pervasive, than any single feature of it we can mention, nor can we gain an adequate idea of its nature by a mere recital of the sundry facts that make up the grammar of the language.” (Sapir, 1921: 120, apud Baker, 1996: 3) Em trabalhos recentes (Roberts & Holmberg, 2010; Roberts, no prelo), Roberts procura reconciliar com a noção de árvore paramétrica as concepções de Kayne e de Baker, aparentemente opostas. Para ele, macroparâmetros são efetivamente agregados de microparâmetros que dizem respeito a propriedades de categorias funcionais, mas esses são hierarquicamente estruturados, de tal maneira que as grandes diferenças –as que definem tipos distintos de línguas- se encontram no topo das árvores paramétricas e as microdiferenças – que definem dialetos próximos – se encontram na parte de baixo das árvores, onde a formulação do parâmetro está cada vez mais detalhada. Um exemplo se encontra abaixo: A árvore paramétrica dos argumentos nulos (Roberts, no prelo) 23 No modelo desenvolvido por Roberts (2010, no prelo), as línguas que correspondem, para um dado parâmetro, a um valor definido nas partes mais encaixadas das árvores paramétricas são línguas mais marcadas (em relação a esse parâmetro) do que as línguas correspondendo a valores definidos em posições mais altas na árvore. Se as evidências empíricas necessárias a essa marcação são tornadas ambíguas de alguma maneira (ou pela ação de um processo linguístico afetando essas evidências ou pela existência de dados conflitantes, devidos, por exemplo, a um contato de línguas), as crianças selecionarão gramáticas menos marcadas, correspondendo a valores paramétricos mais altos na árvore. Isso se deve a um princípio muito geral de economia, não exclusivo da linguagem, ou seja, àquilo que Chomsky (2005, 2008) denomina o 3o fator. Segundo Chomsky, os dois primeiros fatores são, respectivamente, a predisposição genética (para a linguagem, a Gramática Universal), e a experiência. Ele define o 3o fator como “language-independent principles of data processing, structural architecture, and computational efficiency, thereby providing some answers to the fundamental questions of biology of language, its nature and use, and perhaps even its evolution” (Chomsky, 2005:9). The study of the effect of the “third factor” on language acquisition and change is part of the Strong Minimalist Program, “which holds that language is an optimal solution to interface conditions that FL must satisfy; that is, language is an optimal way to link sound and meaning” (Chomsky, 2008:3). Vê-se que a introdução do 3o fator na discussão da mudança linguística permite reintegrar a questão da direcionalidade, enfaticamente rejeitada por Lightfoot (1999), do ponto de vista da Gramática Universal. Porém, uma vez que a discussão inclui o ‘terceiro fator’, uma abordagem baseada na Gramática Universal pode ser reconciliada com a 24 afirmação reiterada dos estudiosos da linguagem de que as mudanças aparentam ter direção. Isso é devido à acão de princípios de economia da mente muito gerais, independentes da linguagem (cf. a reinterpretação da gramaticalização por Roberts & Roussou (2003), e vários estudos em Galves et al., no prelo). A história do português representa um novo e riquíssimo laboratório para a testagem dessas novas hipóteses sobre a aquisição e a mudança. Com efeito, temos paralelamente dois conjuntos de mudanças bem distintos, em contextos histórico-sociais bem diferenciados. Os primeiros passos no sentido de interpretar a mudança para o PB no quadro das árvores paramétricas foram dados por Avelar & Galves (2011), que argumentam que a gramática brasileira ocupa na árvore paramétrica relevante uma posição mais alta do que a gramática portuguesa: 25 A novidade consiste em tentar incorporar ao modelo a influência que as línguas africanas parecem ter tido sobre o desenvolvimento do português no Brasil, a julgar pelas semelhanças observadas entre a sintaxe das línguas banto e a sintaxe do PB (cf. Avelar, 2011). Essas semelhanças levantam a pergunta – já formulada por Adolfo Coelho em 1880 - de saber se o efeito do contato é universal ou se depende das línguas em contato, em particular aquelas chamadas de substrato – ou seja, no caso, a língua daqueles que aprenderam o português como segunda língua. Adolfo Coelho afirma que: “Os factos acumulados por nós mostram à evidência que os caracteres essenciais desses dialectos são por toda a parte os mesmos, apesar das diferenças de raça, de clima, das distancias geográficas e ainda dos tempos. É em vão que se buscará , por exemplo, no indo-português uma influência qualquer do tamul ou do cingalês.” (op. cit. pp. 105106) . Interessante é lembrar que, ao dizer isso, Coelho considera mais as variantes que se podem chamar de crioulas. E foi efetivamente defendido, cem anos depois, pelo grande estudioso dos crioulos, Derek Bickerton, que os crioulos constituíam um grupo de línguas muito semelhantes, e em nada parecidas com as suas línguas de substrato. Já foi agora claramente mostrado que a gênese do PB não envolve a formação de um crioulo (cf. Lucchesi et al., 2009). Porém, como reafirmado por Lucchesi (cf. também Inverno, 2005, 2011), a questão do contato não se esgota na formação de uma língua crioula. Existe um outro efeito que Holm (2004) chama de reestruturação parcial, que está na origem de uma “nova variedade histórica da língua”, nos termos de Lucchesi (2003). A questão da influência ou não de uma outra língua, ou de um outro dialeto, remete à questão de saber se a mudança pode ser desencadeada por dados positivos na aquisição de língua materna. Uma idéia mais aceita na literatura é que ela deriva de dados ambíguos para o aprendiz (cf. Roberts, 2007). Porém, investigaremos a hipótese de que, contrariamente às situações de contato, em que as crianças se veem frente a fixações paramétricas ambíguas ou contraditórias, é possível que as mudanças não induzidas pelo contato derivem de modificações nas evidências positivas acessíveis a uma dada geração, como, por exemplo, o surgimento de um novo padrão prosódico. Essa idéia, já trabalhada nos projetos anteriores, encontra hoje um eco novo em afirmações, como a de Berwick & Chomsky (2008) de que grande parte da variação observável nos sistemas gramaticais reflete mais a natureza do "processo de externalização", isso a interface fonológica/morfológica (PF) do que a sintaxe estreita (narrow syntax). III.2.2 A modelagem estocástica da mudança 26 A descrição da competição de gramáticas, bem como sua integração a uma teoria da mudança, requer, por um lado, a análise formal das gramáticas em presença, e, por outro lado, a modelagem da dinâmica das relações entre essas gramáticas. Precisamos, portanto, além de modelos desenvolvidos no interior da teoria linguística, de ferramentas oriundas de modelos matemáticos, como em Galves & Galves (1995), Cassandro et al. (1999), Niyogi (2006), Yang (2000, 2002), Galves et al. (2012). Neste projeto, aplicaremos à mudança sintática metodologias desenvolvidas nos projetos anteriores para validar hipóteses sobre a dinâmica dos processos fonológicos, em particular na determinação de pontos de corte (cf. Galves et al., 2012) e na modelagem bayesiana de sequências temporais, baseada na noção de “preditiva” (cf. Frota et al., 2011). O trabalho de modelagem matemática dos dados linguísticos se dará em colaboração com o Projeto da USP Matemática, Computação, Linguagem e Cérebro - MacLinc (http://www.ime.usp.br:8080/MaCLinC/project), ao qual vários pesquisadores deste projeto estão associados. III.3 O Corpus Tycho Brahe A história posterior ao séc. XVI em Portugal foi o objeto de dois projetos temáticos, Padrões rítmicos, fixação de parâmetros e mudança linguística (1998-2003) e Padrões rítmicos, fixação de parâmetros e mudança linguística, Fase II (2005-2009) que vieram preencher uma lacuna importante, já que anteriormente esse período não tinha sido objeto de nenhuma abordagem sistemática. No decorrer dos dois projetos, o Corpus Tycho Brahe –cf. http://www.tycho.iel.unicamp.br/~tycho/corpus - (doravante CTB) foi iniciado e consolidado, oferecendo agora uma base de dados de mais de 600.000 palavras anotadas sintaticamente, correspondendo a 15 textos escritos por autores portugueses nascidos entre 1502 e 1836. Esse corpus anotado, único do gênero para a língua portuguesa, já permitiu revisitar de maneira muito rica e produtiva grandes questões da história da língua, como a mudança da sintaxe de clíticos e a mudança da posição do sujeito, associada à perda do fenômeno V2. No decorrer do segundo projeto temático, vários textos brasileiros foram incluídos no Corpus, a partir de colaborações com grupos de pesquisa trabalhando sobre a história do português no Brasil. Alguns desses textos já receberam uma etiquetagem morfológica, mas não foram ainda anotados sintaticamente. Torna-se imprescindível agora incluí-los na base de dados sintaticamente anotados para que o CTB sirva à história do português brasileiro como vem servindo à história do português europeu. Por outro lado, a compreensão do desenvolvimento da língua portuguesa no Brasil passa obrigatoriamente pelo conhecimento do estado de língua que aqui foi trazido. Sem menosprezar as limitações inerentes ao estudo dos textos escritos para o conhecimento da língua efetivamente falada e sua variação, os 27 estudos realizados até agora com base no CTB permitiram consolidar uma descrição da língua portuguesa dos séc. XVI e XVII (o PCl) que não era disponível antes. Como consequência, permitiram entender melhor a natureza da variação encontrada nos textos brasileiros do séc. XIX, confluência de três gramáticas distintas: a do PCl, a do PE e a do PB (cf. Carneiro, 2005; Carneiro e Galves, 2010). O que falta agora é um conhecimento mais sistemático da evolução da língua portuguesa no Brasil, naquilo que os textos escritos podem nos informar. Para isso, faz-se necessário uma grande variedade de gêneros textuais. Isso será possível graças à colaboração com grupos trabalhando na edição de documentos de toda natureza, parceiros essenciais dessa jornada. O conjunto de documentos já existindo e a ser incluído na base de dados constitui um fantástico laboratório para discutir as questões levantadas nas seções anteriores, que estão na ordem do dia da agenda da sintaxe diacrônica, mais especificamente, e na teoria da gramática, mais geralmente. Na continuação dos temáticos anteriores, este projeto tem como característica essencial basear o trabalho de análise diacrônica num grande corpus anotado. Isso implica não somente escolher textos para compor o corpus, mas elaborar ferramentas para a anotação. Estado da arte O Corpus Tycho Brahe, construído ao longo dos dois projetos anteriores, já oferece aos pesquisadores uma base de dados inédita até então. São atualmente 53 textos totalizando 2.464.191 palavras, 31 dos quais têm anotação morfológica revisada e 15 (+/- 600.000 palavras) têm anotação sintática revisada. Com base na data de nascimento dos autores, estes 15 textos cobrem o período que vai de 1502 a 1836, e já permitem trabalhos aprofundados sobre a história da língua do português clássico ao português europeu moderno. Também dão uma base importante para a história do português brasileiro, uma vez que permitem tomar como ponto de partida o português efetivamente trazido ao Brasil e não sua versão moderna, dissipando possíveis equívocos. Os projetos anteriores também desenvolveram, alem do sistema de anotação, ferramentas importantes, como o etiquetador automático e a ferramenta de edição eletrônica E-dictor. Essas ferramentas estão sendo disponibilizadas no site do Corpus, e já estão sendo usadas por vários grupos brasileiros, com auxílio de membros dos projetos anteriores. III.3. 1. Extensão da base de dados: inclusão de novos textos Nesta fase da construção do Corpus Tycho Brahe (doravante CTB) a inclusão de novos textos privilegiará o português brasileiro, sem contudo se limitar a ele. Para a história do português em Portugal, como já foi mencionado, prevê-se reforçar um gênero pouco representado até agora no CTB: o teatro. Essa inclusão faz parte integrante de um projeto de pós-doutorado - já aprovado pela 28 Fapesp - de um pesquisador deste temático, e dirá respeito a textos teatrais escritos em Portugal da alvorada do séc. XVI ao séc. XX, com a seguinte seleção. Gil Vicente, nascido em 1465 (peças escolhidas da Compilaçam); Francisco de Sá de Miranda, nascido em 1481 (Auto dos Estrangeiros e Auto dos Vilhalpandos). Jorge Ferreira de Vasconcelos, nascido por volta de 1515 (Eufrósina e Celestina); António Ribeiro Chiado (Auto das Regateiras); António Ferreira, nascido em 1528 (Inês de Castro). Francisco Manuel de Melo, nascido em 1608 (Auto do Fidalgo Aprendiz) António José da Silva, nascido em 1705 (peça a ser escolhida); Almeida Garrett, nascido em 1799 (Falar a verdade a mentir e Frei Luís de Sousa). Raul Brandão, nascido em 1867; Júlio Dantas, nascido em 1876 (peças a serem escolhidas); José Régio (José Maria dos Reis Pereira), nascido em 1901 (A salvação do mundo); Bernardo Santareno, nascido em 1920; Luiz Francisco Rebello, nascido em 1924 (peças a serem escolhidas). Fora o teatro, prevê-se integrar ao Corpus textos não literários, numa parceria firmada com dois projetos coordenados pela Profa Rita Marquilhas, do Centro de Linguística da Universidade de Lisboa: o projeto Cards e o projeto Post Scriptum, que têm como objetivo “descobrir e publicar cartas privadas escritas em português e castelhano e trocadas por pessoas de todas as classes sociais entre o século XVII e o início do século XIX”. Tanto o teatro quanto os textos não literários devem auxiliar na aproximação do que seja a língua falada na época. No que diz respeito às cartas portuguesas, elas são particularmente importantes no que tange à comparabilidade do português brasileiro com o português europeu, uma vez que grande parte do acervo brasileiro é constituido de cartas (cf. as Cartas brasileiras já presentes no Corpus – va_004). Do ponto de vista da anotação, projeta-se ampliar o Corpus português sintaticamente anotado para pelo menos 1.500.000 palavras, pertencendo a textos repartidos regularmente pelo tempo, com pelo menos 4 textos por período de 50 anos, acrescentando ao período atualmente contemplado a segunda metade do séc. XIX. Quanto aos textos brasileiros, trata-se de constituir um CTB Brasil em colaboração estreita com grupos de pesquisa brasileiros envolvidos na edição de textos não literários produzidos no Brasil ao 29 longo da sua história. Como já foi dito acima, o resultado dessa parceria já redundou na inclusão no Corpus de textos de uma imensa relevância para a compreensão da história do português no Brasil: as Cartas brasileiras, já mencionadas e as Atas da Sociedade Protetora dos Desvalidos (cf. Oliveira, 2006) Trata-se de ampliar e sistematizar essa parceria, de maneira que se constitua um corpus sintaticamente anotado do português brasileiro histórico de pelo menos 500.000 palavras. Desse corpus deverão também fazer parte textos literários, de maneira a permitir uma comparação sistemática das duas vertentes do português no Brasil, o ‘culto’ e o ‘popular’ (pelo menos naquilo que transparece de textos não literários). Está sendo também constituido um corpus de jornais, no âmbito de teses e dissertações em andamento. Enfim, serão acrescentados textos orais representativos do português afro-brasileiro. Os grupos associados a essa pesquisa são os seguintes: - Projeto Brasiliana Digital/ Biblioteca Brasiliana Guita e José Mindlin, USP-São Paulo. - Projeto PHPB-Rio de Janeiro, na Universidade Federal do Rio de Janeiro, coordenado pela Profa Célia Lopes. - Projeto PHPB-Bahia, na Universidade Federal da Bahia, coordenado pela Profa Tânia Lobo, do qual fazem parte os seguintes projetos: Projeto CE-DOHS Corpus Eletrônico de Documentos Históricos do Sertão FAPESB, www.uefs.br/cedohs, coordenado pelas Profas. Zenaide de Oliveira Novais Carneiro e Mariana Fagundes de Oliveira. Projeto Memória Conquistense, na Universidade Estadual do Sudoeste da Bahia –UESB, coordenado pelos Profs Cristiane Namiuti e Jorge Viana. - Projeto Afro-Latin Linguistics: Language Contact in Intercultural Settings, coordenado pela Profa. Dra. Laura Álvarez-López, da Universidade de Estocolmo. Já existe uma intensa parceria entre os três grupos baianos e os projetos associados ao Corpus Tycho Brahe, concretizada em publicações já efetuadas (cf. Lobo e Oliveira, 2009) ou em planejamento (cf. Lobo, Oliveira & Galves em prep.), em transferência de tecnologia e de competência, e em parcerias para disponibilização de textos na Internet. A existência de financiamento para a construção do CTB no âmbito deste projeto temático agilizará essa cooperação, uma vez que permitirá que mais bolsistas efetuem as tarefas de formatação e anotação dos textos. O projeto Afro-Latin Linguistics: Language Contact in Intercultural Settings, que conta com pesquisadores do Brasil, da Suécia e do Uruguai, está iniciando uma cooperação com pesquisadores da Unicamp para a edição de amostras de fala representativas de variedades africanas do português, visando à ampliação do CTB. 30 III.3.2. Elaboração de novas ferramentas e melhoria das já existentes: As ferramentas necessárias ao desenvolvimento do Corpus e seu uso para pesquisa linguística podem ser classificadas em três tipos: - ferramentas de edição eletrônica Um importante produto tecnológico do projeto temático Padrões rítmicos, fixação paramétrica e mudança linguistica Fase II foi a ferramenta E-dictor, planejada por Maria Clara Paixão de Sousa durante seu pós-doutorado no âmbito do projeto, e implementada por Fábio Kepler, então doutorando no Departamento de Computação da USP e Pablo Faria, bolsista TT4A do projeto. Essa ferramenta está sendo usada na construção do Corpus Tycho Brahe, mas também por vários grupos envolvidos na construção de corpora históricos (Vozes do Sertão, Memória Conquistense, PHPB Rio de Janeiro), além do grupo de pesquisa da Biblioteca Brasiliana, que participará da ampliação do Corpus Tycho Brahe. A ferramenta permite que a anotação morfológica seja efetuada no mesmo arquivo. Ela deve ser melhorada no sentido de permitir mais funcionalidades, como a inserção de imagens e a anotação sintática dentro do arquivo. Esse último ponto representará um avanço importante na integração dos aspectos filológicos e sintáticos do Corpus, uma vez que, em estando reunidos num mesmo arquivo, todos os passos da anotação e codificação dos textos, todas as combinações se tornam possíveis, e a anotação sintática pode ser disponibilizada com todos os níveis de edição, inclusive os mais próximos dos textos originais. - ferramentas de anotação morfológica e sintática O etiquetador morfológico foi elaborado no decorrer do primeiro projeto temático, graças à participação decisiva de Marcelo Finger, do Departamento de Computação da USP, na elaboração inicial do Corpus Tycho Brahe. Temos atualmente uma segunda versão, de Fábio Kepler. Para a anotação sintática, utilisamos o analisador sintático automático ("parser") universal, elaborado por Dan Bickel na Universidade da Pensilvânia, e treinado com nossos dados. É parte importante deste projeto a elaboração de um novo "parser", específico para a língua portuguesa e mais eficiente do que o que usamos atualmente, graças à colaboração com Marcelo Finger do Departamento de Computação da USP, Fábio Kepler agora professor na Universidade Federal do Pampa, e os matemáticos Antonio Galves, do Departamento de Estatística da USP, e Jesus Garcia e Veronica González López, do Departamento de Estatística da Unicamp. A originalidade do projeto consiste na articulação de métodos computacionais novos com algoritmos probabilísticos de análise da cadeia sintática. 31 - ferramentas de buscas O trabalho com o Corpus conta com duas ferramentas essenciais, Corpus Draw e Corpus Search (cf. http://corpussearch.sourceforge.net/), elaboradas por Beth Randall no âmbito do projeto do PennHelsinki Parsed Corpus of Middle English, coordenado por Anthony Kroch, na Universidade da Pensilvânia (cf. http://www.ling.upenn.edu/hist-corpora/annotation/index.htm). Corpus Draw permite agilizar a fase de revisão da saída do analisador, e Corpus Search é a ferramenta com a qual se fazem as buscas de estruturas sintáticas nos textos anotados. Uma versão para buscas em textos morfologicamente anotados já está disponível on line no site do Corpus Tycho Brahe. Uma interface deverá ser elaborada no decorrer do projeto para possibilitar buscas on line em textos sintaticamente anotados. Tanto para o desenvolvimento do analisador novo quanto para a procura de interfaces mais eficientes e amigáveis no uso das ferramentas, ou ainda para o estabelecimento de anotações sintáticas mais adequadas, a parceria com Anthony Kroch e sua equipe, em particular Beatrice Santorini, continuará fundamental neste projeto, como foi nos projetos anteriores. 32 Bibliography Adams, Marianne. 1987. Old French, null subjects and Verb-Second phenomena, PhD Dissertation, UCLA. Alkmim, T. 2001. A variedade lingüística de negros e escravos: um tópico da história do português no Brasil. In: Mattos e Silva, R.V. (org.). Para a história do português brasileiro. Vol. II, Tomo II – Primeiros estudos. São Paulo: Humanitas FFLCH/USP, pp. 317-335. Alkmim, T. 2002. Estereótipos linguísticos: negros em charges do século XIX. In: Alkmim, T. (org.) Para a história do português brasileiro. Vol. III – Novos Estudos. São Paulo: Humanitas/FFLCH/USP, pp. 383-402. Alkmim, T. 2008. Falas e cores: um estudo sobre o português de negros e escravos no Brasil do século XIX. In: Stolze Lima, I. & do Carmo, L. (orgs.). História social da língua nacional. Rio de Janeiro: Casa de Rui Barbosa, pp. 247-264. Álvarez López, L. 2008. Fontes escritas como documentação do português falado por africanos e afrodescendentes no Brasil. In: Gonçalves, C. A & Leitão de Almeida, M. L. (orgs.) Língua portuguesa: identidade, difusão e variabilidade. Rio de Janeiro: AILP/Universidade Federal do Rio de Janeiro, pp. 287-302. Alvarez-López, L. 2007. Um estudo sobre a partícula zi/ji em representações da fala de africanos e seus descendentes no Brasil. In: Schrader-Kniffki, M. & García, L. M. (orgs.) Romania en interacción: entre historia, contacto y política. Ensayos en homenaje a Klaus Zimmermann. Frankfurt am Main: Vervuert/Iberoamericana, pp. 391-413. Álvarez-López, L. 2006. Exageros, estereótipos ou espelho da realidade? Fontes escritas como documentação da fala de negros e escravos no Brasil. In: Falk, J. et al. (orgs.) Discurso, interacción e identidad. Estocolmo: Universidade de Estocolmo, pp. 165-177. Andrade, Aroldo. 2010. A subida de clíticos em português. Um estudo sobre a variedade européia dos séc. 16 a 20. Tese de doutorado inédita, Unicamp. Antonelli, André. 2011. Sintaxe da posição do verbo e mudança gramatical na história do português europeu. Tese de doutorado inédita, Unicamp. Authier, J.-Marc P. 1988. Null Object Constructions in Kinande. Natural Language & Linguistic Theory, Vol. 6, No. 1. (Feb., 1988), pp. 19-37. Avelar, Juanito. 2011. “Convergências e contrastes entre o português brasileiro e as línguas Bantu: posição de sujeito e padrões de concordância”. Comunicação apresentada durante o I Simpósio “Dinâmicas Afro-Latinas: Língua(s) e História(s)”, realizado nos dias 27 e 28 de abril de 2011 no IEL/Unicamp. Avelar, Juanito & Sônia Cyrino. 2008. “Locativos preposicionados em posição de sujeito: uma posição contribuição das línguas Bantu à sintaxe do português brasileiro.” Linguística 3 – Revista de Estudos Linguístico da Universidade do Porto, 218-249. Avelar, Juanito; Sonia Cyrino & Charlotte Galves. 2009. “Locative inversion and agreement patterns: parallelisms between Brazilian Portuguese and Bantu languages”, in Margarida Petter & Ronald Beline Mendes. (Eds.). Proceedings of the Special World Congress of African Linguistics 33 São Paulo 2008. Exploring the African Language Connection in the America. São Paulo:: Humanitas, pp. 207-221. Avelar, Juanito & Charlotte Galves, 2010. "Topic and Agreement in the C-T Probe System: the Case of Brazilian Portuguese", comunicação no 1o Rencontres d'Automne de Linguistique Formelle: Language(s) and Cognition, Université Paris VIII. Avelar, Juanito & Charlotte Galves, 2011a. "From European to Brazilian Portuguese: a parameter network approach", comunicação no 13o Diachronic Generative Syntax Conference, University of Pennsylvania. Avelar, Juanito & Charlotte Galves. 2011b. “Tópico e concordância em português brasileiro e português europeu”. In: Armanda Costa; Isabel Falé; Pilar Barbosa. (orgs.) Textos Seleccionados do XXVI Encontro da Associação Portuguesa de Linguística, pp. 49-65. Baker, Mark. 1996. The polysynthesis parameter. Oxford: Oxford University Press. Baker, Mark. 2001. The atoms of language. Oxford: Oxford University Press. Baker, Mark. 2008a. The syntax of agreement and concord. Cambridge: Cambridge University Press. Baker, Mark. 2008b. “The macroparameter in a microparametric world”. in Theresa Biberauer (org.), The limits of syntactic variation, Linguistics Today 132, Amsterdam: John Benjamins. pp. 351-374. Barbosa, Pilar, 1995. Null Subjects. MIT Ph.D. dissertation. Barbosa, Pilar, 1996. Clitic placement in European Portuguese and the position of subjects. In: Halpern, Aaron, Zwicky, Arnold (eds.), Approaching Second: Second position clitics and related phenomena, CSLI Publications, pp. 1-40. Barbosa, Pilar, 2000. Clitics: a window into the null subject property. In: João Costa (org.). Portuguese Syntax, Oxford University Press, Oxford, New York, pp. 31-93. Barbosa, Pilar, 2008. Deslocação local, cliticização e Spell Out cíclico, Diacrítica 22,1, 131-156. Baxter, Alan. 2002. 'Semicreolization'? The Restructured Portuguese of the Tongas of São Tomé - a Consequence of L1 Aquisition in a Special Contact Situation. Journal of Portuguese Linguistics. Lisboa, 1: 7-39. Biberauer, Theresa (org.). 2008. The limits of syntactic variation. Amsterdam: Benjamins. Biberauer, Theresa & Ian Roberts. 2010. “Subjects, tense and verb-movement”, in Biberauer et al., pp. 263-302. Biberauer, Theresa, Anders Holmberg, Ian Roberts & Michelle Sheehan (orgs.) 2010. Parametric variation, Null subjects in minimalist theory. Cambridge: Cambridge University Press. Bošković, Ž. 2008. "What will you have, DP or NP?" In: Proceedings of NELS 37. Bošković, Ž. a sair. "Semantic correlates of the NP/DP parameter." In: Proceedings of NELS 39. Cardeira, Esperança. 2005. Entre o português antigo e o português clássico. Lisboa: Imprensa Nacional Casa da Moeda. Carlson, G. 1977. "A unified analysis of the English bare plural". Linguistics and Philosophy 1, 413–457. Carneiro, Zenaide. 2005. Cartas brasileiras (1809-1904) Um estudo linguístico-filológico. Tese de doutorado inédita, Unicamp. Carneiro, Zenaide & Charlotte Galves. 2010. “Variação e Gramática: colocação de clíticos na história do português brasileiro”. Revista de Estudos da Linguagem 18, 1, 7-38. Carneiro, Zenaide, Charlotte Galves & Tânia Lobo em prep. Cartas brasileiras dos novecentos: um estudo lingüístico. 34 Cassandro, Marzio, Pierre Collet, Antonio Galves & Charlotte Galves. 1999. "A statistical-physics approach to language acquisition and language change". Physica A. 263, 427-437. Castro, Ivo. 2006. Introdução à história do português. Lisboa: Colibri. Cavalcante, Sílvia. O uso de se com infinitivo na história do português: do português clássico ao português europeu e brasileiro moderno. Tese de doutorado inédita, Universidade Estadual de Campinas. Chomsky, Noam. 1982. Some concepts and consequences of the theory of government and binding. Foris, Dordrecht. Chomsky, Noam.1985. Knowledge of Language: its nature, its acquisition, its use. New York: Praeger. Chomsky, N. 2001. “Derivation by phase”. In: Michael Kenstowicz (org.). Ken Hale: a life in language. Cambridge (Mass.): MIT Press. 1-52. Chomsky, Noam. 2005. “Three factors in language design” Linguistic Inquiry 36: 1-22. Chomsky, Noam. 2008. “On Phases”. In: Robert Freidin, Carlos Otero, & Maria Luisa Zubizarreta (eds) Foundational issues in linguistic theory. Cambridge, MA: MIT Press, 133-166. Correa, Vilma. 1991. O objeto direto nulo no português do Brasil. Dissertação de mestrado inédita, Unicamp. Coelho, Francisco Adolfo. 1967[1880, 1882, 1886]. “Os dialetos românicos ou neo-latinos na África, Ásia e América”, in Estudos Lingüísticos Crioulos, reedição de artigos publicados no Boletim da Sociedade de Geografia de Lisboa, Academia Internacional da Língua Portuguesa, Lisboa. Costa, João. 2010. "PB e PE: Orientação para o discurso importa?" Estudos da Lingua(gem), Estados diacrônicos e sintáticos da lingua portuguesa 8.1, 123-144. Costa, João & Ana Maria Martins. 2004. "What is a strong functional head?". Comunicação no Lisbon Workshop on Alternative Views on the Functional Domain, Universidade Nova de Lisboa. Cyrino, Sonia 1997. O objeto nulo no português brasileiro: um estudo sintático-diacrônico. Londrina: Editora da UEL. Cyrino, Sônia 2010. "Morphological marking and verb movement in Brazilian Portuguese". Workshop on Verb Movement: its nature, triggers and effects. University of Amsterdam, Amsterdam, December 11-12, 2010. Cyrino, Sônia. 2011. "On richness of tense and verb movement in Brazilian Portuguese". 21st Colloquium on Generative Grammar (CGG21), Universidad de Sevilla/Universidad Pablo de Olavide, Sevilha, Espanha, 7-9 de abril de 2011. Cyrino, Sônia & Maria Teresa Espinal 2011. "Object Bare Nominals in Brazilian Portuguese: more on the NP/DP analysis". Comunicação apresentada no CSSP 2011. September 21-23, 2011. D’Alessandro Roberta, Adam Ledgeway & Ian Roberts. 2010. Syntactic variation, The dialects of Italy. Cambridge: Cambridge University Press. Diesing, M. 1992. Indefinites . Cambridge MA: The MIT Press. Duarte, Inês. 1987. A construção de topicalização na gramática do português: regência, ligação e condição sobre o movimento.Tese de doutorado inédita, Universidade de Lisboa. Duarte, Maria Eugênia. 1995. A perda do princípio ‘Evite pronome’ no português brasileiro. Tese de doutorado inédita, Unicamp. Duarte, Maria Eugênia & Mary Kato. 2008. "Mudança paramétrica e orientação para o discurso". Comunicação no 24o Congresso Nacional da Associação Portuguesa de Linguística, Braga. 35 Espinal, M. Teresa & Louise McNally. 2009. Characterizing 'have' predicates and indefiniteness. M. T. Espinal, et al. (orgs.) Proceedings of the IV NEREUS International Workshop, Fachbereich Sprachwissenschaft der Universität Konstanz Arbeitspapier Nr. 124, pp. 27-32. Espinal, Maria Teresa & Louise McNally. 2009. "Bare singular nouns and incorporating verbs in Spanish and Catalan". Journal of Linguistics 47, 87-128. Figueiredo, . 2010. A concordância plural variável no sintagma nominal do português reestruturado da comunidade de Almoxarife, São Tomé: desenvolvimento das regras de concordância variáveis no processo de transmissão-aquisição geracional, vols. 1 e 2. Tese de Doutoramento inédita. Universidade de Macau. Fiorin, José Luis & Margarida Petter (orgs.). 2007. África no Brasil: a formação da língua portuguesa. São Paulo: Contexto. Floripi, Simone. 2008. Estudo da variação do determinante em sintagmas nominais possessivos na história do português. Tese de doutorado inédita, Unicamp. Galves, Antonio & Charlotte Galves. 1995. “A case study of prosody driven language change”, manuscrito, USP-Unicamp, disponível em www.tycho.iel.unicamp.br/~tycho/prfpml/fase1/papers/ Galves, Antonio, Charlotte Galves, Jesus Garcia, Nancy Garcia & Florência Leonardi. 2012. "Context tree selection and linguistic rhythm retrieval from written texts", Annals of Applied Statistics 6, 186-209. Galves, Charlotte. 1987. "A sintaxe do português brasileiro". Ensaios de Linguística 13, (reimpresso em Galves, 2001). 31-50, Galves, Charlotte. 1989. "L'objet nul et la structure de la proposition en portugais du Brésil", Revue des langues romanes 93-2, 305-336. Galves, Charlotte. 1994. "V-Movement, Levels of Representation and the Structure of S". Letras de Hoje 96, 35-58. Galves, Charlotte. 1997. "La syntaxe pronominale du Portugais Brésilien" In: A. Zribi-Hertz (org.) Les Pronoms. Presses Universitaires de Vincennes. Galves, Charlotte. 1998. "Tópicos, Sujeitos, Pronomes e Concordância no Português Brasileiro". Cadernos de Estudos Lingüísticos 34, 7-21. Galves, Charlotte. 2001. Ensaios sobre as gramáticas do português. Campinas: Editora da Unicamp. Galves, Charlotte. 2012. "Periodização e competição de gramáticas: o caso do português médio". In: Lobo, Tânia; Carneiro, Zenaide; Ribeiro, Silvana; Soledade; Juliana; Almeida, Ariadne (orgs.). ROSAE: linguística histórica, história das línguas e outras histórias. Salvador: Edufba, pp. 74-88. Galves, Charlotte, Helena Britto & Maria Clara Paixão de Sousa. 2005. The change in clitic placement from Classical to Modern European Portuguese: results from the Tycho Brahe Corpus. Journal of Portuguese Linguistics 4,1, 39-68. Galves, Charlotte, Cristiane Namiuti & Maria Clara Paixão de Sousa. 2006. “Novas perspectivas para antigas questões: revisitando a periodização da língua portuguesa”, in A, Endruschat, R. Kemmler& B. Schafer-Prieβ (orgs.) Grammatische Strukturen des Europaischen Portugiesisch, Tubingen: Calepinus Verlag. Galves, Charlotte & Maria Clara Paixão de Sousa. 2005. "Clitic placement and the position of subjects in the history of European Portuguese". In: Twan Geerts; Ivo van Ginneken; Haike Jacobs.. (orgs.). Romance Languages and Linguistic Theory 2003; Selected Papers from ´Going Romance´ 2003. Amsterdam: John Benjamins, pp. 97-113. 36 Galves, Charlotte & Maria Clara Paixão de Sousa. 2010. "The loss of verb-second in the history of Portuguese: Subject position, Clitic placement and Prosody". Comunicação no Digs12, Cambridge, UK. Galves, Charlotte & Filomena Sandalo. 2012. “From Intonational Phrase to Syntactic Phase: the grammaticalization of enclisis in the history of Portuguese”, a sair em Lingua, 122. Galves, Charlotte, Sônia Cyrino, Ruth Lopes, Filomena Sandalo, & Juanito Avelar (orgs.). no prelo. Parameter Theory and Linguistic Change, Oxford University Press, Oxford. Gibrail, Alba. 2003. O acusativo preposicionado no português clássico: uma abordagem diacrônica e teórica. Dissertação de mestrado inédita, Unicamp. Gibrail, Alba. 2010. Contextos de formação de estruturas de tópico e foco no português clássico. Tese de doutorado inédita, Unicamp. Gonçalves, Perpétua & Chimbutane, F. 2004. O papel das línguas Bantu na gênese do português de Moçambique: o comportamento sintático de constituintes locativos e direcionais. Papia 14, 7-30. Gonçalves, Perpétua 2010 A Gênese do português de Moçambique, Lisboa: INCM. Grimshaw, Jane. 1991. “Extended projections”, Unpublished ms: Rutgers. Holm, John. 2004. Languages in contact, the partial restructuring of vernaculars, Cambridge: Cambridge University Press. Huang, C.T.J. 1984. "On the distribution and reference of empty pronouns", Linguistic Inquiry 15.4, 531-574. Inverno, Liliana Cristina. 2005. Angola’s Transition to Vernacular Portuguese, dissertação de mestrado inédita, Universidade de Coimbra. Inverno, Liliana Cristina. 2011. Contact-induced restructuring of Portuguese morpho-syntax in interior Angola. Tese de doutorado inédita, Universidade de Coimbra. Jon-And, Anna. 2011. Variação, contato e mudança linguística em Mocambique e Cabo Verde. Stockholm: Stockholm University. Kayne, Richard. 2005. “Some Notes on Comparative Syntax”. In Movement and Silence, Oxford: Oxford University Press. Kratzer, A. 1995. "Stage-level and individual-level Predicates". In: G. Carlson & J. Pelletier (orgs.) The Generic Book , The University of Chicago Press, pp.125-175. Kroch, Anthony. 1989. "Reflexes of grammar in patterns of language change". Language Change and Variation 1, 199-244. Kroch, Anthony. 1994. “Morpho-syntactic variation”, in Kenneth Beals et al. (orgs.), Papers from the 30th Regional Meeting of the Chicago Linguistics Society: Parasession on Variation e Linguistic Theory, vol. 2, pp. 180-201. Kroch, Anthony. 2001. “Syntactic change”. In: Mark Baltin & Cris Collins (orgs.) The handbook of contemporary syntactic theory. Oxford: Blackwell, pp. 699-729. Lightfoot, David. 1999. The development of language: evolution, change and acquisition. Oxford: Blackwell. Lightfoot, David. 2006. How new languages emerge. Cambridge: Cambridge University Press. Lobo, Tânia & Klebson Oliveira. 2009. África à vista: dez estudos sobre o português escrito por africanos no Brasil do século XIX., Salvador: EDUFBA. Lobo, Tânia, Klebson Oliveira & Charlotte Galves em prep, Brasil-África à vista: estudos sobre o português escrito por forros brasileiros. Salvador: EDUFBA. 37 Lucchesi, Dante. 2003. “O conceito de transmissão linguística irregular e o processo de formação do português do Brasil”, in Roncarati, Claudia; Abraçado, Jussara. (orgs) Português brasileiro, contato linguístico, heterogeneidade e história, Rio de Janeiro: Viveiros de Castro Editora, pp. 272282. Lucchesi, Dante, Ilza Ribeiro & Alan Baxter. 2009. O português afro-brasileiro. Salvador: EDUFBA. Magro, Catarina, 2008. Clíticos: variação sobre o tema. Tese de doutorado inédita, Universidade de Lisboa. Marquilhas, Rita. 2001. A faculdade das letras. Lisboa: INCM. Martins, Ana Maria. 1994. Clíticos na história do português. Tese de doutorado inédita, Universidade de Lisboa. Martins, Ana Maria. 2011 “Clíticos na história do português à luz do teatro vicentino” Estudos de Lingüística Galega 3, 83-109. Martins, Marco Antonio. 2010. Competição de gramáticas do português na escrita catarinense dos séculos 19 e 20. Tese de doutorado inédita, Universidade Federal de Santa Catarina. Mattos e Silva, Rosa Virgínia. 2004. Ensaios para uma socio-história do português brasileiro. São Paulo: Parábola Editorial. Meillet, A. 1912 “L’évolution des formes grammaticales”. Reprint 1958 in A. Meillet. Linguistique historique et linguistique générale, Paris: Champion, 130-158. Milsark, Gary. 1977. 'Peculiarities of the Existential Construction in English', Linguistic Analysis 3, 1-29. Modesto, Marcello. 2008. "Topic prominence and null subjects". In:Theresa Biberauer (org.), The limits of syntactic variation, Linguistics Today 132, Amsterdam: John Benjamins. pp. 375-410. Moura, Denilda. 2009. Resquícios de Palmares – O que uma comunidade quilombola nos diz. Maceió: EdUFAL. Munn, Allan & Schmitt, Cristina. 2001. "Bare nominals and the morphosyntax of number". In: T. Satterfield, C. Tortora & D. Cresti (orgs), Current issues in Romance Linguistics, Amsterdam: John Benjamins, pp. 217–231. Namiuti, Cristiane. 2008. Aspectos da história gramatical do português: interpolação, negação e mudança. Tese de doutorado inédita, Unicamp. Negrao, Esmeralda. 1999. O português brasileiro, uma língua voltada para o discurso. Tese de Livre-Docência, Universidade de São Paulo. Naro, Anthony & Marta Scherre. 2007. As origens do português brasileiro. São Paulo: Parábola. Newmeyer, Frederic. 2004 “Against a parameter-setting approach to language variation”. Linguistic Variation Yearbook 4:181-234. Niyogi, Partha. 2006. The computational nature of language learning and evolution. Cambridge, Mass: MIT Press. Oliveira, Klebson,2006. Negros e escrita no Brasil do século XIX: sócio-história, edição filológica de documentos e estudo lingüístico. Tese de Doutorado. Universidade Federal da Bahia, Salvador. Ouhalla, Jamal, 2005. "Clitic placement, grammaticalization, and reanalysis in Berber". In: Guglielmo Cinque & Richard Kayne (orgs.), The Oxford Handbook of Comparative Syntax. Oxford University Press, Oxford, New York, pp. 607-638. Pagotto, Emílio. 1992. A posição dos clíticos em Português: Um Estudo Diacrônico. Dissertação de mestrado inédita, Universidade Estadual de Campinas. 38 Paixão de Sousa, Maria Clara. 2004. Língua barroca: Sintaxe e história do português nos 1600. Tese de Doutoramento inédita, Universidade Estadual de Campinas. Paixão de Sousa, Maria Clara. 2010. A Língua Portuguesa, 1400-1600: Aspectos de História e Gramática. Projeto de pesquisa para o Regime de Dedicação Exclusiva à Pesquisa e Docência, Departamento de Letras Clássicas e Vernáculas, Universidade de São Paulo. Petter, Margarida. 2009. "O continuum afro-brasileiro do português" . In: Charlotte Galves, Helder Garmes & Fernando Rosa Ribeiro (orgs.) África-Brasil, Caminhos da língua portuguesa. Campinas: Editora da Unicamp. Pontes, Eunice. 1987. O tópico no português do Brasil. Campinas: Editora Pontes. Raposo, Eduardo. 1986 "On the null subject in European Portuguese". In: Oswald Jaeggli & Carmen Silva-Corvalan (orgs.) Studies in Romance Linguistics. Dordrecht: Foris. Raposo, Eduardo & Juan Uriagereka. 2005. Clitic Placement in Western Iberian: A Minimalist View. In: Guglielmo Cinque & Richard Kayne (orgs.), The Oxford Handbook of Comparative Syntax. Oxford University Press, Oxford, New York, pp. 639-697. Rizzi, Luigi. 1997. "The fine structure of the left periphery". In: Lilian Haegeman (org.) Elements of Grammar: Handbook of Generative Syntax. Kluwer, Dordrecht, pp. 281-337. Rizzi, Luigi. 2004. “On the cartography of syntactic structures”. In: Luigi Rizzi (org.), The Cartography of Syntactic Structures, vol. 2, The structure of CP and IP. Oxford University Press, Oxford, New York, pp. 4-15. Roberts, Ian. no prelo. “Macroparameters and Minimalism: A Programme for Comparative Research”. In : Galves, Charlotte, Sônia Cyrino, Ruth Lopes, Filomena Sandalo, & Juanito Avelar (orgs.). Parameter Theory and Linguistic Change, Oxford University Press, Oxford. Roberts, Ian & Anders Holmberg. 2010. “Introduction: parameters in minimalist theory”, In: Biberauer et al., 1-57. Roberts, Ian & Anna Roussou. 2003. Syntactic Change, A Minimalist Approach to Grammaticalization. Cambridge Studies in Linguistics 100. Cambridge: Cambridge University Press. Rouveret, Alain. 1987. Syntaxe des dépendances lexicales: identité et identification dans la théorie syntaxique. Tese de doutorado inédita. Universidade Paris VII. Rouveret, Alain.1999. "Clitics, Subjects and Tense in European Portuguese". In: Henk van Riemsdijk, (org.), Clitics in the Languages of Europe. Mouton de Gruyter, Berlin, New York, pp. 639-677. Santos, Márcia. 2011. “Novas luzes sobre o português afro-brasileiro: alguns dados de Jurussaca”, Comunicação apresentada durante o I Simpósio “Dinâmicas Afro-Latinas: Língua(s) e História(s)”, realizado nos dias 27 e 28 de abril de 2011 no IEL/Unicamp. Sapir, Edward. 1921. Language, New York: Harcourt Brace. Schmitt, Crisina & Alan Munn. 2003. "The syntax and semantics of bare arguments in Brazilian Portuguese". In: Linguistic Variation Yearbook 2, pp. 185–216. Schmitt, C. & E-P Kester. 2005. "Bare nominals in Papiamentu and Brazilian Portuguese: An exoskeletal approach". Selected peer reviewed papers from the 34th Annual Linguistic Symposium in Romance Languages 2004, Salt Lake City. Silva Neto, Serafim. 1977 [1950]. Introdução ao estudo da língua portuguesa, Rio de Janeiro: Presença, 4a edição. 39 Shlonsky, Ur. 2004. Enclisis and proclisis. In: Luigi Rizzi (org.), The Cartography of Syntactic Structures, vol. 2, The structure of CP and IP. Oxford University Press, Oxford, New York, pp. 329-253. Torres Morais, Maria Aparecida. 1995. Do português clássico ao português europeu moderno: um estudo da cliticização e do movimento do verbo. Tese de doutorado inédita, Unicamp. Uriagereka, Juan. 1995. "Aspects of the syntax of clitic placement in Western Romance", Linguistic Inquiry 26, 79-123. Yang, Charles. 2000. “Internal and external forces in language change”. Language Variation and Change 12, 231-250. Yang, Charles 2002. Knowledge and Learning in Natural Languages. Oxford: Oxford University Press. 40