1 A LÍNGUA PORTUGUESA NO TEMPO E NO ESPAÇO: contato

Propaganda
Projeto Temático
A LÍNGUA PORTUGUESA NO TEMPO E NO ESPAÇO:
contato linguístico, gramáticas em competição e mudança paramétrica
Resumo:
Este projeto visa a revisitar a história do português do século XV ao século XXI, em Portugal e no
eixo Brasil-África, dentro de uma abordagem comparativa baseada na noção de parâmetros, tal
como é formulada na Teoria de Princípios e Parâmetros de Chomsky (1985, 2008), em particular
nos seus últimos desdobramentos no quadro do Programa Minimalista. Para atingir esse objetivo,
pretende-se usar os textos anotados disponíveis no Corpus Tycho Brahe, nos quais é possível fazer
buscas automáticas de construções sintáticas. Faz parte deste projeto alargar a base de textos
sintaticamente anotados para 1.500.000 palavras em textos portugueses, 600.000 palavras em textos
brasileiros, e 150.000 palavras em documentos africanos, além de elaborar um analisador sintático
automático (parser) para o português.
1
I. Apresentação do problema
O português é uma língua que oferece um terreno particularmente fértil para os estudos
históricos, uma vez que a sua história se desenvolve em três continentes e mostra, em seus
desdobramentos recentes, mudanças de diversos tipos.
As variedades do português que vêm emergindo em países como Angola e Moçambique, por
exemplo, representam um caso de evolução linguística que não se dá a partir de uma única fonte
(como nas representações encontradas no modelo clássico em árvore), mas são produzidas pelo
encontro de diferentes línguas, por meio do processo de aquisição do português como L2 por
falantes nativos de línguas níger-congo. Considerando os milhões de africanos (em sua maioria,
falantes nativos de línguas bantas) trazidos como escravos para o Brasil entre os séculos XVI e XIX,
o cenário linguístico que hoje observamos nos referidos países africanos deve guardar semelhanças
significativas com o que marcou a emergência de variedades do português brasileiro. Isso justifica,
em grande medida, a afirmação feita em Petter (2009), de acordo com quem “são tantas as
semelhanças compartilhadas pelas três variedades de português [brasileira, angolana e
moçambicana] nos três níveis de organização linguística selecionados (fonológico, lexical e
morfossintático) que fica difícil defender que tais fatos sejam casuais, resultantes de uma deriva
natural do português ou decorrentes da manutenção de formas antigas do português europeu” (pp.
171-172).
Semelhanças como as observadas por Petter podem, nesse sentido, resultar do fato de que, tanto
no Brasil como na África, em diversos momentos do séc. XV ao séc. XXI, variantes do português
foram adquiridas por falantes de línguas africanas e depois transmitidas para as gerações
subsequentes, dando origem a outras variedades que se afastaram, em muitos aspectos, do que hoje
chamamos de português europeu. Paralelamente à formação dessas variedades, segmentos da
sociedade de origem europeia continuaram a veicular a língua portuguesa nas duas regiões, na sua
forma transmitida regularmente via aquisição de primeira língua.
Em Portugal, nesse mesmo decorrer de tempo, a língua escrita, já afastada dos padrões
medievais do galego-português inicial, passa por uma fase de fixação ao longo dos séculos XVI e
XVII. Em seguida, nos autores nascidos no primeiro quarto do século XVIII, observamos uma nova
mudança, refletida em numerosos aspectos gramaticais. É a emergência do português europeu
moderno, tal como o conhecemos hoje.
A história do português em Portugal e fora de Portugal oferece assim dois conjuntos de
mudanças gramaticais que parecem estar radicadas em causas bem distintas, a saber:
1) um conjunto que abarca mudancas cujas causas parecem ser exógenas, com uma forte história
de contato linguístico na base de alterações que contribuíram para afastar as variedades
2
brasileiras e africanas da língua daquelas faladas em Portugal, configurando um caso, senão
de crioulização, pelo menos de reestruturação parcial (Baxter, 2002; Holm, 2004; Lucchesi
et al., 2009)
2) um conjunto que abarca mudanças cujas causas parecem ser endógenas, uma vez que, pelo
menos aparentemente, nenhum fenômeno externo de contato ou de substituição de um
dialeto por outro está na base das modificações observadas.
Esses dois tipos de mudança abrem espaço para refinar a teoria de parâmetros tal como vem se
desenvolvendo recentemente no quadro do modelo minimalista da teoria gerativa (cf. Baker, 2008;
Biberauer et al., 2010). Com efeito, o primeiro conjunto de mudanças afeta a língua num sentido
“macroparamétrico” (ver a seção III.2), e pode ser caracterizado por abarcar mudanças que remetem
a alterações de base tipológica, uma vez que o PB adquiriu feições que são bastante incomuns no
conjunto das línguas indo-europeias (a presença de propriedades largamente encontradas em línguas
orientadas ao discurso, por exemplo, pode ser um reflexo dessas alterações (cf. Pontes, 1987)). No
segundo caso, encontramos uma mudança bastante frequente na história das línguas românicas e
germânicas, que afeta a posição do verbo na oração finita: a perda do fenômeno V2. Essa mudança,
por sua vez, remete a diferenças de natureza ‘microparamétrica’, uma vez que diz respeito à
modificação dos traços associados a determinadas categorias funcionais. Um quadro interessante
para discutir essa diferença surge de trabalhos como os de Roberts (2010, a sair). Esse autor
desenvolve um modelo no qual os parâmetros são organizados hierarquicamente em árvores, cujo
topo expressa diferenças tipológicas ou macroparamétricas (ver seção III.2), enquanto a base
caracteriza diferenças cada vez mais localizadas, ou microparamétricas.
Os dois referidos conjuntos de mudança possibilitam, além do mais, trabalhar com a questão de
como as dinâmicas de mudança se projetam nos textos, o que nos leva a indagar sobre o
encadeamento de fenômenos de vários tipos, bem como sobre a evolução desses fenômenos em
termos espaciais e temporais e a datação da origem de cada um deles. A história da língua
portuguesa é rica em dados capazes de sustentar empiricamente, e refinar conceitualmente, uma
noção que mudou nosso olhar para a dinâmica da mudança nos textos: a noção de competição de
gramáticas, proposta por Anthony Kroch (Kroch, 1994, 2001).
Em Portugal, dois momentos fornecem elementos indicativos de forte competição gramatical nos
textos. São eles o séc. XV, período tradicionalmente chamado de “português médio” (Cardeira,
2005; Castro, 2006), que vê a tensão entre a gramática do galego-português e a gramática do
português clássico, e o séc. XVIII, durante o qual vai se impondo a gramática moderna (Galves et
al., 2005, 2006; Paixão de Sousa, 2004).
No Brasil, os documentos escritos no séc. XIX fornecem uma ilustração espetacular da
competição de gramáticas. Carneiro (2005) e Carneiro & Galves (2010) mostram que, nos
3
documentos por elas analisados, não são duas, mas três as gramáticas em presença, uma vez que, ao
lado do reflexo da emergência do português brasileiro, observamos também o reflexo da mudança
em Portugal, com 100 anos de atraso em relação às gerações portuguesas. O trabalho de Martins
(2010) mostra o mesmo fenômeno em peças de teatro escritas nos séculos XIX e XX em Santa
Catarina. Avelar (2005) também observa um caso de competição de gramáticas na manifestação de
propriedades das construções possessivo-existenciais em textos brasileiros dos séculos XIX e XX,
nos quais a substituição de haver por ter é marcada pela sobreposição de marcas gramaticais do
português brasileiro e do português europeu.
O português da África oferece um novo e vasto território para o trabalho em torno da noção de
competição de gramáticas, com a presença ainda viva das línguas africanas. Lá, claramente, é
possível flagrar o desencadeamento de uma série de mudanças que poderão ou não se consolidar
nas variedades linguísticas em emergência. Trabalhos como os de Figueiredo (2010), Gonçalves
(2010), Inverno (2011), e Jon-And (2011) que abordam aspectos resultantes da aquisição de
português como língua segunda por falantes de línguas bantas ou crioulas, trazem novas luzes para
a compreensão das mudanças gramaticais induzidas por contato. O cenário atual para a aquisição e
difusão do português em Angola, Moçambique, ou Guiné-Bissau é, nesse sentido, um profícuo
laboratório para a verificação da validade de hipóteses atreladas à noção de competição de
gramáticas, uma vez que, paralelamente à emergência de novas variedades linguísticas, o português
europeu padrão continua a ser veiculado em diferentes esferas da vida social e cultural desses países.
Adicionalmente, surge a questão de saber qual é o estatuto das gramáticas envolvidas em cada
caso de competição, a saber: os estados de língua encontrados nos textos correspondem, em todos
os casos, a variedades vernáculas (ou seja, a gramáticas efetivamente adquiridas como línguas
maternas) ou podem ser variedades representativas de um dialeto essencialmente literário?
Recentemente, Ana Maria Martins (Martins, 2011) lançou o debate para o português europeu,
argumentando em favor da existência de duas gramáticas distintas do português coexistindo na
época: "A gramática proclítica, a que poderíamos chamar "pan-ibérica", era a das classes social e
culturalmente dominantes (tipicamente, alfabetizadas e produtoras de escrita), a gramática mais
especificamente portuguesa era a das classes populares (tipicamente, não alfabetizadas e com
acesso muito limitado à produção escrita). São fatores socioculturais os que determinam que no
português quinhentista (e também quatrocentista e seiscentista) seja extremamente reduzida a
visibilidade da gramática em que a ênclise se terá mantido estável ao longo do tempo." Desse ponto
de vista, não haveria, no séc. 18, propriamente uma mudança para uma nova gramática, mas o
reaparecimento do vernáculo nos textos,. Essa tese questiona as análises baseadas no Corpus Tycho
Brahe (Galves, Britto & Paixão de Sousa, 2005; Galves, Namiuti & Paixão de Sousa, 2006; e os
trabalhos subsequentes), que, sem menosprezar a questão do contato com o castelhano (cf. Paixão
4
de Sousa, 2004), argumentam em favor da existência, nos textos clássicos, de uma gramática
subjacente ao vernáculo, distinta tanto da gramática antiga como da gramática moderna.
Frente a esse conjunto de questões que envolvem as noções de mudança paramétrica e
competição de gramáticas, em adição às considerações sobre contato linguístico, o presente projeto
tem como questão central a natureza da relação entre as diversas vertentes da língua portuguesa,
tanto na diacronia como na sincronia. Na diacronia, se discute a filiação entre um estado de língua
e outro. Examinaremos criticamente, tanto de um ponto de vista teórico quanto empírico, a noção
de deriva, muito recorrente na tradição dos estudos do português brasileiro (cf. Silva Neto, 1950) e
recentemente enfaticamente retomada por Anthony Naro e Marta Scherre (cf. Naro e Scherre, 2007),
ao mesmo tempo em que levaremos em conta o papel das dinâmicas de contato interlinguístico na
formação de variedades brasileiras e africanas do português. Da perspectiva sincrônica, é preciso
integrar aos modelos propostos o papel do contato interno à própria língua portuguesa, ou seja, o
contato das suas diversas variantes, e o efeito desse contato na dinâmica da língua (cf., por exemplo,
o processo de convergência da língua popular e da língua culta na história do português brasileiro,
enfatizado por Dante Lucchesi (cf. Lucchesi, 2003 e Lucchesi et al., 2009).
Essas diversas questões não podem ser enfrentadas sem uma base empírica extensa e confiável.
Dispomos do Corpus Tycho Brahe, elaborado em projetos anteriores. É preciso estendê-lo e
diversificar a tipologia dos textos, não somente no que diz respeito à sua procedência geográfica,
mas a seus gêneros e às suas condições de produção, incluindo, inclusive, dados de fala dos séculos
XX e XXI. É preciso também ampliar a anotação sintática, imprescindível para a recuperação
rápida e consistente de dados, bem como continuar a desenvolver ferramentas computacionais que
são essenciais para as tarefas de construção e utilização de grandes corpora.
II. Resultados esperados
- Equiparação do Corpus Tycho Brahe aos grandes corpora sintaticamente anotados do inglês e do
francês, com a ampliação da anotação sintática a 2 milhões de palavras e a inclusão de textos de
gêneros mais diversificados, inclusive textos não literários, produzidos em Portugal, no Brasil e na
África;
- Anotação sintática de textos orais representativos de variedades do português brasileiro e do
português africano dos séculos XX e XXI, na linha do que já vem sendo desenvolvido pelo CordialSIN, com a utilização de ferramentas computacionais do Tycho Brahe;
- Produção de um analisador sintático (parser) automático para o português;
- Criação de novas ferramentas estatísticas para extrair informações sobre a mudança sintática e
fonológica nos textos;
5
- Emergência de uma nova geração de pesquisadores em linguística histórica, capazes de articular
teoria linguística com trabalho filológico, de usar métodos computacionais modernos e de operar
com ferramentas estatísticas;
- O reforço das redes de pesquisadores, dentro do Brasil, e no eixo Brasil-Portugal-África, visando a
articular o trabalho filológico (edição de documentos) e o trabalho de análise;
- Publicação de um livro pela Oxford University Press, na nova coleção Series in Diachronic and
Historical Syntax, propondo uma história do português revisitada, baseada na descrição e análise da
gramática instanciada nos textos dos sécs. XV a XVII e de sua evolução para o português europeu
moderno e para o português brasileiro;
- Um ou mais livros sobre a formação do português brasileiro (editoras ainda não definidas),
elaborados em parceria com grupos brasileiros envolvidos na edição, descrição e análise de
documentos produzidos no Brasil ao longo de sua história;
- Um novo manual de história do português, que privilegie uma abordagem integrada da história da
língua em Portugal, no Brasil e na África, visando a um público mais largo de alunos de graduação
e professores de português no nível secundário;
- Artigos em revistas internacionais e comunicações em congressos baseados no uso de dados
sincrônicos e diacrônicos da história do português, visando à elaboração conjunta com outros
grupos de pesquisa de um modelo formal de mudança associado ao modelo de árvores paramétricas.
III. Detalhamento do projeto
O projeto será desenvolvido em torno de três frentes de trabalho, a saber:
- Descrição comparativa de fenômenos sintáticos do português ao longo de sua história
(do século XV ao século XXI)
- Análise das dinâmicas da mudança à luz de modelos paramétricos
- Ampliação e consolidação do Corpus Tycho Brahe
Cada uma dessas frentes será apresentada a seguir, focalizando-se o estado da arte e as novas etapas
que nos propomos a percorrer.
III.1 A descrição sincrônica das gramáticas envolvidas
III.1.0 As gramáticas na história do português
6
Ao longo da sua história, o português apresenta fenômenos sintáticos constitutivos de suas diversas
gramáticas, fenômenos esses de grande interesse tanto do ponto de vista sincrônico-comparativo
quanto do ponto de vista diacrônico da dinâmica da mudança. Nesta seção, apresentamos os
fenômenos que serão estudados neste projeto numa ótica comparativa, bem como as questões que
eles levantam para a teoria sintática. Esta parte do projeto, além do seu interesse intrínseco para a
história do português e para a teoria gramatical, constitui a base indispensável da parte seguinte,
sobre a dinâmica da mudança (cf. III.2). O conceito central comum a essas duas partes é o de
parâmetro, uma vez que, além da descrição e análise dos fenômenos, se procura entender as
gramáticas subjacentes aos sucessivos e paralelos estados linguísticos representados nos corpora
históricos. Na teoria de Princípios e Parâmetros, essas gramáticas são definidas pela fixação de um
certo número de parâmetros.
Note-se que os trabalhos desenvolvidos nos projetos anteriores sustentaram a hipótese de que a
história do português europeu pode ser dividida em três fases, correspondendo a três gramáticas
distintas (cf. Galves, Namiuti & Paixão de Sousa 2006; Galves (2012)). Desse ponto de vista, o
português clássico apresenta uma gramática própria, distinta tanto da gramática do português antigo
quanto da do português moderno. Articulando nossos resultados com trabalhos sobre o português
médio (cf. Cardeira, 2005), podemos afirmar que a gramática do português clássico tem seu início
no período quatrocentista, num processo de competição com a gramática do português antigo, e seu
declínio se dá a partir da primeira geração de autores nascidos no século XVIII. Paixão de Sousa
(2004) traz, além disso, evidências de que a mesma gramática é subjacente aos bilhetes da
inquisição do séc. XVII editados por Rita Marquilhas (cf. Marquilhas, 2001). Esse fato é crucial
para caracterizar a gramática do português clássico como pertencente a uma variedade vernácula.
Com efeito, os bilhetes em questão foram escritos por pessoas semianalfabetas, chamadas por
Marquilhas de “mãos inábeis”, que não passaram pela aquisição sistemática de uma gramática
normativa.
O debate sobre a natureza do português clássico, bem como sobre as mudanças que levaram à
emergência do PE, foi recentemente relançado em um texto de Ana Maria Martins (cf. Martins,
2011), no qual a autora propõe que o que se vê nos textos é o reflexo da língua das classes “social e
culturalmente dominantes (tipicamente, alfabetizadas e produtoras de escrita)”; porém, segundo a
autora, uma outra gramática, “a das classes populares (tipicamente, não alfabetizadas e com acesso
muito limitado à produção escrita)”, se apresenta na mesma época. Martins acrescenta: “São fatores
socioculturais os que determinam que no português quinhentista (e também quatrocentista e
seiscentista) seja extremamente reduzida a visibilidade da gramática em que a ênclise se terá
mantido estável ao longo do tempo” (op. cit. p.86). Martins encontra nas peças de Gil Vicente a
base empírica para sua hipótese, uma vez que a sintaxe das personagens populares é mais enclítica
7
do que as personagens ocupando uma posição alta na escala social. Desse ponto de vista, o
decréscimo da ênclise (que começa no século XIV), a forte predominância da próclise nos séculos
XVI e XVII e o retorno da ênclise no século XVIII não são senão momentos diferentes de uma
competição entre duas gramáticas: a do vernáculo popular, enclítica, e a da linguagem culta,
“panibérica”, proclítica. Isso tem como consequência dizer que o que acontece no século XVIII não
é propriamente uma mudança gramatical, mas a inversão entre o peso das duas gramáticas em
competição, que favorece a gramática do vernáculo popular.
A análise de Martins (2011) é parcial, uma vez que se limita à análise da colocação de clíticos.
Paixão de Sousa (2004) mostra que, apesar de terem mais ênclise do que os textos literários, os
documentos das “mãos inábeis” (Marquilhas, 2000) se comportam de maneira idêntica no que diz
respeito à posição do sujeito. A sintaxe dos clíticos, apesar de particularmente saliente nos textos,
não pode, portanto, ser tomada como único traço distintivo da gramática do PCl (entendido como o
estado de língua que se expressa a partir do século XV e, de maneira bastante consolidada, nos
textos escritos por escritores nascidos nos séculos XVI e XVII). Essa fase da língua ainda tem
muito para revelar do seu funcionamento gramatical e dos condicionamentos discursivos que regem
o uso das construções produzidas por sua gramática. Os trabalhos realizados no âmbito dos projetos
anteriores se concentraram na sintaxe dos clíticos e na posição do sujeito, em correlação com o
fenômeno V2. Nesta nova fase da pesquisa, toda a sintaxe da ordem será investigada, de modo a
permitir inferências mais precisas sobre as estruturas subjacentes aos diferentes padrões oracionais
e a natureza das categorias funcionais ativadas na instanciação desses padrões.
III.1.1
A sintaxe V2 do português clássico
As teses de Torres Morais (1995), Paixão de Sousa (2004), Gibrail (2010) e Antonelli (2011),
trouxeram evidências de que a sintaxe do português clássico é de tipo V2. Como nas fases antigas
de outras línguas românicas, trata-se de um V2 diferente das línguas germânicas como o alemão,
uma vez que co-existe com ordens V1 e V3 frequentes. Trabalhando no quadro da cartografia de
Rizzi (1997, 2004), Antonelli argumenta que no PCl o verbo sobe para a categoria Fin (Finitude) e
seus traços-phi satisfazem os traços EPP de Fin. Isso explica por que não é obrigatória a presença
de sintagma na posição de especificador de Fin. Antonelli argumenta que os sintagmas antepostos
ocupam o especificador de outras categorias compondo a camada CP, atraídos por traços de
natureza discursiva, como Tópico e Foco. Isso produz uma grande liberdade na ordenação dos
sintagmas, criada pela superposição de diferentes processos de movimento associados a efeitos
discursivos. Dentre os fatos relevantes, podemos citar os três seguintes: (a) extração de NP, com
abandono de modificador (cf. (1)); (b) extrações não-canônicas, em que o vestígio do elemento
8
extraído se encontra numa oração adjunta (cf. (2)); e (c) flutuação de quantificadores para posições
pré-verbais, em presença de um tópico (cf. 3).
(1) Papagaios há nestas partes muitos de diversas castas, e muito formosos, como cá se vêem
alguns por experiência. (Gândavo, nascido em 1502)
(2) e apertando o capitão-mor outra vez de novo com eles, prove a Nosso Senhor que viraram as
costas, e se recolheram com muita desordem, como gente já vencida, o que vendo os nossos,
os seguiram até dentro da sua tranqueira, onde eles de novo nos tornaram a fazer rosto,
(Fernão Mendes Pinto, nascido em 1510)
(3) Os homens n’aquella primeira infancia do mundo todos vestiam de pelles,
(Vieira, nascido em 1608)
Neste projeto, como mencionado acima, a sintaxe V2 do PCl será estudada na dimensão mais
geral da ordem dos sintagmas na frase e sua relação com a organização da informação. A
investigação sobre a ordem será também estendida às orações não-finitas. O exemplo seguinte,
extraído de Gândavo (n. 1502), evidencia que as infinitivas também podem mostrar diferentes
ordenações de palavras, como VSO, SVO, além dos casos com sujeito nulo. Construções desse tipo
ilustram como a organização da informação dirige a ordem, em particular no que tange à posição de
sujeito. No enunciado em questão, o tópico é outros (macacos); por isso, os Índios, como referente
não-tópico, é realizado em posição pós-verbal.
(4)
Outros há perto maiores que estes, que tem barba como homem: os quais são tão atrevidos,
que muitas vezes acontece flecharem os Índios alguns, e eles tirarem as flechas do corpo
com suas próprias mãos, e tornarem a arremessá-las a quem lhes atirou.
III.1.2 A topicalização não-V2 do português moderno
No português europeu e brasileiro modernos, a topicalização V2 do PCl deixa de existir, e surge a
topicalização não-V2 (cf. Duarte, 1987), em que , quando o elemento topicalizado é o objeto direto
do verbo, a posição argumental fica sem realização fonética. Faz parte deste projeto estudar essa
construção, que não existe nas outras línguas românicas, em textos portugueses e brasileiros do
século XIX e da primeira metade do século XX. Coloca-se a questão de saber qual é a propriedade,
por hipótese diferente no PE e no PB, que legitima uma construção ausente das outras línguas da
mesma família. No PB, a hipótese de partida é que está associada às diversas características que
compõem sua natureza de língua orientada para o tópico (cf. Pontes, 1987; Galves, 1987, 1998;
9
Negrão, 1999; Duarte & Kato, 2008; Modesto, 2008). No que diz respeito ao PE, a situação é mais
complexa. Note-se que se trata de maneira geral de uma língua que traz vários desafios à teoria
gramatical, dadas as suas numerosas particularidades sintáticas. Do ponto de vista da Língua-E,
podemos dizer que é uma língua conservadora, uma vez que preservou características associadas,
nas outras línguas românicas, às fases antigas, como a ênclise nas orações finitas. Essa propriedade
levou muitos estudiosos a apontar para propriedades especiais da periferia esquerda, codificadas
numa categoria funcional alta considerada forte (cf. Martins, 1994; Uriagereka, 1995; Costa &
Martins, 2004; Raposo & Uriagereka, 2005, entre outros). Para muitos autores, por outro lado, a
ênclise está associada a uma posição externa do sujeito em relação às fronteiras da oração. Essa
análise, inicialmente proposta por Rouveret (1987), foi particularmente explorada nos trabalhos de
Pilar Barbosa (cf. Barbosa, 1996, 2000, 2008, entre outros), na esteira de outros estudos que
investiram no argumento de que o sujeito realizado das línguas pro-drop ocupa uma posição
deslocada. Contudo, essa análise não é consensual, e muitos autores argumentam que o sujeito do
PE ocupa uma posição interna à frase (cf. a discussão em Galves & Sandalo, 2012). Esses autores
procuram derivar a existência da ênclise a partir de uma arquitetura oracional na qual o verbo e o
clítico não ocupam o mesmo núcleo na computação sintática (cf. Rouveret, 1999; Shlonsky, 2004;
Ouhalla, 2004). Rouveret (1987) também deriva a topicalização sem retomada pronominal, bem
como a construção de objeto nulo (cf. próxima seção), da estrutura em que o sujeito está em posição
externa. Raposo (1986) argumenta que a categoria vazia objeto nessa construção é uma variável
ligada por um tópico nulo. Curiosamente, isso aproximaria o PE do chinês, tal como analisado por
Huang (1984), ou seja, o objeto nulo, nessa análise, recoloca para esta língua a questão da
proeminência do tópico. Recentemente, João Costa minimizou a questão da diferença entre o PB e o
PE no que tange ao estatuto de proeminência de tópico (cf. Costa, 2010). Segundo ele, todas as
construções usadas para argumentar que o primeiro é uma língua orientada para o tópico, desde o
trabalho pioneiro de Pontes (1987), existem também no segundo. A única diferença, segundo o
autor, diz respeito às construções em que o verbo concorda com o tópico que não corresponde ao
sujeito lógico da oração, possíveis no PB, mas não no PE (ver seção III.1.4).
Segundo Naro & Scherre (2007), o que mais aproximaria o PE do PB seria a ausência de
concordância nominal e verbal. Os exemplos apresentados por esses autores são retirados de
dialetos não-padrão de Portugal, em que frases como as seguintes são registradas:
(5)
A cedrera é muito bom para chá (op. cit., p. 75)
(6)
As querenguelas só presta para pescar (op. cit., p. 98)
10
A análise de Naro & Scherre levanta a seguinte questão: será que em (5)-(6), o sintagma pré-verbal
é, de fato, o sujeito do verbo? Uma análise alternativa seria a de que tal sintagma é, na verdade, o
tópico da frase, retomado por um sujeito nulo de caráter genérico – o equivalente do ça encontrado
no francês.
É tentador ligar ambas propriedades (de objeto nulo e de sujeito nulo genérico) à noção de
operador nulo. Como já mencionamos, essa possibilidade já foi explorada por Raposo (1986) para o
objeto. O operador nulo é, em termos intuitivos, o que permite a identificação referencial de uma
categoria vazia independentemente de uma relação de concordância. Recuperamos aí a noção de
variável, em oposição à noção formal de pronome: o pronome necessita de traços-phi para a sua
identificação; a variável, ao contrário, não necessita desses traços. Esta, contudo, requer um
antecedente identificável no discurso, o que ocorre no caso do objeto nulo. No caso contrário, resta
a interpretação genérica.
A questão seguinte é como expressar a noção de operador nulo no quadro atual do Programa
Minimalista. Essa será uma questão abordada no decorrer do projeto, e as possibilidades de resposta
dependerão de detalhes da derivação sintática que será assumida. É natural, em princípio, atrelar o
operador nulo a um traço de tópico associado a Comp (ou, no quadro da cartografia de Rizzi 1997,
2004, a uma das categorias funcionais da camada Comp), que não desencadeia movimento visível,
mas é capaz de ligar uma categoria vazia.
Nesse novo projeto, daremos mais ênfase a um período do português europeu pouco estudado
nos projetos anteriores – que privilegiaram a emergência da nova gramática no séc. XVIII. Trata-se
do séc. XIX. Ele é importante para o estudo da consolidação das novas formas de topicalização, e
também porque se podem vislumbrar nos textos escritos nessa época elementos de variação dialetal
que prenunciam a variação encontrada no séc. XX entre dialeto padrão e dialeto não-padrão (cf.
Magro, 2008, a respeito do fenômeno da interpolação).
III.1.3
Objeto nulo no PE e no PB
Diferentemente de uma língua como o inglês, tanto o PE quanto o PB têm a possibilidade de não
realizar fonologicamente os complementos diretos dos verbos na ausência de um tópico expresso.
Tem-se então uma interpretação referencial específica que se assemelha à dos pronomes. É o
fenômeno tradicionalmente chamado de “objeto nulo”. Para o PE, Raposo (1986), seguindo o
trabalho seminal de Huang (1984), e dentro da tipologia das categorias vazias de Chomsky (1982),
argumenta que se trata de variável. Contrapondo os argumentos para o PE aos fatos do PB, Galves
(1989) conclui que nesta língua se trata de um pronome nulo, pro. Esta análise encontra alguns
problemas empíricos discutidos em seguida por vários autores (Farrell, 1990; Bianchi & Figueiredo,
11
1994; Galves, 1997). Nesse quadro, e a partir de um estudo diacrônico, Cyrino (1997) propõe que o
objeto nulo do PB é, na realidade, resultado de elipse de NP/DP e Cyrino (2011) sustenta que o
objeto nulo do PB é diferente do permitido em outras línguas, justamente por razões diacrônicas.
De fato, várias línguas permitem vários tipos de objeto nulo, mas o objeto nulo do PB apresenta
certas características: tem preferencialmente antecedente não-animado, não permite correferência
com o sujeito da matriz, ocorre em ilhas sintáticas.
É pertinente a este projeto notar que línguas bantas como o kinande também permitem o objeto
nulo. Authier (1988) mostra que tal língua permite objetos nulos definidos, mesmo com
antecedentes animados, como mostram os seguintes exemplos:
(7)
na-
abiri-
SM TNS
anza [e]
love
I have come to love (her/him/them)
(Authier, 1988:21)
A correferência com o sujeito da matriz, no entanto, não é permitida:
(8)
Arlettei a-
ka-
lengekanaya ati
na-
abiri- anza [e]j/*[e]i
A.
TNS
think
SM
TNS
SM
that
love
Arlettei thinks that I have come to love (herj/*i) (Authier, 1988:23)
Authier argumenta que o objeto nulo em kinande é uma variável (não pode ocorrer em ilhas), e o
considera o vestígio do movimento de um operador nulo para o especificador de CP. No entanto,
seria diferente do objeto nulo do PE, uma vez que em kinande os sintagmas topicalizados se
moveriam para o especificador de CP na sintaxe, ao passo que, em PE, eles seriam gerados na base,
em uma posição de tópico distinta de CP.
Neste projeto, voltaremos a discutir, comparativamente, a natureza do objeto nulo no PE e no PB,
em correlação com as outras construções estudadas, não só no âmbito da frase, como também no
âmbito do sintagma nominal (cf. III.1.6).
III.1.4
Morfologia de aspecto e tempo e posição do verbo na frase
A questão sobre a existência de movimento de verbo em PB vem sendo discutida a partir de Galves,
(1994, republicado como capítulo 6 em Galves, 2001). Nesse artigo, a autora argumenta que o PB
tem um AGR “fraco”, e, portanto, à primeira vista, não deveria ter movimento de verbo. Mas há
argumentos (posição de advérbios, por exemplo) que demonstram que o verbo deve deixar o VP em
12
PB. A autora propõe que um outro elemento em INFL atrai o V: Tempo. No PB, a restrição do
movimento de V para T é, portanto, desencadeada pelas propriedades de T.
Biberauer & Roberts (2010) propõem que a existência de movimento de verbo estaria
relacionada à riqueza de marcação temporal. Cyrino (2010, 2011), porém, argumenta que a
marcação morfológica de tempo não necessariamente leva ao movimento de verbo – BP é uma
língua em que essa morfologia é somente aparentemente rica. Da mesma forma que Galves (1994),
Cyrino (2010, 2011) assume que o verbo deixa o VP em PB e não sobe para uma categoria
funcional alta. Assumindo duas categorias para Tempo, T1 e T2 (cf. Giorgi & Pianesi, 1997; Julien,
2001), a autora propõe que o verbo é alçado para T2, uma categoria relacionada a Aspecto. A
proposta é baseada na perda das formas sintéticas, especialmente do mais-que-perfeito e do futuro
do presente. As formas sintéticas existentes, como o passado simples, não estão restritas a
interpretações estritamente temporais:
(9)
Só faltou cerveja nesta festa!
Em PB, ao contrário de PE, a sentença (9) pode ser usada quando a festa ainda não acabou. Da
mesma forma, sentenças como (10), em que a morfologia de passado remete à interpretação
(aspectual) resultativa, são possíveis em PB, mas não em PE:
(10) Você virou na Rua 7, e chegou na universidade.
Este projeto pretende aprofundar a questão da relação entre a morfologia verbal (tempo e
aspecto) e a posição do verbo na frase dentro de uma perspectiva comparativa.
III.1.5
Posição de sujeito e proeminência de tópico em PB
Tendo em vista os estudos recentes, desenvolvidos por membros do projeto, sobre paralelismos e
contrastes entre o PB e as línguas africanas, o projeto irá pôr foco no estatuto de “proeminência de
tópico” (ou “orientação ao discurso”) que vem sendo relacionado ao PB. Um dos temas que
merecerá particular atenção no desenvolvimento do projeto diz respeito ao tipo de elemento que
pode ocorrer na chamada posição de sujeito e desencadear concordância com a flexão verbal em PB.
Nessa língua, ao contrário da tendência observada entre as línguas indo-europeias, termos com
interpretação locativa (quase sempre interpretados como tópicos) que não equivalem a um sujeito
lógico (ou semântico) do verbo podem concordar com a flexão verbal, como ilustrado em (11) (12). Os casos apresentados em (a) foram extraídos de blogs publicados no Brasil e mostram
13
construções em que um termo equivalente tradicionalmente analisado como adjunto adverbial
ocorre em posição pré-verbal e concorda com o verbo. A correspondência com a função de adjunto
adverbial é facilmente observada nas paráfrases em (b), nas quais o termo locativo passa a ser
obrigatoriamente antecedido da preposição em.
(11) a. “algumas concessionárias tão caindo o preço [do carro]”
b. O preço do carro tá caindo em algumas concessionárias.
http://forum.carrosderua.com.br/index.php?showtopic=122656
(12)
a. “Minhas amígdalas tavam saindo sangue”
b. Estava saindo sangue das minhas amígdalas.
http://www.fotolog.com.br/jees_siica/39442608f
Bastante comuns na fala dos brasileiros, as construções em (a) de (11)-(12) causam
estranhamento quando apresentadas a portugueses (Costa, 2010) ou a falantes de outras línguas
românicas. Não é simples explicar a emergência dessas construções no português brasileiro por
meio da hipótese da deriva, uma vez que não foram, pelo menos até aqui, detectadas no português
europeu e nas demais línguas românicas. Curiosamente, construções com o padrão observado em
(11)-(12) são generalizadas em línguas do grupo banto. Essas construções, exemplificadas em (13)(14) a seguir com dados de línguas bantas, têm sido agrupadas entre o que se pode considerar um
tipo específico de inversão locativa (Salzmann, 2004), no qual um constituinte interpretado como
lugar ou direção estabelece, em vez do sujeito lógico, concordância com o verbo. De acordo com
Baker (2008), padrões oracionais dessa natureza não são usuais nas línguas indo-europeias, mas
bastante comuns nas línguas nigero-congolesas, entre as quais se incluem as do grupo banto.
(13)
KINANDE (Baker 2003: exemplo 25)
Omo-mulongo
mw-a-hik-a
(?o-)mu-kali
LOC.18-village 18S-T-arrive-FV (AUG)-CL1-woman.1
‘At the village arrived a woman’
(14) KIMBUNDO (http://www.linguakimbundu.com/index3.html)
a. Mu njibela muala ni kitadi?
(No bolso tem dinheiro?)
b. Bu kibuna kiami buala o kamba rienu? (No meu banco está o vosso amigo?)
c. Ku ‘nzo ié kuala ni ndenge?
(Na tua casa tem criança?)
Nos dados de (13)-(14), vale chamar a atenção para as construções do quimbundo, que, ao lado
do quicongo e do umbundo, é apontado como língua materna da maioria dos africanos de origem
banta trazidos para o Brasil. Na sua Grammatica elementar do kimbundo ou língua de angola
(1888/89), Heli Chatelain faz menção ao fato de a sintaxe quimbunda permitir a concordância
locativa, salientando que, “quando, por inversão, o locativo acontece preceder o verbo, este
concorda com elle, tomando-o como prefixo. Na inversão, o sujeito logico perde toda influencia
14
sobre o verbo, de modo que não importa a qual cl. sing. ou pl. o sujeito pertença, comtanto que seja
de 3a pessoa” (p. 89).
Considerando a similaridade entre o português brasileiro e as línguas do grupo banto no que
tange à inversão locativa, é plausível indagar sobre a possibilidade de estarmos diante de um reflexo
do contato do português com línguas do grupo banto, por conta da entrada maciça de africanos (em
sua maioria, falantes nativos de línguas pertencentes a esse grupo) em território brasileiro no
decurso de quase quatro séculos. Na linha dos estudos apresentados em Lucchesi et al. (2009), uma
hipótese a ser aventada é a de que o processo de transmissão linguística irregular desencadeado pela
aquisição do português como L2 por milhares de africanos, que produziram grande parte do input
daqueles que passavam a adquirir o português como L1, tenha levado à transferência de padrões
oracionais comuns às línguas africanas (no caso, o padrão de inversão locativa) para variedades
emergentes do português brasileiro. A ampla ocorrência dessas construções em dados de escrita
extraídos de blogs publicados no Brasil em pleno século XXI seria, nesse sentido, resultado de um
processo que teria se iniciado séculos antes, com a aquisição do português como L2 por falantes de
línguas africanas, produzindo construções que se difundiram (em um modus operandi que ainda
precisa ser melhor compreendido em termos temporais, geográficos e sócio-demográficos) por
diferentes variedades do português brasileiro.
III.1.6 O sintagma nominal nas gramáticas do português
O projeto também se deterá sobre a sintaxe do sintagma nominal, que é um aspecto ainda pouco
estudado no PCl e obviamente envolve uma comparação entre o PE e o PB contemporâneo e
também, em certos casos, uma comparação com línguas crioulas de base lexical ibérica (como, por
exemplo, o papiamento). Especificamente o segmento do projeto dedicado ao sintagma nominal
tem dois objetivos empíricos complementares:
(i) descrever aspectos da estrutura e distribuição de vários tipos de sintagmas nominais no
português clássico, tendo em vista determinar as diferenças entre o PE e PB e o PCl.
(ii) utilizar a distribuição de certos tipos de sintagmas na oração para determinar propriedades
da estrutura informacional da oração, o que pode auxiliar no entendimento da sintaxe oracional do
português clássico.
Os estudos recentes sobre a estrutura dos DPs na sintaxe gerativa mostram que é praticamente
impossível examinar as propriedades das frases nominais sem levar em conta propriedades
semânticas e pragmáticas dos próprios DPs e da posição que ocupam. Se por um lado isto faz o
estudo do sintagma nominal mais complexo, por outro, abre um caminho para se usar a distribuição
dos vários tipos de DP como diagnóstico de propriedades sintáticas ligadas ou não à estrutura
informacional tanto do próprio DP quanto da oração. Desde o trabalho seminal de Milsark (1974),
15
sabemos que sintagmas nominais 'fracos', (não pressuposicionais), mas não sintagmas nominais
"fortes", são aceitáveis em construções existenciais. Esta mesma distinção entre SNs fracos e fortes
é utilizada para restringir os tipos de sintagmas nominais que podem aparecer na posição de sujeito
ou podem ser deslocados. Sabe-se também que certos tipos de predicados forçam/restringem a
interpretação de sintagmas nominais em várias posições (cf. Carlson, 1977; Diesing, 1992; Kratzer,
1995 etc). Do ponto de vista do movimento, sabe-se que é "mais fácil" extrair de sintagmas
nominais indefinidos/nus do que definidos (ver Boskovic, 2008; a sair, para uma versão bastante
extrema desta observação).
Dadas essas observações, cabem duas perguntas: (i) há mudanças importantes entre o PCl e o
PB e PE no que diz respeito ao sintagma nominal e sua distribuição? e (ii) em que medida se podem
relacionar certas propriedades do DP no português clássico a uma ordem mais livre de palavras do
que no PB, por exemplo? No que diz respeito ao português, sabemos que os determinantes são
menos empregados no PCl do que no PE. Gibrail (2003) observou que a frequência dos
determinantes aumenta no decorrer do século XVIII, quando diminui a frequência do acusativo
preposicionado. Vê-se também um aumento do uso do artigo com os possessivos, também no
século XVIII (cf. Floripi, 2008), que desembocará na generalização total desse uso. O uso do artigo
com o quantificador universal plural ‘todos’ também não é categórico no português clássico, como
se vê na frase em (15), que fecha a Gramática da linguagem portuguesa de Fernão de Oliveira, ou
ainda na frase em (16), do tratado Da pintura antiga de Francisco de Holanda.
(15) Todas coisas têm seu tempo e os ociosos o perdem.
(16) E não dou eu, certo, menos louvor ao vosso saberdes-vos apartar comvosco e fugir das
nossas inuteis conversações, e a vosso saber não pintar a todos principes que vo'lo pedem, que ao
pintar uma só obra em toda a vida, como tendes feito .
Nas línguas modernas, o uso do determinante é menos frequente no PB do que no PE, se
aproximando nisso o PB mais do PCl, como se pode ver na frase (17), do Corpus de Cartas
brasileiras de Carneiro (2005).
(17) É ele muito distinto sob todos pontos de vista, e, além disto, um correligionário nosso que,
em todas as circunstâncias tem se imposto, por sua lealdade e serviços, à nossa estima
e reconhecimento.
E aqui se coloca a questão de saber a origem das diferenças entre o PB e o PE e o PCl, devendose levar em conta também propriedades de certas línguas crioulas que têm uma distribuição de
nomes sem determinante muito parecida com a do PB.
Estudaremos a estrutura e distribuição dos nomes nus, definidos e indefinidos. Em relação aos
indefinidos com determinante, concentraremos a atenção nas propriedades dos sintagmas
indefinidos com 'um/uns' e 'algum/alguns' tanto em contextos afirmativos como negativos, onde
aparecem diferenças interessantes entre o PB e o PCl (cf. o uso em Gândavo, por exemplo, da
16
expressão "outra coisa alguma", sempre sob o escopo da negação). Quanto aos nomes nus, à guisa
de exemplo, considere-se o caso dos nomes nus contáveis em posição argumental. Assim como os
nomes nus plurais no inglês, os nomes nus singulares contáveis podem ter, no PB, uma leitura
genérica ou existencial. No PE, os nomes nus contáveis têm uma distribuição muito restrita, similar
ao espanhol, sendo aceitos só como complementos de verbos que têm um componente possessivo
(ter, comprar, etc). Assim, enquanto (18a) e (18b) são naturais no PB, no PE, (18a) é inaceitável.
Essa distribuição mais liberal dos nomes nus no PB está correlacionada à possibilidade de
modificação por ''muito" com leitura contável, como exemplificado em (19). No PE, (19a) é
inaceitável e (19b) só é aceita com uma leitura predicativa em que “O Pedro tem um carro
fantástico”, sugerindo diferenças estruturais.
(18)a.
b.
(19)a.
b
Jogador
Tem
carro,
tem
Muito
jogador
ganha
O Pedro tem muito carro.
ganha
muito
dinheiro.
casa,
tem
telefone,
tem
filho.
dinheiro
com
campanha
publicitária.
Para dar conta da existência de nomes nus em posição argumental no PB, Schmitt (1996), Munn
& Schmitt (1999) e Schmitt & Munn (2003) argumentam que no PB esses nomes nus são DPs com
um D nulo. A distribuição restrita dos nomes nus é associada a ausência ou a restrições a um D nulo
nas línguas românicas. Para Dobrovie-Sorin & Bleam (2006) e Espinal & McNally (2009), os
nomes nus em (18a) no espanhol são simplesmente NPs em contextos de certos predicados (ver
também Cyrino & Espinal 2011, sobre essa proposta para o PB ). Cabe então perguntar em que
momento se estabelecem as diferenças entre o PE e o PB e onde essas diferenças estão localizadas.
O que acontece nos períodos anteriores do português? O que leva a estas diferenças?
E aqui devem-se levar em consideração não só propriedades do PCl mas também propriedades de
línguas crioulas de base ibérica como o papiamento (Schmitt & Kester, 2005; Kester & Schmitt,
2007), por exemplo, que têm uma distribuição de nomes nus contáveis quase idêntica à do PB,
inclusive nas restrições discursivas aos nomes nus contáveis em posição de sujeito. Compararemos
também com propriedades dos sintagmas nominais no português africano (cf. Inverno (2005) e do
português afro-brasileiro (cf. Lucchesi et al., 2009)
III.1.7 A variação sintática no português brasileiro
A variação dialetal no português brasileiro, pelo menos no que diz respeito ao nível sintático,
precisa ser melhor descrita e entendida. Em seu desenvolvimento, o projeto se aterá à variação entre
as variantes do português brasileiro mais marcadas pelo contato, o português 'afro-brasileiro' (cf.
Lucchesi et al., 2009), ou ‘étnico’ (cf. Santos, 2011), e a língua que varia, tanto geograficamente
quanto socialmente e ainda individualmente, num eixo que vai do PB culto falado (cf. a série de
volumes do Projeto para a Gramática do Português Falado) para o PBV, português brasileiro
vernacular (Holm, 2004) ainda chamado de português popular brasileiro (PPB) por outros autores
17
(entre outros Mattos e Silva, 2004). Nesse sentido, uma importante vertente do projeto está na
anotação sintática de corpora orais representativos dessas variedades, na linha do que já vem sendo
desenvolvido para dos documentos escritos que compõem o Tycho Brahe (cf. Seção III.3.1).
A anotação sintática de corpora do português brasileiro contemporâneo permitirá não apenas
mapear contrastes sintáticos entre variedades dialetais, mas também refinar a observação da
variação interna aos indivíduos, que pode ser explicada, no quadro teórico que estamos adotando,
de duas maneiras, não mutuamente exclusivas:
(i) a variação é desencadeada pela competição de gramáticas que nasce da tensão entre a aquisição
natural da língua e sua aprendizagem por meio do ensino formal, essencialmente via escola. Um dos
exemplos canônicos dessa variação se encontra na sintaxe pronominal, em particular no uso e
colocação de pronomes clíticos, adquiridos em meio escolar (cf. Correa, 1991).
(ii) a variação resulta da própria natureza da fixação dos parâmetros na língua.
A hipótese em (ii) ocupará um lugar central dentro do projeto: a natureza híbrida de certos
fenômenos morfossintáticos do PB derivaria da própria fixação de um (ou mais) parâmetros, que,
por sua vez, decorreria da sua história de contato de línguas tipologicamente muito diferentes (ver a
seção III.1.3.1).
Se essa hipótese estiver correta, será possível afirmar que não há diferença
gramatical entre dialetos com pouca (ou nenhuma?) concordância e dialetos com muita (ou
integral?) concordância, porque concordar ou não seria uma escolha permitida pela fixação do
próprio parâmetro (cf. Avelar e Galves, 2011). Desse ponto de vista, só a frequência é que seria o
reflexo de uma maior ou menor instrução formal.
Em conjunção com essa ideia, uma outra hipótese de base paramétrica que o projeto irá defender
a respeito do português brasileiro é a seguinte: apesar de manter uma morfologia de tipo indoeuropeu, a sua sintaxe sofreu uma mudança tipológica (ou, nos termos de Baker (1996, 2008, 2010,
2011), uma mudança de natureza macro-paramétrica), ao passar a fixar o parâmetro da
concordância não mais como as línguas indo-europeias, mas como as línguas níger-congo. Em
linhas gerais, se essa hipótese for validada, o estatuto de proeminência de tópico e as
particularidades da posição de sujeito (como as que dizem respeito à inversão locativa, tratadas em
III.1.5) poderão ser tratados como resultantes dessa mudança paramétrica.
III.2.8 A variação sintática no português europeu
A micro-variação entre a língua padrão urbana de Lisboa e os dialetos do interior de Portugal
(cuja sintaxe pode ser agora facilmente estudada graças ao projeto Cordial-SIN, implantado por
Ana Maria Martins no Centro de Linguística da Universidade de Lisboa) é um contraponto
importante para a comparação entre o PB, o PE e seu antepassado comum, o PCl. O método
18
preconizado por Naro e Scherre (2007) para procurar as raízes do PB popular no PE popular será
reinterpretado neste projeto no quadro de uma outra concepção da linguagem. Nesta, a língua não é
um organismo que muda por si só, conduzido por uma deriva interna própria. A mudança
gramatical se deve à seleção de uma gramática por uma geração G, diferente da gramática
selecionada pela geração anterior G-1, fornecedora do input que serve de base à aquisição da língua
pela geração G. Desse ponto de vista, a língua é um objeto mental que só tem realidade no
cérebro/mente de cada falante. Contudo, os dialetos podem nos dizer muito sobre as possíveis
variações em torno de um mesmo tema, para retomar a metáfora da tese de Catarina Magro (Magro,
2008), nos ajudando a entender os parâmetros em jogo (ver Seção III.2 adiante).
III.1.9. As variedades africanas do português
Para cumprir os objetivos previstos pelo projeto, será importante acompanhar o resultado de
investigações que vêm sendo feitas sobre fatos morfossintáticos identificados em variedades do
português faladas na África, particularmente em Angola e Moçambique. Como já destacado na
seção 1, Petter (2009) chama a atenção para a existência de um continuum afro-brasileiro do
português que precisa ser levado em conta na tentativa de explicar as propriedades
particularizadoras do português brasileiro frente ao português europeu. Visando a abordar esse
continuum, o projeto irá investir no mapeamento de convergências e contrastes entre variedades do
português faladas no Brasil e na África.
Uma das convergências está nas propriedades de concordância inerentes ao sintagma nominal,
como mostrado no trabalho de Inverno (2011) para o português angolano e de Jon-And (2011) para
o português moçambicano. Tal como no português brasileiro, variedades emergentes do português
em Angola e Moçambique mostram um alto grau de variação na realização da marca de número no
elemento nominal (como em os livro vs. os livros).
A redução do paradigma flexional dos verbos também pode ser incluída entre as convergências.
Trabalhos como os de Lipski (2008) destacam exemplos como os que se seguem em (20) para
mostrar a redução do paradigma flexional no português angolano, com a forma verbal de terceira
pessoa do singular se generalizando para todas as demais. O autor destaca que a terceira pessoa do
singular também é empregada como forma verbal invariável em um dialeto afro-hispânico da
Bolívia, falado por um grupo de negros descendentes de escravos africanos, como exemplificado
em (21).
(20) PORTUGUÊS ANGOLANO (Lipski, 2008: 88)
a. “Os home já amarrou”
19
b. “Hoje os tempo tá mudado”
c. “[eu] sabe não”
d. “sim, eu namorô, mas já dexô muito tempo”
e. “Os tropa vai no mato e negro fica sozinho”
(21) DIALETO AFRO-HISPÂNICO DA BOLÍVIA (Lipski, 2008: 87)
a. “Nojotro tiene [tenemos] jrutita”
b. “Yo no entende [entendo] eso de vender jruta”
c. “Yo creció [crecí] junto com Angelino”
d. “Nojotro creció [crecimos] loh do”
e. “Nojotro trabajaba [trabajábamos] hacienda”
Um outro aspecto que parece ter lugar no continuum afro-brasileiro está no fenômeno da
inversão locativa, abordado em III.1.3.1. Gonçalves & Chimbutane (2004) mostram que o
português falado como L2 por moçambicanos dá lugar a construções em que sintagmas nominais
preposicionados introduzidos por “em”, com interpretação necessariamente locativa, ocorrem em
uma posição pré-verbal que pode ser identificada como sendo a posição gramatical do sujeito, como
em construções do tipo Na nossa zona era fértil (com o mesmo sentido de A nossa zona era fértil).
De acordo com os autores, construções desse tipo são transferências de padrões oracionais bastante
comuns nas línguas faladas como L1 por moçambicanos, em que sintagmas preposicionados com
interpretação locativa podem ocorrer em posição de sujeito.
Estudos como os de Avelar & Cyrino (2008) e Avelar (2011) observam que o mesmo tipo de
inversão locativa também é possível no português brasileiro, em construções como as que seguem
em (22a)-(26a), encontradas em blogs brasileiros. Os dados em (22b)-(26b) mostram que a
preposição pode ser eliminada, sem resultar em qualquer alteração aparente no sentido da sentença
ou no papel temático atribuído ao constituinte em posição pré-verbal. Avelar & Cyrino (2008)
propõem que, tal como sugerido por Gonçalves & Chimbutane (2004) para o português africano, as
construções em (22a)-(26a) do português brasileiro também trazem sintamas locativos
preposicionados em posição de sujeito.
(22) a. “na minha escola aceita cartão de crédito”
b. a minha escola aceita cartão de crédito
twitter.com/giiovannaflores/status/18219596304
(23) a. “no meu computador imprime a etiqueta corretamente”
b. o meu computador imprime a etiqueta corretamente
http://www.suportegas.com.br/portal/topic.asp?
(24) a. “no curso ensina a fazer impressão de cartão de visita”
b. o curso ensina a fazer impressão de cartão de visita
20
produto.mercadolivre.com.br/MLB-127398826-curso-de-serigrafia-silk-screen-em-2-dvds-_JM
(25) a. “na loja vende o produto separadamente do Tampo”
b. a loja vende o produto separadamente do Tampo
www.reclameaqui.com.br/.../troca-negada-dentro-do-prazo-de-sete-dias-e-nao-atendimento/
(26) a. “na bula recomenda usar [o remédio] imediatamente após abrir”
b. a bula recomenda usar o remédio imediatamente após abrir
http://www.npng.com.br/forum/topic.asp?TOPIC_ID=72805
Enquanto a sintaxe da inversão locativa permite aventar a hipótese da transferência de
padrões estruturais por meio de contato interlinguístico, não nos parece, pelo menos a priori, que o
mesmo tipo de hipótese possa ser estendido para o enfraquecimento da concordância, seja no caso
do português brasileiro, seja no das variedades africanas do português. Cabe destacar que, em
termos de distinção flexional, o paradigma flexional das línguas bantas é tão ou mais rico que o do
português europeu. Os fatos em questão podem, contudo, ser o resultado de erosão morfológica
provocada pelo aprendizado português como L2. À luz dessa hipótese, a erosão morfológica do
paradigma flexional teria se difundido (no caso do português brasileiro) ou estaria em amplo
processo de difusão (no caso do português angolano e moçambicano) para as variedades do
português em formação, então adquiridas como L1. Essa ideia está delineada, embora não
exatamente nos mesmos termos, nas considerações de Lucchesi (in Lucchesi et al. 2009: 182) a
respeito do lugar ocupado pelas mudanças relacionadas ao parâmetro do sujeito nulo no que
caracteriza como “uma formação polarizada do português brasileiro”. Para o autor, o nível de
erosão da morfologia flexional observado atualmente na comparação de variedades do português
brasileiro foi “determinado pela intensidade diferenciada dos processos de transmissão linguística
irregular em sua formação”.
O ponto relevante para este projeto será o de saber se, frente ao desenvolvimento de um
paradigma flexional que mostra paralelos com o das variedades do português brasileiro, as
variedades africanas do português exibem propriedades de língua parcialmente pro-drop (com
sujeitos nulos referencialmente definidos tendendo à realização morfológica, enquanto os
referencialmente indefinidos podem ser apagados), na linha do tratamento que o parâmetro do
sujeito nulo vem recebendo em trabalhos como os de Biberauer et al. (2010). A esse respeito, é
importante ressaltar que as línguas banto são do tipo pro-drop, havendo, na literatura sobre essas
línguas, registros de sujeitos nulos referencialmente definidos e indefinidos. Não é claro, contudo,
qual é o seu estatuto quanto ao caráter canônico (como no português europeu) ou parcial (como no
português brasileiro) relativo à marcação desse parâmetro. O projeto pretende se ocupar dessa
questão, tendo em vista a possibilidade de propriedades atreladas ao parâmetro do sujeito nulo nas
línguas banto se refletirem nas variedades africanas do português e/ou mostrarem pontos em
comum com os fatos relevantes do português brasileiro.
21
Para cumprir com esse objetivo, uma importante ferramenta do projeto será a anotação sintática
de corpora orais representativos de variedades africanas do português. O projeto irá, em especial, se
debruçar sobre o corpus utilizado por Jon-And (2011) em seu estudo sobre a concordância variável
de número em sintagmas nominais do português moçambicano. Esse corpus, que dispõe de um total
de 12 horas de entrevistas com moçambicanos falantes de português como L2, foi disponibilizado
para a equipe do projeto e será sintaticamente anotado, para compor o acervo do Tycho Brahe. Com
isso, o projeto irá contribuir, tanto em termos teóricos quanto empíricos, para uma maior
aproximação entre as investigações sobre contato interlinguístico e as abordagens formais que se
ocupam de mudança gramatical. O projeto também irá se debruçar sobre o resultado de estudos em
andamento voltados ao contato do português com línguas africanas baseados em documentos
escritos, como os de Alkmim (2001, 2002, 2008) e Álvarez-López (2006, 2007, 2008), assim como
os publicados em Lobo & Oliveira (2009).
III.2 O modelo paramétrico e a dinâmica da mudança
O estudo da dinâmica da mudança tem como objetivo, no desenvolvimento do projeto, entender
como, quando e por quê o PCl muda para o PE por um lado e para o PB por outro. Igualmente
relevante será explicar as convergências entre variedades brasileiras e africanas do português, em
contraste com propriedades do PE.
Para atingir esses objetivos, devemos primeiro realizar descrições quantificadas da mudança dos
fenômenos no tempo, com base nos dados extraídos do corpus. Essas descrições nos permitem
verificar correlações entre evoluções temporais de propriedades morfossintáticas distintas,
apontando para sua correlação na gramática, através, por exemplo, da noção de taxa constante de
Kroch (1989). Também nos servem de base para determinar quando se inicia uma mudança. O
corpus e o acesso direto aos textos na sua integralidade nos permitem também realizar estudos na
interface da gramática e do texto, particularmente importantes para a compreensão de fenômenos de
ordem.
A anotação morfossintática tem um papel essencial no uso de grandes quantidades de
dados, na reprodutibilidade das descrições, e na interrogação do corpus a partir de hipóteses.
As descrições quantificadas constituem a base empírica para as análises da mudança dentro da
teoria linguística, mas também na modelagem estocástica que tem caracterizado os projetos
anteriores, e continuará sendo realizada neste projeto, uma vez que constitui um complemento
importante para trazer elementos de resposta a perguntas essenciais da mudança linguística.
Consideraremos sucessivamente essas duas abordagens.
III.2.1. A dinâmica da mudança do ponto de vista da teoria linguística
22
Dentro da teoria gramatical atual, a mudança está intimamente ligada à aquisição, e o
instrumento teórico para abordar ambas é a teoria de parâmetros. Depois de ter ficado um tempo no
limbo, essa teoria está atualmente muito fortemente reavivada, com os trabalhos do grupo de
Cambridge (cf., entre outros, os livros Syntactic variation - the dialects of Italy; Parametric
variation, null subjects in Minimalist Theory, e The limits of syntactic variation.) Como já
mencionado acima, os modelos paramétricos com os quais trabalharemos para a discussão das
gramáticas envolvidas têm correlatos para a questão da mudança.
A discussão recente dessa teoria gira em torno das noções de macro e microparâmetros. Para certos
autores, como Kayne (2005), todos os parâmetros são microparâmetros, e “apparently macroparametric differences might all turn out to dissolve into arrays of micro-parametric ones (i.e., into
differences produced by the additive effects of some number of micro-parameters)” (Kayne, 2005:
284).
Já Baker atribui aos macro-parâmetros uma natureza que não se deixa reduzir à adição de microparâmetros. Para ele, os primeiros não são associados às propriedades de categorias funcionais,
como na proposta conhecida como “Borer-Chomsky conjecture” (BCC), mas à aplicação de
diferentes princípios gerais da gramática. Desse ponto de vista, os macroparâmetros definem o que
Sapir chamou de “gênio estrutural das línguas” (“This type or plan or structural genius of the
language is something much more fundamental, much more pervasive, than any single feature of it
we can mention, nor can we gain an adequate idea of its nature by a mere recital of the sundry facts
that make up the grammar of the language.” (Sapir, 1921: 120, apud Baker, 1996: 3)
Em trabalhos recentes (Roberts & Holmberg, 2010; Roberts, no prelo), Roberts procura
reconciliar com a noção de árvore paramétrica as concepções de Kayne e de Baker, aparentemente
opostas. Para ele, macroparâmetros são efetivamente agregados de microparâmetros que dizem
respeito a propriedades de categorias funcionais, mas esses são hierarquicamente estruturados, de
tal maneira que as grandes diferenças –as que definem tipos distintos de línguas- se encontram no
topo das árvores paramétricas e as microdiferenças – que definem dialetos próximos – se encontram
na parte de baixo das árvores, onde a formulação do parâmetro está cada vez mais detalhada. Um
exemplo se encontra abaixo:
A árvore paramétrica dos argumentos nulos (Roberts, no prelo)
23
No modelo desenvolvido por Roberts (2010, no prelo), as línguas que correspondem, para um
dado parâmetro, a um valor definido nas partes mais encaixadas das árvores paramétricas são
línguas mais marcadas (em relação a esse parâmetro) do que as línguas correspondendo a valores
definidos em posições mais altas na árvore. Se as evidências empíricas necessárias a essa marcação
são tornadas ambíguas de alguma maneira (ou pela ação de um processo linguístico afetando essas
evidências ou pela existência de dados conflitantes, devidos, por exemplo, a um contato de línguas),
as crianças selecionarão gramáticas menos marcadas, correspondendo a valores paramétricos mais
altos na árvore. Isso se deve a um princípio muito geral de economia, não exclusivo da linguagem,
ou seja, àquilo que Chomsky (2005, 2008) denomina o 3o fator. Segundo Chomsky, os dois
primeiros fatores são, respectivamente, a predisposição genética (para a linguagem, a Gramática
Universal), e a experiência. Ele define o 3o fator como “language-independent principles of data
processing, structural architecture, and computational efficiency, thereby providing some answers
to the fundamental questions of biology of language, its nature and use, and perhaps even its
evolution” (Chomsky, 2005:9). The study of the effect of the “third factor” on language acquisition
and change is part of the Strong Minimalist Program, “which holds that language is an optimal
solution to interface conditions that FL must satisfy; that is, language is an optimal way to link
sound and meaning” (Chomsky, 2008:3). Vê-se que a introdução do 3o fator na discussão da
mudança linguística permite reintegrar a questão da direcionalidade, enfaticamente rejeitada por
Lightfoot (1999), do ponto de vista da Gramática Universal. Porém, uma vez que a discussão inclui
o ‘terceiro fator’, uma abordagem baseada na Gramática Universal pode ser reconciliada com a
24
afirmação reiterada dos estudiosos da linguagem de que as mudanças aparentam ter direção. Isso é
devido à acão de princípios de economia da mente muito gerais, independentes da linguagem (cf. a
reinterpretação da gramaticalização por Roberts & Roussou (2003), e vários estudos em Galves et
al., no prelo).
A história do português representa um novo e riquíssimo laboratório para a testagem dessas
novas hipóteses sobre a aquisição e a mudança. Com efeito, temos paralelamente dois conjuntos
de mudanças bem distintos, em contextos histórico-sociais bem diferenciados. Os primeiros
passos no sentido de interpretar a mudança para o PB no quadro das árvores paramétricas foram
dados por Avelar & Galves (2011), que argumentam que a gramática brasileira ocupa na árvore
paramétrica relevante uma posição mais alta do que a gramática portuguesa:
25
A novidade consiste em tentar incorporar ao modelo a influência que as línguas africanas
parecem ter tido sobre o desenvolvimento do português no Brasil, a julgar pelas semelhanças
observadas entre a sintaxe das línguas banto e a sintaxe do PB (cf. Avelar, 2011).
Essas
semelhanças levantam a pergunta – já formulada por Adolfo Coelho em 1880 - de saber se o
efeito do contato é universal ou se depende das línguas em contato, em particular aquelas
chamadas de substrato – ou seja, no caso, a língua daqueles que aprenderam o português como
segunda língua. Adolfo Coelho afirma que: “Os factos acumulados por nós mostram à evidência
que os caracteres essenciais desses dialectos são por toda a parte os mesmos, apesar das diferenças
de raça, de clima, das distancias geográficas e ainda dos tempos. É em vão que se buscará , por
exemplo, no indo-português uma influência qualquer do tamul ou do cingalês.” (op. cit. pp. 105106) . Interessante é lembrar que, ao dizer isso, Coelho considera mais as variantes que se podem
chamar de crioulas. E foi efetivamente defendido, cem anos depois, pelo grande estudioso dos
crioulos, Derek Bickerton, que os crioulos constituíam um grupo de línguas muito semelhantes, e
em nada parecidas com as suas línguas de substrato. Já foi agora claramente mostrado que a
gênese do PB não envolve a formação de um crioulo (cf. Lucchesi et al., 2009). Porém, como
reafirmado por Lucchesi (cf. também Inverno, 2005, 2011), a questão do contato não se esgota na
formação de uma língua crioula. Existe um outro efeito que Holm (2004) chama de reestruturação
parcial, que está na origem de uma “nova variedade histórica da língua”, nos termos de Lucchesi
(2003).
A questão da influência ou não de uma outra língua, ou de um outro dialeto, remete à questão de
saber se a mudança pode ser desencadeada por dados positivos na aquisição de língua materna.
Uma idéia mais aceita na literatura é que ela deriva de dados ambíguos para o aprendiz (cf. Roberts,
2007). Porém, investigaremos a hipótese de que, contrariamente às situações de contato, em que as
crianças se veem frente a fixações paramétricas ambíguas ou contraditórias, é possível que as
mudanças não induzidas pelo contato derivem de modificações nas evidências positivas acessíveis a
uma dada geração, como, por exemplo, o surgimento de um novo padrão prosódico. Essa idéia, já
trabalhada nos projetos anteriores, encontra hoje um eco novo em afirmações, como a de Berwick
& Chomsky (2008) de que grande parte da variação observável nos sistemas gramaticais reflete
mais a natureza do "processo de externalização", isso a interface fonológica/morfológica (PF) do
que a sintaxe estreita (narrow syntax).
III.2.2 A modelagem estocástica da mudança
26
A descrição da competição de gramáticas, bem como sua integração a uma teoria da mudança,
requer, por um lado, a análise formal das gramáticas em presença, e, por outro lado, a modelagem
da dinâmica das relações entre essas gramáticas. Precisamos, portanto, além de modelos
desenvolvidos no interior da teoria linguística, de ferramentas oriundas de modelos matemáticos,
como em Galves & Galves (1995), Cassandro et al. (1999), Niyogi (2006), Yang (2000, 2002),
Galves et al. (2012). Neste projeto, aplicaremos à mudança sintática metodologias desenvolvidas
nos projetos anteriores para validar hipóteses sobre a dinâmica dos processos fonológicos, em
particular na determinação de pontos de corte (cf. Galves et al., 2012) e na modelagem bayesiana de
sequências temporais, baseada na noção de “preditiva” (cf. Frota et al., 2011).
O trabalho de modelagem matemática dos dados linguísticos se dará em colaboração com o Projeto
da
USP
Matemática,
Computação,
Linguagem
e
Cérebro
-
MacLinc
(http://www.ime.usp.br:8080/MaCLinC/project), ao qual vários pesquisadores deste projeto estão
associados.
III.3 O Corpus Tycho Brahe
A história posterior ao séc. XVI em Portugal foi o objeto de dois projetos temáticos, Padrões
rítmicos, fixação de parâmetros e mudança linguística (1998-2003) e Padrões rítmicos, fixação de
parâmetros e mudança linguística, Fase II (2005-2009) que vieram preencher uma lacuna
importante, já que anteriormente esse período não tinha sido objeto de nenhuma abordagem
sistemática.
No
decorrer
dos
dois
projetos,
o
Corpus
Tycho
Brahe
–cf.
http://www.tycho.iel.unicamp.br/~tycho/corpus - (doravante CTB) foi iniciado e consolidado,
oferecendo agora uma base de dados de mais de 600.000 palavras anotadas sintaticamente,
correspondendo a 15 textos escritos por autores portugueses nascidos entre 1502 e 1836. Esse
corpus anotado, único do gênero para a língua portuguesa, já permitiu revisitar de maneira muito
rica e produtiva grandes questões da história da língua, como a mudança da sintaxe de clíticos e a
mudança da posição do sujeito, associada à perda do fenômeno V2. No decorrer do segundo projeto
temático, vários textos brasileiros foram incluídos no Corpus, a partir de colaborações com grupos
de pesquisa trabalhando sobre a história do português no Brasil. Alguns desses textos já receberam
uma etiquetagem morfológica, mas não foram ainda anotados sintaticamente.
Torna-se
imprescindível agora incluí-los na base de dados sintaticamente anotados para que o CTB sirva à
história do português brasileiro como vem servindo à história do português europeu. Por outro lado,
a compreensão do desenvolvimento da língua portuguesa no Brasil passa obrigatoriamente pelo
conhecimento do estado de língua que aqui foi trazido. Sem menosprezar as limitações inerentes ao
estudo dos textos escritos para o conhecimento da língua efetivamente falada e sua variação, os
27
estudos realizados até agora com base no CTB permitiram consolidar uma descrição da língua
portuguesa dos séc. XVI e XVII (o PCl) que não era disponível antes. Como consequência,
permitiram entender melhor a natureza da variação encontrada nos textos brasileiros do séc. XIX,
confluência de três gramáticas distintas: a do PCl, a do PE e a do PB (cf. Carneiro, 2005; Carneiro
e Galves, 2010). O que falta agora é um conhecimento mais sistemático da evolução da língua
portuguesa no Brasil, naquilo que os textos escritos podem nos informar. Para isso, faz-se
necessário uma grande variedade de gêneros textuais. Isso será possível graças à colaboração com
grupos trabalhando na edição de documentos de toda natureza, parceiros essenciais dessa jornada.
O conjunto de documentos já existindo e a ser incluído na base de dados constitui um fantástico
laboratório para discutir as questões levantadas nas seções anteriores, que estão na ordem do dia da
agenda da sintaxe diacrônica, mais especificamente, e na teoria da gramática, mais geralmente.
Na continuação dos temáticos anteriores, este projeto tem como característica essencial basear o
trabalho de análise diacrônica num grande corpus anotado. Isso implica não somente escolher
textos para compor o corpus, mas elaborar ferramentas para a anotação.
Estado da arte
O Corpus Tycho Brahe, construído ao longo dos dois projetos anteriores, já oferece aos
pesquisadores uma base de dados inédita até então. São atualmente 53 textos totalizando 2.464.191
palavras, 31 dos quais têm anotação morfológica revisada e 15 (+/- 600.000 palavras) têm anotação
sintática revisada. Com base na data de nascimento dos autores, estes 15 textos cobrem o período
que vai de 1502 a 1836, e já permitem trabalhos aprofundados sobre a história da língua do
português clássico ao português europeu moderno. Também dão uma base importante para a
história do português brasileiro, uma vez que permitem tomar como ponto de partida o português
efetivamente trazido ao Brasil e não sua versão moderna, dissipando possíveis equívocos.
Os projetos anteriores também desenvolveram, alem do sistema de anotação, ferramentas
importantes, como o etiquetador automático e a ferramenta de edição eletrônica E-dictor. Essas
ferramentas estão sendo disponibilizadas no site do Corpus, e já estão sendo usadas por vários
grupos brasileiros, com auxílio de membros dos projetos anteriores.
III.3. 1. Extensão da base de dados: inclusão de novos textos
Nesta fase da construção do Corpus Tycho Brahe (doravante CTB) a inclusão de novos textos
privilegiará o português brasileiro, sem contudo se limitar a ele. Para a história do português em
Portugal, como já foi mencionado, prevê-se reforçar um gênero pouco representado até agora no
CTB: o teatro. Essa inclusão faz parte integrante de um projeto de pós-doutorado - já aprovado pela
28
Fapesp - de um pesquisador deste temático, e dirá respeito a textos teatrais escritos em Portugal da
alvorada do séc. XVI ao séc. XX, com a seguinte seleção.
Gil Vicente, nascido em 1465 (peças escolhidas da Compilaçam);
Francisco de Sá de Miranda, nascido em 1481 (Auto dos Estrangeiros e Auto dos
Vilhalpandos).
Jorge Ferreira de Vasconcelos, nascido por volta de 1515 (Eufrósina e
Celestina);
António Ribeiro Chiado (Auto das Regateiras);
António Ferreira, nascido em 1528 (Inês de Castro).
Francisco Manuel de Melo, nascido em 1608 (Auto do Fidalgo Aprendiz)
António José da Silva, nascido em 1705 (peça a ser escolhida);
Almeida Garrett, nascido em 1799 (Falar a verdade a mentir e Frei Luís de Sousa).
Raul Brandão, nascido em 1867;
Júlio Dantas, nascido em 1876 (peças a serem escolhidas);
José Régio (José Maria dos Reis Pereira), nascido em 1901 (A salvação do
mundo);
Bernardo Santareno, nascido em 1920;
Luiz Francisco Rebello, nascido em 1924 (peças a serem escolhidas).
Fora o teatro, prevê-se integrar ao Corpus textos não literários, numa parceria firmada com dois
projetos coordenados pela Profa Rita Marquilhas, do Centro de Linguística da Universidade de
Lisboa: o projeto Cards e o projeto Post Scriptum, que têm como objetivo “descobrir e publicar
cartas privadas escritas em português e castelhano e trocadas por pessoas de todas as classes sociais
entre o século XVII e o início do século XIX”.
Tanto o teatro quanto os textos não literários devem auxiliar na aproximação do que seja a língua
falada na época. No que diz respeito às cartas portuguesas, elas são particularmente importantes no
que tange à comparabilidade do português brasileiro com o português europeu, uma vez que grande
parte do acervo brasileiro é constituido de cartas (cf. as Cartas brasileiras já presentes no Corpus –
va_004).
Do ponto de vista da anotação, projeta-se ampliar o Corpus português sintaticamente anotado para
pelo menos 1.500.000 palavras, pertencendo a textos repartidos regularmente pelo tempo, com pelo
menos 4 textos por período de 50 anos, acrescentando ao período atualmente contemplado a
segunda metade do séc. XIX.
Quanto aos textos brasileiros, trata-se de constituir um CTB Brasil em colaboração estreita com
grupos de pesquisa brasileiros envolvidos na edição de textos não literários produzidos no Brasil ao
29
longo da sua história. Como já foi dito acima, o resultado dessa parceria já redundou na inclusão no
Corpus de textos de uma imensa relevância para a compreensão da história do português no Brasil:
as Cartas brasileiras, já mencionadas e as Atas da Sociedade Protetora dos Desvalidos (cf. Oliveira,
2006) Trata-se de ampliar e sistematizar essa parceria, de maneira que se constitua um corpus
sintaticamente anotado do português brasileiro histórico de pelo menos 500.000 palavras. Desse
corpus deverão também fazer parte textos literários, de maneira a permitir uma comparação
sistemática das duas vertentes do português no Brasil, o ‘culto’ e o ‘popular’ (pelo menos naquilo
que transparece de textos não literários). Está sendo também constituido um corpus de jornais, no
âmbito de teses e dissertações em andamento. Enfim, serão acrescentados textos orais
representativos do português afro-brasileiro.
Os grupos associados a essa pesquisa são os seguintes:
- Projeto Brasiliana Digital/ Biblioteca Brasiliana Guita e José Mindlin, USP-São Paulo.
- Projeto PHPB-Rio de Janeiro, na Universidade Federal do Rio de Janeiro, coordenado pela
Profa Célia Lopes.
- Projeto PHPB-Bahia, na Universidade Federal da Bahia, coordenado pela Profa Tânia Lobo,
do qual fazem parte os seguintes projetos:
 Projeto CE-DOHS Corpus Eletrônico de Documentos Históricos do Sertão FAPESB,
www.uefs.br/cedohs, coordenado pelas Profas. Zenaide de Oliveira Novais Carneiro e
Mariana Fagundes de Oliveira.
 Projeto Memória Conquistense, na Universidade Estadual do Sudoeste da Bahia –UESB,
coordenado pelos Profs Cristiane Namiuti e Jorge Viana.
- Projeto Afro-Latin Linguistics: Language Contact in Intercultural Settings, coordenado pela
Profa. Dra. Laura Álvarez-López, da Universidade de Estocolmo.
Já existe uma intensa parceria entre os três grupos baianos e os projetos associados ao Corpus
Tycho Brahe, concretizada em publicações já efetuadas (cf. Lobo e Oliveira, 2009) ou em
planejamento (cf. Lobo, Oliveira & Galves em prep.), em transferência de tecnologia e de
competência, e em parcerias para disponibilização de textos na Internet. A existência de
financiamento para a construção do CTB no âmbito deste projeto temático agilizará essa
cooperação, uma vez que permitirá que mais bolsistas efetuem as tarefas de formatação e anotação
dos textos. O projeto Afro-Latin Linguistics: Language Contact in Intercultural Settings, que conta
com pesquisadores do Brasil, da Suécia e do Uruguai, está iniciando uma cooperação com
pesquisadores da Unicamp para a edição de amostras de fala representativas de variedades africanas
do português, visando à ampliação do CTB.
30
III.3.2. Elaboração de novas ferramentas e melhoria das já existentes:
As ferramentas necessárias ao desenvolvimento do Corpus e seu uso para pesquisa linguística
podem ser classificadas em três tipos:
- ferramentas de edição eletrônica
Um importante produto tecnológico do projeto temático Padrões rítmicos, fixação paramétrica e
mudança linguistica Fase II foi a ferramenta E-dictor, planejada por Maria Clara Paixão de Sousa
durante seu pós-doutorado no âmbito do projeto, e implementada por Fábio Kepler, então
doutorando no Departamento de Computação da USP e Pablo Faria, bolsista TT4A do projeto. Essa
ferramenta está sendo usada na construção do Corpus Tycho Brahe, mas também por vários grupos
envolvidos na construção de corpora históricos (Vozes do Sertão, Memória Conquistense, PHPB
Rio de Janeiro), além do grupo de pesquisa da Biblioteca Brasiliana, que participará da ampliação
do Corpus Tycho Brahe. A ferramenta permite que a anotação morfológica seja efetuada no mesmo
arquivo. Ela deve ser melhorada no sentido de permitir mais funcionalidades, como a inserção de
imagens e a anotação sintática dentro do arquivo. Esse último ponto representará um avanço
importante na integração dos aspectos filológicos e sintáticos do Corpus, uma vez que, em estando
reunidos num mesmo arquivo, todos os passos da anotação e codificação dos textos, todas as
combinações se tornam possíveis, e a anotação sintática pode ser disponibilizada com todos os
níveis de edição, inclusive os mais próximos dos textos originais.
- ferramentas de anotação morfológica e sintática
O etiquetador morfológico foi elaborado no decorrer do primeiro projeto temático, graças à
participação decisiva de Marcelo Finger, do Departamento de Computação da USP, na elaboração
inicial do Corpus Tycho Brahe. Temos atualmente uma segunda versão, de Fábio Kepler. Para a
anotação sintática, utilisamos o analisador sintático automático ("parser") universal, elaborado por
Dan Bickel na Universidade da Pensilvânia, e treinado com nossos dados.
É parte importante deste projeto a elaboração de um novo "parser", específico para a língua
portuguesa e mais eficiente do que o que usamos atualmente, graças à colaboração com Marcelo
Finger do Departamento de Computação da USP, Fábio Kepler agora professor na Universidade
Federal do Pampa, e os matemáticos Antonio Galves, do Departamento de Estatística da USP, e
Jesus Garcia e Veronica González López, do Departamento de Estatística da Unicamp.
A
originalidade do projeto consiste na articulação de métodos computacionais novos com algoritmos
probabilísticos de análise da cadeia sintática.
31
- ferramentas de buscas
O trabalho com o Corpus conta com duas ferramentas essenciais, Corpus Draw e Corpus Search (cf.
http://corpussearch.sourceforge.net/), elaboradas por Beth Randall no âmbito do projeto do PennHelsinki Parsed Corpus of Middle English, coordenado por Anthony Kroch, na Universidade da
Pensilvânia (cf. http://www.ling.upenn.edu/hist-corpora/annotation/index.htm).
Corpus Draw
permite agilizar a fase de revisão da saída do analisador, e Corpus Search é a ferramenta com a
qual se fazem as buscas de estruturas sintáticas nos textos anotados. Uma versão para buscas em
textos morfologicamente anotados já está disponível on line no site do Corpus Tycho Brahe. Uma
interface deverá ser elaborada no decorrer do projeto para possibilitar buscas on line em textos
sintaticamente anotados.
Tanto para o desenvolvimento do analisador novo quanto para a procura de interfaces mais
eficientes e amigáveis no uso das ferramentas, ou ainda para o estabelecimento de anotações
sintáticas mais adequadas, a parceria com Anthony Kroch e sua equipe, em particular Beatrice
Santorini, continuará fundamental neste projeto, como foi nos projetos anteriores.
32
Bibliography
Adams, Marianne. 1987. Old French, null subjects and Verb-Second phenomena, PhD Dissertation,
UCLA.
Alkmim, T. 2001. A variedade lingüística de negros e escravos: um tópico da história do português
no Brasil. In: Mattos e Silva, R.V. (org.). Para a história do português brasileiro. Vol. II, Tomo II –
Primeiros estudos. São Paulo: Humanitas FFLCH/USP, pp. 317-335.
Alkmim, T. 2002. Estereótipos linguísticos: negros em charges do século XIX. In: Alkmim, T. (org.)
Para a história do português brasileiro. Vol. III – Novos Estudos. São Paulo:
Humanitas/FFLCH/USP, pp. 383-402.
Alkmim, T. 2008. Falas e cores: um estudo sobre o português de negros e escravos no Brasil do
século XIX. In: Stolze Lima, I. & do Carmo, L. (orgs.). História social da língua nacional. Rio de
Janeiro: Casa de Rui Barbosa, pp. 247-264.
Álvarez López, L. 2008. Fontes escritas como documentação do português falado por africanos e
afrodescendentes no Brasil. In: Gonçalves, C. A & Leitão de Almeida, M. L. (orgs.) Língua
portuguesa: identidade, difusão e variabilidade. Rio de Janeiro: AILP/Universidade Federal do Rio
de Janeiro, pp. 287-302.
Alvarez-López, L. 2007. Um estudo sobre a partícula zi/ji em representações da fala de africanos e
seus descendentes no Brasil. In: Schrader-Kniffki, M. & García, L. M. (orgs.) Romania en
interacción: entre historia, contacto y política. Ensayos en homenaje a Klaus Zimmermann.
Frankfurt am Main: Vervuert/Iberoamericana, pp. 391-413.
Álvarez-López, L. 2006. Exageros, estereótipos ou espelho da realidade? Fontes escritas como
documentação da fala de negros e escravos no Brasil. In: Falk, J. et al. (orgs.) Discurso, interacción
e identidad. Estocolmo: Universidade de Estocolmo, pp. 165-177.
Andrade, Aroldo. 2010. A subida de clíticos em português. Um estudo sobre a variedade européia
dos séc. 16 a 20. Tese de doutorado inédita, Unicamp.
Antonelli, André. 2011. Sintaxe da posição do verbo e mudança gramatical na história do português
europeu. Tese de doutorado inédita, Unicamp.
Authier, J.-Marc P. 1988. Null Object Constructions in Kinande. Natural Language & Linguistic
Theory, Vol. 6, No. 1. (Feb., 1988), pp. 19-37.
Avelar, Juanito. 2011. “Convergências e contrastes entre o português brasileiro e as línguas Bantu:
posição de sujeito e padrões de concordância”. Comunicação apresentada durante o I Simpósio
“Dinâmicas Afro-Latinas: Língua(s) e História(s)”, realizado nos dias 27 e 28 de abril de 2011 no
IEL/Unicamp.
Avelar, Juanito & Sônia Cyrino. 2008. “Locativos preposicionados em posição de sujeito: uma
posição contribuição das línguas Bantu à sintaxe do português brasileiro.” Linguística 3 – Revista de
Estudos Linguístico da Universidade do Porto, 218-249.
Avelar, Juanito; Sonia Cyrino & Charlotte Galves. 2009. “Locative inversion and agreement
patterns: parallelisms between Brazilian Portuguese and Bantu languages”, in Margarida Petter &
Ronald Beline Mendes. (Eds.). Proceedings of the Special World Congress of African Linguistics
33
São Paulo 2008. Exploring the African Language Connection in the America. São Paulo::
Humanitas, pp. 207-221.
Avelar, Juanito & Charlotte Galves, 2010. "Topic and Agreement in the C-T Probe System: the
Case of Brazilian Portuguese", comunicação no 1o Rencontres d'Automne de Linguistique
Formelle: Language(s) and Cognition, Université Paris VIII.
Avelar, Juanito & Charlotte Galves, 2011a. "From European to Brazilian Portuguese: a parameter
network approach", comunicação no 13o Diachronic Generative Syntax Conference, University of
Pennsylvania.
Avelar, Juanito & Charlotte Galves. 2011b. “Tópico e concordância em português brasileiro e
português europeu”. In: Armanda Costa; Isabel Falé; Pilar Barbosa. (orgs.) Textos Seleccionados
do XXVI Encontro da Associação Portuguesa de Linguística, pp. 49-65.
Baker, Mark. 1996. The polysynthesis parameter. Oxford: Oxford University Press.
Baker, Mark. 2001. The atoms of language. Oxford: Oxford University Press.
Baker, Mark. 2008a. The syntax of agreement and concord. Cambridge: Cambridge University Press.
Baker, Mark. 2008b. “The macroparameter in a microparametric world”. in Theresa Biberauer (org.),
The limits of syntactic variation, Linguistics Today 132, Amsterdam: John Benjamins. pp. 351-374.
Barbosa, Pilar, 1995. Null Subjects. MIT Ph.D. dissertation.
Barbosa, Pilar, 1996. Clitic placement in European Portuguese and the position of subjects. In:
Halpern, Aaron, Zwicky, Arnold (eds.), Approaching Second: Second position clitics and related
phenomena, CSLI Publications, pp. 1-40.
Barbosa, Pilar, 2000. Clitics: a window into the null subject property. In: João Costa (org.).
Portuguese Syntax, Oxford University Press, Oxford, New York, pp. 31-93.
Barbosa, Pilar, 2008. Deslocação local, cliticização e Spell Out cíclico, Diacrítica 22,1, 131-156.
Baxter, Alan. 2002. 'Semicreolization'? The Restructured Portuguese of the Tongas of São Tomé - a
Consequence of L1 Aquisition in a Special Contact Situation. Journal of Portuguese Linguistics.
Lisboa, 1: 7-39.
Biberauer, Theresa (org.). 2008. The limits of syntactic variation. Amsterdam: Benjamins.
Biberauer, Theresa & Ian Roberts. 2010. “Subjects, tense and verb-movement”, in Biberauer et al.,
pp. 263-302.
Biberauer, Theresa, Anders Holmberg, Ian Roberts & Michelle Sheehan (orgs.) 2010. Parametric
variation, Null subjects in minimalist theory. Cambridge: Cambridge University Press.
Bošković, Ž. 2008. "What will you have, DP or NP?" In: Proceedings of NELS 37.
Bošković, Ž. a sair. "Semantic correlates of the NP/DP parameter." In: Proceedings of NELS 39.
Cardeira, Esperança. 2005. Entre o português antigo e o português clássico. Lisboa: Imprensa
Nacional Casa da Moeda.
Carlson, G. 1977. "A unified analysis of the English bare plural". Linguistics and Philosophy 1,
413–457.
Carneiro, Zenaide. 2005. Cartas brasileiras (1809-1904) Um estudo linguístico-filológico. Tese de
doutorado inédita, Unicamp.
Carneiro, Zenaide & Charlotte Galves. 2010. “Variação e Gramática: colocação de clíticos na
história do português brasileiro”. Revista de Estudos da Linguagem 18, 1, 7-38.
Carneiro, Zenaide, Charlotte Galves & Tânia Lobo em prep. Cartas brasileiras dos novecentos: um
estudo lingüístico.
34
Cassandro, Marzio, Pierre Collet, Antonio Galves & Charlotte Galves. 1999. "A statistical-physics
approach to language acquisition and language change". Physica A. 263, 427-437.
Castro, Ivo. 2006. Introdução à história do português. Lisboa: Colibri.
Cavalcante, Sílvia. O uso de se com infinitivo na história do português: do português clássico ao
português europeu e brasileiro moderno. Tese de doutorado inédita, Universidade Estadual de
Campinas.
Chomsky, Noam. 1982. Some concepts and consequences of the theory of government and binding.
Foris, Dordrecht.
Chomsky, Noam.1985. Knowledge of Language: its nature, its acquisition, its use. New York:
Praeger.
Chomsky, N. 2001. “Derivation by phase”. In: Michael Kenstowicz (org.). Ken Hale: a life in
language. Cambridge (Mass.): MIT Press. 1-52.
Chomsky, Noam. 2005. “Three factors in language design” Linguistic Inquiry 36: 1-22.
Chomsky, Noam. 2008. “On Phases”. In: Robert Freidin, Carlos Otero, & Maria Luisa Zubizarreta
(eds) Foundational issues in linguistic theory. Cambridge, MA: MIT Press, 133-166.
Correa, Vilma. 1991. O objeto direto nulo no português do Brasil. Dissertação de mestrado inédita,
Unicamp.
Coelho, Francisco Adolfo. 1967[1880, 1882, 1886]. “Os dialetos românicos ou neo-latinos na
África, Ásia e América”, in Estudos Lingüísticos Crioulos, reedição de artigos publicados no
Boletim da Sociedade de Geografia de Lisboa, Academia Internacional da Língua Portuguesa,
Lisboa.
Costa, João. 2010. "PB e PE: Orientação para o discurso importa?" Estudos da Lingua(gem),
Estados diacrônicos e sintáticos da lingua portuguesa 8.1, 123-144.
Costa, João & Ana Maria Martins. 2004. "What is a strong functional head?". Comunicação no
Lisbon Workshop on Alternative Views on the Functional Domain, Universidade Nova de Lisboa.
Cyrino, Sonia 1997. O objeto nulo no português brasileiro: um estudo sintático-diacrônico.
Londrina: Editora da UEL.
Cyrino, Sônia 2010. "Morphological marking and verb movement in Brazilian Portuguese".
Workshop on Verb Movement: its nature, triggers and effects. University of Amsterdam,
Amsterdam, December 11-12, 2010.
Cyrino, Sônia. 2011. "On richness of tense and verb movement in Brazilian Portuguese". 21st
Colloquium on Generative Grammar (CGG21), Universidad de Sevilla/Universidad Pablo de
Olavide, Sevilha, Espanha, 7-9 de abril de 2011.
Cyrino, Sônia & Maria Teresa Espinal 2011. "Object Bare Nominals in Brazilian Portuguese:
more on the NP/DP analysis". Comunicação apresentada no CSSP 2011. September 21-23, 2011.
D’Alessandro Roberta, Adam Ledgeway & Ian Roberts. 2010. Syntactic variation, The dialects of
Italy. Cambridge: Cambridge University Press.
Diesing, M. 1992. Indefinites . Cambridge MA: The MIT Press.
Duarte, Inês. 1987. A construção de topicalização na gramática do português: regência, ligação e
condição sobre o movimento.Tese de doutorado inédita, Universidade de Lisboa.
Duarte, Maria Eugênia. 1995. A perda do princípio ‘Evite pronome’ no português brasileiro. Tese de
doutorado inédita, Unicamp.
Duarte, Maria Eugênia & Mary Kato. 2008. "Mudança paramétrica e orientação para o discurso".
Comunicação no 24o Congresso Nacional da Associação Portuguesa de Linguística, Braga.
35
Espinal, M. Teresa & Louise McNally. 2009. Characterizing 'have' predicates and indefiniteness. M.
T. Espinal, et al. (orgs.) Proceedings of the IV NEREUS International Workshop, Fachbereich
Sprachwissenschaft der Universität Konstanz Arbeitspapier Nr. 124, pp. 27-32.
Espinal, Maria Teresa & Louise McNally. 2009. "Bare singular nouns and incorporating verbs in
Spanish and Catalan". Journal of Linguistics 47, 87-128.
Figueiredo, . 2010. A concordância plural variável no sintagma nominal do português reestruturado
da comunidade de Almoxarife, São Tomé: desenvolvimento das regras de concordância variáveis
no processo de transmissão-aquisição geracional, vols. 1 e 2. Tese de Doutoramento inédita.
Universidade de Macau.
Fiorin, José Luis & Margarida Petter (orgs.). 2007. África no Brasil: a formação da língua
portuguesa. São Paulo: Contexto.
Floripi, Simone. 2008. Estudo da variação do determinante em sintagmas nominais possessivos na
história do português. Tese de doutorado inédita, Unicamp.
Galves, Antonio & Charlotte Galves. 1995. “A case study of prosody driven language change”,
manuscrito, USP-Unicamp, disponível em www.tycho.iel.unicamp.br/~tycho/prfpml/fase1/papers/
Galves, Antonio, Charlotte Galves, Jesus Garcia, Nancy Garcia & Florência Leonardi. 2012.
"Context tree selection and linguistic rhythm retrieval from written texts", Annals of Applied
Statistics 6, 186-209.
Galves, Charlotte. 1987. "A sintaxe do português brasileiro". Ensaios de Linguística 13,
(reimpresso em Galves, 2001).
31-50,
Galves, Charlotte. 1989. "L'objet nul et la structure de la proposition en portugais du Brésil", Revue
des langues romanes 93-2, 305-336.
Galves, Charlotte. 1994. "V-Movement, Levels of Representation and the Structure of S". Letras de
Hoje 96, 35-58.
Galves, Charlotte. 1997. "La syntaxe pronominale du Portugais Brésilien" In: A. Zribi-Hertz (org.)
Les Pronoms. Presses Universitaires de Vincennes.
Galves, Charlotte. 1998. "Tópicos, Sujeitos, Pronomes e Concordância no Português Brasileiro".
Cadernos de Estudos Lingüísticos 34, 7-21.
Galves, Charlotte. 2001. Ensaios sobre as gramáticas do português. Campinas: Editora da Unicamp.
Galves, Charlotte. 2012. "Periodização e competição de gramáticas: o caso do português médio". In:
Lobo, Tânia; Carneiro, Zenaide; Ribeiro, Silvana; Soledade; Juliana; Almeida, Ariadne (orgs.).
ROSAE: linguística histórica, história das línguas e outras histórias. Salvador: Edufba, pp. 74-88.
Galves, Charlotte, Helena Britto & Maria Clara Paixão de Sousa. 2005. The change in clitic
placement from Classical to Modern European Portuguese: results from the Tycho Brahe Corpus.
Journal of Portuguese Linguistics 4,1, 39-68.
Galves, Charlotte, Cristiane Namiuti & Maria Clara Paixão de Sousa. 2006. “Novas perspectivas
para antigas questões: revisitando a periodização da língua portuguesa”, in A, Endruschat, R.
Kemmler& B. Schafer-Prieβ (orgs.) Grammatische Strukturen des Europaischen Portugiesisch,
Tubingen: Calepinus Verlag.
Galves, Charlotte & Maria Clara Paixão de Sousa. 2005. "Clitic placement and the position of
subjects in the history of European Portuguese". In: Twan Geerts; Ivo van Ginneken; Haike Jacobs..
(orgs.). Romance Languages and Linguistic Theory 2003; Selected Papers from ´Going Romance´
2003. Amsterdam: John Benjamins, pp. 97-113.
36
Galves, Charlotte & Maria Clara Paixão de Sousa. 2010. "The loss of verb-second in the history of
Portuguese: Subject position, Clitic placement and Prosody". Comunicação no Digs12, Cambridge,
UK.
Galves, Charlotte & Filomena Sandalo. 2012. “From Intonational Phrase to Syntactic Phase: the
grammaticalization of enclisis in the history of Portuguese”, a sair em Lingua, 122.
Galves, Charlotte, Sônia Cyrino, Ruth Lopes, Filomena Sandalo, & Juanito Avelar (orgs.). no prelo.
Parameter Theory and Linguistic Change, Oxford University Press, Oxford.
Gibrail, Alba. 2003. O acusativo preposicionado no português clássico: uma abordagem diacrônica e
teórica. Dissertação de mestrado inédita, Unicamp.
Gibrail, Alba. 2010. Contextos de formação de estruturas de tópico e foco no português clássico.
Tese de doutorado inédita, Unicamp.
Gonçalves, Perpétua & Chimbutane, F. 2004. O papel das línguas Bantu na gênese do português de
Moçambique: o comportamento sintático de constituintes locativos e direcionais. Papia 14, 7-30.
Gonçalves, Perpétua 2010 A Gênese do português de Moçambique, Lisboa: INCM.
Grimshaw, Jane. 1991. “Extended projections”, Unpublished ms: Rutgers.
Holm, John. 2004. Languages in contact, the partial restructuring of vernaculars, Cambridge:
Cambridge University Press.
Huang, C.T.J. 1984. "On the distribution and reference of empty pronouns", Linguistic Inquiry 15.4,
531-574.
Inverno, Liliana Cristina. 2005. Angola’s Transition to Vernacular Portuguese, dissertação de
mestrado inédita, Universidade de Coimbra.
Inverno, Liliana Cristina. 2011. Contact-induced restructuring of Portuguese morpho-syntax in
interior Angola. Tese de doutorado inédita, Universidade de Coimbra.
Jon-And, Anna. 2011. Variação, contato e mudança linguística em Mocambique e Cabo Verde.
Stockholm: Stockholm University.
Kayne, Richard. 2005. “Some Notes on Comparative Syntax”. In Movement and Silence, Oxford:
Oxford University Press.
Kratzer, A. 1995. "Stage-level and individual-level Predicates". In: G. Carlson & J. Pelletier (orgs.)
The Generic Book , The University of Chicago Press, pp.125-175.
Kroch, Anthony. 1989. "Reflexes of grammar in patterns of language change". Language Change
and Variation 1, 199-244.
Kroch, Anthony. 1994. “Morpho-syntactic variation”, in Kenneth Beals et al. (orgs.), Papers from
the 30th Regional Meeting of the Chicago Linguistics Society: Parasession on Variation e Linguistic
Theory, vol. 2, pp. 180-201.
Kroch, Anthony. 2001. “Syntactic change”. In: Mark Baltin & Cris Collins (orgs.) The handbook of
contemporary syntactic theory. Oxford: Blackwell, pp. 699-729.
Lightfoot, David. 1999. The development of language: evolution, change and acquisition. Oxford:
Blackwell.
Lightfoot, David. 2006. How new languages emerge. Cambridge: Cambridge University Press.
Lobo, Tânia & Klebson Oliveira. 2009. África à vista: dez estudos sobre o português escrito por
africanos no Brasil do século XIX., Salvador: EDUFBA.
Lobo, Tânia, Klebson Oliveira & Charlotte Galves em prep, Brasil-África à vista: estudos sobre o
português escrito por forros brasileiros. Salvador: EDUFBA.
37
Lucchesi, Dante. 2003. “O conceito de transmissão linguística irregular e o processo de formação
do português do Brasil”, in Roncarati, Claudia; Abraçado, Jussara. (orgs) Português brasileiro,
contato linguístico, heterogeneidade e história, Rio de Janeiro: Viveiros de Castro Editora, pp. 272282.
Lucchesi, Dante, Ilza Ribeiro & Alan Baxter. 2009. O português afro-brasileiro. Salvador:
EDUFBA.
Magro, Catarina, 2008. Clíticos: variação sobre o tema. Tese de doutorado inédita, Universidade de
Lisboa.
Marquilhas, Rita. 2001. A faculdade das letras. Lisboa: INCM.
Martins, Ana Maria. 1994. Clíticos na história do português. Tese de doutorado inédita,
Universidade de Lisboa.
Martins, Ana Maria. 2011 “Clíticos na história do português à luz do teatro vicentino” Estudos de
Lingüística Galega 3, 83-109.
Martins, Marco Antonio. 2010. Competição de gramáticas do português na escrita catarinense dos
séculos 19 e 20. Tese de doutorado inédita, Universidade Federal de Santa Catarina.
Mattos e Silva, Rosa Virgínia. 2004. Ensaios para uma socio-história do português brasileiro. São
Paulo: Parábola Editorial.
Meillet, A. 1912 “L’évolution des formes grammaticales”. Reprint 1958 in A. Meillet. Linguistique
historique et linguistique générale, Paris: Champion, 130-158.
Milsark, Gary. 1977. 'Peculiarities of the Existential Construction in English', Linguistic Analysis 3,
1-29.
Modesto, Marcello. 2008. "Topic prominence and null subjects". In:Theresa Biberauer (org.), The
limits of syntactic variation, Linguistics Today 132, Amsterdam: John Benjamins. pp. 375-410.
Moura, Denilda. 2009. Resquícios de Palmares – O que uma comunidade quilombola nos diz.
Maceió: EdUFAL.
Munn, Allan & Schmitt, Cristina. 2001. "Bare nominals and the morphosyntax of number". In: T.
Satterfield, C. Tortora & D. Cresti (orgs), Current issues in Romance Linguistics, Amsterdam: John
Benjamins, pp. 217–231.
Namiuti, Cristiane. 2008. Aspectos da história gramatical do português: interpolação, negação e
mudança. Tese de doutorado inédita, Unicamp.
Negrao, Esmeralda. 1999. O português brasileiro, uma língua voltada para o discurso. Tese de
Livre-Docência, Universidade de São Paulo.
Naro, Anthony & Marta Scherre. 2007. As origens do português brasileiro. São Paulo: Parábola.
Newmeyer, Frederic. 2004 “Against a parameter-setting approach to language variation”. Linguistic
Variation Yearbook 4:181-234.
Niyogi, Partha. 2006. The computational nature of language learning and evolution. Cambridge,
Mass: MIT Press.
Oliveira, Klebson,2006. Negros e escrita no Brasil do século XIX: sócio-história, edição filológica
de documentos e estudo lingüístico. Tese de Doutorado. Universidade Federal da Bahia, Salvador.
Ouhalla, Jamal, 2005. "Clitic placement, grammaticalization, and reanalysis in Berber". In:
Guglielmo Cinque & Richard Kayne (orgs.), The Oxford Handbook of Comparative Syntax.
Oxford University Press, Oxford, New York, pp. 607-638.
Pagotto, Emílio. 1992. A posição dos clíticos em Português: Um Estudo Diacrônico. Dissertação de
mestrado inédita, Universidade Estadual de Campinas.
38
Paixão de Sousa, Maria Clara. 2004. Língua barroca: Sintaxe e história do português nos 1600. Tese
de Doutoramento inédita, Universidade Estadual de Campinas.
Paixão de Sousa, Maria Clara. 2010. A Língua Portuguesa, 1400-1600: Aspectos de História e
Gramática. Projeto de pesquisa para o Regime de Dedicação Exclusiva à Pesquisa e Docência,
Departamento de Letras Clássicas e Vernáculas, Universidade de São Paulo.
Petter, Margarida. 2009. "O continuum afro-brasileiro do português" . In: Charlotte Galves, Helder
Garmes & Fernando Rosa Ribeiro (orgs.) África-Brasil, Caminhos da língua portuguesa. Campinas:
Editora da Unicamp.
Pontes, Eunice. 1987. O tópico no português do Brasil. Campinas: Editora Pontes.
Raposo, Eduardo. 1986 "On the null subject in European Portuguese". In: Oswald Jaeggli & Carmen
Silva-Corvalan (orgs.) Studies in Romance Linguistics. Dordrecht: Foris.
Raposo, Eduardo & Juan Uriagereka. 2005. Clitic Placement in Western Iberian: A Minimalist
View. In: Guglielmo Cinque & Richard Kayne (orgs.), The Oxford Handbook of Comparative
Syntax. Oxford University Press, Oxford, New York, pp. 639-697.
Rizzi, Luigi. 1997. "The fine structure of the left periphery". In: Lilian Haegeman (org.) Elements
of Grammar: Handbook of Generative Syntax. Kluwer, Dordrecht, pp. 281-337.
Rizzi, Luigi. 2004. “On the cartography of syntactic structures”. In: Luigi Rizzi (org.), The
Cartography of Syntactic Structures, vol. 2, The structure of CP and IP. Oxford University Press,
Oxford, New York, pp. 4-15.
Roberts, Ian. no prelo. “Macroparameters and Minimalism: A Programme for Comparative
Research”. In : Galves, Charlotte, Sônia Cyrino, Ruth Lopes, Filomena Sandalo, & Juanito Avelar
(orgs.). Parameter Theory and Linguistic Change, Oxford University Press, Oxford.
Roberts, Ian & Anders Holmberg. 2010. “Introduction: parameters in minimalist theory”, In:
Biberauer et al., 1-57.
Roberts, Ian & Anna Roussou. 2003.
Syntactic Change, A Minimalist Approach to
Grammaticalization. Cambridge Studies in Linguistics 100. Cambridge: Cambridge University
Press.
Rouveret, Alain. 1987. Syntaxe des dépendances lexicales: identité et identification dans la théorie
syntaxique. Tese de doutorado inédita. Universidade Paris VII.
Rouveret, Alain.1999. "Clitics, Subjects and Tense in European Portuguese". In: Henk van
Riemsdijk, (org.), Clitics in the Languages of Europe. Mouton de Gruyter, Berlin, New York, pp.
639-677.
Santos, Márcia. 2011. “Novas luzes sobre o português afro-brasileiro: alguns dados de Jurussaca”,
Comunicação apresentada durante o I Simpósio “Dinâmicas Afro-Latinas: Língua(s) e História(s)”,
realizado nos dias 27 e 28 de abril de 2011 no IEL/Unicamp.
Sapir, Edward. 1921. Language, New York: Harcourt Brace.
Schmitt, Crisina & Alan Munn. 2003. "The syntax and semantics of bare arguments in Brazilian
Portuguese". In: Linguistic Variation Yearbook 2, pp. 185–216.
Schmitt, C. & E-P Kester. 2005. "Bare nominals in Papiamentu and Brazilian Portuguese: An exoskeletal approach". Selected peer reviewed papers from the 34th Annual Linguistic Symposium in
Romance Languages 2004, Salt Lake City.
Silva Neto, Serafim. 1977 [1950]. Introdução ao estudo da língua portuguesa, Rio de Janeiro:
Presença, 4a edição.
39
Shlonsky, Ur. 2004. Enclisis and proclisis. In: Luigi Rizzi (org.), The Cartography of Syntactic
Structures, vol. 2, The structure of CP and IP. Oxford University Press, Oxford, New York, pp.
329-253.
Torres Morais, Maria Aparecida. 1995. Do português clássico ao português europeu moderno: um
estudo da cliticização e do movimento do verbo. Tese de doutorado inédita, Unicamp.
Uriagereka, Juan. 1995. "Aspects of the syntax of clitic placement in Western Romance", Linguistic
Inquiry 26, 79-123.
Yang, Charles. 2000. “Internal and external forces in language change”. Language Variation and
Change 12, 231-250.
Yang, Charles 2002. Knowledge and Learning in Natural Languages. Oxford: Oxford University
Press.
40
Download