Quarta parte do curso – Conhecimento da língua (Chomsky, 1986) Prefácio Chomsky diz que tem interesse especial em dois problemas. O primeiro é (formulação de Bertrand Russell): “Por que será que os seres humanos, cujos contatos com o mundo são breves, pessoais e limitados, são capazes de saber tanto como sabem?” (p. 15). A este problema, Chomsky chama de problema de Platão. O segundo problema é: como podemos saber tão pouco a partir de tanta evidência. A este, chama de problema de Orwell. É claro que o problema de Platão aqui mencionado será restrito ao domínio da linguagem, que, de fato, tem um interesse especial por seu papel no pensamento e na vida humanos, além de ser um domínio bem definido e aberto à investigação. O problema de Orwell está relacionado com o bloqueio de discernimento geral quanto a crenças difundidas por sistemas totalitários e o apelo de dogmas religiosos. Chomsky trata deste assunto no último capítulo do livro, de que não trataremos neste curso. 1) O conhecimento da língua como objeto de investigação Chomsky começa com um conjunto de citações de pensadores de vários séculos defendendo pontos de vista racionalistas a respeito da linguagem humana. Essas ideias, entretanto, tiveram uma má acolhida pela investigação linguística que dominou o campo do final do século XIX aos anos 1950 do século XX. As razões foram várias: êxitos extraordinários dos estudos históricos, um leque muito maior de línguas estudadas, colocando em cheque concepções apriorísticas dos racionalistas, o impacto do empirismo, etc. A gramática gerativa retoma essas ideias há muito esquecidas. “O seu ponto de referência é o da psicologia individual. Diz respeito aos aspectos da forma e do significado que são determinados pela “faculdade da linguagem”, que deve ser entendida como uma componente particular da mente humana. A natureza desta faculdade é o tema básico de uma teoria geral acerca da estrutura da linguagem, que tem como objetivo a descoberta de um conjunto de princípios e de elementos comuns às línguas humanas possíveis; atualmente esta teoria é muitas vezes chamada de “gramática universal” (GU), por adaptação de um termo tradicional a um novo contexto de investigação” (p. 23). A GU é um mecanismo geneticamente determinado que converte a experiência num sistema de conhecimento atingido: o conhecimento de uma língua. As três perguntas colocadas pela gramática gerativa são: (1) o que constitui o conhecimento da língua? (2) como é adquirido o conhecimento da língua? (3) como é usado o conhecimento da língua? A primeira pergunta é respondida por uma gramática gerativa particular. A segunda é respondida por uma especificação da GU e por uma explicação de como seus princípios interagem com a experiência. A terceira seria respondida por uma teoria do modo como o conhecimento da língua interfere na expressão do pensamento e na compreensão de amostras da língua. Um pouco mais adiante, Chomsky deixa claro que vai tratar de uma corrente recente dentro da teoria gerativa que ficou conhecida como teoria da regência e da ligação (TRL). Fala em termos gerais sobre as dificuldades que a gramática tradicional e a estruturalista enfrentariam para responder as questões (1) e (2) acima. Em particular, menciona as limitações das teorias de Trubetzkoy, Harris e Bloch em relação à questão (2). Uma noção comum era de que a aquisição da linguagem é um caso de sobre-aprendizagem. “A língua era um sistema de hábitos, uma vez que se assumia ser fortemente sobredeterminada pela evidência disponível. A produção e a interpretação de novas formas eram consideradas um caso direto de analogia, não levantando quaisquer problemas de princípio” (p. 26). Não é preciso repetir que a visão da gramática gerativa é justamente a oposta: é a visão de que a língua é subdeterminada pela evidência disponível. Como exemplo: (4) I wonder who [the men expected to see them] [the men expected to see them] John ate an apple John ate John is too stubborn to talk to Bill John is to stubborn to talk to Tomem-se as duas primeiras sentenças. Apesar de idênticas as partes entre colchetes, somente na primeira frase “them” pode ser correferente com “the men”. Problema: como a criança sabe interpretar a oração entre colchetes de modo diferente e sem equívocos, nos dois casos? Vamos agora comparar as outras quatro frases. Em “John ate”, interpretase que John comeu um elemento com referência arbitrária. Aplica-se aqui um processo indutivo na comparação com a frase imediatamente acima. Mas se aplicarmos o mesmo processo indutivo nas duas últimas sentenças, damos com os burros n’água. Por analogia com a de cima, concluiríamos que a última quer dizer que John é muito teimoso para falar com uma pessoa qualquer, mas, aqui, a frase quer dizer que John é muito teimoso para que alguém se disponha a falar com ele. Os falantes do inglês sabem isso sem treino ou evidência relevante. Outras questões podem ser colocadas, como o fato de podermos formar “the dancing bear”, com um verbo intransitivo (“dance”), mas não “the eating man”, com um verbo transitivo que pode ser intransitivo como na quarta frase. Mais uma vez estamos diante do problema da pobreza do estímulo. Comparem-se agora as frases abaixo: (5) John is too stubborn to expect anyone to talk to Bill. John is too stubborn to visit anyone who talked to Bill. John is too stubborn to expect anyone to talk to. John is too stubborn to visit anyone who talked to. A segunda frase de (5) segue o mesmo padrão das duas últimas de (4). Por analogia, poderíamos pensar que a última frase deveria ser interpretada como John é tão teimoso que nenhuma pessoa arbitrária visitaria alguém que falasse com ele. O problema é que a última frase em (5) é uma sequência ininteligível. “Mais uma vez, conhecemos estes fatos como falantes, por mais difícil que possa ser determinar que o nosso sistema de conhecimento tem tais consequências. Conhecemos estes fatos sem instrução ou mesmo sem evidência direta e, seguramente, sem correção dos nossos erros pela comunidade linguística a que pertencemos” (p. 31). Veja-se que somos capazes de conceber as tais analogias que nos permitiriam comparar as frases sob análise, mas sabemos que as analogias nos levam a resultados errados. Portanto, não nos falta capacidade de fazer as analogias esperadas nos casos problemáticos. O problema é que as analogias produzem resultados que são contrários ao que determina nosso conhecimento da língua. Chomsky faz questão se separar conhecimento de capacidades, e enfatiza que os tais processos “dignos de confiança”, analogia, indução, associação, etc., não dão conta de como se adquirem os conhecimentos necessários para atribuir as descrições estruturais corretas às sequências de frases acima. 2) Conceitos de língua A noção de língua do senso comum tem uma dimensão sociopolítica fundamental. Por exemplo: chinês é, no senso comum, uma língua, mas há muitas diferenças entre os dialetos falados na China, que os tornam tão diferentes quanto as diversas línguas românicas. Há ainda uma visão geral de que a aprendizagem de uma língua se dá em termos teleológicos, como se houvesse algo que é, por exemplo, o português, e que os aprendizes têm um conhecimento parcial dessa língua ou estão a caminho de adquirir a língua. Chomsky procurará evitar essas noções. Entre as abordagens científicas, evitam-se aspectos sociopolíticos ou de natureza normativo-teleológica para definir uma língua: por exemplo, Bloomfield (1928) – “uma língua é a totalidade de enunciados que pode ser produzida numa comunidade linguística” (ideal; uma comunidade de indivíduos com o mesmo comportamento linguístico). Entretanto, Chomsky ressalta que as línguas têm aspectos socioculturais e que estes devem ser estudados, mas não sem levar em conta que, para se adquirir uma língua, é preciso que a mente do indivíduo que a adquire possua uma propriedade qualquer P (uma GU, no caso da abordagem que defende), que lhe permite adquirir a língua. A questão aqui é que o estudo desses aspectos socioculturais não requer que nos afastemos de uma orientação fundada na psicologia individual. Chomsky cita os exemplos dos conceitos de iole e galeota, que os indivíduos podem conhecer parcialmente, deixando a especialistas preencher os aspectos não conhecidos. “A linguística estrutural e descritiva, a psicologia do comportamento e outras abordagens contemporâneas manifestaram uma certa tendência para ver uma língua como um conjunto de ações, ou produções, ou formas linguísticas (...) acompanhadas de significados, ou como um sistema de formas e de eventos linguísticos” (p. 39). Conceitos com esta orientação serão, para Chomsky, instâncias do que ele chama de língua externa (Língua-E) – isto é, um construto compreendido independentemente das propriedades da mente. “Deste ponto de vista, uma gramática é uma coleção de afirmações descritivas que dizem respeito à Língua-E, a atos linguísticos reais ou potenciais (eventualmente acompanhadas de uma análise do seu contexto de uso ou do seu conteúdo semântico) (p. 39)”. Nessas visões, a Língua-E é o objeto de estudo. A gramática é uma noção derivada e o linguista é livre para escolher uma gramática qualquer desde que ela identifique corretamente a Língua-E (ou seja, quaisquer gramáticas G ou G’ que identifiquem a Língua-E estudada serão “corretas”, uma vez que ambas são extensionalmente equivalentes). Outra abordagem diferente defende a existência de uma noção de estrutura (expressão de Otto Jespersen) na mente do falante, que o guia na estruturação das frases. A essa noção de estrutura Chomsky vai chamar de língua interna ou Língua-I. “Considerando a língua como Língua-I, a gramática seria, então, uma teoria da Língua-I, que é o objeto a ser investigado” (p. 41). Nesse caso, não se pode mais afirmar que é irrelevante a questão de se encontrar a gramática correta que dê conta da Língua-I. Conhecer uma língua é um determinado estado da mente de um indivíduo. “A GU está agora construída como a teoria das Línguas-I humanas, um sistema de condições que deriva do equipamento biológico humano que identifica as Línguas-I que são humanamente acessíveis em condições normais” (p. 43). A gramática gerativa muda então o foco da investigação linguística, passando do comportamento linguístico e dos produtos deste comportamento para o sistema de conhecimentos que sustenta esse uso, e para a capacidade inata que permite aos seres humanos adquirirem este conhecimento. Ou seja, passa-se do estudo da Língua-E para a Língua-I. “Resumindo, temos o seguinte quadro geral. A faculdade da linguagem é um sistema distinto da mente/cérebro, com um estado inicial E0 comum à espécie (...) e aparentemente exclusivo dessa espécie no que diz respeito aos aspectos essenciais. Dada experiência apropriada, esta faculdade passa de um estado E0 para um estado relativamente estável EE, que, então, sofre apenas modificações periféricas (...). O estado atingido incorpora uma Língua-I (...). A GU é a teoria do E0; as gramáticas particulares são teorias das várias Línguas-I” (p. 44-45). De todas as coisas contidas neste parágrafo, ressalto o fato de que GU e gramáticas são teorias que o linguista formula sobre, respectivamente, o estado inicial e o estado atingido (ou Língua-I), que são objetos do mundo. O conceito de Língua-E é problemático porque as línguas externas não são objetos do mundo real, são objetos artificiais e num certo sentido arbitrários. Para Chomsky, apesar de o conceito de Língua-I ter um grau de abstração mais alto do que o das concepções de Língua-E, a Língua-I é um objeto do mundo físico, real, ao contrário da Língua-E, por razões já discutidas. Note-se, ainda, que quando dizemos que determinada regra do “português” estabelece que os verbos vêm antes dos seus complementos, não estamos falando de uma regra de um certo conjunto de frases ou de comportamentos, mas de uma regra de um sistema de regras constitutivo do “português”. A discussão que segue trata de problemas terminológicos (a indistinção, por exemplo, entre gramática e Língua-I na literatura gerativista) que levaram a certas confusões dos opositores das ideias da teoria gerativa. Além disso, uma tentativa de comparar o estudo das línguas naturais com o estudo de linguagens artificiais como a da aritmética levou a considerarem-se as línguas como objetos externos à psicologia, em alguns casos como entidades abstratas platônicas, que podem ser estudadas sem qualquer referência a categorias e fenômenos psicológicos. “A mudança de ponto de vista para uma interpretação mentalista do estudo da linguagem foi, tal como notado anteriormente, um fator que contribuiu para o desenvolvimento das ciências cognitivas contemporâneas. Foi, ainda, um passo para a incorporação do estudo da linguagem nas ciências naturais, porque ajuda a preparar o caminho para uma pesquisa sobre os mecanismos com as propriedades apresentadas no estudo das regras e das representações” (p. 58). 3) Enfrentando o problema de Platão Quais são os elementos básicos da Língua-I (doravante “língua”)? Por um lado, os mecanismos da GU precisam ser adequados e bastante ricos para dar conta da variedade das línguas; por outro, os mecanismos devem ser escassos, restringindo o número de línguas acessíveis aos aprendizes. O conflito aqui é evidente – é o que chamamos até o momento de conflito entre adequação descritiva e adequação explicativa. Até agora, a resposta foi: a GU fornece especificações dos tipos de regras e das interações possíveis entre elas. “Qualquer sistema de regras que satisfaça o formato proposto se qualifica como uma língua humana possível. Inicialmente, assumimos que existem infinitamente muitos sistemas de regras deste tipo, isto é, que não há limite na complexidade das regras que podem ocorrer nestes sistemas. A mente emprega certas operações primitivas para interpretar alguns dos dados que lhe são apresentados como experiência linguística; de seguida, seleciona entre as línguas consistentes com esta experiência, de acordo com uma avaliação métrica que atribui um valor abstrato a cada língua. O estado inicial da linguagem, E0, incorpora as operações primitivas, o formato para possíveis sistemas de regras e a avaliação métrica” (p. 68). Assumindo que a ordem de apresentação dos dados é irrelevante para o resultado, é como se a aquisição fosse instantânea. Ou, por outros termos, a hipótese empírica abaixo deve ser verdadeira: (1) “Suponhamos que consideremos E0 como uma função que projeta uma coleção D de dados num estado atingido. Se D for a totalidade de dados acessíveis ao aprendiz de uma língua, então o estado EE atingido é E0(D), ou seja, o resultado da aplicação dos princípios de E0 a D” (p. 68). Ou seja, desconsiderando possíveis questões a respeito da maturação dos sistemas, da ordem de apresentação ou acessibilidade seletiva da evidência, de questões de memória, etc., a aquisição é como se fosse instantânea. Nas páginas seguintes, Chomsky explica como funcionavam os modelos anteriores, baseados em regras sintagmáticas e regras transformacionais. Tudo isso já foi visto aqui no curso, e não repetiremos essa discussão. Um ponto interessante dessa discussão, entretanto, merece uma breve menção. A questão é a da assimetria entre sujeito e objeto, o que leva as regras de reescrita a considerarem que uma frase S (ou F) se reescreve em um SN e um SV, e não em coisas como SN V SN ou SV SN (onde SV inclui o sujeito e o verbo). O linguista formula tais regras porque percebe o fato de que é a combinação de verbo com o objeto que determina a interpretação do sujeito, diferenças prosódicas no SN sujeito em relação ao SV objeto, restrições sobre a vinculação de pronomes, etc. Além do fato de que essa assimetria parece ser translinguística. Mas, segundo Chomsky, essa evidência não está disponível para o aprendiz – ou seja, essa assimetria é algo que o aprendiz já sabe sobre a língua. Mais adiante, Chomsky apresenta alguns problemas para as regras simples que deslocam pronomes interrogativos (QU) dentro da abordagem transformacional dos primeiros anos. A ideia de que a anteposição do QU pode ser expressa pela regra (X, Q-, Y) → (2, 1, 3) – explicando-se, assim, orações relativas (the man [who John saw]), interrogativas indiretas (I wonder [who John saw]) e interrogativas diretas (who did John saw?) – e que uma regra de apagamento do QU pode dar conta de frases como the man John saw, é contestada pelo fato de que é agramatical a frase *I wonder John saw (problema para a regra do apagamento, que precisa, portanto, ser mais complicada do que o suposto), e que, entre outras, frases como *I wonder who John found of yours ou *I wonder who a Picture of is on the table são agramaticais (problemáticas para a regra de deslocamento do QU). É preciso complicar muito mais o sistema (ou seja, criar regras mais complicadas e/ou acrescentar exceções a sua aplicação) para dar conta da agramaticalidade das sentenças apresentadas acima. Mas, ora, por que regras mais simples não são as escolhidas, produzindo os resultados errados? Mesmo que compliquemos o sistema, não forneceremos nenhuma explicação para os fatos serem como são. Uma saída é estabelecer princípios gerais que rejam as regras. Por exemplo, um princípio de recuperabilidade do apagamento impede que who em I wonder who John saw seja apagado por não ser determinado por um sintagma estruturalmente relacionado (como ocorre em the man I saw). Esse princípio seria atribuído à GU. Sabendo de restrições como essa, a regra de deslocamento do QU e a regra de seu apagamento são aquilo que as crianças devem aprender sobre o inglês – e essa regra pode ser aprendida a partir de exemplos bem simples. Os resultados agramaticais de aplicação das regras são assim classificados porque violam princípios como o da recuperabilidade do apagamento. “Estes princípios gerais, como o princípio de aplicação cíclica das regras, as restrições de ilhas, a condição de subjacência, condições sobre as representações, e outros, servem para restringir o conjunto de regras que são permitidas, dado que já não é necessário incorporar na própria regra as condições sobre as suas aplicações; efetivamente, essas condições são retiradas de muitas regras e atribuídas ao estado inicial E0. A formulação de tais princípios é, pois, um passo na direção da adequação explicativa (...)” (p.86). Os estudos apontaram que várias transformações poderiam ser reduzidas a operações como Mover-Q ou Mover-SN (por exemplo, regras como a da transformação passiva ou o alçamento de sujeitos em estruturas do tipo John seems to be happy são reduzidas a Mover-SN, operação disparada pela teoria do Caso). No final das contas, toda a componente transformacional da gramática fica reduzida à operação Mover-α. Há variação nas línguas em relação a quando a regra de movimento se aplica. Por exemplo, enquanto em inglês o elemento QU deve ser movido para a periferia da sentença em interrogativas diretas e indiretas, em chinês e japonês o elemento deve ficar in situ. Huang (1982), entretanto, mostra evidência de que o QU deve ser movido para a periferia da sentença em forma lógica. Aqui podemos usar a ideia de parâmetro para tratar da diferença: o parâmetro define em que momento o movimento de QU se aplica, ou a que nível se aplica. Veja-se que um mesmo princípio regendo uma regra (a de coindexação) pode dar conta de coisas distintas como *who does he1 think e1 is intelligent e *Jonh1 didn’t realize that [the fool] 1 had left the headlights on. O princípio é: uma expressão referencial tem de ser livre (excluindo-se a ligação por operador). Aqui, o vestígio de who e that fool são expressões referenciais. Mas não adiantaria restringir a componente transformacional aumentando as outras componentes, como a sintagmática. De fato, a componente sintagmática já tem demasiadas regras, e seria interessante simplificá-la (buscar generalizações) para que caminhemos no sentido de atingir adequação explicativa. “A solução para este problema é a mesma: encontrar meios de reduzir a variedade de sistemas sintagmáticos por abstração de propriedades gerais, que se atribuem a E0” (p. 94). A ideia é converter a componente sintagmática a uma espécie de projeção das propriedades lexicais. Um exemplo: claim. O item seleciona um complemento frásico. Se for um verbo, projeta um sintagma verbal (SV); se for um nome, projeta um sintagma nominal (no exemplo, um N’). Vejam-se os exemplos a seguir: (50) John [SV claimed [F that Bill hit the man]]; the [N’ claim [F that Bill hit the man]]. Nos dois exemplos, claim é um núcleo. Se o fato de esse item selecionar um complemento frásico estiver codificado no léxico, não há por que esta informação estar duplicada na componente sintagmática (ou seja, não é preciso que exista uma regra do tipo SV se reescreve como V F, ou N’ se reescreve como N F, porque a informação de que o item seleciona uma frase como complemento já está codificada na entrada lexical, e, se tivermos um princípio, o princípio da projeção, que diz que as propriedades lexicais estão projetadas na sintaxe, as regras se tornam desnecessárias). Basta então incluirmos uma subteoria sobre o esqueleto geral das estruturas sintagmáticas (a Teoria X’) na GU, eliminando a componente sintagmática como era concebida. Aspectos da ordem (que estava dada nas regras sintagmáticas) pode ser elemento de outras subteorias – por exemplo, a teoria do Caso, que pode incluir uma restrição de adjacência em línguas em que o Caso não se manifesta morfologicamente, proibindo ordens como *put on the table the book –, ou pode ser objeto de variação paramétrica na própria Teoria X’ (parâmetro nuclear). Sobre dois princípios da GU. O princípio da projeção contribui para uma total eliminação da componente sintagmática. O que ele diz? Que as propriedades dos itens lexicais devem estar representadas em cada nível sintático (estrutura profunda, de superfície e forma lógica). Outro princípio é: uma variável tem de ser fortemente ligada. Isso dá conta do fato de que variáveis (por exemplo, vestígios de QU) têm de estar ligadas a seus operadores, mesmo que estes vestígios sejam livres (A-livres – ou seja, não são correferentes com algo que os c-comande em posição A) segundo a teoria da ligação (por terem as mesmas propriedades de expressões referenciais). Sobre o léxico. Os itens estão armazenados no léxico com propriedades fonológicas, semânticas e de seleção. Selecionam semântica e categorialmente, ainda que Chomsky preveja a possibilidade de a seleção categorial ser reduzida à seleção semântica. O exemplo que ele desenvolve para essa redução é o de persuade. Suponhamos que o verbo selecione semanticamente um alvo e uma proposição (CP). O alvo só pode ser um SN; portanto, a seleção semântica determina a seleção categorial neste caso. Agora suponhamos que, em alguns casos, quando o SN for interpretado como proposição, tenhamos dois SNs selecionados por persuade. Ora, como a atribuição de Caso em inglês se dá por adjacência, o segundo SN precisa de um atribuidor de caso, o que força a entrada de of. Assim, temos as duas possibilidades de seleção categorial do item persuade: ___ SN oração; ___ SN [of-SN]; e essas duas representações da seleção categorial do verbo são resultado da interação de sua seleção semântica com outras propriedades da gramática. Ou seja, não precisamos nem de regras sintagmáticas, nem de seleção categorial. Chomsky segue eliminando coisas da teoria. Por exemplo, o filtro de Caso pode ser reduzido à condição de visibilidade – que diz que o papel temático de um item só pode ser visível se este tiver Caso abstrato (e o Caso abstrato precisa ser atribuído, de fato, a elementos que precisam ficar visíveis para a atribuição de papel temático). Isso explica casos como o de John is a fine mathematician ou John did it himself (“a fine mathematician” não está numa posição de atribuição de Caso e não é marcado com papel temático; o mesmo ocorre com “hmself” na segunda frase). Mais adiante, Chomsky propõe um princípio exclusivo das línguas naturais – interpretação plena – que determina que as formas lógicas e fonológicas das sentenças (os níveis de interface) sejam plenamente interpretáveis pelos sistemas periféricos com os quais a faculdade da linguagem interage. Isso quer dizer que quantificações vácuas, por exemplo, não podem ocorrer (pois violariam interpretação plena no lado da forma lógica), nem formas fonológicas em que partes da representação subjacente fossem apagadas sem uma razão bem fundamentada (seguindo algum princípio geral). Observese que nem todos os sistemas simbólicos precisam obedecer interpretação plena: a quantificação vácua na expressão (x)(2+2=4) não é problemática; no entanto, em língua natural, algo como quem o João viu Pedro? não é interpretável. Com este princípio geral, não precisamos de regras específicas que bloqueiem quantificação vácua ou coisas semelhantes. Como a explicamos os fatos linguísticos dentro de uma teoria de princípios e parâmetros? “A GU consiste em vários subsistemas – a teoria X-barra, a teoria da ligação, a teoria do Caso, a teoria temática, a teoria dos nós-fronteira (que trata de condições de localidade sobre o movimento (...)) e outras – contendo cada uma delas certos princípios com um grau limitado de variação paramétrica” (p. 113). Há ainda o princípio da projeção, da interpretação plena, de legitimação; conceitos como o de domínio, c-comando, regência, etc., os quais têm um papel central em todos os subsistemas. “A interação entre os princípios dos vários ‘módulos’ determina a estrutura de cada sequência possível – as suas representações em cada nível (...)” (p. 113). Nessa proposta, não há regras de nenhum tipo na sintaxe da língua. Que conhecimento um falante deve ter para atribuir interpretação para a frase: who was John persuaded to visit? (a) Conhecer os significados das palavras e suas seleções semânticas, aplicando o princípio da projeção; (b) saber que o inglês é núcleo inicial e, portanto, há uma categoria vazia depois de visit (pois o verbo s-seleciona um complemento nominal); (c) o predicado [visit e] deve ter um sujeito, para ser legitimado – e como ele não está visível, deve ser outra categoria vazia; (d) saber que persuade s-seleciona um complemento frásico e um alvo SN; (e) conhecer o princípio da adjacência do Caso em inglês, que vai determinar a ordem dos dois complementos de persuade; (f) como não há dois complementos realizados, um deles é uma categoria vazia logo após persuaded; (g) a forma passiva do verbo não atribui Caso para essa posição, e o complemento direto do verbo é alçado para a posição de sujeito da sentença – portanto, John é correferente com a categoria vazia que segue persuaded, e, através dessa correferência, recebe papel temático; (h) o pronome interrogativo que ocorre na cabeça da frase é correferente com as categorias vazias do complemento frásico de persuaded e estabelece uma relação quantificador variável com uma delas – justamente a que é complemento de visit, pois é nessa posição que a variável recebe papel temático. Resta saber que tipo de categoria vazia é sujeito de [visit e], pois todas as anteriores são vestígios e formam cadeias com seus antecedentes. Chomsky vai chamá-la de PRO, que tem referência presa (no caso, controlada pelo complemento não frásico de persuaded) e ocupa uma posição sem Caso estrutural – a ideia é que PRO tenha um Caso inerente, para que não seja violado o critério temático atrelado à condição de visibilidade, que discutimos acima. O fato de o verbo persuade selecionar um complemento frásico e um nominal, e disparar controle de objeto pelo sujeito do verbo encaixado são propriedades do item, que devem ser aprendidas; o resto é derivado de princípios gerais. Agora voltemos aos exemplos (4) repetidos abaixo: (4) I wonder who [the men expected to see them] [the men expected to see them] John ate an apple John ate John is too stubborn to talk to Bill John is to stubborn to talk to Na primeira frase, the man pode estabelecer referência para them porque há uma categoria vazia (vestígio) de who em [e to see them], que faz com que a vinculação do pronome com the man não viole o princípio B da teoria da ligação, porque, pelo princípio C, o vestígio de who não pode ter como antecedente o sujeito de expect. Na segunda frase, a categoria vazia em [e to see them] é um PRO, controlado por the man; como PRO e them não podem ter a mesma referência para não violar o princípio B, them não pode ter como antecedente the man. Ou seja, precisamos saber somente que tipo de seleção semântica o item expect faz (um complemento frásico) e alguns princípios gerais – a relação entre vestígio e constituinte movido, propriedades de PRO, princípio B e princípio C. O que acontece com o último exemplo, John is too stubborn to talk to? Temos a seguinte estrutura, por conta de uma série de princípios: Johni is too stubborn [Ok [PROj to talk to ek]]. O operador se liga a John, e acaba transferindo sua referência a ek. Se PRO fosse ligado a John, a indexação de e seria igual a de PRO, violando uma condição sobre esse vestígio; só resta a interpretação arbitrária a PRO. Mas por que há um operador nulo tomando o complemento de talk na frase? Chomsky apresenta alguns exemplos que mostram que essas estruturas se comportam como estruturas com QU (onde se estabelece uma relação operador-variável); em particular, no licenciamento de vazios parasitas. Veja-se: which book did you file without reading? *the book can be filed without reading. John is too charming to talk to without liking. Note-se que na frase John is too stubborn to talk to Bill, não há operador nem seu vestígio, e PRO na posição de sujeito do predicado [to talk to Bill] pode tomar John como antecedente. “Podemos explicar como é que as crianças conhecem esses fatos sem instrução ou evidência relevante na base de que o estado inicial E0 da faculdade da linguagem inclui os princípios dos vários subsistemas da GU e a mente é capaz de efetuar computações do tipo das que aqui indicamos, deduzindo os fatos a partir destes princípios, uma vez dados os itens lexicais e suas propriedades” (p.123). As evidências discutidas acima fornecem argumentos a favor de categorias vazias, particularmente os vestígios. Para Chomsky, uma teoria da GU que não leve em consideração os vestígios, como as primeiras versões da gramática gerativotransformacional, ou teorias que só tenham regras sintagmáticas, estão, segundo essas evidências, erradas. Na discussão que segue, Chomsky apresenta inúmeras evidências para a postulação de categorias vazias como PRO em posição de sujeito de predicados. Em particular, essa discussão remete ao princípio da projeção estendido. Gostaria de destacar uma evidência do espanhol, que também possui pro: em frases como muchos estudiantes piensan que ellos son inteligentes, em que temos uma expressão quantificada como possível antecedente de um pronome, o pronome não pode ser uma variável de muchos estudiantes; no entanto, um pro pode, em muchos estudiantes piensan que pro son inteligentes. A restrição sobre pronomes precedidos de expressões quantificadas é, no entanto, enfraquecida em frases como muchos estudiantes dijeron que pro piensan que ellos son inteligentes. Aqui, ellos pode referir-se a muitos estudantes, por conta da intermediação de pro. Essa mesma restrição é amenizada em frases como mucho estudiantes quieren [PRO crer [que ellos son inteligentes]]. Ou seja, a presença de uma categoria vazia PRO como sujeito intervindo entre a expressão quantificada e o pronome licencia a interpretação do pronome como variável a ser ligada pela expressão quantificada. Na discussão que se segue Chomsky procura mostrar que PRO se comporta ora como anáfora, ora como pronome, e apresenta uma gama complexa de exemplos tentando definir sua distribuição e as restrições relativas à sua interpretação. Em outra seção, Chomsky trata de CADEIAS, procurando reduzir alguns princípios a uma condição de boa formação de cadeias (para serem bem formadas, elas têm somente uma posição tematicamente marcada e uma posição casualmente marcada). Também trata da atribuição de papel temático para o argumento externo, vinculando-o à atribuição de Caso ao complemento (generalização de Burzio). Trata ainda das diferenças entre sintagmas nominais e verbais em relação à exigência de um argumento externo (SV, projeção máxima, predica, e, portanto, deve ter um argumento externo; um nome derivado do mesmo verbo transitivo não precisa tê-lo, porque os argumentos externos do sintagma nominal ocorrem imediatamente acima de N’, projeção que não precisa de um argumento externo para ser legítima). A estratégia é sempre reduzir certos pressupostos a outros princípios mais gerais. Apesar de interessantes, não trataremos dessas questões com detalhes neste curso. Agora, vamos tratar da GU como um sistema de princípios e parâmetros A GU não fornece mais um formato para os sistemas de regras e uma avaliação métrica. A partir de agora a GU congrega uma série de subsistemas de princípios tendo uma estrutura modular. “Muitos desses princípios estão associados a parâmetros que têm de ser fixados pela experiência. Estes parâmetros devem ter a propriedade de serem fixados por evidência bastante simples, já que é esta que está disponível para a criança; o valor do parâmetro do núcleo pode ser, por exemplo, determinado por frases como John saw Bill (versus John Bill saw)” (p. 153). É possível que haja valores não-marcados, selecionados na ausência de evidência, para os parâmetros (quando uma determinada marcação de parâmetro gerar um subconjunto adequado de frases gramaticais geráveis pela escolha do outro valor); “esta é uma condição necessária e suficiente para se aprender apenas a partir da evidência positiva, na medida em que os parâmetros sejam independentes” (p. 153). A fixação dos parâmetros determina a língua nuclear, que exclui morfologia irregular, expressões idiomáticas, entre outras coisas (a periferia). “Aquilo que ‘conhecemos inatamente’ são os princípios dos vários subsistemas de E0, o modo como estes interagem e os parâmetros que lhes estão associados. Aquilo que aprendemos são os valores dos parâmetros e os elementos da periferia (juntamente com o léxico, a que se aplicam considerações semelhantes). A língua que sabemos é, então, um sistema de princípios com parâmetros fixados e uma periferia de exceções marcadas” (p. 157). Um valor de um parâmetro tem efeitos em todo o sistema. Por exemplo, o movimento de QU pode ocorrer tanto na sintaxe visível quanto na encoberta, o que caracteriza uma diferença entre o chinês e o inglês. Uma consequência é que frases como who does John believe [the claim that [Bill saw e]], agramaticais em inglês, são gramaticais em chinês, com o sintagma QU in situ. Se assumirmos que, em forma lógica, os QUs devem estar na periferia esquerda da sentença para que liguem uma variável (seu vestígio), sendo esta uma propriedade de todas as línguas, então aquilo que impede o movimento longo de QU em inglês (teoria dos nós-fronteira) deve-se aplicar na sintaxe visível, não na sintaxe encoberta. Evidência também do inglês é encontrada em perguntas com QUs múltiplos. Isso explica por que em chinês a frase é gramatical, mas não em inglês. Interessantemente, tanto em chinês quanto em inglês, a interpretação what did you wonder how to do pode mas a leitura how did you wonder what to do não pode, assumindo como estrutura profunda das duas algo como you wonder to do what how. A ausência dessa leitura é explicada pelo princípio da categoria vazia tanto em chinês quanto em inglês. Assim, um parâmetro de mover α interage com vários princípios da GU explicando as diferenças (e os aspectos comuns) de duas línguas distintas como inglês e chinês. Uma coisa importante a dizer é que quaisquer que sejam as regras que se aplicam sobre a sintaxe encoberta, elas não devem estar sujeitas à variação paramétrica uma vez que não há evidência disponível para a criança em fase de aquisição. Ou seja, a forma lógica deve ser mais ou menos uniforme entre as línguas e os indivíduos. Agora tratemos dos módulos da gramática. Sobre a teoria X’: X, X’ e X’’. A relação núcleo complemento fica representada abaixo do nível X’ e a relação X’ especificador é representada abaixo do X’’. Neste momento da teoria, o especificador de N’ é um DET, que não projeta estrutura sintagmática. A ordem dos elementos é determinada pelo conjunto de parâmetros que tratam da direção de atribuição de Caso e de papel temático. A ordem dos complementos também é determinado pelo princípio de adjacência de Caso (que foi criticado depois e deixou de ser um princípio). Núcleos não precisam ser somente categorias lexicais, podendo ser também categorias funcionais, como a flexão (FLEX ou F). Nessa época, o especificador de F era ocupado já em estrutura profunda pelo SN sujeito. Outro núcleo funcional que projeta é COMP ou C, que seleciona um F’’ como complemento. Assim, complemento vem abaixo de X’ e sujeito é filho de X’’. Citando: “A teoria X’ aplica-se em estruturaP. As regras de movimento podem formar estruturas que não são conformes com o esquema X-barra; mas, em estrutura-P, que é uma projeção direta da estrutura lexical, sujeita a outras condições de legitimação (e. g., as que garantem a presença de sujeitos da predicação), as condições da teoria X-barra são satisfeitas” (p. 167). Alguns conceitos importantes: (a) o domínio de um elemento é o sintagma mínimo em que o elemento ocorre (ou seja, o domínio de V é SV, o de FLEX é F, etc.); (b) um nó qualquer α c-comanda todos os elementos que estão em seu domínio mas não estão contidos em α; (c) um nó α rege uma projeção máxima X’’ se houver c-comando mútuo entre os dois – os regentes só podem ser categorias lexicais e suas projeções, além de FLEX finito (a concordância atribui propriedades nominais, e portanto lexicais, para FLEX, tornando-o um regente). Regência e c-comando são conceitos importantes em DS, SS e LF, mas talvez também em PF (caso do bloqueio da contração em *who do you wanna visit Tom). Teoria da Ligação. Começando com um pequeno inventário de categorias vazias: PRO, pro, vestígio de SN e variável. As propriedades das categorias vazias são dadas por dois traços: [±anafórico] e [±pronominal]. Esses traços também caracterizam categorias lexicalmente realizadas, como reflexivos, recíprocos, pronomes e expressões-R. Um nó x liga um nó y se x c-comanda y e ambos estão coindexados. Eles estão localmente ligados se não houver um elemento interveniente z entre eles que ligue y. Os princípios: (a) Uma expressão-R é A-livre (no domínio da cabeça da cadeia a que pertence); (b) os pronomes são livres e as anáforas são ligadas no domínio do sujeito mais próximo. Ou, por outros termos: (A) Uma anáfora é ligada num domínio local (B) Um pronome é livre num domínio local (C) Uma expressão-R é livre (no domínio da cabeça da cadeia a que pertence) O domínio local de α vai ser uma categoria de regência mínima, isto é, uma projeção máxima que contém tanto o sujeito como uma categoria lexical que rege α. Isso quer dizer que a categoria de regência mínima de uma anáfora ou de um pronome é comumente o menor F’’ finito que os contém, pois SV não tem especificadores e as anáforas estão sempre em posição de complemento. Um SN, que pode ter um sujeito (por exemplo, um genitivo ou um pronome possessivo), também pode definir uma categoria de regência. Para resolver alguns problemas que os dados colocam, Chomsky faz algumas modificações da teoria da ligação conforme formulada anteriormente. Introduz algumas ideias interessantes, como o fato de o movimento A disparar a inserção de um vestígio do tipo [+anafórico, -pronominal], e o movimento A’ introduzir vestígios do tipo [-anafórico, -pronominal]. Para obedecer à condição sobre as cadeias, Chomsky propõe que os movimentos A sejam somente para “cima”; mas a mesma restrição não precisa ser estendida ao movimento A’. O afrouxamento da restrição sobre o sentido do movimento (somente para cima) explicaria a posposição do sujeito em línguas pro-drop – a ideia é que o sujeito se move para uma posição c-comandada pela posição de especificador de IP e deixe como produto uma categoria vazia do tipo [-anafórica, +pronominal], ou seja, um pro formaria, com o sujeito posposto, um par expletivo-associado, e só seria permitido em línguas pro-drop, que possuem essa categoria vazia. Outras questões relacionadas à definição dos domínios de anáforas e pronomes, ao fato de a concordância da flexão não poder ser antecedente de elemento anafórico, ao fato de um elemento interno a um constituinte não poder ser coindexado com ele, ao fato de PRO não ser um elemento regido (pois se comporta contraditoriamente como anáfora e pronome), e, portanto, só poder ocupar as posições de sujeito de infinitivas e gerundivas, etc., são discutidas ao longo da seção. Os temas são interessantes, mas não os discutirei com detalhe aqui por serem muito específicos e fugirem um pouco aos objetivos gerais deste curso. O importante é que Chomsky apresenta os rudimentos de uma teoria da ligação mais simples (com poucos princípios e filtros), que dá conta de um grande número de casos. Teoria temática: o princípio fundamental é o critério temático. Chomsky discute um possível contraexemplo ao critério temático formulado por Burzio: alcuni articoli si leggerano. Temos duas cadeias: a de alcuni articolo é (1, 3) (do objeto para o especificador de FP); e a de si, uma espécie de PRO arbitrário pronunciado, que é (2, 1) (ou seja, da posição de especificador de FP para a segunda posição da sentença). Aqui temos sobreposição de cadeias, que violariam o critério temático. Se a análise estiver correta, coloca problemas para o critério e a relação um para um entre cadeias e papeis. Teoria do Caso. Para explicar o fato de sujeitos fonologicamente realizados (não PROs) em orações infinitivas serem bloqueados a não ser quando precedidos de V transitivo ou P, trabalhos dos anos 70, como Chomsky e Lasnik (1977) postularam filtros na estrutura-S que bloqueavam a sequência SN-to-SV (*John to be the winner is unlikely) a não ser como complementos de V e P (I believe John to be the winner). Essas abordagens, portanto, evitavam tanto regras sintagmáticas quanto regras transformacionais para resolver a questão. O filtro era, entretanto, ad-hoc. Em famosa carta de Jean Roget Vergnaud a Chomsky, Vergnaud propôs que este filtro fosse substituído pelo filtro mais geral de Caso (o qual pode ainda ser reduzido à teoria temática através da noção de visibilidade), que afirma que todos os SNs devem ter um Caso. Onde e por quem os Casos são atribuídos? Por P ao complemento (que é regido por P), por V transitivo ao complemento (que é regido por V), por F finito ao especificador (que é regido por F). POSS é a realização de Caso em sujeito de SN. A explicação para a diferença entre os verbos try e believe em relação a licenciar sujeito realizado como sujeito da oração infinitiva encaixada: try seleciona C, ao passo que believe seleciona F. O verbo believe consegue reger o sujeito de FP, mas não o verbo try, que rege o CP fonologicamente nulo. Uma interação desse raciocínio com o fato de PRO não ser regido (uma consequência da teoria da ligação) faz com que *I believe to be the winner, mas I tried to be the winner. O verbo believe é chamado na literatura de verbo de marcação excepcional de Caso – essa propriedade, que não está presente em línguas como o francês e o alemão segundo Chomsky, deve ser aprendida especificamente pelo aprendiz de inglês a partir das frases relevantes. Problema: recurso a inserção de of para fugir das violações do filtro de Caso: I persuaded John of the importance of going to college. Sendo assim, por que essa regra não se aplica a *the belief John to be the winner? A regra parece pertencer à periferia da gramática, por conta do número limitado de contextos a que se aplica. A questão é por que o aprendiz não a generaliza a outros contextos. Ou seja, será que está mesmo na periferia da gramática? Veja-se que a teoria temática e a teoria X’ preveem que nomes derivados de verbos transitivos tenham complementos. Assim: [N’ destruction [SN the city]]. Aqui, a ideia é que o nome atribua Caso inerente (ver abaixo) em estrutura-P, realizado pela introdução de of em estrutura-S, uma preposição semanticamente vazia, que é, de fato, a marca de Caso do complemento do nome, legitimando a estrutura X’ correspondente. Chomsky distingue os Casos estruturais, nominativo e acusativo, atribuídos em estruturaS, dos Casos inerentes, atribuídos por nomes, preposições e adjetivos. O Caso inerente está associado à atribuição de papel temático e ocorre na estrutura-P (é atribuído por nomes, preposições e adjetivos aos elementos marcados por eles com papel temático); o Caso estrutural (atribuído pela flexão finita e pelo verbo transitivo – que pode, inclusive, fazer atribuição excepcional de Caso a um elemento ao qual não atribui papel temático), não. (Mais adiante Chomsky comenta situações em que a preposição faz marcação excepcional de Caso, nas quais atribui Caso acusativo a elemento que é marcado tematicamente por outro item, como: for me to do that... Aqui, ele admite a possibilidade de as preposições em inglês preferirem marcar seus argumentos com Caso acusativo, que seria um Caso estrutural, e não com Caso oblíquo, um Caso inerente). Note-se que o genitivo do inglês (Caso inerente) estaria associado também à marcação temática do nome, com a leitura geral de posse ou, quando o nome deriva de verbo, o papel correspondente ao argumento externo do verbo. Justamente por conta disso, não se espera que expletivos ocorram em posições marcadas com genitivo, mesmo nos casos em que as nominalizações gerundivas são de verbos de alçamento: *it’s seeming that John is intelligent. A teoria dos Casos inerentes explica os fatos sob escrutínio na seção. Por exemplo, como belief não atribui papel temático para John em *the belief John to be the winner?, não pode atribuir Caso inerente, e, portanto, John não recebe Caso de ninguém e o SN é mal- formado – e nem a inserção de of o salvaria: *the belief of John to be the winner, pois a preposição aqui não seria licenciada. Frases como *there was killed of John não são licenciadas porque o regente do complemento não é um nome ou um adjetivo que atribua Caso inerente (genitivo) a John, Caso realizado pela preposição. Chomsky termina o capítulo com o seguinte parágrafo, que resume suas posições: “A ideia geral de que a faculdade da linguagem envolve um sistema computacional articulado de um modo preciso – bastante simples nos seus princípios básicos, porque os módulos distinguem adequadamente, mas bastante complexo pelas consequências que são originadas - parece razoavelmente bem estabelecida. Como fizemos notar anteriormente, não se trata de uma propriedade óbvia de um sistema biológico. Não obstante, a evidência que a suporta é substancial e é possível que esta conclusão resista às revisões inevitáveis dos sistemas da GU que têm sido propostas nos últimos anos” (p. 205). 4) Questões sobre regras Conhecer uma língua (uma língua-I) é estar em determinado estado da faculdade da linguagem, a qual é uma das componentes da mente. A língua interiorizada L tem duas componentes, um núcleo e uma periferia. Existe um estado inicial fixo que traz propriedades universais e princípios associados a parâmetros de variação. “A resposta a (1ii) que é proposta é que o estado EL é atingido por meio do estabelecimento dos parâmetros de E0 de uma das maneiras permitidas, dando origem ao núcleo, e acrescentando uma periferia, de acordo com os princípios de marcação de E0” (p. 217). A questão (1iii) não foi abordada – como utilizamos esse conhecimento de L? A questão é espinhosa. Principalmente no que diz respeito à produção, que envolve escolhas e outros fatores indeterminados. Talvez não tenhamos meios de chegar a um entendimento do conjunto de fatores associados à ação humana – uma limitação talvez natural e insuperável, afinal nada garante que os seres humanos consigam resolver todos os problemas que são capazes de formular. Outro problema relacionado é o seguinte: “Como é que posso dizer se alguém está a seguir R ou R’? Em que circunstâncias é que faz sentido para mim atribuir a alguém a obediência a regras? Quando é que esta atribuição é correta ou justificada?”. Para Wittgenstein, “a comunidade atribui um conceito (regra) a um indivíduo desde que ele atue em conformidade com o comportamento da comunidade” (p. 221). Ora, como a atribuição de obediência a regras exige referência a práticas de uma comunidade, não pode haver língua privada se entendida como sistema de regras. Chomsky afirma que essa visão carrega vestígios da concepção normativo-teleológica de língua. Um dos problemas que se colocam para essa ideia vem do comportamento infantil em relação a regras linguísticas que ela ainda não adquiriu “corretamente”. Um caso interessante é o da hipergeneralização, quando crianças regularizam paradigmas irregulares. Certamente elas estão seguindo regras, embora não sejam as mesmas que os adultos; e se todos os adultos morressem subitamente, a língua falada passaria a conter as hipergeneralizações dos paradigmas regulares. Ou seja, as pessoas seguem regras mesmo quando as regras em questão diferem das nossas. Chomsky continua a discussão apresentando soluções parciais para os problemas que surgem se seguirmos estritamente as ideias de Wittgenstein. Alguns problemas, entretanto, são insolúveis: por exemplo, o caso de um indivíduo, isolado numa ilha, que fale uma língua exótica que ninguém conhece – como ele está isolado e não interage com ninguém, e como não há outros com condições para lhe atribuir obediência a regras, a conclusão é que aquele indivíduo pode ser perfeitamente considerado como uma pessoa que não segue nenhuma regra. De fato, quando observamos com detalhe o comportamento linguístico dos indivíduos, notamos que muitas regras variam de indivíduo para indivíduo, com a possibilidade de uma regra seguida por indivíduo não ser seguida por nenhum outro membro da comunidade. Se não existem línguas individuais, como explicar que seja possível que um indivíduo siga uma regra que nenhum outro segue na mesma comunidade? Teríamos que assumir que tal comportamento não é regrado apesar de qualquer investigação verificar que ele o é? É importante esclarecer, ademais, que a teoria formulada aqui não concebe que as regras linguísticas descrevam ou determinem o comportamento num sentido amplo. Note-se que quaisquer que sejam as regras linguísticas que o indivíduo Z tenha internalizadas, elas não determinam o que ele vá dizer, ainda que possam determinar parcialmente o que ele compreende ou percebe. A teoria da língua internalizada é descritiva. É claro, no entanto, que as regras postuladas como parte do conhecimento que constitui o estado inicial do falante possuem “eficácia causal” no que diz respeito ao estado atingido. Entretanto, essa doutrina, como sabemos, é bastante combatida. Alguns chegam a afirmar (Searle) que mesmo que “a teoria da GU de E0 explique por que razão o estado atingido tem esta forma, fornecendo assim uma descrição mais profunda dos fatos, a verdade é que isto não é ainda suficiente” – por outros termos, é preciso que haja razão independente para se supor que as regras funcionam causalmente, ou que os falantes seguem regras quando produzem ou interpretam sentenças. Filósofos como Quine vão dizer, por outro lado, que qualquer gramática que seja extensionalmente equivalente ao conjunto das sentenças bem-formadas do inglês forneceria uma teoria correta da gramática do inglês. (Todos concordarão que outros tipos de evidência para além da mera equivalência extensional serviriam de critério para desempatar entre as gramáticas competidoras – e, no caso de indeterminação, a única coisa a se fazer é buscar uma generalização que encontre os aspectos comuns das gramáticas extensionalmente equivalentes chegando a uma teoria mais abstrata que capte as propriedades profundas dos sistemas em competição). A melhor resposta que Chomsky fornece nesse trecho, a meu ver, é uma citação de Tyler Burge (1984), que observa que “questões ontológicas, redução e causação são geralmente epistemicamente posteriores às questões referentes ao sucesso de práticas explicativas e descritivas. Não se pode criticar com fundamento uma prática que se julga ser explicativa ou descritiva começando por fazer apelo a uma concepção anterior do que é uma ‘entidade boa’, ou de como deveriam ser a individuação ou a referência, ou daquilo a que a estrutura global da ciência (ou do conhecimento) deveria vir a assemelhar-se. Questões sobre o que existe, sobre como as coisas são individuadas, e sobre o que é que se reduz a quê são questões que se colocam por referência a práticas explicativas e descritivas em curso. Por si próprias, respostas propostas a estas questões não podem ser utilizadas para avaliar um modo de explicação e descrição bem sucedido nos restantes aspectos” (p. 245). O resto do capítulo lida com mais questões relacionadas a regras. Particularmente, Chomsky rebate as visões que defendem que comportamentos guiados de algum modo por regras implicam algum tipo de conhecimento consciente dessas regras. Para Chomsky, as regras que os falantes seguem são inconscientes. Outro ponto está relacionado com a adequação de termos como “conhecer” para aquilo a que Chomsky se refere quando diz que o falante de uma língua L conhece determinada regra ou princípio P de L. Ainda que a questão não seja de fato muito relevante, Chomsky cunha o termo cognoscer, indicando, por ele, uma espécie de conhecimento que não pode (ou talvez só parcialmente) ser acessado pela consciência.