HISTÓRIA INTERNA DA LÍNGUA PORTUGUESA

Castelar de Carvalho (UFRJ, ABF)

Introdução

Como ensina Saussure, os fatos de uma língua podem ser estudados sob dois pontos de vista: o do funcionamento (sincronia) e o da evolução (diacronia). O estudo diacrônico compreende a história externa (evolução sociolingüística) e a história interna, ou seja, a evolução estrutural da língua em seus aspectos fonológicos e morfossintáticos. No caso do português, uma língua românica, esse estudo deve ter como ponto de partida a distinção latim clássico/latim vulgar. A partir dessa distinção fundamental, traçaremos uma síntese da evolução histórica do nosso sistema gramatical, remontando ao latim vulgar da Península Ibérica e às inovações introduzidas pelo português arcaico (séculos XII ao XVI), até chegar ao português moderno.

Latim Clássico / Latim Vulgar

A língua latina era uma só, mas, como ocorre em toda língua de cultura, apresentava diversidade de realizações, constituindo um diassistema em que se contrapunham dois níveis: o latim escrito e o latim falado. Em termos lingüísticos, uma variante culta (sermo nobilis) e uma variante coloquial-popular (sermo vulgaris ou usualis), que corresponderiam respectivamente aos dois segmentos fundamentais da sociedade romana: os patrícios e os plebeus.

O sermo nobilis, regido pela disciplina gramatical, gozava de notável unidade em todo o Império. Era a língua da escola, das letras, da retórica, da política e das leis. Sua versão literária, estilizada, recebe a denominação de latim clássico (LC), cujo período de esplendor vai do século I a.C. ao I d.C. Nessa modalidade de língua é que foram compostos os monumentos literários da prosa e da poesia latina, representados pelas obras de Cícero, César, Horácio, Virgílio, Ovídio, dentre outros escritores de relevo.

Estilisticamente, pautava-se o LC pelo apuro do vocabulário, correção gramatical e elegância do estilo. Gramaticalmente, caracterizava-se pela riqueza flexional e pelo sintetismo morfossintático. Possuía 5 declinações, 6 casos, 4 conjugações verbais e 3 gêneros (masc., fem. e neutro). A oposição de quantidade (vogal longa/breve) era um traço pertinente de seu sistema fonológico. Da preservação dessa língua literária é que pôde ser depreendida a estrutura léxico-gramatical do idioma dos romanos, hoje registrada nos dicionários e gramáticas de latim e ensinada nas Faculdades de Letras.

O sermo vulgaris, o chamado latim vulgar (LV), por sua vez, era a língua viva, falada cotidianamente não apenas pela plebe (como sugere o inadequado adjetivo "vulgar"), mas na verdade por todos os segmentos da sociedade romana, inclusive os usuários do sermo nobilis, conforme deixa entrever a descrição de Quintiliano (I d.C.), a qual faz referência a uma das modalidades desse tipo de língua: “Sermone quotidiano – quo cum amicis, coniugibus, liberis, servis loquamur” (XII, 10, 40) “falar cotidiano, por meio do qual falamos com os amigos, cônjuges, filhos, escravos”.

Falado em todas as épocas e regiões do orbis romanus, constituía o LV um conjunto complexo e instável de fatos lingüísticos, englobando variados sermones (cottidianus, rusticus, provincialis), daí Serafim da Silva Neto preferir chamá-lo de latim corrente. Na condição de língua predominantemente oral, estava sujeito a toda sorte de alterações e influências: temporais, geográficas e sobretudo socioculturais. Nunca foi uniforme, e sua evolução ao longo do tempo acompanhou a expansão e as vicissitudes do Império Romano, durante um período de aproximadamente oito séculos (III a.C. – V d.C.).

Durante esse longo e incessante devenir o LV, avesso à disciplina gramatical, evoluiu livremente e, embora houvesse inúmeros pontos de contato entre a língua escrita e a falada, foi pouco a pouco se diferenciando do latim escrito, efetivando inclusive certas tendências latentes no próprio LC. Nesse sentido, acabou por forjar um arcabouço fonológico e morfossintático que serviu de base para o desenvolvimento das línguas românicas e que pode ser assim sintetizado: perda da oposição de quantidade, perda do -m final, desenvolvimento de determinantes (artigos), maior uso de prefixos e sufixos, grande simplificação flexional, largo uso de preposições (tendência ao analitismo), predomínio da ordem direta, léxico mais simples.

Tão profundas modificações acabaram por configurar a fisionomia gramatical do LV: oposição vocálica de qualidade (vogal aberta/fechada), 3 declinações (fusão da 4ª com a 2ª e da 5ª com a 1ª), 3 conjugações (fusão da 3ª em -ĕre com a 2ª em -ēre), 2 gêneros (masc. e fem., com a eliminação do neutro) e redução dos 6 casos a 2 (nom. e acus.) e depois a 1 (acus.). Da evolução gramatical do LV e da língua portuguesa, com suas causas e conseqüências, é que trataremos a seguir.

Morfossintaxe Diacrônica

Redução dos casos

Cada um dos seis casos do LC desempenhava funções sintáticas específicas. Representados por morfemas gramaticais chamados desinências casuais, correspondiam os casos latinos às seguintes funções sintáticas em português: nominativo = sujeito e predicativo do sujeito; vocativo = vocativo; acusativo = objeto direto e adjunto adverbial (de causa, lugar, tempo); genitivo = adjunto adnominal e complemento nominal; dativo = objeto indireto e complemento nominal; ablativo = adjuntos adverbiais e agente da passiva.

Devido a causas fonéticas (desinências iguais) e sintáticas (analitismo: emprego de preposições e da ordem direta), os casos foram se reduzindo pouco a pouco, até restar apenas um: o acusativo. Vale lembrar que nos primórdios da língua latina já havia a tendência a reduzir os casos: o locativo e o instrumental acabaram absorvidos, em sua maior parte, pelo ablativo. Quanto ao emprego de preposições como partículas coadjuvantes dos casos, também é tendência que remonta ao LC: o acusativo e o ablativo, ambos podiam ser preposicionados. Lembremos, por exemplo, que para se referir ao lugar onde, aonde e de onde, dizia-se respectivamente: in templo, in templum, ex templo. Como se vê, para tornar mais claro o seu pensamento, recorreram os falantes latinos a dois expedientes sintáticos: a ordem direta e as preposições. Não foi por acaso, portanto, que a posição e a preposição (que tornaram dispensáveis os casos) converteram-se nos dois marcadores sintáticos por excelência na frase românica.

Depois de um longo período de evolução, os casos acabaram reduzidos a apenas dois no LV da Península Ibérica: nominativo (casus rectus), com suas antigas funções e mais a do vocativo, e acusativo (casus obliquus), com suas funções próprias e mais as do genitivo, dativo e ablativo. Posteriormente, perdendo o acusativo o -m final que o caracterizava no singular, acabaram os dois casos por se neutralizar. No plural, entretanto, o -s final permanecerá como marca forte e inconfundível do acusativo e da flexão de número, do que dão testemunho as inscrições, nas quais é o acusativo, e não o nominativo, que aparece na função de sujeito: filias matri fecerunt “as filhas dedicaram à mãe”, quiescant reliquias “(que) os restos descansem” (Ap. Coutinho, 1969:228).

Tornado caso único, o acusativo, auxiliado por preposições, passou a desempenhar todas as funções sintáticas na frase do LV da Península Ibérica. Ao acusativo também é que se vincularão etimologicamente, em sua maior parte, os nomes portugueses (subst. e adj.), daí ser conhecido como o nosso caso lexicogênico, ou seja, gerador do léxico.

Do ponto de vista morfológico, é do acusativo que se derivam as três vogais temáticas nominais da língua portuguesa: -a, -o, -e, que correspondem, respectivamente, à 1ª (fem.), 2ª (masc.) e 3ª (masc. e fem.) declinação do LV. Sirvam de exemplo os seguintes nomes: rosa(m) > rosa, lŭpu(m) > lobo, valle(m) > vale e ponte(m) > ponte. É também o acusativo que nos transmitirá as desinências de gênero feminino (-a) e de número plural (-s): lŭpa(m) > loba, lŭpas > lobas.

Embora o acusativo seja o nosso caso lexicogênico, a língua portuguesa conservou alguns vestígios dos outros casos latinos. Do nominativo restaram os pronomes pessoais retos: ego > eu, tu > tu, ĭlle > ele, nos > nós, vos > vós e os demonstrativos: ĭste > este, ĭpse > esse, *accu+ĭlle > aquele, além de certos nomes próprios – Cícero, César, Nero, Marcos, etc. – e comuns: júnior, sênior, sóror, deus. Estes nomes foram preservados por influência eclesiástica ou erudita. Quanto ao vocativo, seu único vestígio em português é a saudação litúrgica Ave-Maria.

Do genitivo restaram uns poucos vestígios, não mais percebidos sincronicamente, como, por exemplo, patronímicos do tipo Fernandici > Fernandes, Antonici > Antunes e nomes diacronicamente compostos: aquae+ductu > aqueduto, terrae+motu > terremoto, agri+cultura > agricultura. Quanto ao dativo, seus vestígios estão representados pelos pronomes oblíquos tônicos (objeto indireto) mihi > mi (arc.) > mim, tibi, sibi > ti, si (por analogia a mi) e ĭlli > lhe (este é átono). As formas átonas ti e si, do português arcaico, deram te e se, o que explica o uso dessas formas, no português contemporâneo, como objeto indireto, a par do seu emprego como objeto direto, herança, neste caso, do acusativo latino te e se.

Redução das declinações

Os nomes latinos distribuíam-se por um sistema morfossintático que compreendia cinco declinações, mas no próprio LC já existia acentuada tendência para confundir essas declinações, pois havia nomes que podiam ser declinados tanto por uma quanto por outra declinação. Por exemplo: avarities, ei, materies, ei, luxuries, ei, nomes da 5ª, também podiam ser avaritia, ae, materia, ae, luxuria, ae, isto é, declinados pela 1ª. Nomes como cantus, us, laurus, us, pinus, us, domus, us, da 4ª, também podiam ser cantus, i, laurus, i, pinus, i, domus, i, ou seja, da 2ª. A acentuação dessa tendência foi tão grande que levou ao desaparecimento de duas declinações no LV: os nomes da 5ª, quase todos femininos, foram incorporados à 1ª, e os da 4ª passaram à 2ª (esta também recebeu alguns neutros da 3ª: corpus, oris, pectus, oris, tempus, oris > corpus, i, pectus, i, tempus, i). Uns poucos nomes da 5ª, como plebes, ei, passaram à 3ª do LV: plebs, is (esta duplicidade já havia no LC). Em resumo, LC → 5 declinações; LV → 3 declinações. Com o aprofundamento do analitismo e a conseqüente redução/eliminação dos casos, as declinações perderam o sentido, desaparecendo de todo na fase final do LV.

Desaparecimento do neutro

No LC os nomes se dividiam em três gêneros gramaticais: masculino, feminino e neutro (neuter = nem um nem outro), tipologia morfossemântica nem sempre muito nítida e que só se tornava explícita na frase, através da concordância do adjetivo com o substantivo: pulcher lupus, pulchra pirus, pulchrum templum. Acontece que no próprio LC já havia a tendência para fazer desaparecer o gênero neutro, confundindo-o com o masculino. Era comum a presença, em textos, de formas masculinas como fatus, dorsus, caelus, vinus, vasus em vez do neutro fatum, dorsum, caelum, vinum, vasum. No neutro plural a confusão era ainda maior. Os neutros tinham três casos, nominativo, vocativo e acusativo, que faziam o plural em -a, mas tornou-se freqüente na fala popular, e até mesmo na língua escrita, o emprego de formas do masculino plural, como castellos, templos, monumentos, onde o certo seria o neutro plural castella, templa, monumenta.

Essa tendência se generalizou a tal ponto que motivou o completo desaparecimento do neutro, tornando-se masculinos todos os nomes pertencentes a esse gênero, como ensina Maurer Jr. (1959:79): “A confusão do neutro singular com o masculino operou-se na língua popular em época bem antiga”. Outra alteração importante: muitos nomes vindos do plural neutro, por causa da terminação -a, acabaram incorporados ao feminino (já que esta terminação, por acaso, também era a do feminino), daí a duplicidade de gênero, em português, de certas palavras: masc. < neutro sing.: lĭgnu > lenho, brachiu > braço, ŏvu > ovo, fructu > fruto; fem. < neutro plur.: lĭgna > lenha, brachia > braça, ŏva > ova, fructa > fruta. Em resumo, neutros no LV: no singular > masculino; no plural > feminino.

Em português não existe o gênero neutro como categoria gramatical. O que restou do neutro latino são apenas alguns vestígios, conservados em nossa língua em situações específicas, tais como: a) pronomes demonstrativos: aquilo, isto, isso; b) pronomes indefinidos: tudo, nada, algo; c) certas palavras de sentido pluralício: vestimenta, ferramenta, lenha, braça, ova, fruta; d) adjetivos na forma não-marcada de masculino, como determinantes de substantivos usados em sentido geral: É proibido entrada, É necessário paciência, Fruta é bom para a saúde; e) adjetivos neutros (masc.) de um infinitivo: É doce e honroso morrer pela pátria (Dulce et decorum est pro patria mori. Horácio).

Redução das conjugações

O LC possuía quatro conjugações verbais, caracterizadas no infinitivo pelas seguintes terminações: 1ª) -are: amare; 2ª) -ēre: ardēre; 3ª) -ĕre: facĕre; 4ª) -ire: partire. No LV da Península Ibérica houve desde cedo certa preferência pela 2ª conjugação em –ēre, devido à preferência pelos paroxítonos na fala popular. A 1ª conjugação era não só a mais produtiva como também a mais resistente: recebeu verbos de outras conjugações (torrēre > *torrare > torrar, fidĕre > *fidare > fiar, mollire > *molliare > molhar) e não perdeu nenhum. A 2ª conjugação do LV resultou da fusão da 2ª com a 3ª do LC: ponĕre > ponēre > põer/poer (arc.) > pôr, dicĕre > dicēre > dizer, facĕre > facēre > fazer. Além disso, no próprio LC, havia verbos que se conjugavam ora pela 2ª, ora pela 3ª: fervĕre > fervēre > ferver, stridĕre > stridēre > ranger. A 3ª conjugação do LV corresponde à 4ª do LC – audire > ouvir, punire > punir – e foi formada ainda por verbos vindo da 2ª e da 3ª: fugĕre > fugire > fugir, lucēre > *lucire > luzir. Mais tarde, na própria língua portuguesa, a 3ª conjugação se ampliou, recebendo verbos de outras conjugações: cadĕre > cadēre > caer (arc.) cair, corrigĕre > corrigēre > correger (arc.) > corrigir. Os verbos em -ĕre, de introdução mais recente, passaram à 3ª conjugação em -ir: affluĕre > afluir, illludĕre > iludir, retribuĕre > retribuir.

Fonologia Diacrônica

Vocalismo

A oposição vogal breve/longa era um traço pertinente do sistema fonológico do LC. Assim, por meio dessa oposição, distinguiam-se casos, como o nominativo rosă do ablativo rosā, o presente lĕgit (lê) do passado lēgit (leu), o adjetivo mălum (mau) do substantivo mālum (maçã) ou valores semânticos do tipo dĭco (consagro)/dīco (digo). Com a perda da quantidade vocálica no LV, as vogais passaram a distinguir-se pela qualidade (timbre aberto/fechado), criando-se o seguinte quadro de correspondências: ā, ă > a, ĕ > é, ē, ĭ > ê, ī > i, ŏ > ó, ō, ŭ > ô, ū > u. Em outras palavras, LC → 10 vogais; LV → 7 vogais > 7 vogais tônicas em português.

Na evolução do LV para o português, o destino das vogais vai depender de sua posição na sílaba. Em geral, as tônicas permanecem: mare > mar, secretu > segredo, vita > vida, rota > roda, sapore > sabor, lupu > lobo. Com relação às átonas pré-tônicas, o quadro é o seguinte: a) iniciais – conservam-se (amare > amar), sofrendo aférese em alguns casos (acume > gume); b) mediais – sofrem síncope: honorare > honrar, veritate > verdade. Quanto às vogais pós-tônicas, temos: a) mediais – síncope: calidu > caldo, lepore > lebre; b) finais – conservam-se: rosa > rosa; modificam-se: dixi > disse, amicu > amigo; o -e final sofre apócope quando precedido de -l : male > mal, -n: bene > bem, -r: amare > amar, -s: mense > mês, -z: vice > *veze > vez; o -e final conservou-se nos demais casos: nocte > noite, hodie > hoje, ipse > esse, salute > saúde.

Na evolução dos ditongos latinos para o português, o quadro é o seguinte: a) -ae- tônico > -é-: saeculu > século, caecu > cego; -ae- átono > -ê- ou -i-: aestimare > estimar, aetate > idade; b) -oe- > -ê-: poena > pena, foedu > feo (arc.) feio; c) -au- > -ou- (criação românica): auru > ouro, causa > cousa > coisa (-ou- > -oi-, por influência da pronúncia judaica, segundo J. J. Nunes, 1956:75). -au- > -o- (por razões dialetais): pauper > *popere > pobre, auricula > oricla > orelha. Como criações românicas, surgem ainda outros ditongos: a) por vocalização: -ei-: lacte > *laite > leite, regnu > reino; -oi- : nocte > noite; -ou-: alteru >*autru > outro; b) por síncope da consoante medial: -ão: manu > mão; -ães/-ões: panes > pães, leones > leões; -ai-: vanitate > vaidade; c) por epêntese de uma semivogal: -ei-: credo > creo > creio; d) por oclusão: -éu-: velu > *velo > veo > véu; -au-: malu > *malo > mao > mau; e) por metátese: -ai-: rapia > *rabia > raiva.

Os hiatos em português, comuns no período arcaico da língua, têm sua origem na síncope de uma consoante medial, sobretudo o -l- e o -n-, esta a partir do século XI. A tendência da língua, entretanto, tem sido evitar os hiatos: a) por crase: colore > coor > cor, dolore > door > dor, sedere > seer > ser; b) por oclusão: ego > *eo > eu, caelu > *celo > céo > céu; c) por ditongação (epêntese de um iode): avena > avẽa > avea > aveia, foedu > *fedo > feo > feio. A nasalização da vogal anterior pelo -n- e sua posterior síncope trouxeram repercussões para a fonologia portuguesa, representadas, por exemplo pela presença de vogais nasais em diversas palavras, como vi(n)u > vĩo > vinho, la(n)a > lãã >lã, matia(n)a > maçãã > maçã. No caso do -l- intervocálico, é a sua síncope que justifica formas de plural como sóis (< soes < soles) e animais (< animaes < *animales). Na morfologia, a queda do -n- intervocálico produziu o ditongo -ão (grã(n)u > grão), com sua tríplice possibilidade de plural: em -ãos (gra(n)os > grãos), -ães (pa(n)es > pães) e -ões (leo(n)es > leões).

Consonantismo

As consoantes iniciais do LV, de um modo geral, se conservam na passagem para o português: bucca > boca, cabbalu > cavalo, dare > dar, feroce > feroz, gutta > gota, lacu > lago, male > mal, nocte > noite, pace > paz, rivu > rio, siccu > seco, tauru > touro. São raras as alterações: cattu > gato, vessica > bexiga, pallore > bolor. As consoantes mediais surdas passam a sonoras: sapere > saber, vita > vida, pacare > pagar, facere > fazer, profectu > proveito, rosa > rosa (/rossa/ > /roza/). As mediais sonoras têm três destinos: a) síncope: crudu > cruu > cru, gelare > gear, granu > grão, lana > lãa > lã, persona > pessõa > pessoa; b) permanência: paganu > pagão, amare > amar; c) alteração: dubitare > duvidar (degeneração -b- > -v-). Quanto às consoantes finais, todas sofreram apócope, exceto o -s: Deus > Deus, Marcus > Marcos, amas > amas, debemus > devemos, magis > mais; o -r permaneceu sofrendo metátese: semper > sempre, quattor > quatro, super > sobre; o -m final, que já era muito débil, tanto no LC quanto no LV, permaneceu na escrita, como grafema, para indicar a ressonância nasal: cum > com, quem > quem.

Quanto aos grupos consonantais, façamos uma síntese, apontando os casos principais. Os grupos iniciais terminados em -r se conservam: cruce > cruz, dracone > dragão, gradu > grau, pratu > prado; os terminados em -l sofrem palatalização, uma das inovações do galego-português (clave > chave, flamma > chama, pluvia > chuva), ou modificam o -l- para -r (clavu > cravo, flaccu > fraco, placere > prazer).

Dentre os grupos consonantais mediais, destacam-se os representados pelas consoantes duplas ou geminadas (grupos homogêneos). Como estas eram pronunciadas duplamente, sofreram apenas simplificação, no próprio LV, ao contrário das consoantes simples, que desapareceram ou sofreram algum tipo de alteração. Ex.: sabbatu > sábado, bucca > boca, additione > adição, effectu > efeito, aggravare > agravar, capillu > cabelo, flamma > chama, pannu > pano, suppa > sopa, gutta > gota.

Alguns grupos consonantais mediais formaram-se pela síncope de uma consoante medial, no próprio LV, outros já existiam, sofrendo diversos tipos de evolução. Por exemplo: a) palatalização (dígrafos -lh- e -ch-): oc(u)lu > olho, teg(u)la > telha (a par de reg(u)la > regra), rot(u)la > *rocla > rolha, inflare > inchar, ; b) conservação: membru > membro, nigru > negro, intrare > entrar; c) alteração: lacrima > lágrima, duplare > dobrar, lepore > *leb(o)re > lebre. Nos grupos consonantais disjuntos (em sílabas diferentes), do tipo -ps-, -rs-, a segunda consoante assimilou a primeira (assimilação regressiva): ipse > esse, persicu > pêssego. Trata-se de fenômeno que remonta ao próprio LV, pois no Appendix Probi aparece persica non pessica.

Conclusão

Do exposto neste breve roteiro histórico, concluímos que a língua portuguesa guarda íntima afinidade com suas matrizes latinas, sobretudo no que diz respeito ao vocalismo e à morfologia nominal. Nosso sistema fonológico apresenta um quadro de 19 consoantes, 7 vogais tônicas silábicas e 2 assilábicas (semivogais /y/ e /w/), cujas raízes se encontram na trajetória evolutiva do LV da Península Ibérica. Algumas inovações foram introduzidas no período arcaico da língua (séc. XII ao XVI), como a palatalização dos grupos consonantais cl-, fl- e pl- , que passaram a /š/, o dígrafo ch-, a síncope do -n- intervocálico, que trouxe conseqüências fonológicas e morfológicas, e a grande quantidade de hiatos, desfeitos mais tarde no português moderno. O quadro das desinências nominais (gênero e número) e verbais (modo-temporais e número-pessoais) também remonta à velha cepa latina, preservada em nossa língua em sua fisionomia básica. Quanto ao léxico, em sua maior parte, provém do acusativo, por isso mesmo conhecido como o nosso caso lexicogênico.

Bibliografia

COUTINHO, Ismael de L. Pontos de gramática histórica. 6ª ed. Rio de Janeiro: Acadêmica, 1969.

GRANDGENT, C. H. Introducción al latín vulgar. Trad. de Francisco de B. Moll. 2ª ed. Madri: Consejo Superior de Investigaciones Científicas, 1952.

MAURER JR., Th. Henrique. Gramática do latim vulgar. Rio de Janeiro: Acadêmica, 1959.

NUNES, José J. Compêndio de gramática histórica. 5ª ed. Lisboa: Livraria Clássica, 1956.

TEYSSIER, Paul. História da língua portuguesa. Trad. de Celso Cunha. Lisboa: Sá da Costa, 1982.