AS UNIDADES LEXEMÁTICAS

Sílvio Edmundo Elia

1. O lingüista suíço Ferdinand de Saussure, no seu Curso de Lingüística Geral (póstumo, como se sabe, e redigido por dois colegas da Universidade de Genebra, Charles Bally e Albert Sechehaye  , com a colaboração de Albert Riedlinger, “maître ao Collège de Genève”, 1a ed. 1916;  S. falecera em 1913). Ao se ocupar com o que se viria a chamar “análise estrutural das línguas”, e partindo do princípio de que “dans une état de langue, tout repos sur des rapports” , distingue entre dois tipos fundamentais de relações, que “correspondent à deux formes de notre activité mentale”  , as quais denominou relações sintagmáticas e relações associativas. Posteriormente, o lingüista dinamarquês, Luís Hjelmslev, criador de uma teoria estruturalista que se queria de bases puramente formais, a Glossemática, apadrinhou esses dois tipos de relações, mas às segundas preferiu chamar relações paradigmáticas, inovação que acabou por predominar. Relações paradigmáticas e sintagmáticas  passaram então a integrar o campo da análise estrutural das línguas.
2. Um tanto sumariamente poder-se-á dizer que o ofício do lingüista afiliado à corrente estruturalista consiste em depreender as unidades mínimas do nível de cada língua (paradigmática) para depois combiná-las entre si, segundo regras que viabilizem a construção de frases (oratio, sentença), portadores de sentido (sintagmática). A primeira dá o código, a segunda a mensagem.
Essa rede de oposições atravessa todos os níveis da linguagem: o fônico, o gramatical e o lexical. As unidades mínimas correspondentes a cada um deles são, respectivamente, o fonema, o morfema e o lexema. E as disciplinas que as estudam a Fonologia, a Morfologia  e a Lexologia, cada uma com seus ramos paradigmático e sintagmático, a saber: Fonêmica (paradig.) e Fonotática (sint.); Morfêmica e Morfotática; Lexêmica e Lexotática. A presente comunicação se situa no âmbito da Lexologia.
3. Acabamos de dizer que a Lexologia se desdobra em Lexêmica e Lexotática . A Lexêmica se ocupa com a depreensão de unidades mínimas de cada um dos estratos e a Lexotática , com as suas combinações.
A unidade mínima da Fonêmica é o fonema, a da Morfêmica, o morfema e a da Lexêmica, o lexema. Morfema e lexema são unidades significativas, ao passo que o fonema é unidade não-significativa.
Não-significativa, não, porém, assignificativa, pois na linguagem tudo é significação; o fonema não significa por si mesmo, mas tem por função distinguir significações (cf. os pares opositivos pomba/bomba, tia/dia, saca/saga, por. ex.).
O morfema tem significação interna ou gramatical; isto é, pertence ao sistema e não ao mundo interior; por isso o seu número é limitado, ao passo que o universo das palavras lexemáticas é praticamente ilimitado.
A palavra é uma unidade significativa, mas a sua significação não é só lexemática, pode também ser morfemática, isto é, gramatical. O lexema, ao contrário, tem significação externa ou referencial. A sua referência pode ser a coisas concretas ou abstratas
Conforme conhecida classificação de Bloomfield, as unidades significativas mínimas ou se apresentam como formas livres ou como formas presas. As formas livres ocorrem isoladamente; as formas presas, ao revés, pressupõem sempre uma forma livre à qual se ligam. A palavra pode então ser definida como unidade significativa livre. Livre, não, porém, mínima. Já dissemos que a palavra pode ter significação lexemática ou morfemática, isto é, ou referencial ou gramatical. Neste último caso a palavra é tida como uma das possíveis formas de morfemas, ou seja o chamado morfema vocabular, também conhecido como palavra gramatical. Mattoso Câmara Jr. Prefere, em vez de “palavra gramatical”, a expressão “vocábulo gramatical” , porque, na sua ótica, a palavra deve ter sempre significação lexemática (ou, na nomenclatura que adota, valor semântico, isto é, de um semantema). Usaremos indiferentemente palavra ou vocábulo gramatical. São exemplos de palavras gramaticais os artigos, as preposições, as conjunções. Estudam-se na Gramática e são em número limitado; já as palavras lexemáticas, ou referenciais, constituem a maior parte do léxico de uma língua e são de número indeterminado; encontram-se nos dicionários. Isso resulta de que, por refletirem as constantes mutações por que passam as coletividades humanas (lembrem-se aqui os grandes progressos tecnológicos alcançados neste expirante século XX, sempre surgem novas criações no acervo lexical dos idiomas (neologismos).
4. Cabe observar não haver fronteiras estanques entre palavras lexemáticas  e as palavras morfemáticas. No decorrer da história das línguas, as palavras lexemáticas podem converter-se em morfemáticas ou até em simples morfemas presos. É, p. ex., o caso dos chamados “verbos auxiliares”. Na conjugação verbal portuguesa, p. ex., aparece o verbo Ter com a função de auxiliar na formação dos “tempos compostos”: tenho cantado, tinha cantado, terei cantado, tenha cantado... Ter provém do latim tenere, onde significa “sustentar, segurar, possuir”. Foi esta última acepção que passou às línguas românicas: ex. “Tenho quatro canetas”. Mas esse sentido pleno ou lexemático foi-se esvaziando quando passou a integrar a conjugação dos verbos e o verbo ter passou a constituir com o verbo principal uma nova forma verbal. Destarte, em ptg., criou-se o sintagma tenho cantado, dito “presente continuado”, ao lado das demais formas, ditas “perfeitas” como terei cantado, “futuro perfeito”, isto é “acabado”. Note-se que nas línguas românicas (mesmo em galego, onde o uso normal é o das formas simples) não existe o valor continuado próprio do português. O que prevaleceu foi o auxiliar habere “ter, possuir” e não tenere; habere mais particípio passado convergiu sempre num tempo perfeito: esp. he cantado, fr. j’ai chanté, it. ho cantato, rom. am cântat, mas port. cantei.
Outro exemplo é o do verbo ir, usado nas formas ditas periféricas, para indicar começo de ação futura, como em vou chorar, onde o sentido próprio de ir: “deslocar-se de um ponto para outro” está apagado, para ceder lugar ao de um morfema de natureza aspectual.
Quanto a chegar à condição de morfema preso, o caso talvez mais frisante seja o dos futuros românicos. A princípio (latim vulgar) duas palavras cantare habeo , acabaram por fundir-se numa só, passando as flexões de habeo a incorporar-se ao tomado verbo principal, tornando-se assim mera flexão verbal: ptg. cantarei, esp. cantaré, fr. chanterai, it. canterò. Em romeno, como em inglês, o futuro é sempre analítico, funcionando como auxiliares os verbos a voi “querer” ou a avea “ter de”. O português, ainda hoje, traço arcaizante, permite, nos futuros de indicativo, que as formas verbais de habeo se desmembrem do infinitivo do verbo principal; é a chamada tmese. Ex.: amar-te-ei, amar-te-ia.
Relembre-se que, ainda em 1885, Gonçalves Viana e Vasconcelos Abreu, distinguindo entre “perífrase consciente” e “perífrase inconsciente”, recomendavam a grafia descrevê-lo hei para o futuro-do-presente, mas descrevê-lo-ia para o futuro-do-pretérito, porque acreditavam persistir no sentimento da língua de certo modo a existência de um verbo haver embutido na forma futura do presente, o que não se daria em descrevê-lo-ia.
Exemplo bastante conhecido é o do sufixo adverbial –mente, na origem o subst. Latino mens, -entis “a mente, o espírito”, que no ptg. arc., ainda podia ocorrer em duas palavras separadas. Mesmo no ptg. atual essa separação pode dar-se, ainda que indiretamente, quando o sufixo se prende a dois adjetivos sucessivos como em “caminhava lenta e silenciosamente”. Note-se que, ainda hoje, o adjetivo, que funciona como palavra primitiva, vai para o gên. feminino para concordar com o substantivo mente. A esse processo de passagem de um lexema a morfema, dá-se o nome de “gramaticalização”.
5. De passagem, já nos referimos ao conceito de “palavra”. Vamos agora voltar ao ponto para melhor precisá-lo.
Como se sabe, o termo palavra tem gerado um monte de definições. A razão está em que alguns se detêm no aspecto fônico (quando se trata, p. ex. , de sua delimitação), outros, no morfológico (palavras simples e compostas), outros ainda, no semântico (por que ? ou porque ?). Existem até definições que poderíamos chamar “desesperadas”, como a ortográfica, que ensina que a palavra “é um conjunto de letras separado de outros conjuntos de letras por espaços em branco”. Ou a intuitiva de Gauger (V. “Determination und Determinans im abgleiten Wort”, em Festschr, H. Marchand), segundo a qual é a consciência do sujeito falante quem determina a existência da palavra como unidade semântica discreta.
Para Martinet (Eléments: 1967: 114), a palavra é “um sintagma formado de monemas não separáveis”. Mais antiga e famosa é a definição de Meillet (Linguistique Historique et Linguistique Générale, I: 1926: 30): “Uma palavra é definida pela associação de um dado sentido a um dado conjunto de sons susceptível de um dado emprego gramatical”. Quer dizer, Meillet reuniu na definição as três faxes da palavra: a fônica, a semântica e a gramatical.
6. Apesar de mais antiga, cremos que ainda é a melhor definição. De fato, a palavra, como tudo que é lingüístico, tem de ter uma base vocal, no caso um segmento fônico; também como tudo que é lingüístico, tem que ser portadora de uma significação; finalmente há que exercer qualquer função no enunciado, pois as línguas são sistemas de unidades funcionais. Apenas, si parva licet, acrescentaríamos algo que a tornasse menos vulnerável e assim poderíamos tê-la: “Palavra é a menor forma livre constituída pela associação, etc.”
Fonema, morfema, lexema  são entidades abstraídas de suas respectivas realizações fônicas, respectivamente o fone, o morfe, a palavra. Aqui se impõe a incômoda distinção entre palavra e vocábulo. Geralmente se ensina que o vocábulo é simplesmente o espaço fônico da palavra, ou seja, a sua realização no enunciado ou discurso. P. ex. , a seguinte frase : “Um grande homem não é necessariamente um homem grande conteria nove palavras mas somente oito vocábulos, porque o mesmo segmento fônico (/grande/) ocorre duas vezes. Dubois et alii, em seu prestimoso Dictionnaire de Linguistique relembram que, no poema épico espanhol El Cid, contam-se 16.690 palavras, mas somente 1.518 vocábulos.
7. Cabe aqui a introdução de um termo novo: lexia.
A lexia, termo que se deve ao lingüista francês Bernard Pottier, é nome geral para qualquer unidade lexemática  . A menor unidade lexemática é a palavra, que Pottier denomina lexia simples. A lexia simples se combina com outras lexias simples para formar novas unidades lexemáticas: a lexia composta (correntemente palavra composta), que Pottier define como resultado de uma integração semântica e exemplifica com o fr. tire-bouchons (ptg. saca-rolhas) e a lexia complexa, entendida como uma seqüência de palavras em via de lexicalização, em graus diversos. Cabem aqui certas expressões que assumem o caráter de palavra composta, como guerra fria ou mesmo já como locução (B. exemplifica com o fr. bel et bien). No referente à lexia composta , B. também assim considera as palavras derivadas ou as compostas por prefixação e exemplifica com fourchette e remanier. Preferimos incluir as palavras derivadas por sufixação ou compostas por prefixação (derivadas por prefixação, segundo Said Ali) como novas palavras, pois contêm apenas um lexema.
8. Outro termo que também se impõe à nossa atenção é o de sintagma, como se sabe introduzido por F. de Saussure, que define (Cours, 1931: 170) como “relação que as palavras contraem entre si, em virtude do caráter linear do significante”.  Portanto a depreensão das unidades lexemáticas é assunto próprio da Sintagmática. Em nosso caso, mais restritamente da Lexotática.
André Martinet distingue entre sintagma e sintema, termo por ele criado. Sintagma, diz-nos, é “toda e qualquer combinação de monemas”.  O sintema distingue-se do sintagma por ser esta constituído de monemas  livres, ao passo que o sintema é formado por monemas “conjuntos”. Monemas conjuntos são os constitutivos da palavra composta ou derivada. Então sem-vergonha é um sintema e sem chapéu, um sintagma.
Outro termo novo no capítulo é sinápsia, criado pelo lingüista francês Emile Benveniste.
Benveniste distingue entre compostos, conglomerados e sinápsias.
“Há composição quando dois termos identificáveis para o locutor se conjugam numa unidade nova dotada de significado único e constante” (p. 171). B. exemplifica com centímetro, palmípede, telégrafo (traduzimos os exemplos). Há casos em que o sentimento da composição desaparece. Podemos exemplificar em português com fidalgo; nessa hipótese deixa de haver composição.
B. chama conglomerados “unidades novas formadas por sintagmas complexos constituídas de mais de dois elementos” (ib.).
Pelos mesmos dados, ou se trata das lexias fixas, de Pottier  (meurt-de-faim, décrochez-moi-ça) ou de casos de aglutinação (désormais = dès or mais).corresponde  Sinápsia corresponde à lexia semifixa, de Pottier.
9. Parece-nos,  contudo, que se pode trabalhar sem essas novidades terminológicas. Eis o que modestamente propomos para concluir.
Adotaremos o termo lexia como denominação geral das unidades lexemáticas.
A lexia pode ser vocabular ou fraseológica. A lexia vocabular pode constar de uma palavra simples (a lexia simples, de Pottier), ou de uma palavra derivada (lato sensu). A lexia simples é monolexemática, isto é, contém um só lexema: o radical ou tema; a palavra derivada também é monolexemática (contém somente um tema ou radical) acrescido porém de um afixo (prefixo ou sufixo, ou ambos). Ex.: velho (lexia simples; palavra), revelho (lexia derivada; radical + prefixo), velhice (lexia derivada; radical + sufixo), envelhecer (lexia duplamente derivada ou parassintética; radical + prefixo + sufixo).
As lexias fraseológicas  são polilexemáticas, isto é, contêm mais de um tema ou radical. Resultam de uma associação de palavras, que, em virtude de seu uso constante na língua, acabam por se transformar em construções fixas. Acham-se, pois, num processo de lexicalização semântica, vale dizer, de, numa forma múltipla, adquirirem significado único, Podem ir da aglutinação à locução. No caso da aglutinação, se desaparecer o sentimento de composição (lato sensu), como em fidalgo, o melhor é considerar o vocábulo uma lexia simples; mas, se sobrevive o sentimento da composição, como em planalto ou aguardente, a preferência deve ser no sentido de lexia fraseológica.
Entre a aglutinação e a locução, se situa a lexia composta. Consiste esta em pôr lado a lado duas lexias simples ou derivadas, ligadas pela significação. Escrevem-se simplesmente justapostas ou separadas por um hífen, segundo regras ortográficas um tanto caprichosas. Exemplos não faltam: auriverde, vaivém, rubronegro, malmequer, beija-flor, caneta-tinteiro, porta-bandeira...
Nas locuções sempre intervém uma palavra de relação; o uso do hífen também depende  de regras ortográficas. Ex.: ferro de engomar, imposto de renda, bife à milanesa, pé-de-moleque, olho-de-boi, rosa-dos-ventos.
Há um quarto caso de lexias fraseológicas, o de formação de sintagmas, que passam a ter significação específica e corrente, mas cuja institucionalização na língua fica dependente de fatores de ordem social imprevisíveis. São constituídos de palavras graficamente separadas ou relacionadas por morfemas vocabulares. Exs.: guerra fria, testa coroada, canto do cisne, galinho de briga, jovem guarda, dar bola e muitos outros. Poderíamos chamá-los lexias semifixas.
10. O que fica dito pode ser resumido no seguinte quadro:
 
 

                                                                                    palavras radicais (mar)
                   monolexemáticas   Simples
                                                                                    palavras derivadas (marinho)
Lexias
                                                                                        aglutinação (aguardente)
                                                                        Fixas       justaposição (malmequer, beija-flor)
                                                                                         locução (rosa-dos-ventos)
               polilexemáticas   Fraseológicas
                                                                                           justapostas (guerra fria)
                                  lexias complexas   Semifixas
                                                                                           locucionais (bola de neve)

Obs.: As lexias semifixas tendem a fixar-se, se deixam de permitir intercalação de elementos vocabulares. As lexias semifixas são as sinápsias de Benveniste. O importante é a unidade de significação. Assim valet de chambre é sinápsia, mas coin de chambre não o é.