Caricare documenti e articoli online 
INFtub.com è un sito progettato per cercare i documenti in vari tipi di file e il caricamento di articoli online.


 
Non ricordi la password?  ››  Iscriviti gratis
 

LE PAROLE DELL'ITALIANO. LESSICO E DIZIONARI di C. Marello - CHE COS'È UNA PAROLA ITALIANA.

lingue



LE PAROLE DELL'ITALIANO. LESSICO E DIZIONARI di C. Marello


  1. CHE COS'È UNA PAROLA ITALIANA.

I.   Il parlante e il linguista di fronte alla parola.

Un parlante italiano non colto è in grado di giudicare, messo di fronte ad una parola, se è italiana o no. E ci riesce abbastanza presto anche uno straniero che studia l'italiano. In genere sia l'italiano che lo straniero riescono meglio se è una parola di cui conoscono il significato, ma daranno dei buoni giudizi anche quando si tratta di parole inventate. Questo dimostra che ci sono criteri formali per riconoscere una parola italiana, anche se chi li usa deve riflettere un po' per trovarli e solo i parlanti colti padroneggiano quel minimo di terminologia necessaria per esprimere tali criteri. Parola = unità linguistica a cui sono associati una funzione grammaticale e un significato, separata graficamente dalle altre da spazi e dotata di coesione interna, per cui non si possono inserire altri elementi al suo interno, né si può mutare l'ordine degli elementi che la costituiscono. Ci sono:



parole per eccellenza, prototipiche (es: più, mai)

parole più complesse come quelle che derivano da altre (padroneggiare)

parole il cui statuto di "parola che è un tutt'uno" è già più problematico, come le parole composte con flessione interna (es: casseforti, mezzibusti)

gruppi di parole graficamente staccate, ma così coesi al loro interno da non poter essere interrotti da altre parole, né cambiati nell'ordine dei componenti e tali dunque da presentarsi alla coscienza dei parlanti come se fossero una parola sola

Si vuole qui dare una definizione ostensiva di parola italiana, facendo vedere quali sono i tipi più diffusi e riconoscibili di parole italiane.


I.I.   Le lettere con cui sono scritte le parole italiane.

L'alfabeto italiano è composto di 21 lettere, a cui vanno aggiunte j, k, w, x, y. Queste 5 lettere, che oggi gli italiani sono abituati ad associare alla grafia dei prestiti stranieri, hanno invece storie diverse legate all'anzianità di servizio nel nostro lessico:

la w non compare nell'alfabeto latino né in quello greco, e in italiano si trova solo in nomi propri stranieri e nei loro derivati o in prestiti (cowboy, würstel), tratti da lingue nel cui alfabeto w è presente o è stata usata nella traslitterazione in alfabeto latino

la k si trova già nelle prime attestazioni scritte di italiano; è entrata attraverso germanismi nei secoli viii, ix, x ed è stata usata per il suono che oggi scriviamo c di fronte alle vocali a, o, u e ch davanti alle vocali e, i

fino all'inizio del secolo xx° si usava j per la doppia i dei plurali in -io (principj) e più raramente per la i semivocalica (jeri). Ora la si trova in prestiti dal francese (julienne), dall'inglese (jazz, joystick) e da altre lingue

le lettere x, y sono spesso usate nella grafia dotta di parole greche o latine o di derivazione greca o latina (uxoricida); in prestiti da altre lingue (yuppie, yogurt)

Nell'insieme si può affermare che la grafia delle parole italiane non è cambiata molto dall'inizio del 500, quando le prime prestigiose edizioni a stampa di fatto imposero uno standard comune. Basta tuttavia sfogliare un testo a stampa di 400 anni fa per individuare alcune differenze rispetto alle grafie attuali:

fino alla fine del xviii° secolo non si distingueva fra u maiuscola e minuscola e v maiuscola e minuscola. Il non distinguere graficamente la V dalla U porta ad avere nei dizionari un ordine alfabetico rigoroso, ma misto, che a noi oggi crea qualche problema. Sul finire del 600 dall'Olanda vengono i caratteri che distinguono tipograficamente U e V. Di conseguenza, si distinguono tipograficamente U, u e V, v, ma esse vengono ancora mantenute nella stessa rubrica alfabetica. La separazione delle 2 lettere è un fatto ottocentesco

il segno h in posizione iniziale, che ora compare soltanto nella coniugazione del presente indicativo di avere (ho, hai, ha, hanno) e in alcune esclamazioni oltre che nei prestiti stranieri, nel 600 compariva ancora in parole come huomo, homiciatto, homicciuolo e nei testi continuò, sulla scorta della grafia latina, in parole come humile, Hercole. Tuttavia, la spinta decisiva a limitare l'h etimologicamente alle voci del verbo avere, in cui serviva a distinguere parole omofone, è avvenuta nel 700 circa

Nonostante l'italiano sia fra le lingue che più si leggono come si scrivono, alcune delle sue 26 lettere si pronunciano in modo diverso a seconda della parola in cui si trovano o meglio a seconda dei foni che le accompagnano. Ci sono inoltre segni che possono corrispondere a 2 suoni. Ci sono, viceversa, nella scrittura gruppi di 2 o 3 lettere che rappresentano un singolo suono. Fra le combinazioni possibili dei suoi 30 fonemi, l'italiano (come del resto le altre lingue con i propri fonemi) si è ritagliato quelle concretamente pronunciabili e fra queste ne ha privilegiate alcune, distinguendosi dalle altre.


I.II.   La tipica parola italiana.

Lemma = quella parola, scelta in base a certe convenzioni, che fa da intestazione ad una voce di vocabolario. In italiano, ad esempio, mangerò, bellissime, anforetta, dottoressa sono da un punto di vista lessicografico forme di parola e come tali si trovano in liste dette formari. I lemmi relativi a queste forme, cioè le forme scelte convenzionalmente per titolare la trattazione di una parola nel dizionario, sono rispettivamente:

l'infinito per i verbi (magiare)

il maschile singolare degli aggettivi (bello)

la forma non alterata dei nomi (anfora)

se sono nomi con una forma maschile e una femminile, il lemma sarà al maschile singolare (dottore)

L'insieme dei lemmi di un dizionario, o un elenco di lemmi, viene detto lemmario. In italiano, la lunghezza media dei lemmi è di 9.36 caratteri. Più della metà dei lemmi hanno da 8 a 12 lettere ciascuno. Questo conferma l'impressione che gli stranieri hanno della nostra lingua come lingua con parole molto lunghe. In realtà l'italiano condivide questa caratteristica con un'altra lingua neolatina come il francese, ma il fatto che il francese abbia una pronuncia più lontana dalla grafia, che molte lettere non si sentano, fa passare più inosservata la lunghezza delle parole francesi scritte. Le parole dell'inglese scritto sono invece più corte, ma non così corte come alcuni credono: gli occhi dei lettori sbagliano nel misurare le parole inglesi, influenzati da una brevità fonica e dalla caratteristica delle parole inglesi di essere mono- o bisillabiche. Si è sostenuto che ciò che caratterizza veramente le parole italiane è la presenza di un alto numero di vocali. La stessa percentuale però si rileva anche nel lemmario francese; tuttavia, in francese una buona parte delle lettere e non accentate (la lettera in assoluto più frequente) è muta, e quindi il francese sembra, almeno all'orecchio, meno pieno di vocali rispetto all'italiano. Le lettere relative a vocali più frequenti nei lemmi italiani sono nell'ordine a, i, o, e; la u ha una percentuale decisamente inferiore. Le 4 vocali, prese singolarmente, sono in assoluto le lettere più frequenti; le consonanti più frequenti sono, invece, nell'ordine r, t, n, c, s. Per la i incide sulla frequenza l'uso diacritico, grafico, come nelle sequenze gia, cia, glia, gnia, .. e l'uso come semiconsonante. Se si osserva poi che un'alta percentuale delle sillabe è del tipo CV (consonante/vocale), si comprende il perché dell'alta percentuale di vocali rispetto alle consonanti: C può essere scelta fra 15 diverse consonanti (18 se consideriamo anche k, w, x), mentre le lettere per le vocali sono 5 in tutto.


I.III.     Le sillabe che formano le parole italiane.

Ciò che tuttavia contribuisce veramente a dare un'idea delle combinazioni di fonemi, e quindi conseguentemente di lettere, caratteristici della lingua italiana è la struttura delle sillabe. Nella lingua italiana la scansione in sillabe è particolarmente sensibile, anche se i confini delle sillabe fonetiche non sempre corrispondono alle sillabe fonologiche e grafiche della tradizionale divisione in sillabe. Qui, parlando di sillabe, si intenderanno sempre le sillabe fonologiche e grafiche, le uniche che interessino veramente chi descrive il lessico, perché dipendono dalla struttura funzionale di ogni lingua e sono legate all'analisi in morfemi delle parole. Anzi ciò che interessa il lessicologo è più propriamente la sillaba grafica. La fonicità delle parole preoccupa il lessicologo e il lessicografo in quanto determina l'aspetto grafico delle parole, ad esempio creando la necessità di distinguere tipograficamente nei dizionari l'accento anche ortografico, presente in caffè, da quello presente nel lemma caffelàtte, che non è normalmente presente nei testi, oppure la necessità di segnalare nei lemmi dei dizionari la diversa pronuncia di determinati foni che sono rappresentati dalla stessa lettera (es: pésca e pèsca). La sillaba è costituita da un nucleo e da una periferia. Il nucleo, o centro, o apice della sillaba è una vocale caratterizzata da un picco di prominenza o intensità sonora; attorno al nucleo si possono raggruppare altri fonemi consonantici o semiconsonantici come nel caso dei dittonghi. La periferia può anche mancare, nel senso che la sillaba può essere costituita da una sola vocale: un numero limitato di sillabe del formario è costituito da vocali-sillaba (es: a-ra, re-o), ma il tipo più normale di sillaba in italiano e in tutte le lingue è quella costituita da C (consonante) e V (vocale). Si ha poi un numero elevato di sillabe aperte, cioè terminanti in vocale. L'italiano presenta sillabe formate da dittonghi e trittonghi (es: cuo-io; a-iuo-la), ma sono piuttosto rare. Le sillabe CV sono le più frequenti, seguite:

da quelle CVC (can-to)

dalle sillabe CCV (sta-gno)

e da quelle VC (al-ba)

Si noti che in questi dati, e nei successivi, C e V hanno un valore puramente grafico: gno è considerata CCV tanto quanto sta, benché dal punto di vista fonetico in gno ci sia una sola consonante e in sta 2. Il formario italiano presenta una grande varietà di sillabe: ce ne sono più di 2.000 diverse fra loro. Le più frequenti sono te, mo, re, si; le più frequenti sillabe di tipo CCV sono sti e ste. Le sillabe più lunghe registrate sono di 6 lettere (marsch) e alcune onomatopee (schioc, schiaf). Riassumendo: le sillabe più comuni in italiano sono di 2 lettere (più frequente l'ordine CV di quello VC); seguono in ordine decrescente di frequenza le sillabe di 3 lettere e quelle di una sola lettera (ovviamente una vocale). In italiano ci sono parole formate da una sola lettera: ad esempio a (preposizione), e (congiunzione), è (voce del verbo essere), i (articolo determinativo plurale maschile), o (congiunzione ed esclamazione vocativa). Le parole formate da 2 lettere vocali sono, oltre ad alcune esclamazioni, ai (preposizione articolata a + i), io (pronome di prima persona), ei (forma letteraria di egli); più numerose, ma non moltissime, le parole formate da una consonante e da una vocale (es: ad, da, al, fa, la, ..). A queste vanno aggiunte le esclamazioni ah, oh, uh, eh, ih, dove la lettera h non ha alcune valore fonico. Mediamente la parola italiana è formata da 4/5 sillabe. La parola italiana termina in vocale, eccezion fatta per qualche monosillabo, per i prestiti stranieri e per la parole che hanno subito l'elisione o il troncamento:

l'elisione fa cadere la vocale finale atona di una parola seguita da un'altra che comincia per vocale; al posto della vocale caduta si mette un apostrofo (es: l'esame, nessun'altra)

il troncamento può far cadere un'intera sillaba (es: quel cane) o una vocale (es: parlar, mal di mare). Perché ci sia troncamento la parola dopo essere stata troncata deve terminare in r, l, n o, più raramente, m, mentre la parola che segue non deve iniziare per s seguita da consonante, da z, x, gn e ps. Gran è un troncamento che fa eccezione a questa regola (gran psicologo) e all'altra che vieta di troncare parole al plurale (buon maestro, ma buoni maestri; gran maestro, gran maestri)

L'accento considerato normale in italiano è quello sulla penultima sillaba che contraddistingue le parole piane (es: gatto, bambino). L'accento piano, essendo l'accento normale, non è mai marcato, talvolta neppure nei dizionari, a meno che la sillaba accentata contenga le vocali e, o di cui i dizionari devono indicare l'apertura o chiusura. Seguono:

le parole sdrucciole (accento sulla terzultima sillaba: cúlmine)

le parole tronche (accento sull'ultima sillaba)

e quelle bisdrucciole (másticare)

quando ai verbi si attaccano dei clitici (cálcolatelo) possiamo avere in italiano anche delle trisdrucciole

Sdrucciole e bisdrucciole hanno l'accento tipograficamente marcato solo nei dizionari, non nei testi. Questa mancanza di indicazioni sulla sillaba tonica nella grafia italiana costituisce una difficoltà per molti apprendenti stranieri e talvolta anche per gli stessi italiani. Identikit della parola scritta tipicamente italiana:

i lemmi italiani hanno una lunghezza media di 9.36 caratteri

le forme sono lunghe in media 10.71 caratteri

il 68% delle forme è piano

le forme hanno per il 62% 4/5 sillabe

più della metà delle sillabe presenti nelle forma è del tipo CV e la sillaba finale è generalmente CV o CCV

Le parole dell'italiano parlato sono più brevi di quelle dello scritto, ma sono, proprio come quelle scritte, piane e formate per il 60% di sillabe di tipo CV.

LESSICO E LESSICOLOGIA

II.     Dentro le parole: i morfemi italiani.

La corposità della lingua italiana è dovuta al fatto che le parole italiane sono ricche di morfemi. Morfema = unità linguistica minima fornita di un suo significato; può costituire una parola (morfema libero) o essere parte di una parola (morfema legato). In italiano i morfemi liberi non sono molti: coincidono con le parole formate da una o 2 lettere e con più corpose parti invariabili del discorso quali avverbi ed esclamazioni (es: sempre, più, caspita). Se ammettiamo che anche l'informazione grammaticale singolare maschile portata da -o in nero è un significato, sia pure diverso da quello portato da ner-, allora capiremo che sono ben poche le parole italiane formate da un solo morfema. I morfemi grammaticali o flessivi, come vengono talora chiamati quei morfemi che portano informazioni sul numero, sul genere dei nomi e degli aggettivi o dei pronomi o su tempo, modo, persone, diatesi dei verbi sono di pertinenza di uno studio morfologico e grammaticale dell'italiano e quindi non ce ne occuperemo qui. Tuttavia la loro presenza nella parole italiane ci obbliga ad un affinamento terminologico. Mangerò, mangeresti, mangiò vanno considerate 3 parole diverse o 3 forme della parola mangiare?? Nero, nera, neri, nere sono 4 parole o 4 forme di nero?? Da un punto di vista lessicologico ci troviamo di fronte a 2 morfemi lessicali e a 7 morfemi flessivi, mentre da un punto di vista lessicografico ci troviamo di fronte a 7 parole riconducibili a 2 lemmi. Se fra i linguisti c'è accordo nel definire quali sono i morfemi flessivi, più dibattuta è invece la questione se il morfema lessicale sia ner- o nero. Accettando la seconda ipotesi si suppone che quando il morfema lessicale nero viene a contatto con il morfema flessivo -o, oppure -a, -e, -i, si ha un'elisione della vocale terminale, detta vocale tematica, perché appunto vocale che unita alla radice dà il tema della parola. Questa soluzione appare inutilmente macchinosa con i morfemi lessicali il cui significato è chiaro anche senza vocale tematica, ma presenta dei vantaggi quando il morfema lessicale senza vocale tematica potrebbe essere attribuito a parole diverse (es: pizz- potrebbe essere il morfema lessicale di pizza, ma anche di pizzo). Inoltre è la radice più la vocale tematica, cioè il tema, che concorre a formare le parole composte; considerare il tema come punto di partenza per le derivazioni e le flessioni permette un trattamento unificato di nomi e verbi. Il tema può coincidere con una parola (nero, libro, pizza), o con una forma verbale (ama è sia il tema di amare, da cui per derivazione abbiamo, ad esempio, amatore, sia la terza persona singolare dell'indicativo presente o la seconda singola dell'imperativo), ma in quanto unità di base delle morfologia è piuttosto una parola astratta. Ricapitolando: il tema contiene 2 morfemi, la radice e la vocale tematica che determina l'appartenenza della radice ad una classe flessiva. D'ora in poi, quindi, indicheremo il morfema lessicale con la vocale tematica tra parentesi, ner(o), pizz(a), per distinguerlo dalle parole e dai lemmi, cioè dalle forme con cui una parola diventa oggetto di una voce di dizionario.


ner(o)


radice vocale tematica

(1° morfema) (2° morfema)



tema


Ogni lingua ha le sue convenzioni di lemmatizzazione, cioè segue dei criteri per decidere quale forma deve rappresentare tutte le altre forme flesse (il seguire precise regole di lemmatizzazione ha inizio nel Rinascimento). I morfemi portatori di un valore semantico più specifico, quali i morfemi lessicali e gli affissi, sono molto importanti per una descrizione del lessico. I morfemi lessicali differenziano le parole le une dalle altre in modo macroscopico (nero e bianco sono 2 parole diverse perché ner(o) è diverso da bianc(o) e ha un diverso significato); anche gli affissi differenziano le parole, ma in modo tale che fra base e derivato mediante affissazione si riconosca una relazione (es: ecologia-ecologista; antiquario-antiquariato). La principale funzione degli affissi è permettere al lessico di ampliarsi, adeguandosi alle esigenze della comunità dei parlanti, senza implicare grandi sforzi creativi prima e di memoria poi.


II.I.   Parole derivate mediante affissi.

Da una parola già esistente (o più precisamente da quella parola astratta o tema di cui si è fatto cenno nel paragrafo precedente), che d'ora in poi sarà detta base, possono derivare altre parole con l'aggiunta di affissi. Le basi italiane sono perlopiù nomi, aggettivi, verbi. Rari sono i casi in cui la base è un avverbio come in pressappochismo, indietreggiare, o una locuzione come in menefreghismo. Gli affissi sono di solito morfemi legati, cioè unità che compaiono se non in unione con altri morfemi. Si distinguono in:

prefissi, quando vengono preposti alla base

suffissi, quando vengono posposti

infissi o interfissi, quando sono inseriti nella base

In italiano viene da alcuni considerato un infisso -er- in fuocherello, pazzerello, giocherello. Così sarebbe un interfisso -ett- in rockettaro. La ragione per cui si è detto che gli affissi sono di solito morfemi legati sta nel fatto che molti prefissi coincidono con proposizioni (es: contro, in) e come preposizioni potrebbero venir considerati forme libere. Oggi anche nei dizionari la preposizione contro viene distinta dal prefisso contro-: preposizione e prefisso sono trattati in 2 voci separate.


Derivati mediante prefissi. Parasintetici.

I derivati con prefissi appartengono alla stessa categoria grammaticale della base, della quale mantengono i tratti morfologici, sintattici e semantici fondamentali. I prefissi più produttivi nell'italiano sono a-, di-, de-, con-, per-, ri-, re-, s-. Talvolta il prefisso ha un significato preciso (si pensi a quelli temporali e spaziali come sotto-, fuori-, post-, ante- o superlativi come arci-, stra-, ultra-) e dà luogo ad un derivato dal significato trasparente; in altri casi invece non è possibile ricavare il significato del prefisso in parole come promettere, concedere, perché ci sono già arrivate prefissate dal latino. Vi sono prefissi come dis-, super-, s-, inter- che si premettono sia a nomi che ad aggettivi e verbi; altri come i prefissi negativi a(n)- e in- (amorale, intoccabile) sono tipicamente aggettivali. I verbi parasintetici sono formati da basi nominali e aggettivali con l'aggiunta simultanea di un prefisso (generalmente s-, ad-, in-) e della vocale tematica -a- oppure -i- che determina l'appartenenza del verbo alla prima o alla terza coniugazione. Esempi di verbi parasintetici denominali e deaggettivali sono rispettivamente addentare, incenerire, svecchiare, abbellire. Inoltrare, addentrarsi sono casi rari di parasintetici con base avverbiale. Sfrontato, spietato, sgraziato sono aggettivi parasintetici formati dal prefisso s-, da un nome e da un suffisso di tipo participiale -ato.


Derivati mediante suffissi.

I derivati mediante suffissi appartengono di solito ad una categoria lessicale diversa da quella della base: i nomi denominali (cioè derivati da nomi) sono un caso particolare e si formano con suffissi come -aio, -ario, -iere, -ista, -eto, -ile, -ino, -ismo, .. e con suffissi propri delle nomenclature scientifiche: -ite, -oma, -ema, -uro, -ato, -ito, -ide, .. I più comuni suffissi italiani, fra quelli che danno luogo a nomi deverbali (cioè derivanti da verbo), sono:

suffissi che producono nomi d'azione, come -zione/-ione, -mento, -(t)ura, -aggio, .. (es: fruizione, invasione, divertimento, potatura, cottura)

suffissi che producono nomi d'agente, di mestiere, come -tore/trice, -ante/ente, -ino/ina, -one/ona (sciatore, insegnante, imbianchino, chiacchierone)

Suffissi che producono aggettivi deverbali (cioè aggettivi derivati da verbi) sono -bile, -evole, -ante/ente (onorevole, supponente). Nomi deaggettivali sono formati da suffissi come -ezza, -erìa/èria, -ità, -izia, -ismo, .. (bellezza, stramberia, cattiveria, felicità). Numerosi i suffissi che danno luogo ad aggettivi denominali: -ario, -ino, -ale, -ico, -izio, -oso, .. (ipotecario, salino, fatale, alfabetico, costoso). I suffissi che servono a formare verbi denominali sono -izzare, -ificare, -eggiare (monetizzare, cornificare, arieggiare). Gli stessi suffissi formano anche verbi deaggettivali come fertilizzare, purificare, amareggiare. Il suffisso -mente serve a formare avverbi da aggettivi (gentilmente, chiaramente). Un caso particolare di derivazione, detta con suffisso zero, è quella in cui il derivato non aggiunge nulla alla base, ma passa ad un'altra parte del discorso, assumendone la morfologia flessiva. Tipi comuni sono il passaggio da aggettivo a verbo (scuro, scurire) da nome a verbo (sci, sciare), da verbo a nome (comandare, comando; ricoverare, ricovero). Nei derivati a suffisso zero dell'ultimo tipo (da verbo a nome) spesso è difficile per il parlante stabilire qual è la base in assenza di conoscenze sulla storia della parola. Alcuni studiosi considerano questi passaggi da una parte del discorso all'altra come casi di conversione più che di derivazione zero. Per semplicità di descrizione ci pare utile mantenerli separati dai casi più comuni di conversione come la sostantivazione di aggettivi e verbi (il correre, il vero) o il passaggio da participio ad aggettivo e sostantivo.


Alterati.

Un particolare tipo di suffissi che non cambia la categoria grammaticale della base sono i suffissi alterativi. L'italiano è la lingua neolatina più ricca di suffissi alterativi, sia dal punto di vista della loro varietà, sia dal punto di vista della loro frequenza d'uso. I suffissi possono avere la funzione di indicare davvero dimensioni più grandi o più piccole del solito (casina, casona) o qualità negative (casaccia), ma più spesso servono a segnalare l'informalità della situazione, l'atteggiamento del parlante (esempi di cenetta, sposini, colpaccio). È impossibile prevedere quali e quanti suffissi alterativi si possono utilizzare con un nome o un aggettivo, perciò i dizionari italiani sono soliti elencare le forme alterate possibili. L'unica regola consiste nel predire che difficilmente si altera un nome con un suffisso simile alle lettere con cui finisce il nome stesso (tetto, tettuccio, ma non tettetto; tuttavia cucinino esiste). I suffissi diminutivi, usati con nomi e aggettivi, più comuni sono:

-ino (cestino, pesantino)

-etto (quadretto, furbetto)

-ello (alberello, poverello)

-uccio (regaluccio, calduccio)

Vi sono poi suffissi meno frequenti: -erello, -otto, -olino, -acchiotto, -icello, -uzzo, -iccio (fuocherello, scemotto, verdolino, volpacchiotto, fraticello, viuzza, malaticcio). Vi sono suffissi, anche questi piuttosto rari, diminutivi e dispregiativi: -ucolo, -iciattolo, -onzolo, -icchio, -ognolo (dottorucolo, vermiciattolo, pretonzolo, governicchio, verdognolo). Il suffisso accrescitivo è -one (scatolone, avarone). Suffissi peggiorativi sono -accio e -astro (tempaccio, verdastro). Con i verbi si possono usare i seguenti suffissi: -acchiare, -icchiare, -ucchiare, -erellare, -ettare, -ottare, -uzzare (giocherellare, parlottare, tagliuzzare). L'alterazione dei verbi è tuttavia molto meno frequente di quella di nomi e aggettivi. L'uso di alterati è frequente anche come risorsa neologica in italiano. Fra i neologismi più recenti: telefonino (radiotelefono portatile), merendina (dolcetto di produzione industriale confezionato in modo da facilitarne il trasporto e il consumo).


II.II.     Parole composte.

Un altro modo in cui il lessico delle lingue si espande è la composizione = 2 o più parole già presenti nel lessico vengono giustapposte, di solito seguendo l'ordine in cui comparirebbero nelle frasi, e danno luogo a nomi composti, più raramente ad aggettivi. L'italiano attuale per ampliare il proprio lessico si serve principalmente della derivazione e di quel procedimento, a metà strada fra derivazione e composizione, come i dizionari chiamano adesso quelli che sono stati di volta in volta chiamati prefissoidi/suffissoidi, temi lessicali, semi-parole (" elementi di composizione). In italiano il composto tipico è formato di 2 costituenti. Fra i procedimenti compositivi il più produttivo resta quello V + N, che dà luogo a numerosi neologismi. Nel lessico italiano le combinazioni di parole composte seguono di solito le regole sintattiche dell'ordine delle parole nelle frasi. Abbiamo quindi nomi composti formati da:

nome + aggettivo (lingualunga, pastasciutta)

aggettivo + nome (bassorilievo, mezzobusto)

verbo + nome (asciugatutto, contascatti, spremiagrumi)

preposizione + nome (senzapatria, sottobosco, dopolavoro)

nome + nome (pescespada, fondovalle, girocollo, capogiro)

verbo + verbo (parapiglia, fuggifuggi, dormiveglia)

verbo + avverbio (tiratardi)

avverbio + participio (benestante, altoparlante)


Gli aggettivi composti sono formati da:

aggettivo + aggettivo (bianconero, agrodolce, sordomuto)

nome + aggettivo (nullatenente, videodipendente)

aggettivo + nome (verde bottiglia, giallo ocra)

avverbio + aggettivo (sempreverde)


Nei composti le preposizioni cadono: pomodoro è un caso raro rispetto a fondovalle e capostazione. Talvolta l'ordine dei composti V + N contrasta con la sintassi e presenta il soggetto dopo il verbo (battiscopa, marciapiede). Anche nei composti N + N non sempre il modificatore segue come in cartapecora; può precederlo come in capogiro. Per spiegare meglio la natura dei composti è necessario richiamare la nozione di sintagma e di testa del sintagma. Sintagma o gruppo = un'unità linguistica, di solito formata da più di una parola, i cui componenti hanno fra di loro legami più forti di quelli che hanno con le parole che precedono o seguono. Fido, il mio cane, il cane di papà, il cane che mi hanno regalato sono tutti e 4 sintagmi nominali, anche se di crescente complessità; mangia, magia l'osso, magia troppo sono sintagmi verbali; di papà, sul tavolo sono sintagmi preposizionali. Testa del sintagma = l'elemento la cui presenza motiva la presenza degli altri componenti del sintagma. In un sintagma nominale la testa è il nome, in un sintagma preposizionale la testa è la preposizione e in uno verbale è il verbo. Vengono detti composti endocentrici quelli in cui la parola composta condivide le caratteristiche morfologiche e sintattico-semantiche della testa del composto. Tutti i nomi composti da V + N o da preposizione + N sono quindi composti esocentrici, perché la parola composta è un nome e non appartiene alla stessa parte del discorso (verbo o preposizione) a cui appartiene la testa del sintagma associabile al composto. Non sempre i composti nominali formati da N + N o aggettivo + N sono endocentrici, pur condividendo con la testa la parte del discorso: ad esempio, il purosangue non è sangue e il pellerossa non è pelle, quindi non c'è condivisione delle proprietà semantiche. Capostazione, capogiro, mezzogiorno e acquasanta sono endocentrici perché il capostazione è un capo e il capogiro è un giramento di capo, il mezzogiorno è una parte del giorno e l'acquasanta è acqua. Talvolta nei composti N + N (caffelatte), e sempre in quelli aggettivo + aggettivo o V + V non è possibile individuare una testa perché il rapporto fra le parti del composto è di coordinazione più che di subordinazione. Non molti composti conservano fedelmente, parola per parola, la struttura del sintagma da cui derivano: oltre a pomodoro, ricordiamo nontiscordardimé, magiaebevi, tiramisù, capintesta, vucumprà. Di solito, se si conserva parola per parola il sintagma, si ha una locuzione o un sintagma lessicalizzato fatto di parole non unite fra loro (fai da te, mordi e fuggi, presa in giro). L'altra grande fonte di composti sono i calchi di parole inglesi composte che danno solitamente origine a locuzioni formate da 2 o più parole che vengono scritte separate e, in qualche caso, unite con trattino. Il trattino è però in regresso: il suo uso è ormai ristretto ad aggettivi del tipo ibero-americano o cino-coreano, che rientrano piuttosto fra le parole formate con elementi di composizione, e a parole derivate con il prefisso non- seguito da un sostantivo o da un aggettivo (non-allineato, non-belligerante, non-decisione, non-fumatore). Fra i pochi altri casi di uso del trattino ricordo i punti cardinali (nord-est) e i prestiti dall'angloamericano che ci arrivano corredati di trattino (city-car, hard-core, yes-man). Nella raccolta di neologismi, i composti con trattino come ragazza-hamburger, distruggi-famiglia, posta-spazzatura, proteggi-slip, sono veramente rari in confronto alle locuzioni formate da parole staccate.


II.III.     Elementi di composizione.

Una gran parte dei neologismi è formata di parole come mini-, maxi-, auto-, fono-, logo-, eco-, filo-, disco-, narco-, euro-, -crazia, -mania, -gramma, -teca, .. e da una base. Queste parole non si trovano come parole autonome del lessico italiano: sono parole di altre lingue, generalmente il greco, il latino, talvolta anche di lingue moderne (es: buro- viene dal francese), oppure sono forme scorciate di altre parole come euro- (da Europa) o cino- (da cinese). Sono come gli affissi perché non sono morfemi liberi in italiano, però somigliano alle parole che entrano nei composti perché possono combinarsi fra loro senza intervento di morfemi liberi, come ad esempio in emofilia, fonografo, demoscopia, radiotelescopio, tomografia. Chi li ha chiamati prefissoidi e suffissoidi ha sottolineato il primo aspetto, chi li ha denominati semiparole, temi lessicali e elementi di composizione dà maggior rilievo al secondo aspetto, anche sulla base di considerazioni che tengono conto della loro maggior libertà di combinazione rispetto agli affissi. Nei maggiori dizionari italiani è prevalso il termine elementi di composizione e si specifica se sono primi o secondi, cioè se stanno all'inizio o al fondo della parola. Mentre ci sono elementi che possono essere indifferentemente primi e secondi (bibliofilo, filoamericano), altri possono stare solo come primi elementi o all'interno della parola (neoministro, radiogoniometro), altri ancora solo come secondi elementi (-metria, -fonia, -filia). Nelle composizioni formate da una parola vera e propria in prima posizione e da un elemento di composizione di origine greca in seconda posizione, la vocale finale della parola viene mutata in o (musica + logia = musicologia; Dante + filo = dantofilo), mentre si ha un riaggiustamento con i quando l'elemento di composizione è di origine latina (insetto + cida = insetticida; erba + voro = erbivoro). La produttività degli elementi di composizione si deduce dal fatto che tali elementi ormai da tempo compaiono in parole al di fuori dei lessici tecnico-scientifici. Ovviamente ci sono elementi più popolari di altri: ad esempio, auto-, foto-, tele-, radio-, narco-, video-, eco- hanno nei dizionari spesso 2 lemmi, uno con significato legato alla parola dotta greca o latina da cui derivano e un altro col significato legato alle parole più prestigiose e fortunate fra quelle formate con tale elemento. Auto- vuol dire da sé in greco e con tale valore rientra in autoironia e autografo, ma l'elemento auto- veramente popolare è quello che porta il significato di relativo all'automobile. Così vale per gli altri sopra elencati. È interessante notare che, a parte l'ultimo (ostacolato nel processo di diventare abbreviazione di ecologia dall'omonimia con l'eco che compare in frasi come: in questa grotta c'è l'eco), gli elementi sopra elencati sono ormai diventati parole nel lessico italiano, morfemi liberi sia pure risultanti da accorciamenti di parole più lunghe. Questo rafforza l'interpretazione in chiave compositiva, più che derivativa, di parole come telegiornale, videogioco o autolavaggio. A differenza della neologia basata su alterati che appare diffusa anche a livello di lingua orale e di scritto narrativo, la neologia con elementi di composizione resta un po' pesante ed è appannaggio, oltre che dei testi specialistici scritti e orali, dello scritto giornalistico, saggistico o al massimo del parlato colto o del parlato brillante e scherzoso.


III.     Conversione.

Un fenomeno non trascurabile di arricchimento lessicale è il passaggio di una parola da una parte del discorso ad un'altra.

Macroscopico e caratteristico fenomeno di conversione in italiano è la possibilità di sostantivare l'infinito: bere, il bere. Il fenomeno è presente anche in altre lingue neolatine, in francese, ad esempio, ma non è così diffuso come in italiano; inoltre in italiano mantiene una caratteristica di registro formale ed è usato soprattutto nello scritto o nel parlato colto. In qualche caso questi infiniti sostantivati hanno raggiunto tale autonomia di significato rispetto al verbo, da aver acquisito anche la flessione nominale del plurale (saperi, averi, esseri, doveri, voleri) e da poter essere alterati (esserino). Nella maggioranza dei casi però il verbo sostantivato indica un processo e non un oggetto o un atto numerabile ed è quindi usato soltanto al singolare.

Un altro caso di conversione frequente è la possibilità di sostantivare l'aggettivo (il povero, il ricco, il magro, il grasso, il bello). Quest'uso porta ad ambiguità: infatti se il povero e il ricco, il magro significano univocamente un uomo povero, un uomo ricco, un uomo magro, il grasso può anche significare la parte grassa della carne oltre ad un uomo grasso e il bello può indicare la bellezza e un uomo bello. Perciò i dizionari italiani, soprattutto quelli che intendono aiutare gli stranieri, farebbero bene a segnalare queste possibili polisemie, insieme alle loro caratteristiche morfologiche.

I participi presenti e passati sono diventati spesso in italiano degli aggettivi e dei sostantivi: divertente, conosciuto, occupato, rifornito, studente, cantante, percorso, discorso, risultato, deputato.

Un particolare tipo di arricchimento lessicale a metà tra conversione ed ellissi è quello che porta da un iniziale uso del tipo linea direttrice a direttrice, da computer portatile a portatile, da telefono cellulare a cellulare, da cerniera o chiusura lampo a lampo (nome femminile), da modello 740 a 740, ..

Un'ulteriore fonte, piuttosto moderna, di conversioni viene dall'accesso da parte delle donne ad una serie di professioni e titoli che un tempo erano esclusivo appannaggio degli uomini. Poiché alcuni dei classici morfemi preposti al passaggio al femminile dei nomi d'agente, come -essa o -ora, sono sentiti come connotati in senso comico-spregiativo, tutte le volte che la professione finisce in -e si assiste ad un recupero della possibilità di avere un nome a 2 uscite. Perciò accanto a vigilessa e presidentessa si stanno affermando la vigile, la presidente e la giudice, che vanno ad affiancarsi a la preside, da tempo affermato.

La fondamentale differenza fra la sostantivazione di infiniti e aggettivi da un lato e gli altri fenomeni qui menzionati sta nel fatto che mentre la sotantivazione è sempre possibile, è prevista dal sistema della lingua italiana, gli altri tipi di passaggio sono meno sistematici e più dominati dall'uso linguistico.



  1. PRESENTE E FUTURO DEL LESSICO ITALIANO.

I.   Il lessico italiano è ancora italiano.

Il vocabolario dei testi parlati per il 99.7% è fatto di parole ben radicate nel suolo italiano. Raffrontati all'intero corpo del lessico, o anche ai prestiti dialettali, è chiaro che gli anglicismi e l'intera sfera degli esotismi sono a livello di minima significatività statistica. Si è voluto sottolineare questo aspetto perché la preoccupazione più grande dei cultori di lingua italiana oggi è proprio la minaccia costituita dal cosiddetto itanglese, una mistura formata da una sintassi italiana semplificata e dall'ampio uso di lessico angolamericano. È diffuso il timore che l'italiano, finalmente giunto ad essere la lingua parlata dalla maggioranza degli italiani in tutte le circostanze, si sia liberato dai dialetti solo per finire invaso da una lingua straniera con una grafia e una fonetica radicalmente diverse. I dati forniti sui prestiti non adattati dall'inglese e sulla percentuale di etimologie che partono dall'inglese non sono tali da confortare, ma non bisogna dimenticare che il lemmario di un dizionario non è che uno dei modi di rispecchiare una lingua. Ciò che conta veramente è la percentuale d'inglese nei testi italiani parlati e scritti. Altre indagini condotte su testi di riviste e quotidiani dimostrano che l'incidenza degli anglicismi non adattati nella stampa è aumentata negli ultimi decenni, ma in modo modesto. Comunque attraverso l'analisi dei modi più vitali di accrescimento del lessico italiano, si è potuto constatare che la penetrazione dei prestiti lessicali e sintattici è abbastanza circoscritta: i dizionari di neologismi e la prosa giornalistica danno un'immagine distorta ed esagerata delle conseguenze dell'invasione dell'angloamericano. Circa la lingua delle giovani generazioni di italiani, il cui uso di prestiti inglesi non adattati potrebbe fornire argomenti per proiezioni future, non disponiamo per ora di studi ampi sul loro parlato. I dati che provengono da uno spoglio di loro scritti (sia pure scolastici e quindi forse autocensurati) sono consolanti: poco numerosi sono infatti i prestiti non adattati e si tratta di parole poco vistosamente straniere (es: film, sport, computer, picnic, spray, hobby, jeans, ..). Paradossalmente ci sarebbe da temere se gli italiani che parlano l'inglese bene fossero davvero molti: finché la maggioranza delle trasmissioni televisive sarà doppiata e l'insegnamento delle lingue nella scuola italiana resterà ai livelli attuali di efficienza, abbiamo poco da temere per l'italiano, o meglio i pericoli maggiori non verranno all'italiano dalla pressione di lingue straniere, quanto dal mediocre italiano diffuso dalla televisione e sempre più spesso anche dai giornali. Il miglior modo per difendere l'italiano non è alzare barriere di indiscriminato protezionismo linguistico; la vera soluzione sta nell'insegnarlo bene, farlo amare, farne capire le strutture, anche attraverso il confronto con le altre lingue e dialetti, nell'indurre gli italiani a coltivare la loro lingua al di fuori della scuola con buone letture. Certo i presentatori, i giornalisti, i cosiddetti grandi comunicatori debbono essere consci della loro responsabilità e debbono essere i primi a chiedersi se molte delle parole straniere che usano siano veramente necessarie, se non esistano appropriati corrispondenti italiani. Altrettanto dovrebbero fare all'interno delle lingue di settori specialistici gli estensori di manuali universitari, di istruzioni per l'uso di apparecchiature, di cataloghi commerciali.


I.I.   Prevedibili sviluppi.

Vediamo quali sono le linee di sviluppo prevedibili per l'italiano del 2000.

Fra le classi suffissiali in espansione ci sono quelle più internazionali, come -ista, -ismo, -izzare, -ale, -zione e -mento che hanno forme consimili in inglese, francese, spagnolo, e talvolta in tedesco.

Fra le più tipicamente italiane -erìa ha molto successo per indicare esercizi commerciali; anche gli alterati propongono alternative neologiche non troppo faticose.

Più onerose, ma ugualmente molto in voga, sono le formazioni con elementi di composizione, mentre pian piano si va diffondendo la tendenza, già in atto da tempo in altre lingue, ad un uso più frequente delle sigle e delle abbreviazioni come prof (scritto senza puntino e non seguito da nome proprio).

La derivazione a suffisso zero si sta diffondendo al di fuori dell'ambiente burocratico in cui ha avuto sempre ampia diffusione e ora si ha accanto a delibera, bonifica, revoca, affido, anche spiega per spiegazione.

Nel complesso, per quello che riguarda il lessico e la formazione della parole, la norma e il sistema dell'italiano paiono orientarsi secondo 3 tendenze fondamentali:

la preferenza per espressioni sintetiche invece che analitiche (fortuna di prefissazioni, suffissazioni e composizioni, sigle)

l'azione di fatti semplificanti ed economici (abbreviazioni, sigle, concentrazione su una lista non ampia di formativi, prefissi e suffissi, molto produttivi e polifunzionali, ..)

la spinta a conformarsi ad uno Standard Average European (prendendo dalle lingue europee di cultura, e specialmente dall'inglese, alcuni moduli lessicali, e incrementando quelli già propri del sistema italiano che abbiano un parallelo in inglese, francese, tedesco, ..)

Naturalmente, anche nel lessico è presente la tendenza generale a diminuire le distanze fra standard scritto e parlato medio, con l'assunzione nel neo-standard di termini un tempo sub-standard. I fenomeni profondamente innovativi sono molto pochi e, per ora, marginali: i più rilevanti sono l'accoglimento di forestierismi senza adattamento alla morfologia dell'italiano, e la coniazione di sigle e derivati prefissali (o di composti) che violano anch'essi le regole morfonologiche della struttura della parola in italiano.

Questa situazione di sostanziale stabilità non impedisce che l'arricchimento delle basi lessicali renda molto più distanti, dal punto di vista del vocabolario impiegato, un testo d'oggi da un testo del secolo scorso, di quanto non fosse distante il testo ottocentesco da un testo italiano dei secoli precedenti. Prima del xx° secolo soltanto il periodo dell'Illuminismo aveva visto una rivoluzione lessicale e derivativa nell'italiano. Ora, come all'epoca dei lumi, il lessico diventa la cartina di tornasole della maggior circolazione del sapere, dell'estrema specializzazione delle discipline, dell'ingresso del sapere scientifico, anche sotto forma di metafore, nel linguaggio comune. Anche i dizionari di italiano hanno dovuto affrontare il fenomeno e hanno reagito ampliando moltissimo il loro lemmario rispetto al passato. Altre lingue europee hanno dovuto affrontare questa irruzione di lessico scientifico e specialistico, ma essendo lingue parlare da più tempo, l'immissione è parsa meno vistosa che in italiano, una lingua per secoli usata solo per lo scritto e prevalentemente per lo scritto letterario. Già Leopardi nel 1821 notava che c'erano degli europeismi, termini comuni a tutte le lingue colte in Europa, e lamentava che l'italiano del primo 800 fosse priva di questi europeismi. Da allora l'italiano è rientrato nel processo di europeizzazione, nonostante le resistenze dei puristi. Le parole nuove, quelle create adesso su basi italiane o straniere, vengono assegnate ai paradigmi più frequenti: la coniugazione in -are per i verbi, il maschile in -o, plurale -i per i nomi, il femminile in -a, plurale -e per i nomi femminili. Però il successo dei derivati in -tore, -zione, -bile, -ista provoca maschili in -e, -a, femminili in -e. La produttività dei parasintetici in -ire è notevole. Sono spinte in senso opposto alla riduzione delle forme di flessione, a cui comunque si assiste in campo neologico e che si riscontra nell'italiano dei bambini e nelle varietà di apprendimento degli stranieri. Talvolta verifichiamo la repentina resurrezione di un suffisso: ad esempio -ile sembrava cristallizzato, non più produttivo, quando, sulla scorta di canile, si è formato gattile. Queste resurrezioni, se avvengono per una sola parola, fanno pensare piuttosto ad un processo di imitazione (canile-gattile), che alla consapevole riscoperta di una derivazione tramite suffisso. Al di fuori degli europeismi morfologici continuano ad essere produttivi in italiano profili originali come:

nomi deverbali a suffisso zero (ammollare-ammollo e un recentissimo carta assorbitutto antispappolo)

derivati nominali costituiti dalla forma femminile del participio passato (mangiata, dormita, bevuta) col significato di azione breve e rapida, o derivati da nomi + -ata col significato di quantità che sta ad X, colpo di (cucchiaiata, videata, gomitata)

nomi derivati in -istica (oggettistica, francesistica)

l'uso di suffissi alterativi

l'uso di verbi complessi probabilmente legati a forme corrispondenti nei dialetti settentrionali e simili ai phrasal verbs inglesi (buttar giù, metter sotto, tirar su)

forme di composizione nettamente distinte da quelle del latino e in parte diverse da quelle delle altre lingue romanze: nome + nome con testa a sinistra (vacanza avventura, legge truffa); verbo + nome (aspirapolvere); ripetizione del verbo (pigia pigia, corri corri); composizione con elementi di composizione (audiocassetta, multiproprietà)


II.     Quando le parole straniere diventano italiane.

Rispetto al francese e allo spagnolo, l'italiano attuale accoglie più facilmente le parole straniere e in particolare le parole dell'angloamericano. Da più parti ci si lamenta che i giornali italiani non abbiano adottato, come invece fanno gli spagnoli, la politica di arginare l'uso di forestierismivistosa che in italiano, una lingua per secoli usata solo per lo scritto e prevalentemente per lo scritt; altri invocano dei provvedimenti governativi simili a quelli francesi per difendere l'italiano dall'invasione dei forestierismi. I mezzi di comunicazione di massa, specie la televisione, hanno una responsabilità grandissima sia nel diffondere parole straniere, sia nel decretare invece il successo di parole italiane al posto dei prestiti. Non bisogna, tuttavia, essere allarmisti: le raccolte di neologismi, che sono in gran parte formate di prestiti dall'inglese, pescano le loro novità nei giornali e nei periodici dove si considera una caratteristica dello stile brillante far sfoggio di prestiti. Se si osserva la lingua parlata di tutti i giorni, si vede però che la gente rifiuta i prestiti più ostici, usa quelli di cui ha veramente bisogno, salvo sostituirli nel tempo con parole italiane (un numero molto basso del totale delle occorrenze è formato da esotismi, per la maggior parte inglesi, latini e francesi; okay è il più frequente fra gli esotismi, ex è il latinismo più frequente). Nello sport del calcio si è visto un chiaro caso di progressiva italianizzazione (penality, corner (calcio di) rigore, (calcio d')angolo). Di Blitzkrieg è rimasto in italiano solo il blitz inteso come irruzione di forze dell'ordine; per il resto è prevalsa la traduzione guerra lampo, così produttiva che adesso abbiamo matrimonio lampo, cerniera lampo, notizia lampo. L'abitudine di un prestito straniero è spesso graduale. Un tempo si adattava alle regole grafiche dell'italiano anche la forma scritta della parola: sciampagna, sciampo, gol, per il francese champagne e l'inglese shampoo e goal, sono 3 esempi. Adesso l'adattamento è solo nella pronuncia, mentre la grafia viene mantenuta, sia pure a prezzo di frequenti errori. L'adattamento fonetico è cosa ormai acquisita anche dai migliori dizionari che a fianco dei prestiti (soprattutto inglesi e americani), oltre a dare la pronuncia originaria, danno una o più pronunce italiane, registrando quella che ormai è una norma dell'italiano parlato, conservativo nei confronti della grafia straniera, ma decisamente orientato verso un'italianizzazione della pronuncia. La pronuncia italiana di questi prestiti è spesso regionale ed è una via di mezzo tra fonetica italiana e straniera. Chi parlando, anche in ambiente colto, usa la vera pronuncia viene giudicato appunto una persona snob, che fa indebito sfoggio di cultura. D'altra parte la stessa persona deve poi cedere di fronte ai nomi derivati: se pronuncia surf e computer con impeccabile accento inglese, non potrà evitare italianizzazioni quando deve dire surfista e computerizzare.

Insieme all'adattamento fonetico c'è un ambientamento morfologico, sia per le parole di lingue che non hanno genere come l'inglese, sia per quelle che provengono da lingue come francese, tedesco, spagnolo che l'hanno. Il genere scelto è spesso l'originale, oppure il maschile, che è meno marcato del femminile, ma talvolta è il genere di una parola italiana vicina per senso o per suono al prestito. Crème caramel in francese è femminile, ma in italiano è il crème caramel per influenza di caramello. Con l'inglese si hanno spesso incertezze e oscillazioni: il/la fitness, il/la CD-ROM (compact disc è maschile perché disco è maschile, ma l'ultima lettera di ROM sta per memory, memoria e induce al femminile di tutta la sigla). La fine della settimana è il week-end e porta addirittura al calco il fine settimana. Quest'ultimo esempio ci porta anche a notare il tipo di articolo da premettere ai prestiti stranieri che iniziano per h, w, cha, .. Si usa in generale l'articolo che si troverebbe in una parola italiana iniziante con lo stesso suono e quindi il jet, il chachacha, ma lo champagne e lo yuppie. Tuttavia l'uso è oscillante e complesso, perché bisogna, ad esempio, sapere se l'h è muta o aspirata (l'habeas corpus ma lo Hegel), se w corrisponde a semiconsonante o a [v]. Si dovrebbe quindi dire e scrivere l'week-end, il wafer, ma di fatto troviamo quasi sempre il weekend, il whisky, il western. La parola viene solitamente presa al singolare e considerata invariabile: le occorrenze di films sono sempre meno e, nonostante le avvertenze dei dizionari, capita spesso di leggere i più famosi anchorman televisivi, .. al posto del corretto anchormen. Se la parola proviene da lingue neolatine, in particolare dallo spagnolo, è più probabile che si mantengano i plurali originali (banderillas, aficionados). Se una parola è entrata al plurale, spesso non viene rianalizzata (il neutro plurale latino opera omnia, che dovrebbe essere in italiano un maschile plurale o un neutro femminile plurale del tipo le uova, diventa per i più la opera omnia, femminile singolare). Con le particolarità grafiche, l'uso è variabile: ad esempio gli accenti del francese vengono di solito mantenuti (si veda però hotel, senza accento circonflesso sulla o), ma le maiuscole dei nomi tedeschi tendono a cadere tanto più facilmente quanto più il prestito ha messo radici. Quanto alle lingue che non hanno l'alfabeto latino (es: lingua araba), spesso l'italiano moderno è tributario di grafie francesi o inglesi, o di altre lingue europee attraverso le quali ha conosciuto la parola e spesso regna un'estrema incertezza. Un successivo ambientamento dei prestiti si ha quando questi diventano basi di derivati con suffissi italiani o entrano in composizione con parole italiane (handicappato, judoista, bypassare). La musica moderna e l'informatica sono stati fra i campi più fertili di formazioni miste come jazzista, rockettaro, computerizzare, softwarista, formattare, per tacere gli omonimi perfetti grafici e fonici processare, scrollare, scannare da to process, to scroll, to scan. Si sente nel parlato chi dice: ho chiuso un filone, un filino (pronunciati failone, failino dall'inglese file) esattamente come filmone e filmina entrarono anni fa nel lessico. I prestiti composti o sono presi di peso (juke-box, hard-core), oppure danno luogo a calchi che obbediscono all'ordine sintattico italiano: hard disk - disco rigido, pin-up girl - ragazza (da) copertina, free climbing - arrampicata libera, skycraper - grattacielo. Le forme del tipo bagnoschiuma, droga-party, IBM-compatibile, babyspacciatore, scuolabus, sci alpinismo, cioè con testa a destra, sono abbastanza isolate o ristrette al giornalese o ad ambiti tecnico-burocratici, a meno che non si prendano in considerazione i moltissimi composti con elementi di composizione (del tipo autoriparazioni e videodipendente), che mostrano l'influenza di modelli formativi stranieri facilmente innestati nel modello di formazione di parole dotte con elementi di composizione.

Quanto al versante del significato, se il prestito arriva con un oggetto o un concetto sconosciuto ha in italiano il significato che aveva nella lingua d'origine, salvo assumerne degli altri, traslati, in seguito (by-pass, dall'originario ambito di cardiochirurgia, si è diffuso oggi nel linguaggio comune attraverso il verbo bypassare nel senso di superare un ostacolo). Se invece il prestito è una parola polisemica, o è stato introdotto come termine da stile brillante, molto spesso si afferma in uno solo dei significati originali (goal in italiano è solo la rete del calcio, mentre in inglese è obiettivo, scopo e anche rete; ticket, parola che in inglese significa biglietto, scontrino e in italiano significa invece per i più quota che deve corrispondere per medicinali o prestazioni mediche chi ricorre all'assistenza sanitaria pubblica). Vi sono poi quei casi curiosi di finti prestiti: pile, termine che noi crediamo d'aver preso dall'angloamericano, in Gran Bretagna e negli Stati Uniti non si usa. Espadrillas non è spagnolo, pre-maman non è vero francese, ma un marchio registrato, factotum e facsimile sono pseudolatinismi formati modernamente.


III.   Quando le parole italiane diventano straniere.

L'italiano ha smesso da tempo di esportare parole in grande quantità. Dopo il periodo della fioritura bancaria fiorentina e genovese, del commercio veneziano, del prestigio dell'arte figurativa medievale e rinascimentale e della musica italiana che portarono parole italiane nelle altre lingue di cultura, di recente abbiamo esportato pochi termini, quasi tutti di cucina, qualcuno di moda, sport e di .. malavita (mafia, ormai usato anche col significato esteso di organizzazione criminale). Gli altri italianismi relativi a sfere culturali alte sono usati soprattutto nello scritto. La presenza di comunità di emigrati italiani non ha avuto un'influenza decisiva sul diffondersi di italianismi nel lessico delle società ospiti: al di là del successo delle ammirate e apprezzate peculiarità gastronomiche, la scarsa penetrazione di italianismi è stata determinata

sia dalla bassa scolarità degli emigrati, che generalmente conoscevano un dialetto italiano più che l'italiano, e quindi tendevano ad usarlo solo in famiglia o in gruppi ristretti di emigrati provenienti dalla stessa regione

sia dal disinteresse che caratterizzava fino ad un decennio fa la politica estera culturale dell'Italia nei confronti delle comunità di italiani all'estero in quanto possibili centri di irradiazione di cultura e lingua italiana

La situazione cambia radicalmente là dove non solo il governo pratica una politica linguistica che favorisce il mantenimento della lingua del paese d'origine, ma la comunità italiana è formata da famiglie di ceto medio-alto, più attente ai problemi linguistici.

In sostanza oggi gli italianismi diffusi all'estero derivano direttamente dall'Italia, ma non possono certo controbilanciare l'enorme quantità di forestierismi, soprattutto angolamericani, che entrano quotidianamente nel lessico italiano. Inoltre l'italianismo nella stampa americana è molto più marcato, molto più esotico di quanto non sia ormai l'inglese nella nostra. Passando a dati sui lemmari di dizionari, sul migliaio di italianismi citati da un dizionario americano e accolti senza modificazioni grafiche, più di 1/3 riguardano la musica (adagio, prestissimo, staccato, ..), 1/5 le arti figurative (altorilievo, putti). Un altro quinto sono italianismi gastronomici arrivati non per via colta attraverso l'Inghilterra come i precedenti, ma portati dagli emigrati italiani. Se antipasto, polenta, macaroni erano già nei dizionari inglesi del 500, è dalla seconda metà dell'800 che inizia l'ingresso di lasagne, spaghetti, ricotta, risotto, salami, e nel nostro secolo mozzarella, rigatoni, scampi, fino a espresso e cappuccino, importati probabilmente dalle truppe americane che erano state in Italia durante la seconda Guerra mondiale. Alcuni italianismi si affermano nella forma dialettale: il caso più famoso è macaroni, entrato nel lessico angolamericano direttamente dal napoletano e affermandosi a spese dell'italiano maccheroni. Il plurale degli italianismi è generalmente all'inglese (pizzas, scenarios), a meno che la parola non sia stata accolta al plurale (agnolotti). Quanto ai significati, se si abbandona la gastronomia, spesso accade il fenomeno per cui i prestiti vengono assunti con un solo significato dei molti che la parola ha nella lingua di partenza. Così scala mobile ha nei giornali americani il solo significato economico; graffiti significa negli Stati Uniti la scrittura clandestina sui muri e nella metropolitana. Alcuni italianismi hanno sviluppato da tempo un significato autonomo come bimbo = sgualdrina, acida = bruciore di stomaco. Il suffisso italiano -ola, che si riscontra non solo in nomi di marchi famosi (Motorola), è produttivo anche nello slang inglese britannico e dà luogo a parole formate da basi inglesi e suffisso come payola = bustarella. Vi sono altre parole, quali Victoriana = oggetti dell'epoca della regina Vittoria, culturali = i colti, glitterati (da to glitter = luccicare) = persone dell'alta società e dello spettacolo, che si basano su suffissi italiani, pur non essendo prestiti veri e propri. Un altro settore in cui l'italiano è in credito verso l'inglese sono i nomi propri femminili: mentre le Deborah, Samantah, Jennifer, Nancy, Sheila dopo un boom inaspettato stavano già gradualmente diminuendo qualche anno fa, i nomi italiani come Antonia, Claudia, Laura, Monica hanno popolarità crescente nelle famiglie inglesi e anche i nomi di auto tedesche o giapponesi si ispirano all'italiano.

Riguardo all'incidenza di italianismi nel lessico della lingua tedesca, la situazione è molto più equilibrata, rispetto a quella dei rapporti con l'angloamericano, e forse leggermente a favore dell'italiano.

Col francese restiamo in debito, nonostante negli ultimi decenni la lingua francese abbia perso molto del prestigio che tradizionalmente esercitava in Italia. A fronte dei circa 600 francesismi registrati (chance, routine, limousine, élite, silhouette, bricolage, surplus, braille, parquet, ..), gli italianismi in francese, al di fuori della cucina e della musica, non sono poi così rilevanti. Va poi detto che la vicinanza delle 2 lingue porta a tradurre, a produrre un calco francese per espressioni italiane che in altre culture hanno dato luogo a prestiti (maxiprocès - maxiprocesso, parrain - padrino, pieuvre - piovra). In Francia più che un importante ingresso di nuove parole italiane, si riscontra un approfondimento nell'uso degli italianismi già esistenti (l'ammirazione condiscendente, legata ad un fondamentale sentimento di superiorità, che tende ad usare ogni forma straniera come elemento di esotismo, si sta trasformando in considerazione più rispettosa). Per i francesi, ma anche per gli inglesi o per altri stranieri che passano le vacanze in Spagna e in Italia risulta spesso difficile distinguere una parola spagnola da una italiana. In francese e in inglese, poi, alle parole italiane al singolare viene aggiunta una -s per formare il plurale: di fronte a loggias, marinas, scuderias e cafeterias (quest'ultima di origine ispanoamericana), non si può non comprendere e scusare la confusione.

La maggior parte degli italianismi penetrarono nello spagnolo nei secoli xvi e xvii, quando le relazioni fra i 2 paesi erano molto intense: troviamo perciò nel lessico spagnolo gli stessi italianismi legati all'italiano letterario, musicale, delle arti figurative che sono presenti nelle altre lingue di cultura già esaminate. Le nostre odierne esportazioni linguistiche in Spagna seguono soprattutto i canali commerciali, turistici e aziendali e riguardano quindi l'italiano parlato e termini di linguaggi settoriali. Si può quindi dire che i nostri scambi con lo spagnolo sono alla pari, anche se il crescente prestigio dello spagnolo come lingua internazionale e soprattutto il ruolo delle comunità ispano-americane negli Stati Uniti potrebbero in un futuro far crescere gli ispanismi in italiano.


IV.   Parole formate da più parole.

Quando si accostano le unità lessicali formate da più di una parola grafica bisogna constatare che manca una terminologia accettata dai più. La tradizione grammaticale suggerisce il termine locuzione seguito da un aggettivo che ne specifichi la funzione come parte del discorso: conto corrente è una locuzione nominale maschile, giallo oro è una locuzione aggettivale, in carpione può essere sia locuzione aggettivale (pesci in carpione), sia avverbiale (cucinare in carpione), mandar via è una locuzione verbale, lemme lemme è una locuzione avverbiale, dentro a una locuzione preposizionale e visto che una locuzione congiuntiva. In linguistica si sono coniati vari termini: lessie, unità lessicali superiori, polirematiche, lessemi complessi, sintagmi lessicalizzati, collocazioni ristrette. Qui, in un'ottica più attenta alla forma che al significato, si adotteranno i termini neutri e descrittivi di parole giustapposte e di sintagmi lessicalizzati. Qui ci interessano quei sintagmi formati da più parole che si comportano come se fossero una parola sola. Vengono detti sintagmi lessicalizzati, perché la lessicalizzazione è appunto quel procedimento per cui i rapporti sintattici fra parole si irrigidiscono, la combinazione da libera diventa fissa e il sintagma viene considerato alla stregua di un'unità di lessico. Gran parte dei procedimenti di composizione nel lessico italiano moderno si esplica attraverso la giustapposizione di parole, più che attraverso l'unione grafica dei componenti. Come nei composti, anzi più rigidamente, si osserva l'ordine delle parole nel sintagma che è per così dire all'origine del composto e si eliminano articoli e preposizioni. Le parole giustapposte sono formate di nomi e aggettivi e danno come esito solo nomi o aggettivi.

Quando la testa è un aggettivo si tratta quasi sempre di un aggettivo di colore modificato da un nome che è come un termine di paragone e si ottiene una parola giustapposta che ha la funzione di aggettivo (biondo cenere, bianco avorio).

I nomi giustapposti presentano al loro interno sia rapporti di coordinazione (studente lavoratore, odio amore, padre padrone), sia rapporti di subordinazione, alcuni chiarissimi (monte (delle) ore, banca (dei) dati, busta (della) paga, nave (di) appoggio, scuola (di) guida, posto (per l')auto), altri più complessi da individuare perché il secondo nome è assimilabile ad un termine di paragone o ad una relativa o ad un nome di predicato (parola chiave, nave scuola, governo ombra, bandiera ombra, effetto notte, teatro tenda, ragazza squillo, auto civetta).

Molto spesso nei nomi giustapposti uno dei 2 è un sostantivo straniero usato in funzione aggettivale (orchestra jazz, momento clou, stile liberty, autista kamikaze). In questi casi la giustapposizione può essere il calco di un composto straniero o può essere nata dal bisogno di chiarire un prestito straniero (così si può interpretare momento clou rispetto a clou da solo); talvolta la giustapposizione è diventata produttiva e autoctona, anche se è filtrata nella nostra lingua attraverso un originario uso aggettivale inglese (kitsch in tedesco è solo sostantivo e ha il suo aggettivo in kitschig; il giapponese kamikaze letteralmente significa vento divino).


IV.I.     Parole giustapposte e sintagmi lessicalizzati nei dizionari italiani.

Come affrontano le giustapposizioni i dizionari italiani (e al loro seguito i bilingui)??

La lessicografia inglese da tempo ha promosso alla dignità di lemmi formati da più parole molti fra i composti N + N maggiormente frequenti, oltre naturalmente a darne altri all'interno delle voci in cui si descrive l'uso aggettivale di una parola che è anche, con la stessa forma, un nome (caso frequentissimo in una lingua povera di morfologia come l'inglese).

La lessicografia francese, maggiormente aperta di quella italiana e spagnola ai lemmi formati da più parole, non presenta comunque fra questi un gran numero di parole giustapposte, quanto piuttosto sintagmi lessicalizzati e collocazioni ( "

I dizionari italiani più moderni danno conto delle giustapposizioni in modo indiretto, cioè segnalano l'uso come aggettivo (generalmente) invariabile sempre posposto dei nomi che hanno un certo numero di combinazioni (es: chiave, civetta, lampo, letto, madre, ombra, scuola, spia) e poi danno altri casi nella fraseologia della voce dedicata al lemma corrispondente alla prima delle parole giustapposte.

Il comportamento dei vari dizionari è abbastanza uniforme, ma ampi margini di variazione sono comprensibili nella descrizione di questa area del lessico oltre la parola, perché si tratta di fenomeni di norma linguistica che alcuni riconoscono già come standard e altri sentono ancora troppo legata ad un uso giornalistico o comunque non standard. Più compatti sono i dizionari italiani nei confronti sia dei sintagmi lessicalizzati nominali (ferro da stiro, campo da gioco, macchina da scrivere, spazzolino da denti, lente a contatto, gomma da masticare, giacca a vento, sacco a pelo, galleria d'arte, fuoco d'artificio), sia delle collocazioni ristrette nominali (conto corrente, piatto freddo, pronto soccorso, panna montata, grande magazzino): non sono mai lemmi, al massimo sono sottolemmi, ma quasi sempre sono mescolati agli esempi, ai modi di dire, agli usi figurati, ai proverbi. Quanto al trattamento di sintagmi lessicalizzati non nominali (mettere in moto, prendere in giro, dar fuoco, alla carlona, a bagnomaria, in ghingheri, sott'olio, nella misura in cui, in relazione a) i dizionari italiani sono in buona compagnia internazionale quando li trattano all'interno delle voci dedicate ad una fra le parole-lemma che li compongono (es: sotto ghingheri, carlona anche se tali parole da sole non esistono nei testi ma sono sempre accompagnate da in e alla). La questione dei lemmi formati da più parole è infatti sentita soprattutto per i gruppi nominali che sono numericamente di gran lunga i più numerosi. Soltanto la lessicografia angloamericana presta particolare attenzione, e ne fa sempre almeno dei sottolemmi, anche ai cosiddetti verbi frasali (phrasal verbs = verbi sintagmatici), cioè a quelle locuzioni verbali formate da verbo e preposizione o da verbo e avverbio (to look up, top ut off) così numerose in inglese. I verbi frasali o meglio le locuzioni verbali sono presenti, in numero ristretto, anche in italiano (buttar giù 2 righe, metter sotto un passante, metter su un'azienda, far fuori qualcuno), ma vengono nascoste dai dizionari fra le pieghe delle voci elefantiache dedicate a verbi tanto ricchi di usi quali appunto mettere, fare, mandare. Mentre i dizionari a stampa si adegueranno pian piano a registrare meglio le parole giustapposte, un grande aiuto viene dai dizionari consultabili tramite computer, perché questi sono corredati di programmi che permettono di individuare pacchetti di parole ovunque siano registrati, anche all'interno delle voci. In ogni caso una descrizione del lessico italiano che si voglia accurata e attuale dovrà d'ora in poi dedicare sempre più spazio sia alle combinazioni di parole che hanno un significato unitario, sia ai rapporti sintagmatici più frequenti fra parole e fra gruppi di parole. Le analisi effettuate dalla cosiddetta linguistica dei corpora, cioè dalla linguistica che si fonda su dati tratti da insiemi di testi disponibili su supporto elettronico, stanno infatti dimostrando che noi parliamo e scriviamo combinando pacchetti di parole più che parole singole e che le scelte lessicali appaiono molto più fisse e prevedibili di quanto finora non si fosse disposti a credere.


IV.II.     Giustapposizione e lessicalizzazione viste dai linguisti.    ( " Voghera)

Lo studio di questa area oltre la parola e al di qua della frase ha beneficiato moltissimo delle ricerche morfosintattiche (definizione prototipica di morfema e di parola, ordine delle parole, nominalizzazioni, ..), ma si sta rivelando molto più proficuo se affrontato in una prospettiva lessicologica che tiene conto del testo e della funzione pragmatica. Al termine lessema complesso si fa ricondurre tutti i risultati di fenomeni di lessicalizzazione, cioè i processi di rianalisi per cui i parlanti finiscono per percepire come una sola unità lessicale formazioni che in origine erano sequenze sintattiche. Ad esempio, congiunzioni e avverbi italiani sono spesso frutto di una lessicalizzazione avvenuta nel passaggio dall'italiano antico a quello moderno, e se molti, come poi che e là dove, sono diventati anche graficamente una parola sola (poiché, laddove), altri come se mai, per lo più oscillano ancora oggi tra forme grafiche unite (semmai, perlopiù) e disunite. La lessicalizzazione è un processo che presenta gradi diversi e anche origini diverse: i lessemi complessi si possono distinguere in 3 gruppi a seconda della loro composizione interna, del grado di coesione fra le unità che li compongono e del tipo di significato dell'unità complessa. Applicando ai lessemi complessi i criteri solitamente usati per identificare le unità lessicali (non-interrompibilità, non-mobilità dei costituenti, isolabilità o autonomia, pausa potenziale), la non-interrompibilità e la non-mobilità dei costituenti sono i 2 criteri che permettono di distinguere fra di loro i lessemi complessi. Se ne deduce che la grande maggioranza dei lessemi complessi è simile alle parole-parole, presenta cioè grande coesione interna. Esiste un certo grado di corrispondenza fra grado di coesione interna e categoria grammaticale del lessema complesso: i lessemi complessi interiettivi sono tutti non interrompibili, non mobili e senza flessione, mentre i lessemi complessi che sono nomi possono presentare tutti i gradi di coesione, dalla massima alla minima. I lessemi complessi composti da un sintagma verbale (render conto, prendere tempo) sono quelli che continuano ad avere più caratteristiche in comune con un sintagma che con una parola, perché si possono facilmente interrompere (rendere davvero conto, perdere molto tempo). I lessemi complessi formati da sintagmi nominali (luna di miele, macchina da scrivere, conto corrente) possono avere diversissimo grado di coesione interna, ma sono già più vicini alle parole, mentre i lessemi complessi che sono sintagmi preposizionali (in erba, a ruba) o che sono formati con avverbio + preposizione (prima di, insieme a) o con complementatori (in modo che) sono totalmente coesi e del tutto assimilabili ad una parola. La natura del significato del lessema complesso influenza anche la sua percezione come unità più o meno coesa: ad esempio i lessemi complessi che hanno la funzione di interiezioni, siano essi formati da un sintagma verbale (apriti cielo) o da sintagmi preposizionali (per carità) o da sintagmi nominali (mamma mia) sono tutti sentiti come formazioni molto coese. Circa la natura dei procedimenti di lessicalizzazione, si propone di distinguere fra:

lessicalizzazione additiva: caratterizzata dei lessemi complessi formati da sintagmi preposizionali e da strutture con complementatore: i componenti della struttura sintattica di partenza si uniscono gli uni agli altri senza alcuna modificazione

lessicalizzazione compositiva: caratteristica di lessemi complessi formati da sintagmi nominali e verbali; le strutture sintattiche di partenza sono strutture parzialmente mobili la cui cristallizazione nasce dalla compenetrazione di fatti sintattici e semantici " un buon esempio sono i nomi giustapposti con rapporti di vario tipo fra i 2 nomi componenti (fermo posta, posto auto), per i quali è fondamentale l'affermarsi di un significato unitario del composto


  1. LE ORIGINI DEL LESSICO ITALIANO.

I.   Mille e più anni di storia.

Il lessico dell'italiano, come il lessico di qualsiasi lingua naturale, non ha tanto una precisa data di nascita, quanto un periodo di incubazione durato qualche secolo. Fanno eccezione ovviamente le parole d'autore, anche se sono comunque poco numerose. Una difficoltà intrinseca nel dare un'età alle parole di una lingua sta nel fatto che la prima attestazione si deve basare su un documento e per i secoli anteriori al nostro i documenti possono essere solo fonti scritte. I volgari italiani, come gli altri volgari romanzi, all'epoca della loro formazione erano lingue orali, soltanto parlate, raramente scritte. Perciò quando una parola di un volgare compare scritta per la prima volta e tale data viene presa come sua prima attestazione, molto probabilmente è già stata usata nel parlato per varie generazioni. Infatti basta aprire una delle tante raccolte di carte latine volgareggianti dei secoli altomedievali per trovare forme volgari. Se si tiene conto delle forme volgari in carte latine, allora vi sono parole che si possono retrodatare anche di 6 o 7 secoli. La scarsità di frammenti interamente in volgare pervenutici non è quindi un riflesso della ristretta diffusione dei volgari italiani fra le genti d'Italia che, anzi, sicuramente parlavano quei volgari. Non è nemmeno puro frutto del caso (solo pochi documenti sarebbero giunti fino a noi, i più sarebbero andati distrutti), quanto conseguenza di un oggettivo ridotto uso scritto del volgare prima del 1200, uso riconducibile a testimonianze e postille in documenti notarili, al filone religioso, a conti di mercanti. I primi documenti di carattere poetico sono dei ritmi della seconda metà del xii° secolo e scritti di Rambaldo di Vaqueiras, poeta provenzale vissuto tra il 1155 e il 1210 circa (in particolare un componimento plurilingue in cui compare anche un volgare d'Italia).


I.I.   Le parole più antiche.

Volendo sapere quali sono le parole italiane più anticamente attestate fra quelle registrate nei dizionari, si può fare una ricerca nei testi di storia della lingua e nei dizionari che, oltre all'etimologia, danno la data di prima attestazione della parola. (La lista è parziale e limitata a parole che sono sopravvissute fino ad oggi).

Secoli ix-x. Parole dell'iscrizione della Catacomba di Comodilla a Roma e, secolo x, parole del Glossario di Monza, quali, ad esempio, non, a (preposizione), boce (voce), bevere, da (preposizione), dente, favella, vacca. Quanto al Glossario, presenta forme ancora ibride, in un latino in cui si inserisce qualche volgarismo schietto e quindi è incerta l'attribuzione ad un volgare italiano di parole la cui grafia latina coincide quasi completamente con quella di parole italiane.

Secoli xii e xii-xiii. Si contano circa 240 parole.

. Sono circa 80 parole.

Da quest'ultima data in poi il numero di parole che gli storici della lingua italiana possono ascrivere a date precise aumenta. La ragione di questa maggior precisione sta nell'aumento di documenti, anche letterari, di datazione sicura. Va ripetuto che molte delle parole menzionate quando appaiono nella loro prima attestazione hanno una forma diversa da quella odierna. Forme che appunto rivelano la regionalità dei volgari da un lato, l'influenza della grafia latina dall'altro. Non è stato considerato l'Indovinello Veronese, risalente al secolo viii-ix, che è in un latino ricco di volgarismi.


I.II.   Parole prese a prestito: lusso e necessità.

Spesso la lingua è considerata un bene, un patrimonio che si trasmette, si allarga, si rovina: questa omologazione appare particolarmente chiara per il lessico. Si parla di arricchimento e impoverimento del lessico, di eredità del greco e del latino, di prestiti lessicali. Le lingue antiche, morte o morenti, lasciano eredità, le lingue moderne invece fanno prestiti, quasi che, restate a corto di parole, potessero reclamare le parole prestate alle altre lingue moderne. In quest'ottica ci sarebbe da preoccuparsi, perché l'italiano nel corso dei secoli ha preso moltissimo dal francese e dallo spagnolo, più recentemente dall'inglese. Il termine prestito è tanto diffuso quanto fuorviante: invano si è cercato di sostituirlo con forestierismo e con gli -ismi specifici (francesismo, anglicismo, ..). Tutto quello che si è riusciti a fare è specificarne meglio la natura dal punto di vista della forma in prestito non adattato, prestito adattato o integrato e calco, e dal punto di vista della motivazione in prestito di lusso e di necessità. Nei paragrafi che seguono si ricorrerà moderatamente a questa seconda distinzione legata a criteri extralinguistici: il prestito di necessità è la parola straniera importata insieme a prodotti, processi o animali in precedenza sconosciuti, il prestito di lusso sarebbe quello superfluo, in quanto la lingua possiede già delle parole per indicare il tale oggetto, processo, .. e chi lo importa lo fa soltanto per distinguersi dagli altri, per sembrare più colto e moderno. La distinzione è pratica, ma pecca di semplicismo: infatti la necessità in senso assoluto di un prestito non esiste; ogni lingua possiede i mezzi per indicare nuovi oggetti o nuovi concetti senza ricorrere a parole straniere. Viceversa non tutti i prestiti di lusso sono assolutamente inutili, in quanto spesso la voce straniera può contenere delle sfumature diverse da quelle della parola indigena.


II.     La complessa eredità greca e latina.

Fra le lingue neolatine l'italiano è quella che più palesemente manifesta nel lessico la propria derivazione dal latino. Si tratta però di un'eredità complessa. Una prima questione è rappresentata dai rapporti fra greco e latino: la maggioranza delle parole di origine greca in italiano è arrivata attraverso il latino. Il greco è l'unica lingua straniera che la cultura romana abbia rispettato e il cui insegnamento sia stato diffuso nelle classi sociali elevate. Il greco è stata l'unica altra lingua di comunicazione internazionale, per così dire, all'interno dei confini dell'impero romano.


II.I.   Greco: classico e bizantino. Composti neoclassici.

Le parole d'origine greca ci sono arrivate in gran parte attraverso il latino, però una buona metà sono segnalate come voci dotte. Gli studiosi europei, soprattutto dall'Umanesimo in poi, recuperarono voci direttamente dai testi greci, quando questi, in seguito alla caduta di Costantinopoli, furono diffusi dagli esuli in tutto l'Occidente. Lo studio del greco divenne più comune fra gli intellettuali e gli scienziati che si rivolgevano al greco per formare termini specialistici. Le parole di origine bizantina sono invece molto più ridotte. Parole che un dizionario dà come derivate dal greco bizantino, sono da un altro classificate come greco tardo; parole che i bizantini hanno adattato dall'arabo o dal persiano vengono ricondotte all'etimologia più lontana; ma anche tenendo conto di queste variazioni, appare evidente che le principali porte d'ingresso del greco nell'italiano restano i grecismi gia presenti nel latino e i vocaboli dotti. Non trascurabile è infine l'apporto che il greco dà tuttora alla formazione di nuove parole italiane attraverso affissi ed elementi di composizione, detti anche neoclassici, proprio in omaggio al fatto che sono quasi tutti di origine greca e latina. Numerosissime sono le parole formate da composti di origine greca. Allo-, atropo-, archi- o arci-, astro-, auto-, bio-, eco-, etero-, filo-, macro-, micro-, tele-, per non citare che gli elementi iniziali più noti. Se poi consideriamo anche gli elementi terminali come -crazia, -filia, -fobia, -fobia, -logia, -metria, -logo, possiamo affermare che la presenza del greco nelle parole composte italiane, accolte da un dizionario generale in un volume, va molto al di là delle 3.000 unità. Forse la nostra lingua accoglie relativamente bene un gran numero di nuovi composti con elementi cosiddetti neoclassici e talvolta li usa anche al di fuori dei linguaggi specialistici (paninoteca, tangentopoli) proprio perché ospita da secoli molte parole d'origine greca (considerate più come parole difficili dal parlante comune italiano che non come parole estranee, quali invece appaiono al parlante comune inglese). Il fenomeno è comunque paneuropeo e la vitalità del materiale lessicale greco perdura proprio perché molti elementi lessicali sono ormai degli europeismi: rimbalzano, come già nei secoli passati, dal francese o dall'inglese o dal tedesco all'italiano e attecchiscono tanto meglio quanto più ci sono familiari.


II.II.     Quale latino??

Considerando che il latino è ancora oggi lingua ufficiale della Chiesa cattolica, si può dire che documenti in lingua latina sono stati prodotti lungo un arco di più di 2.300 anni durante i quali il latino, come tutte le lingue naturali, è cambiato. L'italiano è stato esposto al latino in diversi periodi e ha inglobato parole provenienti da latini diversi. Qui ci si limiterà a fornire un quadro schematico per quanto concerne l'eredità lessicale latina. L'Appendix Probi, una lista di 227 parole o forme o grafie non corrispondenti al buon latino classico e perciò segnalate da un maestro del iii-iv secolo all'attenzione dei suoi allievi perché le evitassero, viene considerata una testimonianza del latino volgare, una raccolta di forme che poi hanno dato luogo agli sviluppi romanzi. Il maestro raccomandava di usare auris e non oricla, oculus e non oclus, viridis e non virdis, ma tutti noi riconosciamo nelle forme condannate quelle più vicine a orecchio, occhio, verde. Una buona parte del lessico italiano si è dunque formata a partire dal latino volgare, dal latino parlato e in particolare dal caso obliquo, non dal nominativo. In una buona parte dei casi l'etimo, cioè la parola del latino volgare che avrebbe dato origine a quella italiana, non è documentabile se non attraverso congetture. Si ritrovano forme simili nei vari volgari derivati dal latino e si ricostruisce una forma in latino volgare. Queste forme sono asteriscate appunto per distinguerle da quelle documentate in testi scritti, in graffiti murali, decifrate su lapidi, su vasi, monili o altre suppellettili. Spesso l'etimologia ricorre anche alla contaminazione col francese e col provenzale o con un dialetto per ricostruire l'origine di una parola italiana (es: magione da mansionem attraverso il francese maison). Come si è visto per il greco tardo rispetto al bizantino, anche per le etimologie riconducibili al latino medievale non c'è unanimità. Dai secoli xiv e xv in poi il ruolo del latino viene costantemente eroso dall'affermarsi dei volgari, fino ad assumere la funzione di lingua dei dotti, diventando, come il greco, un serbatoio di materiale lessicale per terminologie scientifiche. Nel coniare parole derivate dal latino, le persone colte si rifanno ai testi scritti e così abbiamo coppie in cui il nome è arrivato dal latino attraverso la tradizione orale, e quindi ha subito tutti i mutamenti fonetici del passaggio dal latino alle lingue romanze, mentre l'aggettivo è di coniazione dotta (oro-aureo, pioggia-pluviale, albero-arboreo, ghiaccio-glaciale, mese-mensile, occhio-oculare). Il fenomeno, detto allotropia, ha avuto anche come risultato coppie, e più raramente triplette, di parole appartenenti alla stessa classe grammaticale e allo stesso genere (angustia-angoscia, area-aia, circolo-cerchio, clausura-chiusura, estraneo-straniero, flebile-fievole). Non sempre il lasso di tempo che separa la comparsa dell'allotropo dotto dall'attestazione di quello di tradizione diretta è grandissimo; spesso sono forme che si affermano contemporaneamente in ambiti diversi. Non sempre il termine di derivazione dotta è più raro di quello di derivazione diretta, infatti se si pensa a giustizia e giustezza, a furia e foia, a fuga e foga, è sicuramente la parola d'origine dotta ad essere oggi più comune. Soprattutto a partire dalla seconda metà del 700 il latino influenza i linguaggi scientifici: è largamente rappresentato nelle classificazioni linneane, in nomi di botanica e zoologia, in termini di chimica, della medicina e della biologia. Molte parole composte sono costituite con elementi lessicali latini, e gli elementi di composizione derivati dal latino sono numerosi, benché non così numerosi come quelli di derivazione greca: ambi-, bi-, cerebro-, -dotto, ego-, equi-, -ficio, -grado, milli-, multi-, pluri-. Video- è un elemento di composizione derivato dal latino, ma giunto in italiano attraverso l'inglese. È necessario sottolineare il fatto che nelle etimologie di composti con elementi di composizione latini la latinità del materiale lessicale non appare esplicitamente. Inoltre la qualificazione voce dotta sta ad indicare che la parola non è arrivata in italiano per tradizione diretta. Va infine sottolineato che fra i prestiti non adattati i più numerosi nel lessico italiano sono, dopo quelli inglesi e francesi, proprio i latini.


III.   Il ruolo delle lingue germaniche.

I germanismi hanno influito in modo notevole sulla formazione della lingua italiana nel Medioevo, ma la loro azione di superstrato è stata un po' ridimensionata dagli studiosi del nostro tempo. Sono detti paleogermanismi quelli che risalgono ai rapporti tra Romani e popolazioni germaniche anteriormente alla caduta dell'impero romano e che quindi sono passati nei volgari attraverso il latino volgare. La maggior parte dei germanismi è però entrata in seguito alle invasioni; in particolare hanno lasciato tracce linguistiche i Goti, i Longobardi e i Franchi, ma non è semplice dire con precisione da quale fra questi popoli certe parole ci sono arrivate.

Sono di origine gotica parole che riguardano la sfera militare e la sfera dell'abitazione e degli attrezzi.

L'influsso franco è difficile da individuare, perché quando i Franchi penetrarono in Italia erano insediati in Gallia da più di 2 secoli, erano perlopiù bilingui e non si può dire che la loro fosse un'invasione germanica. È arduo stabilire se una parola è arrivata al volgare italiano dal franco o dal francese.

I Longobardi, essendo il popolo che più a lungo ha dominato in Italia, hanno lasciato tracce notevoli nei dialetti e nelle toponomastica.


III.I.     Tedesco. Olandese. Lingue scandinave.

I rapporti fra Italia e Germania sono frequenti dal xiv al xviii secolo, specie nelle terre di Venezia. Lo dimostra fra l'altro la produzione di lessici bilingui: anzi, nel 1477 viene stampato per la prima volta al mondo un lessico bilingue ed è proprio quello veneto-bavarese. L'apporto di tedeschismi al lessico italiano è però ridotto. Nel 700 e nell'800 entrano a far parte del lessico italiano termini della mineralogia tedesca; si affermano alcuni termini dell'ambito gastronomico, ma la maggioranza dei prestiti dal tedesco resta non adattata se non per l'iniziale resa minuscola. Da segnalare una serie di calchi fra 800 e 900 che riguardano termini di filosofia e cultura (imperativo categorico, plusvalore, psicanalisi, super-io, superuomo). Mitteleuropeo è un'interessante combinazione di calco, adattamento e prestito. Nel nostro secolo sono da segnalare termini chimici, biologici, filosofici costruiti quasi sempre su basi greco-latine. Numerosi lemmi di forestierismi tedeschi portano anche l'indicazione della pronuncia, chiara spia della loro natura di prestiti non adattati.

Le voci derivate dall'olandese sono meno numerose e sono perlopiù voci di marina e pesca (babordo, baccalà, stoccafisso, scialuppa), voci legate ai domini coloniali in Africa (boeri, boscimani) e voci come gin, golf, bluff, bitter, iceberg, pompelmo, diga.

Dal danese ci sono arrivati lego, i prefissi atto- e femto-, e parole che derivano da nomi propri di scienziati danesi.

Dal norvegese e dall'islandese abbiamo importato geyser, fiordo, sci, slalom e dallo svedese tungsteno, nickel, oltre ad una serie di parole legate a nomi propri di luogo e persona.


IV.   Il lascito dell'arabo e del persiano.

In Sicilia la dominazione araba durò abbastanza a lungo, ma gli arabismi tipicamente siciliani sono scarsamente presenti in italiano. Più incisivo fu il ruolo svolto dai contatti fra mondo arabo e repubbliche marinare, Pisa, Genova, Venezia. Alcune parole bizantine entrate in italiano sono, come si è detto, di origine araba. Inoltre parecchi arabismi penetrarono nelle cultura europea attraverso le traduzioni dall'arabo in latino di testi d'astronomia, matematica, medicina e attraverso lo spagnolo. Quando un arabismo italiano inizia con al- (un adattamento dell'articolo arabo) è molto probabilmente giunto attraverso lo spagnolo o attraverso il latino scientifico spagnolo. Dall'arabo derivano termini marinareschi e commerciali (arsenale, ammiraglio, aguzzino, scirocco, libeccio, dogana, magazzino, tariffa), nomi di piante (albicocco, carciofo, limone, melanzana), parole come assassino, cotone, facchino, fachiro, marzapane, ragazzo, risma, quintale, sceriffo, sultano, zecca, zerbino, parole dall'astronomia e dalla matematica (almanacco, algebra, algoritmo, auge, cifra, zero), dalla chimica e dalla farmacia (alchimia, alcool, elisir, sciroppo, talco). La grande maggioranza degli arabismi è adattato perché penetrato nella nostra lingua nei primi secoli della sua formazione.

Quanto al persiano i prestiti sono meno numerosi (arancio, bazar, bronzo, cachi, carovana, ciabatta, gelsomino, mago, mummia, pascià, sarabanda, scacco, scarlatto, scialle, scimitarra, spinacio, talismano). Molti termini persiani sono giunti in italiano attraverso il turco (chiosco, divano, tulipano).


V.     L'influenza del francese e del provenzale.

Fra le lingue moderne il francese è indubbiamente quella che più ha influenzato la lingua italiana sia quantitativamente, sia nel tempo. Il 700 fu il secolo di massimo infranciosamento, per usare il termine negativo con cui i puristi indicavano l'influenza della lingua d'oltralpe sulla nostra. Grazie alla durata della sua influenza riesce ancora a vincere largamente il confronto con l'angloamericano, che è penetrato massicciamente soprattutto negli ultimi 2 secoli. La presenza di parole inglesi o americane nel lessico italiano è più vistosa perché più aliena e recente e quindi almeno graficamente non adattata. Inoltre la fonetica è data di una percentuale più bassa di prestiti francesi, a riprova dell'acclimatazione delle parole francesi.


V.I.   Francese antico. Provenzale.

La determinazione della reale origine delle parole che dalla Francia vennero ai volgari italiani fino agli inizi del 300 è piuttosto complessa. Principali canali di diffusione furono:

la via scritta (attraverso il latino medievale)

la presenza di guarnigioni franche e di duchi franchi in Italia settentrionale dopo la sconfitta dei Longobardi

il regno dei Normanni nell'Italia meridionale

le crociate

i pellegrinaggi

gli scambi commerciali

il prestigio della letteratura d'oltralpe

Di come sia difficile individuare l'apporto linguistico dei Franchi rispetto a quello delle altre popolazioni germaniche stanziatesi in Italia abbiamo già detto. Il lunghissimo arco di tempo, più di 1.000 anni, nei quali parole provenienti dalla Francia sono arrivate nel lessico italiano comporta una necessaria distinzione fra

quanto ci è arrivato dal francese antico, prima del grande cambiamento verificatosi nella lingua francese a partire dal xiv secolo

quanto ci è arrivato dal francese moderno

Altrettanto doveroso è distinguere i provenzialismi, quando è possibile. Fra le parole penetrate dal francese prima del 300 un certo numero riguarda la vita feudale in cui cavalli, caccia col falcone, armi e tornei avevano grande prestigio. Fra le parole del lessico comune ricordiamo: abbandonare, agio, dozzina, gioia, leggero, malvagio, mangiare, maniera, mestiere, motto, reame, roccia, vantaggio. Colpisce la frequenza dei suffissi -aggio e -iere: derivati dai francesi -age e -ier, sono diventati suffissi produttivi in italiano, indipendentemente dalle parole francesi in cui compaiono, usati per creare derivati anche da temi non francesi (volantinaggio, tangentiere). La penetrazione di elementi di morfologia derivativa, e non solo di parole isolate, è una delle spie più forti di influenza di una lingua su un'altra, perché si oltrepassa il confine dell'episodico arricchimento lessicale per entrare nel sistema delle regole produttive.

Potente veicolo di parole di origine sicuramente provenzale è stata la poesia (della Scuola siciliana, ma non solo). Si pensi a beltà, coraggio, donzella, noia, orgoglio, sonetto, tenzone; ma anche a termini come affannare, ambasceria, astuccio, grattare, leale, lusinga, pensiero, sostegno, targa, traboccare, truffa, urtare, ventaglio, viaggio. Fra i nomi di alimenti il provenzale ci ha dato merluzzo, pagnotta. Attraverso il piemontese è arrivato cicchetto (bicchierino).


V.II.     Francese moderno.

In Italia dalla Francia nel xiv e xv secolo arrivano pochi oggetti e nomi (burro, mostarda, cuscino, frangia, pattino). Penetrano in italiano del xv e xvi secolo vocaboli attinenti la vita militare, anche se in questo campo in quest'ultimo secolo il francese prende molto anche dall'italiano. Se il 500 è il secolo del predominio spagnolo, i francesi non mancano di influire sulla cucina, sulla moda, sulla vita sociale (confettura, crema, abbigliamento, passamano, biglietto, mughetto, racchetta). Nella seconda metà del 600 il predominio spagnolo comincerà ad offuscarsi e l'influenza francese ad aumentare per giungere all'invasione settecentesca. Entrano in italiano appunto nella seconda metà del secolo xvii termini militari e della diplomazia o dell'amministrazione (abdicare, alleanza, arruolamento, brigadiere, carabina, carabiniere, colpo di stato, garantire, indennizzare, plotone, caserma, stato maggiore). Il costume italiano vede l'affermarsi della parola moda, di parrucca e parrucchiere, ovatta, tappezzare, ammobiliare, calesse, pipa; i salotti vedono affermarsi le persone brillanti, ben portanti, i begli spiriti; con buon senso arrivo anche libertinaggio. L'influenza del francese si nota soprattutto per la penetrazione di un gran numero di locuzioni (far la corte, darsi la pena, mettere sul tappeto, tastare il polso, valere la pena) e di parole che indicano qualità, processi, relazioni (allarmare, azzardare, controbilanciare, rimarcare). Nel 700 la cultura italiana è nutrita di libri francesi in originale e in traduzione; lo studio del francese è comunissimo fra i ceti abbienti e i dizionari bilingui assumono dimensioni e qualità ragguardevoli. Fra le parole francesi più familiari entrate nel lessico italiano nel xviii secolo abbiamo nomi di colore (blu, marrone), di mobili (comò, sofà), cravatta, ragù, besciamella, bignè, croccante, fanatismo, neologismo, miliardo, provvisorio; locuzioni (colpo d'occhio, tagliar corto, aver l'onore); tutto il lessico politico portato dalla Rivoluzione francese (federalismo, incostituzionale, terrorismo). Nell'800, passata la bufera napoleonica, restò nei regni restaurati della penisola gran parte della terminologia amministrativa e burocratica francese che continuò a fornire prestiti per tutto il secolo. Numerosi prestiti, più o meno adattati, arriveranno dalla vita politica, dalla gastronomia, dall'abbigliamento e dall'arredamento. Altri francesismi arrivano in italiano dai campi della fotografia, della stampa, dell'economia, dello sport, della medicina, perfino della geologia e mineralogia. Nel secolo xx il francese resta la lingua straniera più conosciuta dagli italiani e più studiata nelle scuole fino agli anni 70, ma il suo prestigio e la sua forza di penetrazione lessicale nell'italiano diminuiscono per lasciare il posto all'angloamericano. Forte resta l'afflusso di francesismi dalla moda e dalla cucina: gli adattamenti sono anteriori alla metà del secolo; l'adattamento recente è raro, e si verifica solo quando la grafia francese sembra proprio troppo diversa dalla pronuncia (fusò, italianizzazione del francese fuseaux). Le commedie italiane del 700 e dell'800 prendono in giro chi vuol far sfoggio di francese e ne storpia la pronuncia, ma negli ultimi decenni, per effetto della sempre minore conoscenza del francese presso la popolazione italiana si assiste non solo ad una progressiva italianizzazione della pronuncia dei prestiti graficamente non adattati, ma addirittura a ridicoli casi di parole francesi pronunciate come se fossero inglesi.


VI.   L'influenza dello spagnolo e del portoghese.

Nel Medioevo dalla penisola iberica arrivano all'italiano soprattutto arabismi per il tramite dello spagnolo. È però nel xvi e xvii secolo che la grande maggioranza di ispanismi entra in italiano e nei dialetti: sono termini riguardanti la vita sociale e militare: le danze, le vesti, la marineria (accudire, appartamento, baciamano, brio, disinvoltura, doppiare, etichetta, flotta, guerriglia). Attraverso lo spagnolo sono arrivati anche i nomi di oggetti, piante e animali del Nuovo Mondo (amaca, cacao, caimano, canoa, cioccolata, coca, condor, coiote, lama, mais, patata, savana, uragano). Più recentemente, negli ultimi 2 secoli, l'italiano ha accolto parole provenienti soprattutto, ma non solo, dallo spagnolo parlato in America latina (baraonda, bolero, bongo, caramella, compleanno, disguido, corrida, torero, flamenco, maraca, poncho, rumba, siesta, sigaro, tango). Gran parte di questi prestiti non sono adattati graficamente grazie alla notevole vicinanza fra le 2 lingue. Un numero consistente di ispanismi è penetrato negli ultimi tempi, quando ormai non si adatta più il prestito, almeno dal punto di vista grafico (di conseguenza se ne dà la pronuncia).

Dal portoghese abbiamo tratto molto meno (albino, barocco, caravella, casta, commando, fazenda, marmellata, veranda).

Dal brasiliano ci sono arrivati: samba, telenovela, viado. Come lo spagnolo, il portoghese è stato il tramite di penetrazione nelle lingue europee di nomi e animali, oggetti, piante del continente americano, africano e dell'Oriente (ananas, bambù, banana, cobra, cocco, macaco, mandarino, pagoda, piragna, tanga, tapiro, tifone, tucano, zebra).


VII.   L'influenza dell'angloamericano.

Fino al xvii secolo gli anglicismi in italiano sono quasi inesistenti: non a caso il primo dizionario bilingue italiano e inglese fu pubblicato in Inghilterra per gli inglesi, che allora studiavano l'italiano e il francese come lingue di cultura. Nel 700 comincia l'anglomania di molti intellettuali italiani e importiamo soprattutto termini di politica e di costume (coalizione, commissione, convenzione, mozione, opposizione, conformista). Entra il plaid e il color fumo di Londra. Nell'800 aumenta il numero delle traduzioni dall'inglese e se da un lato prevalgono gli adattamenti, dall'altro cominciano ad affermarsi prestiti non adattati (leader, dandy, jersey). Compare il termine sport e in seguito gli sport furono proprio veicolo privilegiato di anglicismi (tennis, derby, match). Fra i cibi e le bevande si affacciano curry, brandy, whisky, sandwich, rostbif (adattamento di roast-beef), così come la cucina vegetariana. Dal giornalismo e dalla vita americana vengono reporter, intervista, revolver, cowboys, Far West. Nel secolo xx si istituiscono cattedre universitarie di inglese, la lingua è sempre più conosciuta e se notevole è il numero di anglicismi che penetra prima, con la seconda Guerra mondiale si ha una crescita esponenziale. Sciuscià (dall'inglese d'America shoe-shine = lustrascarpe) resta un caso isolato: non si adatta più la pur ostica grafia inglese. Il cinema, la musica rock, oltre naturalmente alle scienze, sono veicoli importanti presso il grande pubblico.


VIII.     L'apporto di altre lingue.

Dal mondo slavo non sono arrivati grandi apporti al lessico italiano.

Dal russo ci sono arrivati nei secoli passati, oltre all'etnico russo, le parole zar, steppa, rublo, balalaica. Mammut ci arriva attraverso il francese e quindi ha una grafia italiana adattata sulla traslitterazione dall'alfabeto russo compiuta dai francesi. Fra le parole entrate in italiano in questo secolo, molte si riferiscono all'organizzazione dello stato sovietico (apparato, bolscevico, menscevico, intellighenzia, kalashnikov, presidium, pogrom, stacanovismo, vodka). Più recenti gulag, cosmonauta contrapposto all'americano astronauta, sputnik, e degli ultimi decenni perestroica. Come si può notare, a parte pochi termini che hanno acquisito anche significati estesi non più inerenti alla società russa, la grande maggioranza dei prestiti dal russo riguarda oggetti, istituzioni, avvenimenti russi. Nella seconda metà del secolo i prestiti sono arrivati in italiano attraverso traslitterazioni fatte dalla stampa di lingua inglese e quindi le k e le h sono aumentate; inoltre i dizionari italiani hanno adottato grafie più vicine alla pronuncia russa. Nei forestierismi non adattati le parole russe non sono molto numerose.

Dal serbocroato i prestiti più famosi sono stravizio (mutato sia nel genere che nel significato rispetto alla parola originaria), vampiro (giuntoci però tramite il tedesco e il francese), crucco.

Dal polacco vengono le parole mazurca e sciabola; dal polacco, ma attraverso il francese, viene il nome del dolce babà; attraverso tedesco e francese è penetrato calesse.

Dal ceco ci sono giunte polca e robot.

Dall'ungherese, oltre all'etnico magiaro, abbiamo tratto gulasch (in grafia tedesca).

Dal finlandese sono arrivati i termini sauna e renna, quest'ultimo attraverso tedesco e francese.

Il turco, come abbiamo già visto, è stato il tramite attraverso cui ci sono giunte parole persiane e arabe (caffè, sorbetto), ma i rapporti fra Venezia e la Turchia erano numerosi. Termini come balcanico, bergamotto, bricco, caciucco, colbacco, caviale, divano, harem, tartaro, turbante, yogurt (attraverso il veneziano) e, attraverso il francese, odalisca, sciacallo, dimostrano che da questa lingua non ci sono arrivati solo nomi di autorità turche come pascià e l'etnico turco.

Dall'ebraico sono passate nella liturgia cristiana attraverso la traduzione latina della Bibbia parole come alleluia, amen, belzebù, cabala, cherubino, messia, osanna, pasqua, rabbino, fariseo, sabato, satana, serafino. A personaggi ed episodi delle Sacre Scritture sono legate parole di uso comune come babele, eden, bacucco, beniamino, giuda, golia, sansone, salomone, manna, matusalemme. Fasullo, inghippo sono voci giudeo-romanesche e marachella è dall'ebraico attraverso il triestino. Parole come sionismo, kibbutz sono entrate più tardi in italiano.

Dal sanscrito abbiamo tratto, oltre alla stessa parola sanscrito, i termini bramino, maragià (attraverso il francese), pranoterapia e parole che il caso o l'interesse per le religioni orientali hanno resto quasi popolari (svastica, guru, karma, nirvana, yoga, mantra, Harekrisna, kamasutra).

I rapporti con la Cina sono antichi, ma l'apporto lessicale cinese alla nostra lingua è trascurabile e perlopiù indiretto, cioè attraverso le lingue delle potenze coloniali (cincin attraverso l'inglese). A parte casi rari come tè, tao, in cui la grafia è assimilata a quella italiana, la traslitterazione degli ideogrammi è fatta sul modello delle traslitterazioni francesi prima, inglesi poi: chow-chow, kung fu, litchi, tai chi chuan, yin, yang, ginseng, ketchup, pidgin necessitano tutte di un'indicazione di pronuncia nei dizionari.

Solo ultimamente con la grande espansione economica del Giappone e una maggior conoscenza del paese, grazie alla presenza di turisti giapponesi in Italia e di scambi commerciali, si assiste ad un uso esteso, cioè non legato a referenti nipponici, di parole giapponesi: samurai, harakiri, kamikaze sono diventati sinonimi coloriti di guerriero, suicidio, persona spericolata; bonsai sta diventando un aggettivo invariabile sempre posposto come mini o baby per indicare qualcosa in formato ridotto. Altrimenti la penetrazione di parole giapponesi nel lessico italiano è legata a piante, oggetti e usi del Giappone (soia, chimono, sakè, geisha, scintoismo, sumo, zen). I nomi delle varie arti marziali e dei loro praticanti e attrezzi si sono andati diffondendo a partire da jujitsu, per proseguire con karaté, judo, judoca, judogi. Più recentemente, complice anche la diffusione di programmi televisivi (cartoni animati e serie televisive ambientate nell'antico Giappone), sono penetrati più stabilmente nel lessico italiano insieme a shogun, ninja, origami, sushi.


IX.   L'apporto dei dialetti.

Nei precedenti paragrafi abbiamo accennato al fatto che determinate parole dell'italiano hanno la loro prima attestazione in una forma volgare più vicina a forme che noi oggi troviamo nei dialetti italiani che non al lemma registrato nel dizionario italiano. Inoltre abbiamo fatto notare che certe parole di lingue straniere sono arrivate all'italiano per il tramite dei dialetti. Tratteremo qui delle parole che sono entrate nel lessico italiano da un dialetto italiano, ovvero che presentano come origine etimologica un dialetto e accosteremo anche la questione dell'uso regionale di un termine. Se si vanno a controllare queste voci, alcune hanno un'etimologia latina o araba presunta e sono termini usati solo in dialetto. Altre invece sono parole normali (con anche un possibile significato figurato) e in più hanno un altro significato delimitato dall'etichetta pseudogeografica. Paragonabile a questo secondo uso pseudogeografico, c'è nei dizionari l'attribuzione di etichette come regionale, dialettale, meridionale, settentrionale. Qualche esempio: caligine è regionale per fuliggine; è regionale il modo di dire non esiste per non è possibile che; tubista, camola, pedalino sono geosinonimi o sinonimi regionali di idraulico, tarlo, calzino. Cocuzza è meridionale per zucca; lumare è settentrionale per adocchiare; pantegana e soffoco (sostantivo) sono dialettali. Queste etichette vogliono dire che le voci hanno una derivazione dialettale o di una certa area, che in certi significati sono usati solo in quelle aree geografiche oppure che, qualora siano usati al di fuori di certe aree o di certi testi, danno un colorito meridionale, dialettale, toscaneggiante, .. al discorso di chi li usa. Sono quindi etichette che assommano molte indicazioni, più spesso di stile che di provenienza etimologica o di limitazione geografica dell'uso. La forte valenza stilistica si deduce dal fatto che esse sono spesso accompagnate dalle etichette arcaico e familiare. Il toscano non è un dialetto come gli altri: i suoi numerosi prestiti parlano chiaro. È perfino da discutere se sia giusto dire che è nei dizionari in quanto dialetto. Il gran numero di toscanismi sta nei dizionari per via delle raccolte di autori toscani dell'Accademia della Crusca e perché il fiorentino parlato è alla base della proposta manzoniana. Allo stesso modo l'aumento di voci dialettali siciliane o venete nei dizionari italiani è diretta conseguenza di una notorietà dovuta a film, a comici televisivi e a scrittori che le diffondono. Fra i dialetti che più figurano nelle etimologie di parole del lessico italiano vi sono il romanesco, il ligure e il genovese, il piemontese, il veneto e il veneziano, il lombardo e il milanese, il napoletano.

Voci di origine veneta: branzino, naia, pantegana, pastrocchio, pettegolo. Di origine veneziana: ciao, ghetto, lazzaretto, spago.

Dal genovese arrivano: abbaino, mugugno, piovasco, scoglio, trenetta. Dal ligure provengono: acciuga, monegasco.

Il piemontese ha lasciato voci come: cicchetto, gianduia, grissino, pelandrone.

Il romanesco ha dato al lessico italiano: battona, benzinaio, caciare, capoccia, frocio, mondezza, pacioccone, pennichella, puzzone, sgamare, stranito, supplì, tassinaro, zompo.

Dal milanese sono giunti: bigino, borlotto, mantovana, panettone, stracchino, tampinare. Voci lombarde sono: bauscia, farfugliare, imbesuito, mascarpone, menagramo, portineria, ringhiera, scartoffia.

Dal napoletano il lessico italiano ha tratto: arrapare, carosello, razziata, fesso, guaglione, guappo, impapocchiare, piccirillo, pummarola, sceneggiata, scugnizzo, sommozzatore, vongola.

Dal siciliano vengono: intrallazzo, mafia, picciotto.


X.     Prestiti non adattati.

Nell'800 si sosteneva che i prestiti dalle altre lingue adattati erano ormai parole italiane a tutti gli effetti. Dei prestiti non adattati si sosteneva invece che potevano essere adoperati nelle opere da scrittori italiani, ma questo non voleva dire che si sarebbero registrate nel vocabolario della lingua italiana, il quale è il generale elenco delle parole italiane. Ora non è più così: i dizionari d'italiano accolgono molti forestierismi non adattati (basta considerare quanto sono aumentate le voci che iniziano per h, j, x, y, w). I dizionari non sono più i censori della buona lingua, sono anche spettatori degli sviluppi linguistici della società italiana e si sentono in dovere di registrare e spiegare le parole straniere che sono usate nei giornali o in certi manuali scientifici. Ricapitolando i prestiti non adattati più numerosi sono nell'ordine inglesi, francesi, latini, spagnoli, tedeschi, giapponesi, greci, russi, portoghesi, arabi e cinesi. La grafia non adattata comporta problemi di pronuncia, ma questi sono talvolta ignorati qualora la grafia sia molto simile all'italiana. I prestiti non adattati inglesi sono doppiamente vistosi perché costituiscono anche il gruppo più numeroso di lemmi multilessicali: il gruppo delle locuzioni inglesi, cioè dei lemmi che sono formati da più di una parola, è il più cospicuo, seguito da quello latino e dal francese. Caratteristica dei lemmi multilessicali latini è che ne fanno parte molte locuzioni avverbiali e/o aggettivali o frasali, mentre le locuzioni inglesi e, in misura minore ma ugualmente considerevole, le francesi sono soprattutto locuzioni nominali. Curiosa in questa corsa al prestito è la coniazione di pasuedofrancesismi (pre-maman), pseudoanglismi (footing, smoking) e pseudoispanismi (espadrillas). Certo impressiona constatare che le parole inglesi non adattate superano di gran lunga i toscanismi ed è facile prevedere che il numero dei primi aumenterà, mentre il numero dei secondi diminuirà o, al più, resterà stabile. Nei dizionari specialistici i tecnicismi inglesi sono molti, ma le opere lessicografiche in cui i prestiti non adattati angloamericani sono in numero preponderante sono i dizionari di neologismi. Ultimamente il problema dei prestiti è così sentito che si pubblicano dizionari di forestierismi per così dire universali o relativi al solo francese o al solo inglese.


XI.   Dal nome proprio al nome comune. Etimologie onomatopeiche.

Si affronterà in questo paragrafo 2 filoni di nascita delle parole che sono comuni all'italiano come alle altre lingue naturali perché più motivate e trasparenti.

La deonomastica, cioè lo studio dei modi in cui i nomi propri di persona o di luogo danno origine a nomi comuni, ha individuato 3 procedimenti alla base del passaggio:

l'antonomasia: procedimento per cui un personaggio storico o mitico o letterario o un'opera vengono assunti a simbolo di una professione o di una qualità o di una vicenda e il loro nome proprio diventa il nome comune per indicare quella professione o una persona o una vicenda che manifesta la tal qualità*

la metonimia: si ha nel caso del battezzare col nome di qualcuno o di una località specie animali o vegetali o minerali prima sconosciuti, sostanze o macchine nuove, unità di misura di fenomeni fisici

l'ellissi §

Dal mondo classico, biblico ed evangelico abbiamo: adone, atlante, barabba, beniamino, caino, cicerone, giuda, maddalena, madonna, matusalemme, mecenate, narciso, odissea, sosia, venere. Più recenti e di varia provenienza sono: casanova, cenerentola, corea, disneyland, figaro, galateo, giamburrasca, lolita, otello, paparazzo, rampo, siberia, tartufo, vespasiano, waterloo. Mentre alcuni sono internazionali, altri sono peculiari dell'italiano come i manzoniani azzeccagarbugli, perpetua o come caporetto.

Casi quasi sistematici di passaggio dal nome proprio al nome comune si hanno per i nomi di formaggi e vini che traggono origine dal nome del luogo in cui vengono (o venivano) prodotti: marsala, barolo, gorgonzola, taleggio, asiago. In questo caso di potrebbe vedere l'ellissi di vino/formaggio di §.

In altri casi il nome dell'inventore o di un famoso artigiano o di un autore si lega ad un tipo di prodotto o procedimento: biro, bignami, sandwich, silhouette, pullman, morse. Un sottoinsieme abbastanza compatto è costituito dalle unità di misura (hertz, ampère, gauss, watt), praticamente tutti prestiti salvo fermi e volt dal nome di A. Volta.

Dal punto di vista morfologico i nomi propri diventati comuni se sono italiani o italianizzati possono essere messi al plurale (i mecenati), ed eventualmente alterati (narcisetto); se stranieri restano invariabili (i rambo, i figaro). Quanto ai nomi di vini e formaggi restano al singolare perché nomi non numerabili e se vengono volti al plurale (3 baroli) acquistano il significato di 3 qualità/bottiglie/marche di barolo.

Un certo numero di nomi propri ha subito una modificazione morfologica con aggiunta di suffissi che li rende più maneggevoli: è questo il caso di ghigliottina, mongolfiera, e di tutti i nomi botanici o di mineralogia che hanno forme latinizzate, sia quando partono da un nome di persona, sia quando vengono da un nome geografico (camelia, fucsia, robinia, sansevieria, dolomite, francio). Va da sé che questi nomi di piante, minerali, invenzioni sono degli internazionalismi, sono cioè presenti con minime variazioni anche nelle altre lingue.

I nomi propri possono fungere da base per derivati che solo lontanamente hanno una relazione con la persona o il luogo da cui traggono origine (daltonismo, darwinismo, pastorizzare, galvanizzare, galileiano, machiavellico, amletico, arlecchinata, edipico).

Altri derivati come freudiano, nietzschiano restano invece più vicini al significato di Freud o della sua scuola, .. e costituiscono un problema lessicografico non indifferente, non solo perché hanno, quando la base è straniera, una pronuncia mista, ma soprattutto perché aprono la questione dell'ingresso dell'enciclopedia nel dizionario linguistico. La tendenza è di promuoverli a lemmi, come si fa per i numeri, solo quando sono ricchi anche di significati estesi (un sorriso leonardesco, una rivoluzione copernicana, un quarantotto, un 30 e lode).

Da molte parti tuttavia si sollecita una maggior attenzione dei dizionari soprattutto per gli aggettivi dei nomi propri di persona e di città, perché non sempre se ne riesce a prevedere la formazione (giovanneo, carlino, maltusiano). Il nome dell'abitante e l'aggettivo di Malta è maltese, Marsala-marsalesi, Gorizia-goriziano, Catania-catanese, La Spezia-spezzino, Chioggia-chioggiotto, Bergamo-bergamasco: la varietà degli esiti è tale (il suffisso -ese è il più frequente, seguito dalla parafrasi quelli di X, da -ino, -ano, -ense) da giustificare queste inserzioni come l'inserzione, già avvenuta, delle coniugazioni difficili o irregolari dei verbi. È anche vero che i verbi sono una classe delimitata: se si apre la porta agli etnici e agli aggettivi derivati dai nomi e cognomi di persona, il lemmario può esplodere. Esiste un dizionario specialistico che riporta i nomi in italiano standard e in dialetto dei diversi comuni italiani e delle loro frazioni più importanti, nonché appunto dei rispettivi etnici.

Un sottoinsieme problematico di aggettivi derivati da basi assimilabili ai nomi propri è quello dei derivati da sigle (pidiessino, alfista, aclista, cobasiano, damsiano). È un fenomeno per ora circoscritto, ma destinato ad aumentare di pari passo con il diffondersi dell'uso di sigle anche in italiano.

Un altro gruppo di parole la cui formazione è per così dire internazionale è quello dei termini che hanno un'origine onomatopeica: tuttavia in questo caso il modo in cui le varie lingue rendono i suoni è decisamente meno uniforme. L'esempio classico è il verso del gallo o del gatto o del cane nelle lingue europee: c'è da chiedersi se sia la stessa specie animale! Oltre le onomatopee pure (tic tac, paff, miao, cri cri), vanno considerati i sostantivi come pacca, ronzio, tiritera, sbuffo, scia, verbi del tipo miagolare, abbaiare, schiaffeggiare, schizzare, tuffarsi, ciucciare. L'italiano e le altre lingue neolatine, avendo una ricca morfologia flessiva e derivativa, inglobano l'onomatopea in altro materiale che finisce per mimetizzare la riproduzione del suono rendendolo meno individuabile di quanto non sia nelle onomatopee dell'inglese.


XII.   Paretimologie, etimi complessi.

I parlanti ricostruiscono le origini di una parola attraverso somiglianze di forma con altre parole: è il processo detto etimologia popolare o paretimologia, che porta talvolta alla modificazione della parola per rendere più trasparente l'interpretazione (es: unione dell'articolo, scambi di lettere). Ecco alcuni esempi: emottisi è voce dotta composta di emo- = sangue e dal greco ptysis = sputo, ma l'interpretazione popolare l'avvicina a tisi. Piattola deriva dal latino blattuma(m), diminutivo di blatta, ma è accostata per etimologia popolare a piatto. Intruppare è deformazione paretimologica di intoppare. Altri esempi di etimologia popolare sono: archibugio, aguzzino, ciarlatano, collimare, melanzana, pentacolo, scarnificare. Vi sono poi delle sovrapposizioni come per pappagallo che deriva dal bizantino papagas ed è stato incrociato con gallo. Scialacquare è l'incrocio di scialare con annacquare. Ballatoio deriva dal latino bellatorium = galleria di combattimento sulla nave, ma è incrociato con ballare. Anche le parole baldracca, barbabietola, fracassare, gattabuia, mucca, salsiccia, serbatoio, tirchio, ugonotto sono frutto di incroci. Per gli esperti di etimologia non sempre è possibile individuare un etimo: vi sono etimi incerti ed etimi complessi perché i passaggi attraverso cui una determinata parola è arrivata coinvolgono più lingue o comportano discussioni fra gli esperti. Fra i casi noti: lampone, muffa, tuta.


XIII.     L'etimologia nei dizionari italiani.

Appare quindi chiaro che l'individuazione dell'origine di una parola è operazione complessa e affrontabile in vari modi. A differenza dei dizionari etimologici che possono spendere intorno ad un'etimologia controversa il numero di righe che vogliono e trattare di altre parole della famiglia lessicale (= insieme di parole che hanno legami di senso e soprattutto di forma, provenendo tutte dalla stessa base) o di lingue affini, l'informazione etimologica nel dizionario monolingue in un volume dev'essere succinta e comprensibile anche ai non addetti ai lavori, dal momento che la ricerca dell'origine delle parole resta una delle ragioni di consultazione del dizionario. Tutti i dizionari italiani oggi in commercio, in un volume, di circa 2.000 pagine e con una copertura oltre i 60.000 lemmi, danno l'informazione etimologica. Poiché solitamente in famiglia non c'è un dizionario etimologico, la responsabilità del dizionario monolingue è grande: il linguista che si incarica dell'etimologia deve innanzitutto decidere se dare quella prossima o quella remota. Ad esempio il Devoto-Oli è fra i dizionari in commercio il più incline a dare un'etimologia che risale spesso oltre la prossima. L'idea di base è quella di risalire di solito all'etimo immediato, ma in parecchi casi, per chiarire meglio l'origine della parola, si è creduto opportuno risalire anche più addietro. Quest'atteggiamento è coerente con la caratteristica del Devoto-Oli che consiste nel privilegiare la descrizione del senso della parola, ed è facilitato dalla decisione di porre l'etimologia in fondo alla voce. Il Palazzi-Folena è stato il primo dei dizionari in un volume a dare la data della prima attestazione di ogni parola. Rispetto ai dizionari etimologici o ai dizionari storici, il Palazzi-Folena, per ragioni di spazio, si limita a dare la prima attestazione del significato principale di una parola, salvo casi particolari per cui si dà la prima attestazione del significato principale e la prima attestazione del possibile significato secondario. Tutti i dizionari italiani moderni in un volume (e a maggior ragione quelli in più volumi) fanno attenzione nelle etimologie di parole di origine latina, sia a distinguere di quale latino si tratta (classico, volgare o parlato, tardo, medievale, scientifico), sia ad indicare la trasmissione orale e ininterrotta (segnalata di solito con la semplice abbreviazione lat.[ino] prima della base) in modo diverso dalla tradizione interrotta, quella dei libri, della chiesa, della scienza (individuabile perché preceduta dalla formula Dal lat.). Lo stile in cui sono scritte le etimologie è molto uniforme; le variazioni più grandi stanno nel campo dei cosiddetti incroci e delle paretimologie quando più di una base concorre all'origine della parola. In questi casi c'è chi ricorre più spesso alla formula etimologia incerta, senza dare ulteriori spiegazioni, c'è chi dà l'etimologia come non sicura, ma la dà, e chi la dà senza incertezze. Le etimologie delle parole derivate sono spesso molto brevi, nel senso che sono dei rimandi all'etimologia della parola capostipite della famiglia lessicale. Il rimando avviene attraverso formule come Der.[ivato] di X; talvolta però quest'informazione, pur non essendo errata, risulta irrispettosa della vera storia della parola. Di particolare interesse l'informazione etimologica presente nel DIR (Dizionario Italiano Ragionato): infatti oltre ad essere presente, e piuttosto minuziosa, per le singole parole, l'etimologia guida la disposizione dei lemmi che non sono in rigoroso ordine alfabetico, ma per famiglia lessicale. Può essere interessante per chi ha curiosità etimologiche o persegue un particolare tipo di didattica del lessico. Il fenomeno del supplettivismo, cioè dell'avere una base di derivazione dotta e una di derivazione popolare, fa sì che per molti italiani, e ancor più per gli stranieri, non sia facile raggruppare insieme tutte le parole derivate dalla stessa parola latina: l'ordine alfabetico le disperdeva, la soluzione del DIR le riunisce.


XIII.I.   Dati percentuali.

Chiarite le difficoltà insite nella formulazione dell'informazione etimologica dei dizionari in un volume, proviamo a rendere più chiare con grafi a torta le cifre tratte dallo Zingarelli (1995). Si ribadisce che le liste di lemmi risultanti da queste ricerche tramite computer sono altamente rappresentative, ma vanno prese con qualche precauzione: ai fini di uno studio che non s'accontentasse come questo di dare indicazioni di massima, sarebbe necessario un controllo capillare per scartare casi di sovrapposizioni. Comunque si è verificato che questo controllo umano dei dati selezionati dal computer non cambierebbe di molto i dati qui riportati. Inoltre:

un'etimologia può contenere ingl[ese] o fra[ncese] o altro etnico senza che il lemma a cui si riferisce sia davvero derivante dall'inglese, francese, ..

in parecchie etimologie sono citate più lingue e quindi un'etimologia unica finisce per essere contata più volte (i correttivi che si sono adottati per ovviare a questo inconveniente danno i risultati riportati nel grafo B)

le percentuali e i dati non si riferiscono a tutti i lemmi contenuti nello Zingarelli (1995), ma soltanto a quelli che hanno un'etimologia in cui sia esplicitamente menzionata una delle lingue che più hanno inciso sulla formazione del lessico italiano; non sono quindi conteggiati i lemmi composti con elementi di composizione e i derivati


Grafo A  Grafo B


I dati del grafo B sono stati ottenuti facendo ricerche di insiemi disgiunti di etimologie. Di conseguenza le etimologie che contengono la parola latino non contengono la parola greco, provenzale, francese, germanico, inglese, spagnolo, arabo, portoghese, tedesco (e così per le altre lingue). Diminuiscono i casi di etimologie con germanico perché quasi sempre tali etimologie non sono unicamente incentrate sul germanico, ma contengono anche la menzione dell'inglese, del francese, del tedesco, del latino. Nel complesso le percentuali tengono, salvo quella relativa al latino, che aumenta ancora e appare davvero come fonte principale del lessico italiano.


XIV.     I dizionari etimologici e i dizionari storici.

Dizionario etimologico = dizionario che descrive la derivazione delle parole del lessico di una o più lingue da parole di lingue più antiche o anche da lingue contemporanee; non dà lunghe definizioni né, solitamente, contesti d'uso. Il dizionario etimologico di taglio tradizionale è un'opera piuttosto ostica per i non addetti ai lavori, non tanto perché difficile o di struttura complessa, quanto perché fa ampio uso di documenti citati attraverso abbreviazioni e sigle, presenta grafie insolite della parola a lemma, usa molto la punteggiatura connessa agli elenchi e alle citazioni e i diversi tipi di caratteri tipografici, e traccia un discorso ellittico, non disteso e del tutto articolato con connettivi e nemmeno scandito dai numeri arabi in grassetto che si trovano nei dizionari monolingui. Un'opera di più largo respiro, che cerca di venire incontro al lettore non specialista, pur non prescindendo dal necessario rigore filologico, è il DELI (Dizionario etimologico della lingua italiana). Il DELI offre una lettura più agevole di altri dizionari etimologici perché ogni voce si divide in:

una prima parte che contiene la definizione della parola a lemma, e una sua storia attraverso una serie di luoghi di citazione e loro data

una seconda parte con le affermazioni degli etimologisti sull'origine del lemma, anche queste citate per esteso

Il LEI (Lessico etimologico italiano), in corso di compilazione, è l'opera di più vasto respiro che mai sia stata intrapresa per la lingua italiana, è rivolta agli specialisti, con una copertura ricchissima dei rapporti fra latino volgare e dialetti italiani e fra questi e italiano.

Un sottoinsieme di dizionari etimologici piuttosto popolare anche fra i non specialisti è costituito dai dizionari di onomastica (origine dei nomi e cognomi italiani più comuni) e di toponomastica.

Le storie delle parole si ritrovano per esteso nei dizionari storici, la cui funzione è principalmente quella di fornire ampia illustrazione dei contesti d'uso della parola a lemma attraverso i secoli. Anche il dizionario storico è un'opera in più volumi, per specialisti, ma la presenza di molte citazioni, soprattutto letterarie, ne fa uno strumento meno ostico del dizionario etimologico. Il Vocabolario degli Accademici della Crusca ne è stato il primo autorevole esempio non solo per l'italiano, ma per tutta l'Europa, anche se quando apparve (600) non era inteso come un dizionario che facesse la storia delle parole, quanto come un dizionario con gran quantità di citazioni tratte da autori selezionati, degni di essere proposti come modelli di lingua. Nelle successive edizioni gli intellettuali italiani più attenti alle esigenze comunicative della comunità cominciarono a notare lo scollamento fra citazioni del Vocabolario della Crusca e realtà linguistica italiana, dovuto, alle soglie dell'800, al fatto che le citazioni provenivano spesso da opere vecchie di quasi 500 anni, ma anche all'accentuazione dell'intento documentaristico e arcaicizzante di alcuni curatori. Il vero dizionario storico dell'italiano è stato avviato nella seconda metà del secolo xx: si tratta del Grande dizionario della lingua italiana (GDLI). L'opera comprenderà in tutto 21 volumi; nel corso degli anni la redazione ha progressivamente allargato la raccolta di scritti tecnici e scientifici, di testi antichi, di quotidiani, trasformando il GDLI in un'opera molto attenta a rappresentare anche l'agitata storia della lingua italiana alla fine del secondo millennio. La redazione farebbe poi un'opera di lodevole divulgazione se cominciasse già da adesso a preparare una versione ridotta in 2/3 volumi, destinata al grande pubblico, che attualmente non trova sull'affollato mercato lessicografico italiano nemmeno un dizionario storico abbordabile per spesa e ingombro. Il GAVI, dizionario storico dell'italiano delle origini (opere anteriori al 1300), è frutto di ampi spogli e contiene una documentazione imponente.

Vocabolario degli Accademici della Crusca (1612)

 




Stampato a Venezia nel 1612. Il suo successo fu grandissimo: la struttura delle sue voci costituì un esempio per tutta la lessicografia occidentale del tempo, anche se in altri paesi ci si discostò dalla scelta di usare esclusivamente esempi tratti da buoni autori. Ha avuto 4 edizioni, la 5° incompleta. A partire dalla 3° edizione il numero dei volumi è aumentato: questo incremento è il risultato dell'accrescimento del numero delle voci trattate e del corredo degli esempi (anche di quelli di autori precedentemente ignorati). Gli estratti e le ristampe non ufficiali sono stati molto numerosi. La lessicografia italiana e la questione della lingua sono state dominate dalla presenza di questo monumento linguistico, concepito per persone colte, dagli interessi prevalentemente letterari. Il lemma è ben visibile: in mancanza del neretto, che sarà introdotto solo nel xix secolo, si stampa il lemma in caratteri maiuscoli. L'ordine alfabetico del lemmario tratta u e v se fossero indistinte. Le abbreviazioni di parte del discorso a volte ci sono, a volte no. Le parole latine sono in quasi tutte le voci con una funzione di chiarimento del significato della parola italiana, anche a beneficio degli stranieri. Se la parola ha più significati diversi, il vocabolario fornisce tante parole latine quante sono necessarie a distinguerli. Talvolta la parola latina costituisce anche l'etimologia della parola italiana a lemma. Le parole greche sono molto più rare, ma hanno la stessa funzione delle latine. La lingua usata per le definizioni non è distinta tipograficamente dalla lingua della citazioni: per entrambe è il tonfo e solo l'indicazione dell'opera da cui è tratta la citazione fa da stacco. Le suddivisioni fra un significato e l'altro sono evidenziate dal segno .

Dizionario Universale critico-enciclopedico della lingua italiana (1797-1805)

 




Alberti compilò questo dizionario in 6 tomi. Fu stampato a Lucca tra il 1797 e il 1805. Ebbe altre 2 edizioni. Alberti fu il primo a rispondere concretamente all'esigenza di un dizionario che registrasse voci dell'uso e voci tecniche. Forte dell'esperienza maturata traducendo in italiano un dizionario speciale francese e soprattutto redigendo un dizionario francese-italiano, approdò al Dizionario Universale, che già dal titolo appariva più enciclopedico dei precedenti dizionari italiani. Infatti non solo allargò il numero degli autori da cui citare, ma introdusse a lemma molta terminologia scientifica e delle arti e mestieri e adottò nelle definizioni classificazioni di stampo enciclopedico. Insieme al Vocabolario della Crusca fu un modello per tutta la lessicografia ottocentesca. L'albero sistematico che Alberti propose nell'introduzione suddivide lo scibile umano in vari campi: l'autore non ebbe tempo di realizzare un'enciclopedia in cui il sapere fosse distribuito secondo il suo sistema, ma influenzò gli autori di dizionari non alfabetici dell'800. Il dizionario continua a trattare U e V insieme (saranno separate nella seconda edizione). Fra le informazioni che accompagnano il lemma non manca mai la parte del discorso o un suo equivalente. Se una parola appartiene a più parti del discorso riceve voci distinte. I vari significati sono separati del segno e iniziano su una nuova riga. Gli esempi sono in corsivo e si distinguono bene da tutto il resto; definizioni, informazioni grammaticali, etichette in tondo. Anche il corrispondente latino è in corsivo ed è usato come nel Vocabolario della Crusca. La definizione vera e propria (sia essa un sinonimo o una parafrasi o una spiegazione) si distingue dal discorso metalessicografico perché inizia col maiuscolo. Alberti usa un insieme di etichette di sottocodice e di uso che fu apprezzato dai contemporanei ed esteso dai lessicografi che lo seguirono.

Vocabolario universale italiano (Tramater 1829-1840)

 




Compilato a cura della Società Tipografica Tramater e stampato a Napoli fra il 1829 ed il 1840 in 7 volumi. Ebbe altre 2 edizioni con numerose aggiunte. Opera collettiva, persegue lo scopo di avvicinarsi ai dizionari del resto dell'Europa, per sostenere il confronto con le opere delle accademie francese e spagnola e con i dizionari inglesi. È un vocabolario-enciclopedia frutto dello spoglio di nuove edizioni di testi, opere scientifiche e dizionari specializzati non solo italiani e dell'integrazione, non sempre armoniosa e scarsamente originale, dei lemmi e degli esempi del Vocabolario della Crusca con quelli di altri repertori, fra cui il Dizionario critico-universale. Il lettore ha l'impressione di consultare non un dizionario generale, ma scritti specialistici, soprattutto per le voci di botanica, zoologia, chimica, medicina. È grande la minuziosità delle definizioni. In omaggio al suo carattere universale l'opera accoglie voci dell'uso, così come registra arcaismi, francesismi, voci dialettali, ma non risponde alla sentita necessità di un nuovo grande dizionario storico della lingua italiana. L'enciclopedismo si nota anche per il fatto che il Tramater innesta nel lemmario i nomi propri. Fornisce inoltre la divisione sillabica, attraverso la quale viene anche indicata la pronuncia. Accanto all'etimologia si trovano spesso traduzioni in altre lingue, oltre al latino e al greco. Il corsivo è usato per le definizioni, ma non per quelle sinonimiche, e per il linguaggio metalessicografico, oltre che per i luoghi da cui sono tratte le citazioni. Le indicazioni di sottocodice hanno rilievo in quanto sono fra parentesi tonde: (Geog.), (Filol.), (Milit.), mentre le indicazioni di parte del discorso o di derivazione sono in corsivo, a volte fra parentesi quadre. I significati sono numerati anche all'interno del sottocodice. Le lettere (A), (B), (G), (N), (O), (V), poste in coda ai significati, stanno ad indicare la fonte da cui sono tratti i significati.

Dizionario della lingua italiana (Tommaseo-Bellini 1865-1879)

 




Compilato da Tommaseo e Bellini con numerose aggiunte ai precedenti dizionari e stampato a Torino tra il 1865 ed il 1879 in 8 volumi. Ha avuto grande successo e varie ristampe. Costituisce l'impresa lessicografica italiana più importante dell'800, quella in cui si è riusciti a raggiungere un equilibrio tra i vari livelli diacronici di lingua. È per l'italiano l'ultimo vocabolario storico completo disponibile. La riuscita dell'opera è legata ad almeno 3 fattori:

la grande esperienza di Tommaseo

il fatto che Tommaseo seppe circondarsi di collaboratori che avevano una grande conoscenza della lingua

la stesura delle voci tecniche e specialistiche, la cui moderata registrazione fu affidata ad esperti validissimi

Il Tommaseo-Bellini presenta parecchi difetti fra cui etimologie fantasiose, successione dei significati ora basata su un ordine storico, ora su un ordine logico, ora costruita partendo dal significato più noto e comune, ora iniziando col più arcaico, non corrispondenza tra le sigle usate nelle voci e quelle elencate nella tavola delle abbreviazioni, .. Resta comunque un monumento della lessicografia italiana, un'insostituibile testimonianza di dizionario vivo sia per l'abbondante registrazione di fraseologia dell'uso toscano-fiorentino, sia per le osservazioni finissime, anche se a volte troppo personali, polemiche, e moraleggianti, del Tommaseo (queste osservazioni sono precedute da [T.] ).

Novo Vocabolario della lingua italiana secondo l'uso di Firenze (Giorgini-Broglio 1870-1897)

 




Ordinato dal Ministero della Pubblica Istruzione. Ispirato alle dottrine linguistiche di Manzoni. Poiché la stesura fu lunga e l'opera venne pubblicata a fascicoli, in un numero limitato di esemplari, non ebbe grande diffusione. La funzione di modello e depositario dell'uso fiorentino vivo che il Giorgini-Broglio avrebbe dovuto svolgere, anche attraverso edizioni ridotte da distribuire nelle scuole, fu invece svolta dal Nòvo dizionàrio universale della lingua italiana. Nel lemmario non vengono registrati arcaismi (che, secondo Manzoni, andrebbero raccolti in appositi repertori, diversi dal dizionario dell'uso). Per quanto riguarda la struttura della voce, scompaiono le citazioni d'autore, sostituite da esempi creati dal lessicografo e da fraseologia tratta dall'uso. Le voci sono di facile lettura, perché ogni significato inizia su una riga nuova, è distinto dal segno e da un numero e consta di poche righe, alleggerito com'è del peso delle citazioni. Gli esempi sono ben confezionati e aggiungono informazioni alla definizione; talvolta da soli hanno il compito di definire un significato. Il linguaggio delle definizioni e degli esempi è veramente moderno: a distanza di un secolo, appare infatti comprensibilissimo, appena un po' sostenuto. Il fiorentinismo viene ridimensionato e la coloritura fiorentineggiante emerge soprattutto nei costrutti propri del dialetto.


  1. RAPPORTI FRA PAROLE E FRA SIGNIFICATI.

I.   Arbitrarietà e motivazione.

L'idea che il lessico di una lingua sia una nomenclatura di cose e concetti è antica e radicata. Nella Bibbia non troviamo soltanto la concezione nomenclatoria del lessico, ma anche quella per cui i nomi sono legati da ragioni ontologiche, da qualità intrinseche, all'essenza delle cose e dei concetti che indicano. I popoli (e i bambini) devono conoscere e apprezzare lingue e culture diverse per giungere a cogliere l'arbitrarietà, la convenzionalità del legame esistente tra significante e significato. La sola conoscenza non basta: senza il rispetto per le lingue e le culture altre si cade nella tentazione di considerare solo la propria lingua a cultura degna dell'uomo, e tutto il resto versi animaleschi o tutt'al più balbettii primitivi, infantili. Siamo consci dell'impossibilità di sostenere per tutto il lessico un legame motivato, non arbitrario tra significante e significato. Le onomatopee costituiscono un nucleo di significanti legati per natura al loro significato, ma anche ammettendo che le lingue naturali si siano sviluppate da un nucleo di onomatopee, ormai le lingue ci appaiono come frutto della storia, cioè dell'arbitrarietà legata alla convenzione che porta i membri di una comunità linguistica ad istituire gli stessi rapporti arbitrari fra suoni (o grafie) e senso, pena l'isolamento e l'incomprensione. Quanti vedono nelle ricerche etimologiche il tentativo di ricostruire la storia di una parola per avvicinarsi al suo vero significato sembrano voler trascurare che, giunti all'etimo remoto, il legame che unisce tale etimo al suo significato è pur sempre arbitrario. Le lingue naturali sono però arbitrarie anche nel modo in cui ritagliano il mondo da nominare: il latino sentiva la necessità di distinguere fra albus (bianco opaco) e candidus (bianco brillante), l'italiano no. I francesi non sono disturbati dal fatto che bois significhi sia bosco, sia legna. La stessa materia può essere formata o strutturata diversamente in lingue diverse. La materia rimane, ogni volta, sostanza per una nuova forma, e non ha altra esistenza possibile al di là del suo essere sostanza per questa o quella forma (come la stessa sabbia si può mettere in stampi diversi). Oggi gli studi delle funzioni neurofisiologiche hanno fatto emergere degli universali. Per esempio, nel caso dei colori sembra prevalere l'idea che tutti percepiscano gli stessi colori, nonostante le varie lingue ritaglino diversamente lo spettro del colore. Il pensiero non è più visto come massa amorfa prima che intervenga il linguaggio a conferirgli articolazione, ma l'articolare del linguaggio non riproduce l'articolazione del pensiero. Anche in questa veste aggiornata, la posizione del linguista strutturalista è radicalmente diversa dal realismo nomenclatorio, anzi ne rovescia la prospettiva. Il linguista strutturalista sostiene che il modo in cui noi vediamo cose, concetti, processi dipende anche dalla lingua che parliamo e non pensa che le cose esistono, i concetti hanno una loro realtà mentale al di fuori della lingua; il linguista strutturalista non considera i nomi come un insieme di etichette e non crede che il lessico di ogni lingua naturale sia un insieme di etichette da appiccicare a oggetti e concetti. Non esiste il significato della parola presa singolarmente, tale significato non si può determinare semplicemente attraverso la descrizione degli oggetti o dei concetti, ma il significato di un segno è sempre relativo a quello di altri segni, i confini tra significati di aree semantiche limitrofe variano da lingua a lingua e, nel tempo, all'interno della stessa lingua. È soprattutto nel nostro secolo, con Saussure, che questa arbitrarietà a tutti i livelli è stata chiaramente enunciata.


I.I.   Senso e significato. Intensione ed estensione. Denotazione e connotazione.

I linguisti che si occupano di semantica distinguono fra:

significato: valore che un segno linguistico ha nel sistema, in astratto

senso: valore che un segno linguistico ha nel contesto, in un enunciato.

Il senso è l'insieme delle associazioni che ciascuno di noi lega agli enunciati e queste associazioni sono frutto dell'esperienza personale, ovviamente molto diversa da individuo ad individuo. Il significato è quanto tutti quanti costantemente associano ad un enunciato.

In questo capitolo si parlerà di significati, nel capitolo 7, complice la dimensione testuale, emergeranno considerazioni legate al senso.

Si noti che in filosofia senso e significato (o più comunemente senso e denotazione) corrispondono alla coppia di termini:

intensione di un'espressione: è l'insieme delle informazioni linguistiche che determinano a che cosa si riferisce quell'espressione. L'intensione di un enunciato è detta proposizione, quella di un predicato proprietà, quella di un termine singolare concetto individuale. L'intensione di blu è una funzione che associa a ciascun mondo possibile l'insieme degli oggetti che sono blu in quel mondo possibile

estensione di un enunciato: è il suo valore di verità. 2 enunciati hanno la stessa estensione se sono entrambi veri o entrambi falsi. L'estensione di un termine singolare è un individuo, l'estensione di un predicato è una classe. L'estensione di essere blu è la classe degli oggetti che sono blu

La coppia di termini denotazione/connotazione negli ambienti dei linguisti e dei semiologi italiani e francesi permette di distinguere fra significato primario e significato aggiunto, ottenuto per allargamenti e spostamenti del significato originario. I significati connotativi sono quelli che i dizionari spesso indicano con le abbreviazioni per estens[ione], fig[urato], o con la notazione traslato. La connotazione non dev'essere confusa con il senso: benché sia un significato secondario, è pur sempre appartenente al sistema e non legato ad esperienze individuali.


II.     Tra lessicologia, semantica e lessicografia.

Lessicologia = studio dei lessemi di una lingua.

Lessema = unità lessicale a 2 facce (significante e significato) appartenente al sistema (come il fonema e il morfema). Anzi, il termine lessema è nato proprio per avere il corrispondente lessicale di fonema, un'entità astratta che evitasse l'uso di parola, vocabolo troppo ambiguo.

Ad esempio, ad una concreta parola fonica e grafica pianta, corrispondono 2 forme flesse del lessema piant(a)re (la terza persona singolare dell'indicativo presente e la seconda persona singolare dell'imperativo), il participio passato al femminile singolare di piangere e il singolare del lessema pianta = albero. Più parole sul piano del significante associate ad un significato unico, come coda di rospo = rana pescatrice, lemme lemme = lentamente, corrispondono ad un unico lessema. Per alcuni lessema corrisponde al solo morfema lessicale, distinto dai morfemi grammaticali e derivazionali. Per la maggioranza dei lessicologi corrisponde all'intera unità lessicale e, anzi, spesso ad una famiglia di unità lessicali: il lessema affondare ha il significato far affondare, ma anche quello di andare a fondo. Sono 2 unità lessicali distinte, dal momento che un'unità lessicale si definisce come l'associazione di un significante e di un solo significato, ma può essere utile considerarle un solo lessema, come pure nel caso di forte, aggettivo e avverbio, o di gelato, nome non numerabile e numerabile. In questi casi, ricorrenti in modo sistematico nel lessico, può essere conveniente un lessema unico che copre una famiglia di unità lessicali. Invece in un caso non prevedibile come piano (di una scala) e piano (progetto) o piano (strumento musicale) ci si trova di fronte a 3 unità lessicali e a 3 lessemi. La distinzione fra unità lessicali e lessema può tornare utile per affrontare le metafore e altri spostamenti di significato, in particolare in tutte quelle occasioni in cui, pur riconoscendo che ci si trova di fronte a significati diversi, e quindi a unità lessicali diverse, si vogliono sottolineare le parentele fra questi significati.

Semantica = disciplina che si occupa dei significati dei segni linguistici; semantica lessicale = quando il segno linguistico è una parola o un'altra unità linguistica lessicale. Lessicologia e semantica lessicale sarebbero coincidenti, se la seconda non fosse totalmente indifferente al significante, e invece interessata alle relazioni fra significati (sinonimia, iperonimia, solidarietà lessicale, ..) e alle condizioni di verità. Per i lessicologi invece il significante ha molta importanza, in particolare negli ambiti classici della ricerca lessicologica, quali lo studio dell'etimologia, di calchi e forestierismi, della creazione di neologismi. La descrizione del significato di un segno è stata affrontata dalla semantica ispirata dalla linguistica strutturale per mezzo della scomposizione in tratti semantici o semi, sulla scorta dell'analisi dei fonemi in tratti fonetici. Ad esempio bue e toro condividono i semi [+ bovino, + adulto, + maschio], differiscono per il tratto [atto alla procreazione]. La spiegazione di un numero finito di semi con cui descrivere il significato dell'intero lessico di una lingua non ha però dato i risultati che si speravano e l'analisi in tratti è piuttosto applicata a segni appartenenti a campi semantici delimitati. Altri modelli della competenza semantica del parlante sono stati proposti in ambito psicolinguistico, filosofico e di intelligenza artificiale: fra i più interessanti:

Putman osserva che tutti noi sappiamo che un faggio non è un olmo, ma molti di noi non saprebbero distinguere uno dall'altro perché le conoscenze in nostro possesso non sono sufficienti. Lo stesso accade per molti altri nomi di specie naturali come animali, metalli, pietre preziose. Per fissare queste denotazioni bisogna ricorrere a degli esperti: c'è una divisione del lavoro linguistico, per cui la maggior parte dei parlanti associa ad un nome di specie naturale uno stereotipo, un'idea convenzionale che non costituisce necessariamente una caratterizzazione corretta dell'estensione del nome di specie naturale. Lo stereotipo raggruppa le informazioni socialmente obbligatorie perché un parlante che usa il nome di specie naturale venga riconosciuto competente nell'uso del nome. Le definizioni lessicografiche dei nomi di specie naturale sono dei compromessi, oscillano fra la descrizione della conoscenza dell'esperto, descrizione spesso così tecnica da riuscire incomprensibile ai più, e la descrizione dello stereotipo

La teoria del prototipo suggerisce che la rappresentazione mentale dei concetti, soprattutto dei significati di parole che indicano animali, piante, minerali o manufatti, è organizzata intorno ad esemplari tipici (es: il prototipo di uccello potrebbe essere il passero o il colombo, di sicuro non il pinguino o lo struzzo, perché sono uccelli che non volano). È una teoria utile per indagare come si forma il significato nel bambino e anche per stabilire se ci sono concetti comuni a culture molto diverse. Le caratteristiche prototipiche sono legate all'orizzonte di esperienze del soggetto più che determinate dall'estensione; gli studi sperimentali hanno dimostrato che ci sono motivazioni costanti nello scegliere un prototipo di veicolo, frutto, .., ma anche che i giudizi di tipicità possono variare molto non solo tra parlanti diversi, ma addirittura per lo stesso parlante in momenti diversi

Lessicografia = tecnica di compilazione di dizionari; si avvale degli studi di lessicologia, semantica, morfologia, sintassi, statistica, capacità percettiva dell'occhio, .. e anche di ricerche metalessicografiche (come disegnare un lemmario o le voci secondo le esigenze di fasce diverse di utenti). Il rapporto fra lessicologia e lessicografia non è più, ammesso che lo sia mai stato, un rapporto di filiazione, con la teoria che viene calata nella prassi: la lessicologia è una delle molte fonti di informazione del lessicografo e d'altra parte la lessicografia moderna sta diventando sempre più spesso, soprattutto nella sua veste elettronica, una fonte di ispirazione per i linguisti.



II.I.   Polisemia e omonimia.

I lessemi possono essere polisemici = avere più di un significato. Le unità lessicali invece non possono per definizione avere più di un significato. Generalmente i significati di un lessema polisemico hanno un denominatore comune, un significato fondamentale, originario, perché la polisemia è il risultato del minimo sforzo che i parlanti fanno per comunicare: essi riutilizzano significanti già esistenti per nuovi significati. I neologismi sono perciò in gran parte neologismi semantici, neologismi nuovi solo per il significato. La scelta del significante da riutilizzare si fa sulla base dell'analogia e questo spiega perché i significati di un lessema polisemico hanno qualcosa in comune (finestra nei programmi di videoscrittura, imbottigliamenti di auto). Il significato di un lessema si può modificare estendendolo, restringendolo, rendendolo figura, simbolo di qualcosa di analogo ma diverso: lo si può fare per ragioni neologiche, e in tal caso si adotta appunto la strategia del minimo sforzo, oppure per motivazioni di tipo retorico-letterario, e in tal caso questi spostamenti di significato rivelano il frutto di un lavorìo creativo. È più comune che un significato venga esteso, piuttosto che venga ristretto. Esempi di significati ristretti sono: modella per indossatrice, respiro per singolo atto inspiratorio o espiratorio. Verde nell'accezione di ricco di vegetazione ha un significato ristretto, cioè che ha attinenza con l'agricoltura; ha poi varie accezioni che corrispondono a significati estesi = attinente a movimenti socio-politici ecologisti, di frutto, non ancora maturo, di legna, fieno e simili non stagionato, .. Più un lessema ha realizzazioni frequenti nei testi, più fa parte del lessico centrale di una lingua, più è probabile che sia polisemico, perché riutilizzare un significante comune richiede meno sforzo mnemonico che riutilizzare uno più raro. I linguaggi specialistici cercano di usare termini monosemici, ma accade spesso che un termine molto popolare fra gli studiosi di una materia finisca per assumere significati leggermente diversi da scuola a scuola, diventando polisemico. Quando una lingua accoglie un prestito straniero costituito da un lessema polisemico nella lingua di partenza, lo accoglie con un significato specialistico (goal). La polisemia si riscontra sul piano del sistema, i lessemi sono polisemici, ma le parole, la loro realizzazione concreta nei testi, sono quasi sempre disambiguate dal contesto in cui compaiono.

Omonimia = fenomeno per cui parole di origine etimologica diversa finiscono per avere significati coincidenti. In italiano gli omonimi sono il risultato della coesistenza di prestiti di varia provenienza diventati omofoni nel processo di adattamento alla fonetica e alla grafia italiana. L'inglese per le sue vicende fonetiche ha omografi non omofoni, cioè parole che si scrivono nello stesso modo, ma si pronunciano diversamente, e omofoni non omografi, che si scrivono in modo diverso, ma si pronunciano in modo uguale. L'italiano, invece, data la quasi perfetta corrispondenza fra grafia e pronuncia, ha omonimi che sono sia omografi sia omofoni. L'omofonia può essere impedita da differenze di accento tonico (prìncipi e princìpi, àncora e ancóra), o dall'opposizione /e/ /ε/, /o/ / / (pèsca, pésca, bòtte, bótte). L'omonimia grammaticale somma all'omofonia e all'omografia anche l'appartenenza alla stessa parte del discorso. Esempi italiani sono: diligenza, sceriffo, schifo, tara. Chi ritiene l'omonimia molto rara in italiano, parte da un computo dei soli lemmi omonimici riscontrabili nei lemmari dei dizionari monolingui e trascura i casi in cui forme verbali flesse sono omonime di sostantivi (legge, letto, affetto, porto, pianta, ..).


II.II.     Sinonimia.

Sinonimia = fenomeno per cui 2 unità lessicali dal significante diverso hanno lo stesso significato; è certo il più noto e il più importante dei rapporti semantici. Dare una definizione sinonimica è il modo più sbrigativo di chiarire il significato di una parola. La parafrasi, la riformulazione si fondano sulla sinonimia fra unità lessicali più o meno estese. Perfino la possibilità di tradurre da una lingua ad un'altra si basa sull'istituzione di relazioni sinonimiche fra unità lessicali di codici diversi (eteronimia). Se 2 unità lessicali hanno lo stesso significato dovrebbero potersi sostituire negli stessi contesti: in realtà la sinonimia è possibile nel sistema, in astratto, ma molto difficile da trovare nei concreti contesti (addirittura fra e tra, per ragioni di suono). Ciò che solitamente impedisce di sostituire un sinonimo ad un altro è il fatto che se i significati denotativi di 2 significanti diversi possono essere equivalenti, i loro significati connotativi non lo sono quasi mai (papà e mamma ≠ padre e madre). In italiano il tardo raggiungimento di un'unità linguistica ha determinato la geosinonimia, cioè il fenomeno per cui acquaio è sinonimo di lavandino e pedalino di calzino solo in certe regioni. L'eteronimia, la sinonimia tra codici diversi, è direttamente collegata alla concezione del lessico come nomenclatura, alla credenza che le lingue naturali appiccichino delle etichette a realtà extralinguistiche preesistenti. I dizionari bilingui o plurilingui sono costruiti su questa concezione non condivisa dalla linguistica moderna.


II.III.     Antonimia.

2 unità lessicali sono dette antonime o contrarie quando hanno significato contrario (bello/brutto, amore/odio). L'antonimia è caratteristica soprattutto degli aggettivi e dei nomi ad essi legati; esistono prefissi italiani come dis-, in-, s-, a- che premessi ad una base danno il suo antonimo (interesse/disinteresse, logico/illogico, misurato/smisurato, storico/astorico). L'antonimia può essere graduabile: fra bello e brutto ci può essere carino, passabile; non amore non equivale necessariamente a odio, c'è posto per indifferenza, antipatia, .. Raramente nel linguaggio comune ci sono antonimi complementari, cioè non graduabili. Sono più frequenti nei linguaggi scientifici (vivo/morto è un esempio di coppia complementare che le moderne conquiste della medicina e della biologia stanno rendendo graduabile). Si può costruire un complementare artificialmente, cioè negando un lessema (non nero è antonimo complementare di nero). Come contrari sono spesso indicate coppie di lessemi che sono piuttosto simmetrici o inversi (comprare/vendere, servo/padrone, maestro/discepolo). In queste coppie non si riscontra un tratto semantico con polarità ora positiva ora negativa, quanto un interscambio, un reciproco rinvio, un definirsi l'uno rispetto all'altro. Enantiosemia = fenomeno per cui una parola può avere sia un significato, sia il suo opposto: alto può significare sia alto, sia profondo, apparente che è evidente e che sembra e che non è, cacciare inseguire per raggiungere e mandare via, allontanare. Talvolta si tratta di omonimi, come per mondezza = purezza e, dialettale, immondizia, o di derivati da prefissi omonimi come s- e in-, come per spolverare = togliere la polvere, spargere la polvere. Altre volte un significato si è sviluppato da un altro, ma entrambi coesistono, come storia = resoconto vero di fatti reali e resoconto inventato, bugia. Questi esempi, per quanto numerosi, costituiscono un aggregato in gran parte casuale e disparato piuttosto che un insieme caratterizzato da interessanti tratti specifici.


II.IV.   Iperonimia-iponimia, rapporto parte-tutto, solidarietà lessicale.

L'iperonimo è il termine generico (sovraordinato) sotto il quale si possono raggruppare uno o più iponimi, termini specifici (sottordinati). Ad esempio, garofano, rosa, gladiolo sono co-iponimi dell'iperonimo fiore. L'iponimo ha estensione più ristretta dell'iperonimo e ha invece un numero di tratti semantici maggiore (per dire in che modo il gladiolo differisce dalla rosa, si devono utilizzare tutti i tratti di fiore e poi elencare quelli specifici di gladiolo non presenti nella definizione di rosa e viceversa). La definizione attraverso genere prossimo e differenza specifica è costruita sul rapporto di iperonimia-iponimia, che è anche alla base della struttura di molti dizionari onomasiologici e dei tesauri per la ricerca di informazioni nelle banche di dati. Non sempre le lingue naturali presentano iperonimi formati da una sola parola: talvolta è necessario crearli ricorrendo a locuzioni come luogo di culto, arma da fuoco. Gli iperonimi, specie gli iperonimi non scientifici, sono una delle aree lessicali che meglio dimostrano l'anisomorfismo semantico, cioè la diversità con cui le lingue naturali ritagliano la materia da nominare: spesso manca il termine corrispondente in una determinata lingua, o se c'è, ha un grado diverso di genericità. Insieme alla sinonimia, al rapporto parte-tutto e alla solidarietà lessicale, il rapporto iperonimo-iponimo è uno dei mezzi semantici attraverso cui si garantisce la coesione di un testo.

Il rapporto parte-tutto, detto anche con termini dotti rapporto meronimo-olonimo è, fra le relazioni esaminate finora, il più legato a conoscenze enciclopediche e pragmatiche. Se uno non sa che la penna è una parte del martello corre il rischio di non capire un enunciato come: devo comprare un martello nuovo, si è rotta la penna e non riesco a schiodare le assi. Se uno non conosce lo scenario del matrimonio occidentale, non può cogliere l'ironia di un resoconto come il seguente: matrimonio dell'anno ieri al Santuario di XY: non tutti però hanno gradito lo humour del testimone dello sposo che si è presentato con 3 anelli, di cui uno al naso. Matrimonio in questo caso funge da omonimo e anello nell'accezione di fede nuziale è un suo meronimo. Includere le relazioni fra elementi di uno scenario sotto la relazione parte-tutto non è esplicitamente fatto da tutti, ma ci pare sia un uso lecito anche se figurato. Se si trova inaccettabile questo uso figurato, si possono far rientrare le relazioni fra scenario e i suoi elementi nella solidarietà lessicale. L'iponimo è sempre il suo iperonimo con qualche tratto in più (il garofano è un fiore, mentre non tutti i fiori sono garofani). Il meronimo invece non è il suo omonimo, ne è solo parte (un libro è una pubblicazione, ma non è una biblioteca, ne può solo far parte).

A differenza dei rapporti sinonimici, antonimici e iperonimici che sono paradigmatici, sostitutivi, la solidarietà lessicale è sintagmatica, si instaura fra lessemi le cui realizzazioni concrete possono essere contemporaneamente presenti negli stessi enunciati. La solidarietà può essere basata sull'affinità (fra uomo e giovane, capello e riccio), sulla selezione (fra guidare e un iponimo di veicolo, ad esempio auto, camion, carro), sull'implicazione (tra afferrare e mano). La solidarietà lessicale per selezione, quella per cui la scelta di una parola è praticamente obbligata dalla presenza di un'altra parola, è alla base di molte collocazioni ristrette: quando si spezza o si sottolinea questa solidarietà si creano effetti stilistici particolari (batté la testa, batté il ferro ancora caldo).


II.V.     Spostamenti di significato: metafora, metonimia, sineddoche, eufemismo, antonomasia, ellissi.

Quando si dice che qualcuno è un'aquila perché ha una mente acuta, che qualcosa è il nocciolo della questione, che si mettono i bastoni fra le ruote, si stanno facendo delle metafore. Non si stanno più usando aquila, nocciolo e bastoni nel loro significato primario, ma come figure di qualcosa d'altro. Alcune di queste figure sono ormai così radicate che molti non sanno di che cosa sono metafore: il collo della bottiglia, la gamba del tavolo, la nervatura della foglia non sono mai stati sostituibili, sono delle catacresi, dette anche metafore di denominazione, perché colmano vuoti del vocabolario di una lingua.

Metonimia = scambio di nome, designazione di un'entità qualsiasi mediante il nome di un'altra entità che stia alla prima come la causa sta all'effetto e viceversa oppure le corrisponda per legami di reciproca dipendenza (contenente/contenuto, occupante/luogo occupato, proprietario/proprietà materiale o morale, ..). Particolarmente frequenti sono le metonimie del contenente per il contenuto (bere un bicchierino, scolare una bottiglia), dello strumento per chi lo adopera (essere una buona forchetta, una buona penna), del fisico per il morale (avere fegato, non avere cervello), della località di produzione per il prodotto (il gorgonzola, il barolo), della marca per il prodotto (guidare una Fiat).

Sineddoche = esprimere il tutto nominandone solo una parte, l'usare il singolare per il plurale, la specie per il genere, la materia di cui è fatto l'oggetto per l'oggetto stesso (tetto per casa, ferro per spada, pane per cibo, l'italiano per gli italiani).

Spostamenti di significato sono dovuti all'eufemismo = figura retorica che mira a velare, attenuare ciò che viene considerato disdicevole, troppo crudo per essere detto in modo esplicito. Con metafore, perifrasi, litoti, allusioni, antonomasie si evita di nominare parti e funzioni del corpo umano, o altre realtà oggetto di scandalo o timore nella comunità linguistica. Moltissimi eufemismi riguardano la malattia e la morte: mancare, passare a miglior vita, salire al Cielo sono eufemismi per morire; male incurabile, male del secolo stanno per tumore. Il procedimento eufemistico ha spesso prodotto delle parole nuove ottenute per deformazione di esclamazioni volgari o blasfeme: accidempoli, accipicchia sono varianti eufemistiche di accidenti; cribbio di cristo; diamine è un incrocio fra diavolo e domine.

Dell'antonomasia si è già parlato trattando del passaggio dal nome proprio al nome comune. Però oltre alle antonomasie basate su nomi propri ci sono quelle basate su nomi comuni (la Riforma, che indica la riforma protestante) o su numerali (la 500, nota utilitaria della Fiat; il 300, il 500 che indicano il secolo xiv e il xvi e non, come il significato consentirebbe, il iv o il vi secolo). Un tempo i dizionari ospitavano soltanto le antonomasie bibliche, classiche, al più manzoniane: ora ospitano anche le antonomasie giornalistiche delle cronache (la Signora per la Juventus) o l'Avvocato per G. Agnelli.

Ellissi = procedimento che provoca spesso conversione (trasformazione): portatile per computer portatile, decappottabile per auto decappottabile, direttrice per linea direttrice, coronarie per arterie coronarie, nera per cronaca nera sono esempi di passaggio da aggettivo a sostantivo per ellissi del sostantivo originario. La disco per disco-music, la lampo per cerniera lampo sono esempi di ellissi che possono provocare cambiamenti di genere (lampo da maschile a femminile) e casi di isolamento dell'elemento di composizione restituito alla sua parte del discorso originaria (in greco la parola dískos è sostantivo). Disco in disco-music è un accorciamento di discoteca, come foto lo è di fotografia o auto di automobile. La Finanza per la Guardia di Finanza è ellissi e antonomia insieme, angolo e rigore per calcio d'angolo, di rigore, un palo, una traversa per tiri che colpiscono un palo o una traversa della porta nel gioco del calcio, la zona per gioco a zona sono esempi di ellissi in cui i procedimenti di selezione di ciò che si può omettere si basano pesantemente su una presunzione di conoscenze condivise. Potrebbero benissimo rientrare nell'ellissi giustapposizioni, come scuola (di) guida, posto (per l')auto, nelle quali le preposizioni sono omesse, e altre come nave scuola, auto civetta, parola chiave, progetto pilota nelle quali si può immaginare l'ellissi della copula (il/la X è un[a] y) o più verosimilmente l'ellissi del pronome relativo e del verbo (che fa da, che è un[a]). Tuttavia, il trattamento che i dizionari riservano a questi fenomeni è piuttosto non sintattico (cioè si limitano a registrarli e a spiegarne il significato senza etichettarli grammaticalmente) o, se è sintattico, viene spiegato in termini di conversione: pilota, scuola, .. vengono considerati, in usi simili a quelli sopra menzionati, aggettivi invariabili sempre posposti. Le ellissi si verificano spesso nell'assunzione dei prestiti: lo scotch da Scotch Whisky, il blitz da Blitzkrieg, il night da night club, i jeans da blue-jeans. Gli esempi riportati fanno pensare che si prenda la prima parola, e nei casi di scotch e night le parole che ancora non erano dei prestiti già acclimatati, come club e whisky. In blue-jeans il riconoscimento del colore porta a non omettere il sostantivo.

Nei dizionari, ovviamente, sono registrate solo le catacresi di metafore, metonimie e sineddoche, quelle riconoscibili fuori di contesto e fissate dall'uso, gli eufemismi e le antonomasie più conosciute e le ellissi ormai lessicalizzate.


II.VI.   Famiglie lessicali, campi semantici.

Famiglia lessicale = insieme di parole che hanno in comune la forma e una parte di significato in quanto derivano dalla stessa base. La comunanza di forma è più importante della condivisione del significato, che è soltanto una conseguenza dell'avere la stessa base formale. Quando per spostamenti di significato non si riesce più a cogliere il legame semantico, non per questo l'unità lessicale cessa di far parte della famiglia (canicola fa parte della famiglia di cane). Quando invece per questioni di allotropia si hanno basi diverse come albero e lat. arbor, pur essendo le 2 basi degli eteronomi, dei sinonimi con significato praticamente uguale, i linguisti preferiscono parlare di famiglie lessicali collegate.

Campo semantico (campo lessicale) = insieme di unità lessicali connesse da relazioni sintagmatiche e paradigmatiche. Fra i campi più studiati nelle varie lingue ci sono quello dei termini di parentela e quello dei termini di colore. Ad esempio, il campo semantico di cavallo comprende iperonimi (equino), iponimi (destriero, ronzino, ..), meronimi (criniera, zoccolo, ..), solidarietà lessicali (galoppare, nitrire, strigliare, montare, ..), scenari in cui rientrano ippodromi, scommesse, .. I teorici del campo lessicale sono strutturalisti, pensano che il campo sia un modo di strutturare un'area concettuale e che il valore delle unità lessicali sia determinato soltanto dalle relazioni con altre unità del campo. All'interno del campo la descrizione del significato è fatta attraverso tratti semantici. Il maggior inconveniente della teoria del campo sta nella difficoltà di stabilire i confini di un'area concettuale astorica e universale rispetto a tutte le articolazioni linguistiche. Assunto in modo ateoretico, il concetto di campo è indispensabile per l'insegnamento del lessico, per l'organizzazione di dizionari onomasiologici e di banche dati.


III.   La descrizione del significato nei dizionari.

Le strategie lessicografiche per far fronte alla polisemia sono varie. Generalmente il dizionario in un volume numera come accezioni (termine lessicografico per ciascuno dei significati di un lemma polisemico) distinte solo i significati così diversi tra di loro da richiedere, per esempio, sinonimi e contrari diversi, iperonimi, meronimi e rapporti di solidarietà differenti. I significati connotati, e talvolta anche i traslati, sono ricondotti alle accezioni più vicine semanticamente, a meno che non sviluppino una fraseologia ampia o siano più frequenti del significato primario: in tal caso possono assumere dignità di accezioni autonome.

Per quanto si cerchi oggi di disegnare in modo uniforme la microstruttura dei dizionari, cioè la struttura interna di ogni voce, il numero e la qualità delle accezioni di un lemma polisemico, resta l'area più difficile da regolamentare, una di quelle in cui i dizionari tendono a diversificarsi fra di loro, perché dividere il significato in quanti discreti è già complesso (quando è possibile), ma diventa sgradevole quando si deve, come nei normali dizionari, farlo attraverso un metalinguaggio non rigidamente normalizzato. Le diversità fra dizionari sono tanto più evidenti quando si tratta di lemmi che non hanno un referente concreto, ma riguardano verbi e aggettivi di processi mentali o affettivi.

Le accezioni numerate sono più per l'occhio che per la mente: servono a far sembrare più ordinata una glossa molto lunga. Gli esempi e la fraseologia distribuiti il più delle volte sotto ogni accezione mitigano la bruschezza dei salti, mostrano che c'è sempre un aggiustamento tra senso della parola nell'esempio e significato definito in capo all'accezione. Un lessicografo è sempre più incline di linguisti e filosofi a non spezzare la fluidità dei passaggi da un significato all'altro, perché se da un lato insegue il rigore e la precisione, dall'altra è conscio che sta scrivendo definizioni per un utente umano, e quindi non solo non può, ma non deve nemmeno essere scientifico ed esplicito fino in fondo, può dare per scontate alcune conoscenze linguistiche ed enciclopediche.

La sua bravura sta nello stabilire che cosa può dare per scontato visto il tipo di dizionario da compilare e il tipo di pubblico da servire. Bisogna evitare il pericolo di promuovere ad accezione quello che è il senso specifico che una parola acquista in un enunciato. La lessicografia italiana, nata con una tradizione di esempi d'autore, corre talvolta il rischio di subire il fascino del bell'esempio: si può finire per frammentare eccessivamente le proprie accezioni inseguendo sensi specifici di un contesto, non riuscendo a dare un'immagine complessiva della parola.

Quanto all'ordine delle accezioni nei dizionari in un volume è ormai generalmente diffuso l'ordinamento per cui si va dal significato che si ritiene basilare, ai significati figurati e specialistici. I significati arcaici, anche se sono stati i primi, finiscono in coda alla glossa, in quanto è meno probabile che interessino ad un utente normale. L'ordinamento storico delle accezioni è invece appannaggio dei dizionari storici che tracciano appunto un quadro della vita della parola dalle prime attestazioni fino ad oggi.

Il numero di accezioni specialistiche contenute in un dizionario monolingue dipende dalla sua mole: se è in più volumi, e non è storico, sarà più enciclopedico e quindi coprirà un maggior numero di aree tecnico-scientifiche. I dizionari per le scuole elementari non contengono di solito accezioni scientifiche; i dizionari ridotti o minori ne contengono meno dei dizionari di cui sono la riduzione, ma ne conservano un certo numero.

È abbastanza raro che la microstruttura di un dizionario monolingue presenti una sezione fraseologica in cui raggruppa tutto ciò che non è riuscito a mettere sotto le accezioni (modi di dire, proverbi). Accade soltanto per lemmi come essere, avere, fare, mettere, dare, prendere, mandare, .., ma a volte non si trova neanche per quelli, e il lessicografo si sforza di inventare accezioni che facciano da comune denominatore per tutte le locuzioni registrate.

Un caso estremo sono le microstrutture dei lemmi costituiti da preposizioni, pronomi, articoli, esclamazioni: le glosse di questi non possono presentare accezioni simili a quelle delle glosse per nomi o verbi e quindi sono degli elenchi ostensivi dei vari tipi di contesti in cui la preposizione, il pronome, .. può essere trovato. La definizione è una parafrasi sinonimica con informazioni metalinguistiche nell'intento di spiegare la funzione di tali parti del discorso.

I lemmi omonimici nei dizionari italiani sono segnalati da esponenti numerici affiancati al lemma. Solitamente se i lemmi sono omografi ma non omofoni, il dizionario lo segnala nella grafia del lemma (pésca e pèsca) e quindi non lo segnala con l'esponente numerico; altri dizionari preferiscono non contare troppo sulla vista del lettore e mettono ugualmente l'esponente numerico, pèsca(1) e pésca(2), nonostante i lemmi abbiano un diverso accento sulla lettera e.

Circa la decisione di fare 2 lemmi omonimici per gru (uccello e macchina), macchia (d'unto e d'alberi), calcolo (biliare e matematico), credenza (opinione e mobile), che da un punto di vista etimologico hanno la stessa origine, i dizionari si comportano in modo abbastanza simile. Ad esempio per credenza, macchia, calcolo vince la lontananza attuale dei significati e tutti danno 2 lemmi omonimici; per gru tutti danno un solo lemma. L'opinione degli esperti in proposito è divisa: c'è chi privilegia l'ottica sincronica sostenendo che quando è improbabile che un parlante istituisca un legame fra i 2 significati, allora è bene fare lemmi omonimici. C'è chi invece ritiene sia compito del dizionario insegnare, riconducendo tutto ad un unico lemma, che esiste un antico legame fra significati oggi lontanissimi.

I dizionari italiani adottano un atteggiamento omonimico implicito nel descrivere i verbi: benché il lemma sia unico, all'interno della voce ci sono di fatto sezioni distinte e indipendenti per il verbo usato transitivamente, per il verbo usato intransitivamente e per il verbo nella forma in -si, cosiddetta riflessiva.


III.I.     La definizione lessicografica.

La definizione di un dizionario dovrebbe contenere ciò che è

universale

necessario

costitutivo

della competenza del parlante nativo, lasciando all'enciclopedia ciò che è particolare, contingente e non costitutivo della competenza. Intendendo con necessario ciò che è pragmaticamente indispensabile a stabilire un accordo tra i parlanti allo stato attuale della nostra cultura. Il problema dominante per la semantica contemporanea, e di riflesso per la lessicografia, non è tanto tenere separato il sapere dizionariale-linguistico dal sapere enciclopedico, quanto stabilire qual è la parte di informazione necessaria, resistente a tutti i contesti. Le soluzioni adottate dai dizionari in commercio sono piuttosto empiriche e non sempre coerenti in tutte le definizioni di oggetti dello stesso tipo. Per adesso nei dizionari generali le definizioni sono in un metalinguaggio poco rigido, molto simile alla lingua di tutti i giorni se non fosse per alcuni particolari che si notato solo con una frequentazione attenta e assidua. I difetti definitori più comuni da cui il lessicografo deve guardarsi sono:

la circolarità diretta, cioè definire A come sinonimo di B e B come sinonimo di A non è del tutto eliminabile in un dizionario che non faccia ricorso ad un metalinguaggio deficitario rigidamente organizzato, però si può aumentare il numero di passaggi necessari per arrivare da A a B, in modo da offrire al lettore più informazioni e non fargli provare il senso di irritazione e frustrazione che la circolarità diretta provoca

l'uso di termini non definiti a loro volta nel dizionario attualmente, l'abitudine di compilare i dizionari con sistemi di videoscrittura o con programmi appositi facilita nell'evitare il rischio di usare in una definizione termini che non compaiono come lemmi nello stesso dizionario

Le definizioni dei dizionari cercano di essere delle parafrasi della parola-lemma tali da avere le stesse occorrenze della parola (un nome con un nome, un aggettivo con un aggettivo, ..). Naturalmente ci sono parole come i pronomi, le onomatopee, certe esclamazioni, i numeri, che non si possono definire con un sinonimo e spesso nemmeno con una parafrasi, ma richiedono definizioni non sostituibili alla parola lemma. In pratica anche per nomi, aggettivi, verbi, avverbi si è visto che la sostituibilità in un contesto di una parola con la sua definizione è molto problematica.

Quando il lemma è costituito da una parola che indica un referente concreto, la definizione è una definizione dell'oggetto (il contascatti è un dispositivo)

in altri casi è piuttosto una definizione della parola (maneggevole vuol dire, significa arrendevole) e/o della sua funzione nella frase

Anche voci non troppo complesse contengono già discrete dosi di metalinguaggio lessicografico, tali da giustificare ampiamente a scuola lezioni per imparare ad interpretare le definizioni dei dizionari. Non a caso i dizionari per gli alunni delle elementari spesso danno il lemma, la parte del discorso, e immediatamente degli esempi seguiti da definizione. Questo modo di procedere è più simile al modo di definire del bambino che, superata la fase delle associazioni, dà definizioni per esemplificare, cioè definisce la parola portando esempi concreti tratti della propria esperienza personale. Dare definizioni attraverso esempi è una strategia che va applicata con estrema attenzione perché è facile cadere nell'errore di definire solo il senso che la parola ha nell'esempio. Rovesciando la procedura dei dizionari per adulti che definiscono l'accezione e poi danno esempi per attualizzare il significato, si è più sicuri di evitare tale errore, ma si rinuncia, per facilitare le cose, ad addestrare gli allievi ai passaggi dal generico allo specifico, dalla definizione fuori di contesto all'esempio. I dizionari che premettono gli esempi non allenano, o allenano meno, a cogliere la sottile differenza fra accezione e significato della parola nell'esempio.

Vi sono dizionari illustrati che non contengono definizioni linguistiche ma ricorrono a definizioni ostensive, costituite da disegni o fotografie. Possono essere dizionari per bambini in età prescolare o dizionari bilingui e plurilingui che illustrano macchine e parti di macchine, uccelli, erbe, funghi, alberi, pesci, .. Il disegno è preferito alla fotografia perché il disegnatore opera una selezione dei particolari da enfatizzare. La fotografia a volte è più bella, ma non mette a fuoco i dettagli importanti per distinguere un oggetto da un altro molto simile. L'ideale resta l'azione congiunta, cioè il ricorrere ad una descrizione linguistica e ad un disegno (o ad una foto). Come la definizione linguistica riesce meglio se la parola viene confrontata con altre simili, e viene situata in un campo lessicale, così disegni isolati di conchiglie, sparsi qua e là dove li destina l'ordine alfabetico, sono utili, ma meno informativi di una tavola raggruppante tutti i disegni delle conchiglie i cui nomi sono lemmi del dizionario. Le tavole permettono di fare confronti, purtroppo però, separando il disegno dalle definizioni, privano il lettore del vantaggio di poter passare dalla descrizione linguistica alla rappresentazione iconica e viceversa senza cambiar pagina (le opere di riferimento su CD-ROM risolvono in modo parziale questi problemi).


IV.   Dizionari di sinonimi e contrari. Dizionari di omonimi.

I dizionari del passato contenevano moltissimi sinonimi. Oggi vi sono dizionari che li danno all'interno della voce: finché rimarrà la convinzione che la ricchezza di sinonimi sia un pregio della lingua italiana, perché consente di variare il discorso, di non ripetere le stesse parole, i dizionari continueranno a fornirli come informazione extra, oltre a servirsene per definire. I dizionari italiani esclusivamente dedicati alla registrazione di sinonimi hanno origine nel secolo scorso sulla scorta della tradizione francese. Erano dizionari che definivano i sinonimi, attraverso gradazioni e distinzioni. Nel nostro secolo invece la tradizione di spiegare la differenza fra i sinonimi non è diffusa: la maggior parte sono cumulativi, cioè raggruppano i sinonimi senza spiegarli. I più estesi hanno divisioni in accezioni numerate seguite da brevi indicazioni simili a quelle dei dizionari bilingui (anche se l'articolazione in accezioni non rispecchia totalmente quella dei monolingui). Il Garzanti contiene inoltre degli inserti di sinonimia ragionata, in cui gruppi di parole dal significato affine vengono definite e confrontate (gara, certame, concorso, partita, tenzone). Fra le caratteristiche che fanno del Garzanti uno dei migliori dizionari di sinonimi sul mercato vi è anche l'indicazione degli analoghi (parole non sinonime ma con affinità semantica), degli iperonimi e degli iponimi, nonché degli inversi (genero-suocero, comprare-vendere).

I dizionari italiani di omonimi sono piuttosto rari anche perché hanno una funzione limitata: fornire la materia per creare giochi di parole, elenchi di omonimi per eventuali analizzatori sintattici (parser). Ben diverso è il ruolo dei dizionari di omofoni e omografi inglesi e francesi che possono essere utili strumenti per apprendimenti stranieri. Il Devoto-Oli su CD-ROM ha una ricerca predisposta che elenca tutti i lemmi omonimici; un dizionario degli omonimi però non si ferma ai lemmi, cerca l'omonimia fra nomi e verbi coniugati, fra alterati e verbi, ..


V.     Dizionari bilingui.

I dizionari bilingui mettono in contatto 2 lingue ai fini della traduzione; si basano su coppie di eteronimi, cioè costruiscono le loro glosse sulla sinonimia attraverso lingue diverse. Le necessarie correzioni dovute all'anisoformismo semantico delle lingue naturali vengono fatte attraverso le discriminazioni di significato, brevissime notazioni poste generalmente subito dopo il numero di accezione e prima del traducente. Queste discriminazioni di significato possono essere dei sinonimi, delle perifrasi, ma talvolta sono in rapporto sintagmatico con il lemma. Sono, ad esempio, soggetti o complementi tipici del verbo che compare a lemma o nomi che si accompagnano alla parola a lemma, quando questa è un aggettivo. In altre occasioni la discriminazione è ellittica di un si dice e quindi si situa su un piano diverso, quello della parola che non si riferisce a qualcosa ma a se stessa (autonimia). Pensiamo alla voce maneggevole, la cui ultima accezione dice T. mar. del vento, quando .. : ebbene questa informazione va parafrasata: maneggevole, termine di marina, si dice del vento, quando .. In questo caso maneggevole è autonimo e del vento insieme a T. mar. svolgono la funzione di discriminazioni di significato. I dizionari bilingui generalmente evitano le discriminazioni di significato sul piano dell'autonimia, che sono invece più comuni nei dizionari monolingui. Negli esempi che seguono, tratti da dizionari bilingui, le discriminazioni sono in rapporto paradigmatico o sintagmatico con la parola che sta a lemma, e tale parola non è presa come autonima, ma come segno linguistico da inserire in sintagmi ed enunciati. È da tradurre con certi traducenti quando è sinonima dell'espressione che funge da discriminatore di significato (primo esempio) o entra con essa in rapporto sintagmatico (secondo esempio). Le discriminazioni di significato sono in entrambi gli esempi in corsivo e tra parentesi tonde.


critèrio m. 1 .. ; (principio) .. 2 (fam) (buon senso) .. ; (discernimento) .. 3 (idea, opinione) ..


affranchir (come finir) vt 1 (anche fig.) .. || 2 (la posta) .. || 3 (veter.: animali) .. || 4 (dir.: una proprietà da obbligo o servitù) ..


La lingua in cui sono date le discriminazioni di significato rivela qual è la direzione che gli autori hanno privilegiato per quella parte di dizionario. Infatti se le informazioni grammaticali, di registro, di sottocodice e le discriminazioni di significato sono nella lingua del lemma, vuol dire che si privilegia l'utente che ha come lingua madre la lingua del lemma. Perciò nella metà del dizionario che va dall'italiano all'inglese se tutte le informazioni suddette sono in italiano vuol dire che si vuol favorire l'italiano che traduce dall'italiano in inglese; se nella metà inglese-italiano le informazioni sono sempre in italiano, allora si vuole aiutare l'italiano che sta leggendo e traducendo un testo inglese, ma se le informazioni sono date in inglese allora si vuole aiutare un inglese che usa il dizionario per tradurre dall'inglese in italiano. Quando un lessicografo che compila bilingui vuol essere servitore di 2 padroni li serve entrambi male, ma dovendo decidere in che servirli meglio, il lessicografo privilegia il compito più difficile, cioè la traduzione in lingua straniera. Questo spiega perché quando un dizionario bilingue vuol essere venduto sui mercati di entrambe le comunità linguistiche dà le discriminazioni di significato nella lingua del lemma, supponendo, a ragione, che l'utente abbia bisogno di maggior aiuto quando deve scrivere un testo in lingua straniera. Dopotutto l'italiano che traduce dall'inglese ha il contesto del brano che sta leggendo a fargli da discriminatore di senso, a fargli scartare i traducenti di accezioni inaccettabili in quel testo. Le microstrutture dei bilingui italiani sono abbastanza simili: la grande maggioranza dei dizionari suddividono la fraseologia sotto le varie accezioni, per cui si è spesso costretti a leggere molte accezioni e molti traducenti prima di scovare quello giusto. I dizionari Sansoni di tedesco e di francese hanno invece adottato una microstruttura più pratica per chi ha fretta di trovare un traducente: raggruppano in alto nelle prime righe della glossa tutte le accezioni coi traducenti, mentre la fraseologia è presentata di seguito organizzata in modo alfabetico. Con una microstruttura che raggruppa subito all'inizio tutti i traducenti, pur mantenendoli discriminati in base all'accezione, l'utente meno esperto è invogliato a cercare se ci sia un traducente migliore del primo su cui è capitato. Nei dizionari bilingui nella metà che va dalla lingua straniera alla lingua madre i lessicografi privilegiano la creazione di omonimi per 2 ragioni:

i dizionari bilingui sono generalmente più sincronici dei monolingui, non danno etimologia e quindi l'utente non può nemmeno porsi il problema di stabilire quali sono gli omonimi per ragioni etimologiche e quali per ragioni di lontananza di significati attuali

nei dizionari bilingui si fa di tutto per rendere le glosse più facili da consultare; spezzare una glossa lunga in 2 glosse più brevi, relative a 2 lemmi omonimici, è uno dei modi per raggiungere il risultato

Nella metà che presenta il lemmario in lingua straniera il dizionario bilingue deve affrontare problemi di lemmatizzazione diversi per ogni lingua (come registrare i phrasal verbs inglesi, i verbi separabili tedeschi, le parole composte inglesi, ..).


VI.   Dizionari onomasiologici e analogici, tesauri.

I dizionari che dispongono i lemmi in base all'ordine alfabetico sono detti dizionari semasiologici e vanno dal significante al significato; i dizionari che invece raggruppano le parole in base a criteri semantici o pragmatici sono detti onomasiologici e vanno per così dire dal significato al significante. I dizionari onomasiologici possono seguire un metodo, applicare un sistema, spiegato nell'introduzione, per suddividere i concetti, e quindi i vocaboli, ed è interessante studiare questi sistemi come specchio delle concezioni del mondo legate ad un'epoca. Se conservano questo metodo in modo esplicito e hanno capitoli e sottocapitoli sono appunto detti dizionari sistematici o metodici.

Il lessicografo, dopo aver usato un metodo per stabilire i centri attorno ai quali raggruppare i vocaboli, può decidere che al lettore non serve conoscerlo, e presentare le parole attorno alle quali ha riunito le altre come capitoletti disposti in ordine alfabetico. Questo tipo di dizionario onomasiologico è detto analogico ed è stato soprattutto sviluppato in Francia. I dizionari analogici comunemente sono cumulativi, cioè non danno definizioni, e presentato come intestazione dei capitoletti parole che sono nomi, più raramente verbi e aggettivi.

I primi dizionari italiani furono onomasiologici: La fabbrica del mondo (1548) di Alunno, ad esempio, suddivide i vocaboli in 10 capitoli intitolati: Dio, Cielo, Mondo, Elementi, Anima, Corpo, Uomo, Qualità, Quantità, Inferno. Il primo dizionario bilingue a stampa è l'Introito e porta, italiano-tedesco (1477), una specie di vademecum da viaggio per mercanti e quindi presenta i vocaboli suddivisi per aree pragmatiche: trasporti e vie, alberghi, osterie e stallaggi, monete, cibi, .. La convinzione di tutti i compilatori di dizionari onomasiologici è che il loro modo di ordinare i vocaboli si possa estendere alle altre lingue e sia valido attraverso il tempo. Nell'800 vi fu in Italia una fioritura di dizionari onomasiologici detti dai loro autori metodici o sistematici e talvolta domestici, perché l'area del lessico legata alla vita domestica era fra le più comunemente trattate in tali dizionari. Questa fioritura va collegata all'esigenza di imparare i termini italiani degli oggetti e delle azioni della vita quotidiana o delle arti e dei mestieri che fino ad allora ogni regione aveva nominato con vocaboli dialettali. All'inizio del xx secolo è stato pubblicato l'ultimo grande dizionario onomasiologico dell'italiano, Il tesoro della lingua italiana Vocabolario nomenclatore illustrato (spiega e suggerisce parole, sinonimi, frasi) di Premoli. Premoli procede per ordine alfabetico, dando brevi definizioni in cui appare in grassetto la parola che ha nel vocabolario un trattamento esteso. Quando arriva, nell'ordine alfabetico che le spetta, una voce che ha sinonimi, analoghi, .., e alla quale si è fatto rimando da altre voci, allora Premoli la definisce, dà sinonimi, fraseologia, meronimi, .. definendoli a loro volta. Il dizionario di Premoli sembra perciò piuttosto un dizionario analogico con definizioni, ma rispetto ai dizionari analogici ha un numero altissimo di voci guida o capitoletti di estensione variabilissima e contiene anche molte voci derivate, alterati, avverbi con rimando alle voci più sviluppate. Va sottolineata la sua incredibile ricchezza e unicità nell'ambito della lessicografia onomasiologia non solo italiana. Nel 1939 Palazzi compilò un Novissimo dizionario della lingua italiana che costituiva un tentativo originale e riuscito di innestare un dizionario onomasiologico in un dizionario alfabetico. Oltre ad avere una parte nomenclatoria con sinonimi, contrari, meronimi in coda alle voci di un normale dizionario con etimologia, indicazioni grammaticali, definizioni ed esempi, queste dizionario presentava delle tavole nomenclatorie cumulative, simili a capitoli di dizionari domestici (abbigliamento, cavallo, mestieri vari, ..). L'esempio del Palazzi è stato seguito, soprattutto nell'ultimo quarto di secolo, da quasi tutti i dizionari monolingui italiani che ora presentano tavole di nomenclatura o inserite nel corpo del dizionario o in appendice.

Il termine tesauro (dal greco tesoro) è stato usato nell'antichità e nel Rinascimento per indicare opere enciclopediche e lessicografiche sia semasiologiche sia onomasiologiche. La sua diffusione attuale è legata al fatto che è stato ripescato da Roget nella sua forma latinizzata (thesaurus) per battezzare il suo dizionario sistematico cumulativo (1852). L'analogia fra ricchezze ammassate e cumulate e il patrimonio lessicale di una lingua è antico: pareva che un dizionario non alfabetico che valorizzasse i rapporti semantici fra le parole meglio degli altri mostrasse i tesori di una lingua. La fortuna del dizionario di Roget, non eccezionale in sé, ma reso eccezionale dal fatto di essere inglese, cioè fatto per valorizzare i rapporti semantici fra le parole della lingua internazionale per eccellenza, ha determinato la fortuna del termine tesauro nel nostro secolo. Thesaurus in area angloamericana ricopre il significato di dizionario onomasiologico (di qualunque tipo); in Italia il termine tesauro si usa prevalentemente per indicare i sistemi di classificazione elaborati per la ricerca di informazioni in banche di dati. I tesauri sono quindi raramente a stampa; semmai la versione a stampa è un prodotto secondario, per migliorare il sistema, per vederlo nell'insieme. Sono cumulativi, non hanno definizioni, si configurano come reti di parole legate fra di loro soprattutto dalla relazione di sinonimia, di iperonimia-iponimia, olonimia-meronimia. Sono per campi ristretti del sapere e più spesso per ambiti tecnologico-scientifici, ma sono stati compilati e felicemente adottati tesauri generali per ricerche bibliografiche per soggetto nei cataloghi unificati di biblioteche universitarie o nazionali consultabili tramite computer. Il più conosciuto dall'utente comune è questo tipo di tesauro che aiuta la ricerca bibliografica: quanto ai cosiddetti tesauri inclusi nei sistemi di videoscrittura sono più che altro rudimentali dizionari dei sinonimi.


  1. CENTRO E PERIFERIA DEL LESSICO. LESSICO E COMPUTER.

I.   Varietà di lingua e di lessico.

Esiste un centro del lessico, un nucleo di parole che ogni membro di una comunità linguistica non può non sapere, e settori lessicali frequentati solo da certi gruppi di persone. È facile rendersi conto che il lessico cambia abbastanza rapidamente, più rapidamente della sintassi e della fonetica (un nonno che ascolta il proprio nipote parlare con i suoi coetanei; lo stesso nonno usa parole che il figlio non usa più, ma che capisce, mentre il nipote non le usa e non le capisce nemmeno). Il lessico dunque è qualcosa di diverso per tutti noi: c'è un nucleo comune, ma poi ci sono dei sottoinsiemi di parole che condividiamo solo coi coetanei o con i colleghi di lavoro o con i compagni di tempo libero. Le cosiddette varietà della lingua non consistono unicamente in caratteristiche lessicali, ma certo queste sono le più vistose. Abbiamo quindi parole che appartengono a varietà diacroniche, quelle che nei dizionari vengono etichettate come arc(aiche) o disus(ate) o ant(iquate). Vi sono parole che appartengono a varietà diatopiche, che vengono cioè usate in particolari zone del paese: le abbreviazioni di dialetto o le più generiche sett(entrionale), merid(ionale) segnalano nei dizionari la varietà legata al luogo. Le parole appartengono poi a varietà diafasiche, cioè legate all'uso funzionale o contestuale e in particolare ai sottocodici che dipendono dall'argomento di discorso e ai registri legati invece al destinatario del messaggio. Quando in un dizionario appare un'abbreviazione come alp(inismo), fil(osofia), metr(ica), biol(ogia), .., il lessicografo sta segnalando appunto un'accezione che appartiene ad un sottocodice. Le etichette di registro sono invece volg(are), pop(olare), aul(ico), colloq(uiale), lett(erario), .. : mettono in guardia dall'usare la parola in una o in tutte le sue accezioni quando si ha a che fare con certi interlocutori e permettono, leggendo, di cogliere aspetti pragmatici e non solo di senso. Lett(erario) indica termini usati in testi letterari e perciò considerati alti anche quando usati fuori da testi letterari. Nei dizionari le etichette funzionali e di registro finiscono per veicolare anche informazioni relative ad altre varietà e in particolare a varietà diastratiche, cioè legate alla stratificazione sociale in classi e gruppi: se gerg(ale) è a metà fra il sottocodice e la varietà diastratica, colloq(uiale) è spesso usato in luogo di parlato per indicare una varietà diamesica, condizionata cioè dall'uso del mezzo scritto o orale. Bur(ocratico) è più spesso una segnalazione di registro formale e pedantesco che non l'indicazione di un sottocodice. Teoricamente bisognerebbe avere 2 serie di abbreviazioni, una per i registri dello scritto e una per i registri dell'orale: succede abbastanza spesso che quanto suona popolare parlando, risulti volgare se scritto. Nessun dizionario in un volume arriva a tanto, quelli in più volumi segnalano per esteso la differenza, ma non sistematicamente. Vi sono poi abbreviazioni, come iron(ico), scherz(oso), spreg(iativo), enf(atico), che segnalano l'irrigidimento di un uso stilisticamente connotato della parola (carretta è scherz(oso) per auto vecchia e malridotta). Un parlante, specie se giovane o straniero, può conoscere una parola, ma non conoscerne le accezioni spregiative o scherzose: queste segnalazioni di registro e di uso connotato sono fra le più preziose e le più delicate in un dizionario, perché soggette a rapido invecchiamento.


II.     Lessici specialistici e dizionari specialistici.

Il lessico può dunque essere suddiviso in vari modi a seconda delle prospettive adottate e degli scopi della ricerca. C'è una lessicografia degli autori che studia il lessico di un autore o di un movimento artistico e come tale fornisce materiali preziosi alla critica letteraria. C'è una lessicologia per periodi cronologici che spiana la via tanto allo storico delle idee quanto allo storico della lingua. C'è una lessicologia, strettamente imparentata alla dialettologia e alla sociolinguistica, che studia il lessico in relazione all'area geografica in cui è usato. Ci sono studi dei lessici propri di un determinato mestiere artigianale che sono il punto di partenza per ricreare nei musei di cultura materiale botteghe e officine ormai scomparse, e studi sui termini propri di moderni procedimenti industriali che spesso sconfinano negli studi di terminologia, di standardizzazione delle nomenclature. A questi studi lessicologi corrispondono produzioni lessicografiche che vanno sotto il nome di dizionari specialistici in quanto contrapposti a quelli generali. Benché tutti i dizionari che non cerchino di dare un'idea complessiva del lessico di una lingua siano specialistici, di solito con questo termine il grande pubblico indica i dizionari riguardanti varietà diafasiche e in particolare dizionari che comprendono il lessico di un sottocodice (un dizionario di architettura, di bioetica, ..). Non c'è limite alla specializzazione di un sottocodice. Nella ricerca lessicologica il rigore porta alla raccolta di dati copiosi relativi ad un numero di lemmi ristretto o di dati non facilmente manipolabili ai fini della preparazione di un articolo di dizionario a stampa leggibile. Di grande vantaggio risulta a questo proposito la possibilità di liberarsi dai vincoli della stampa, confezionando raccolte di dati lessicali da consultarsi tramite computer. Da questi dati chi volesse stampare un'opera con voci snelle e di consultazione rapida per esigenze non scientifiche potrà scegliere solo alcuni campi e tralasciare altri senza che questi siano persi. Resteranno nella banca di dati a disposizione di altri ricercatori che magari vorranno confezionare opere lessicografiche o di consultazione di diverso taglio. Finora tuttavia i dizionari specialistici a stampa, soprattutto quelli relativi ad un sottocodice, hanno presentato degli articoli molto diversi da quelli del dizionario generale e hanno inglobato solo quelle informazioni che paiono alle case editrici di vero interesse per il pubblico. Così, nonostante questi dizionari siano molto spesso bilingui o plurilingui, non contengono quasi mai indicazioni di pronuncia o di grammatica, non danno esempi e se contengono definizioni sono definizioni di carattere enciclopedico. Il fatto che non diano indicazioni di parte del discorso è abbastanza comprensibilmente legato alla natura del lemmario: si tratta di lemmi che sono quasi esclusivamente sostantivi o sintagmi nominali, raramente verbi, quasi mai aggettivi o altre parti del discorso; tuttavia per le lingue che hanno il genere grammaticale almeno questo andrebbe indicato. Si direbbe che gli autori e le case editrici pensino ad un pubblico di traduttori ed interpreti che non hanno bisogno di queste indicazioni o a utenti senza alcun interesse a tradurre. Alcuni dizionari specialistici di dizionario hanno solo il nome, perché sono piuttosto delle piccole enciclopedie con voci ordinate alfabeticamente. Per il nostro secolo una bibliografia di dizionari specialistici italiani sarebbe di ardua compilazione, qualora si volesse raggiungere un accettabile grado di completezza. Infatti le specializzazioni sono talmente tante che le fonti di informazioni più complete e aggiornate finiscono per essere le associazioni di categoria o gli organismi e i centri internazionali, quali INFOTERM o TERMIA, preposti al delicato compito di stilare versioni multilingui di regolamenti, normative, .. Per i settori in cui l'aggiornamento è vitale e l'utenza vede una convenienza economica nel restare il più possibile aggiornata, l'editoria specializzata offre ormai banche di dati in linea o su dischetto o su CD-ROM periodicamente riviste, a cui ci si abbona e che contengono sia testi sia glossari multilingui. Una bibliografia di strumenti lessicografici specialistici che aspirasse ad una certa completezza e non volesse diventare obsoleta nel giro di pochi anni dovrebbe quindi non solo prendere in considerazione anche dizionari e glossari consultabili via computer, ma soprattutto dovrebbe essa stessa essere concepita come opera di consultazione su supporto elettronico, in modo da poter essere agevolmente aggiornata.

Più avanti si parlerà di quei dizionari specialistici i cui articoli sono costituiti da un lemma e da numeri relativi ad informazioni statistiche o da un lemma e dalla lista dei passi in cui compare in una determinata opera o nella produzione complessiva di un autore: per queste opere di solito si evita di usare nel titolo la parola dizionario o vocabolario, preferendo termini specifici (concordanze, lista o lessico di frequenza, ..), ma ragioni di mercato spingono ugualmente ad adottare i nomi più diffusi e generici perché sono più facili da ricordare.

Altri tipi di dizionari specialistici che riguardano da vicino i linguisti e gli insegnanti di lingua sono

quelli che si concentrano sull'origine e sulla storia della parola (dizionari etimologici, dizionari di neologismi, di esotismi)

i dizionari che mettono in risalto i rapporti di senso (dizionari dei sinonimi e dei contrari, dizionari analogici) e quelli che si basano sui rapporti fra parole e cose o concetti (dizionari onomasiologici)

i dizionari che contengono solo lemmi formati in un certo modo (dizionari degli alterati, dizionari di falsi amici)

dizionari che danno unicamente le forme coniugate dei verbi o le loro reggenze sintattiche (dizionari di valenze)

Va precisato che le ricerche lessicologiche, e le opere lessicografiche in cui talvolta sfociano, possono mescolare aspetti diversi (diacronici e diafasici, diacronici e grammaticali). L'editoria commerciale favorisce la commistione fra dizionario bilingue (o plurilingue) e dizionario specializzato di sottocodice o fra dizionario bilingue (o plurilingue) e dizionario enciclopedico, generalmente di uno o più sottocodici. La vitalità di una lingua naturale si deduce dalla sua capacità di creare terminologia specialistica senza ricorrere troppo spesso al prestito dalla lingua internazionale della scienza che un tempo era il latino e adesso è l'inglese, anzi l'angloamericano. L'italiano da questo punto di vista è meno agguerrito del francese o dello spagnolo e perlopiù s'arrende al prestito crudo o s'arrangia rivestendo di morfologia italiana gli ostici anglicismi. Se il settore della terminologia specializzata fosse lasciato un po' meno in balia dei soli addetti ai lavori, se ci fosse da parte delle associazioni di categoria una maggior abitudine a chiedere anche il parere dei linguisti prima di procedere a certe coniazioni, forse l'italiano dei lessici tecnico-scientifici moderni godrebbe di maggior salute. La condizione ideale per avere lessici specialistici più ricchi di coniazioni italiane sarebbe avere degli addetti ai lavori con una maggior coscienza linguistica. Tuttavia, nel 1991 è stata fondata a Roma l'Associazione Italiana per la Terminologia con lo scopo specifico di promuovere l'arricchimento della terminologia scientifica e tecnica in lingua italiana. Va notato comunque che spesso la questione della traduzione in buona lingua italiana si innesta su un problema più complesso con antiche radici nella tradizione scolastica italiana: la nostra scuola persegue ancora una cultura troppo umanistica per formare schiere di scienziati con una sensibilità spiccata nei confronti dei problemi linguistici legati alla trasmissione dei risultati della ricerca scientifica.


III.   Il vocabolario di base tra frequenza, dispersione e disponibilità.

Il vocabolario di base o fondamentale di una lingua, quello condiviso da tutti i parlanti di una comunità linguistica, dovrebbe essere formato da parole comuni in accezioni comuni, non dovrebbe, a rigore, includere parole tipiche di una sola regione, di un sottocodice o di uno strato sociale o di epoche passate. Selezionare la parole che fanno parte di un vocabolario di base è dunque operazione delicata che è stata affrontata in Italia prevalentemente sulla scia di studi consimili condotti per l'inglese e il francese. I criteri con cui si può redigere una lista di parole considerate fondamentali sono

o legati all'esperienza del linguista

o basati su spogli di testi, generalmente scritti

L'esperienza dice che vi sono parole presenti di rado nei testi, ma ciò nonostante di alta disponibilità nella vita quotidiana. Gli autori di liste di parole fondamentali

possono soggettivamente decidere quali e quante sono le parole di maggiore disponibilità da includere nei loro elenchi

oppure possono interrogare gruppi diversi di parlanti per isolarle

Gli spogli di testi danno liste di frequenza: la frequenza però può essere poco significativa se il corpus non è ben bilanciato, cioè non è costituito da tipi di testi diversi, e nel caso di periodici e quotidiani, anche di periodi temporali diversi. Per ragioni casuali una parola potrebbe essere usata moltissimo e poi tornare ad essere usata poco; è necessario perciò calcolare la dispersione di una parola, cioè fare la media della sua frequenza nei vari tipi di testo. Se una parola compare solo in alcuni tipi di testi vuol dire che ha una dispersione minima, se invece compare in tutti i tipi di testi ha una dispersione massima. Secondo Sciarone non è necessario includere nella lista parole ad alta disponibilità, né calcolare la dispersione, ma basta allargare al milione e mezzo le occorrenze per avere delle frequenze stabili, non dipendenti da contesti e casi fortuiti. Generalmente, però, i dizionari di frequenza danno la dispersione; un altro valore spesso fornito è il cosiddetto coefficiente di variazione, una combinazione della frequenza e della dispersione, detto anche uso della parola. Tuttavia questo valore uso non serve per ordinare le parole secondo un criterio d'importanza. Più una parola è frequente, meglio è distribuita; un lessico di base che contenga solo parole molto frequenti sarà utile per capire qualsiasi testo sia scritto che parlato.


III.I.     Quali e quante sono le parole fondamentali??

I primi vocabolari fondamentali e di frequenza dell'italiano sono dovuti a studiosi stranieri oppure a italiani operanti all'estero

Il primo vocabolario fondamentale di italiano è la lista di 500 lemmi, fra cui anche parole grammaticali, con frequenza non inferiore a 30, che ricavò Thompson nel 1927.

Il secondo vocabolario fondamentale è quello di Knease; è del 1931/33, elenca circa 2090 parole; tali parole hanno una frequenza minima e una dispersione minima di 9.

Seguono altre liste intorno alle 3000 parole.

Nel 1943 Migliorini pubblica in Germania una lista delle 1500 parole italiane più importanti, dandone il traducente tedesco, un'esemplificazione minima e la pronuncia in IPA.

Dopo 15 anni dal suo primo elenco, nel 1962 Russo pubblica una lista di 452 idioms (modi di dire, frasi fatte, sintagmi lessicalizzati, ..) fra i più comuni e dispersi in testi per l'insegnamento dell'italiano adottati nelle scuole americane.

Giovannelli nel 1966 pubblica in Germania un dizionario composto da 74 parole grammaticali, 2000 parole di lessico fondamentale e 2500 parole di perfezionamento; queste ultime non sono in ordine alfabetico, ma per campi concettuali. Tutte le 4500 parole sono accompagnate da traducenti tedeschi e esemplificazione.

Nel 1974 Reiske prepara per l'unione delle scuole popolari per adulti una lista di 1580 lemmi, compresi i termini grammaticali, corredati di ricca esemplificazione.

Nello stesso anno Baldelli e Mazzetti pubblicano il Vocabolario minimo della lingua italiana per stranieri, che contiene un repertorio di 1741 parole con esemplificazione e traducenti in inglese, francese, tedesco e spagnolo.

Galli de' Paratesi nel Livello Soglia per l'insegnamento dell'italiano come lingua straniera (1981) ha incluso una lista di 1400 parole selezionate in base a criteri soggettivi della lingua parlata; le parole sono accompagnate da esempi o definizioni.

Con il Lessico di frequenza della lingua italiana contemporanea (LIF) di Bortolini, Tagliavini, Zampolli (1972) e il Frequency Dictionary of Italian Words di Juillard e Traversa (1973) si passa dalle liste pensate soprattutto per l'insegnamento a liste che sono il frutto di spogli elettronici di corpora bilanciati (testi di teatro, narrativa, saggistica, periodici, testi tecnici e scientifici). Entrambi ricavano una lista di oltre 5000 lemmi.

Il Vocabolario fondamentale della lingua italiana (1977) di Sciarone combina i 2 ultimi campioni sopra citati con un nuovo campione: ne ricava i 2726 termini più frequenti.

A parte gli ultimi 3 dizionari di frequenza, le liste fin qui menzionate hanno come principali destinatari gli studenti stranieri di italiano. L'avvento della cosiddetta scuola dell'obbligo nel 1963, unificando l'Avviamento e la Scuola Media, riunendo nelle stesse classi alunni di estrazione sociale molto diversa, ha fatto esplodere il problema dell'italiano lingua straniera in patria, ossia la questione di quanta lingua dovessero sapere gli allievi che uscivano dagli 8 anni di frequenza. Una risposta al quesito è venuta da De Mauro e dai suoi collaboratori, che hanno elaborato il VdB Vocabolario di base. Del VdB fanno parte 2000 vocaboli fondamentali, 2937 parole di alto uso e 1753 vocaboli di alta disponibilità. I 2000 vocaboli fondamentali sono le 2000 parole di maggior uso (frequenza per dispersione) del LIF. Se si usavano solo le parole del vocabolario fondamentale, si poteva sperare di essere capiti dal 66% della popolazione italiana, cioè da quelle persone che avevano almeno la licenza elementare. Il VdB è stato sottoposto a verifiche per controllarne la reale comprensione da parte di ragazzi di 3° media e di adulti con la licenza media. Di recente nella sua versione allargata di circa 7050 vocaboli (1991) è stato allegato al Codice di Stile delle comunicazioni scritte ad uso delle amministrazioni pubbliche. Il VdB è una lista di parole, un lemmario; basandosi in parte su tale lemmario, De Mauro e Moroni hanno costruito il DIB Dizionario di base della lingua italiana, un vero e proprio dizionario con glosse ed esempi e una grafia particolarmente chiara. Comprende 2000 voci di parole fondamentali, 3000 di parole di alto uso, 2000 di alta disponibilità e altre 8000 che risultano indispensabili per la comprensione dell'informazione corrente giornalistica, di costume, sportiva, .. È per ora il prodotto che più si avvicina ad un dizionario per apprendenti stranieri. È da affiancare a queste fonti il recente Lessico Elementare (1994); essendo un lessico di frequenza basato su un corpus di pubblicazioni per allievi della scuola primaria italiana e di composizioni scritte da allievi della stessa fascia, può anche considerarsi uno specchio del vocabolario centrale dei bambini. Un confronto non sistematico fra i lemmi del Lessico Elementare e quelli del VdB:

non mostra differenze per i lemmi fondamentali

mostra alcune differenze per quelli di alto uso

mentre gran parte dei lemmi di alta disponibilità non compaiono nel Lessico Elementare

Per ora nei dizionari generali le parole del lessico fondamentale non sono segnalate nel corpo del dizionario. Il De Felice-Duro (1993) presenta in appendice un vocabolario di base: 1500 parole italiane con le corrispondenti voci francesi, inglesi, spagnole e tedesche. Ci si può chiedere che utilità abbia tale indicazione:

paiono evidenti i vantaggi che ne può ricavare l'insegnante che deve formulare domande di comprensione di un testo e soprattutto l'insegnante di italiano come lingua straniera

ma anche chi consulta comincerà a notare che le parole più frequenti sono anche le più polisemiche, che sono raramente derivati corposi, che comprendono tutti gli articoli, i pronomi, le preposizioni, le congiunzioni più semplici

La polisemia delle parole più frequenti porterà a considerare meglio la distribuzione delle accezioni nelle voci dei dizionari, sia da parte dei lessicografi che da parte degli utenti. I calcoli di frequenza infatti per ora non dicono quale dei molti sensi della parola è il più frequente, ma è già possibile avere buone approssimazioni in tale direzione grazie al calcolo di co-occorrenza statistica, che permette di fissare il valore statistico indicativo della probabilità che hanno 2 parole di essere associate in un determinato testo. DBT, il software di interrogazione impiegato nel CD-ROM dei testi della letteratura italiana Zanichelli, consente tale calcolo e indirettamente, attraverso le co-occorrenze statistiche, indica l'accezione con cui è più probabile incontrare una parola in un testo. Infatti per co-occorrenza statistica si intende il calcolo della probabilità che hanno le parole di un testo, o di un corpus, di essere associate con altre parole.

Non esiste ancora per l'italiano, e non resta che auspicarne la pubblicazione il più presto possibile, un dizionario come il COBUILD inglese che usa i risultati dello spoglio di un corpus vastissimo per ordinare sulla base della minore o maggiore frequenza le accezioni di un lemma polisemico.

Nel 1989 l'IBM Italia pubblica il VELI Vocabolario Elettronico della Lingua Italiana, che contiene 10.000 lemmi: questo lemmario non si può tuttavia dire rappresentativo della lingua scritta contemporanea perché il corpus da cui è tratto, enormemente più vasto di quello del LIF, non è però sufficientemente bilanciato.

Ciò che veramente ha ravvivato la discussione sul lessico fondamentale è stata la pubblicazione del LIP Lessico di frequenza dell'italiano parlato (1993). È stato possibile confrontare le parole più frequenti del LIP con quelle dei precedenti lessici di frequenza sia di italiano scritto, sia di parlato. 2 sono le conclusioni importanti:

il parlato usa un numero inferiore di parole diverse una lista di frequenza basata su campioni scritti risulta valida anche per la lingua parlata

non ci sono novità ampie e sistematiche che si possano dire specifiche del parlato rispetto allo scritto

In un articolo che mette a confronto sistematicamente il VdB con il LIP, si osserva che i risultati del LIP, soprattutto quelli provenienti dalle conversazioni faccia a faccia e da quelle telefoniche, dovrebbero consentire di riequilibrare il VdB attraverso:

l'immissione di nuovi lemmi (ascolto, insegnamento, percorso, giornalistico, teorico, assolutamente)

lo slittamento da una fascia all'altra (aeroplano e motocicletta andrebbero sostituite con aereo e moto)

la riconsiderazione delle categorie morfologiche con le quali sono etichettati nel VdB i lemmi omografi (amico, critico, espresso, vuoto registrati non solo come sostantivi, ma anche come aggettivi)

Il problema diventa ancora più acuto quando si passa al confronto fra il LIP e i lemmi della fascia del Vocabolario di alto uso nel VdB: la permanenza o la scomparsa di certi lemmi dipenderà dal peso che si vorrà attribuire ai tipi testuali in cui essi occorrono o non occorrono, e gli interventi richiederanno una puntuale analisi qualitativa. Il confronto fra lemmi di alta disponibilità nel VdB e lemmi del LIP conferma che si tratta di un lessico abbastanza nascosto anche nell'uso del parlato, ma riserva anche interessanti sorprese: numerosi lemmi che nel LIP sono concretamente attestati dovrebbero essere promossi e inseriti almeno nella fascia di alto uso (carino, chilo, pizza, signorina). In conclusione: sia la quantità sia la qualità delle parole che costituiscono un lessico fondamentale (dell'italiano o di un'altra lingua) possono variare a seconda delle esigenze e dell'età dei parlanti/scriventi, ma le 2000-3000 parole risultanti come più frequenti dagli spogli di corpora bilanciati sono sicuramente fondamentali per vivere comunicando decentemente in una comunità, in quanto permettono di riconoscere il 90% del lessico usato nei testi. Riconoscere il 90% dei testi non significa necessariamente capirli al 90%, come vedremo, ma è già un buon punto di partenza. Circa la qualità, è conveniente fare riferimento ad una lista di frequenza basata sul parlato solo se si insegna la lingua parlata, ma per insegnare sia la lingua scritta, sia la lingua parlata, una lista di frequenza ben fatta (cioè basata su un corpus bilanciato e sufficientemente vasto, comunque non inferiore al milione e mezzo di occorrenze, di testi scritti), si rivela molto più attendibile dei lessici redatti a partire dall'esperienza senza il supporto dell'analisi statistica sui corpora.


IV.   Lessico e leggibilità.

Il grado di difficoltà nel comprendere ciò che si sta leggendo è stato misurato in vari modi; naturalmente i modi più pratici sono quelli che:

prescindono dalle caratteristiche del lettore (età, cultura, motivazione), difficili e lunghe da quantificare

e si basano sulle proprietà linguistiche del testo

Per calcolare l'indice di leggibilità di un testo ci si serve solitamente di dati quali numero di sillabe per parola, numero di parole per frase, moltiplicati per determinati coefficienti.

Le analisi del numero medio di sillabe per parola e il conto del numero medio di parole per frase nei testi, dati resi disponibili dalla linguistica quantitativa, permettono di calibrare lingua per lingua i coefficienti da usare nelle formule. Da quando questi indici sono stati inclusi nei pacchetti di software che corredano i programmi di videoscrittura, la loro notorietà è aumentata, anche perché tali programmi li calcolano immediatamente, senza gli sforzi e il tempo prima necessari a chi avesse voluto applicarli a testi non composti attraverso programmi di videoscrittura (si tenga presente che per avere un valore indicativo gli indici devono essere applicati a testi di almeno 300 parole).

Questi indici tendono a sottolineare l'equivalenza parola lunga = parola difficile. Di solito una parola derivata e quindi piuttosto corposa non è una parola molto usata ed è probabile che sia meno conosciuta di altre più brevi. Il rapporto tra lunghezza e frequenza sia nel LIP che nel LIF mostra che le parole più frequenti sono quelle più brevi. Non è difficile però costruire un testo pieno di arcaismi brevi, inseriti in una sintassi semplice, scoprire che è leggibilissimo secondo gli indici e constatare che gli allievi non l'hanno capito che in parte.

Per stabilire se un brano ha una buona leggibilità o è più leggibile di un altro, si devono quindi affiancare agli indici del tipo sopra menzionato anche analisi che tengano conto della diversità lessicale, cioè del numero di lemmi diversi rispetto al numero totale delle parole. Caratteristica dei testi parlati è una minore diversità lessicale (l'esempio più rappresentativo sono le telefonate); i testi del LIP che presentano la maggior lunghezza media di parole sono quelli con il maggior numero di forme e lemmi distinti, sono cioè quelli più pianificati, come lezioni, conferenze, trasmissioni radiotelevisive. I testi scritti, più pianificati, meno ripetitivi, hanno un numero di lemmi diversi più alto.

Infine bisogna tener conto del tipo di parole usate; se un testo è composto con un vocabolario controllato, ad esempio ricorre soltanto a parole riconducibili ai 2000 lemmi del vocabolario fondamentale, sarà più leggibile di un testo che ricorre agli oltre 7000 vocaboli del VdB.

Un programma che tiene conto di tutti gli aspetti fin qui menzionati è ÉULOGOS. Si tratta di un programma che analizza il lessico di testi italiani e anche di corpora di grandi dimensioni. Permette di misurare la leggibilità attraverso il controllo delle parole usate nel testo rispetto ad uno o più vocabolari di riferimento, fra cui appunto il VdB, e attraverso l'applicazione della formula GULPEASE. Quest'ultima è nata presso il GULP, Gruppo Universitario Linguistico Pedagogico dell'Istituto di Filosofia dell'Università degli Studi di Roma La Sapienza, ed è facile perché calcola la lunghezza delle parole in lettere e non in sillabe. I suoi ideatori l'hanno tarata direttamente sull'italiano e sono ricorsi alla lunghezza in lettere per ovviare al problema della divisione in sillabe. GULPEASE è dunque più facilmente informatizzabile; inoltre all'interno di ÉULOGOS l'affidabilità dell'indice è aumentata da un programma che capisce la punteggiatura, cioè individua con precisione dove inizia e dove finisce una frase. ÉULOGOS è stato applicato con successo all'analisi delle istruzioni per la compilazione del modello di dichiarazione dei redditi. DBT (Data Base Testuale) è un software di interrogazione che permette di calcolare l'indice di leggibilità di un testo attraverso la formula GULPEASE e, avendo incorporato il VdB, indica per ogni parola del testo esaminato la sua appartenenza al lessico fondamentale, a quello di alto uso o a quello di alta disponibilità. Quando questi strumenti saranno più diffusi e utilizzati fra chi si occupa di insegnamento dell'italiano, se ne potrà meglio verificare l'impatto positivo sull'efficacia nella scelta dei testi da inserire nelle pubblicazioni didattiche; già fin d'ora si comprende tuttavia come la liberazione dalla fatica del calcolo delle formule di leggibilità e il confronto sistematico con lessici di base costituiscano grandi vantaggi per il glottodidatta e per chiunque si ponga il problema di prevedere oggettivamente la comprensibilità di testi che devono essere capiti dal maggior numero possibile di persone.


V.     Dizionari nei computer.

La lessicografia computazionale è forse la branca della linguistica computazionale più conosciuta fra i non linguisti e in particolare fra i cultori di studi umanistici, ma tutti coloro che si sono trovati ad elaborare testi non numerici con l'ausilio del calcolatore hanno fatto, con maggiore o minore consapevolezza, operazioni lessicografiche. Chi vuole redigere un indice analitico dei soggetti tramite un sistema di videoscrittura deve affrontare problemi di lemmatizzazione e di omonimia, proprio come un lessicografo. Il calcolatore elettronico, permettendo di immagazzinare e rielaborare grandi quantità di dati, è stato fondamentale per le operazioni di spoglio preliminari alla compilazione di dizionari storici e soprattutto per redigere concordanze, liste di frequenza, dizionari inversi. Questo non significa che prima dell'avvento del computer gli studiosi non avessero già approntato opere di spoglio estremamente accurate e di gran mole, ma il tempo che tale lavoro comportava era enorme. Vite intere spesso di più persone. Anche oggi lo studioso che si trova di fronte ad una concordanza con migliaia di contesti ha dei problemi d'analisi, ma l'informatica e i programmi moderni gli permettono di raggruppare automaticamente i sottoinsiemi omogenei di contesti. Attualmente, poi, la possibilità di immagazzinare grandi corpora di testi permette di compilare dizionari che contengono esempi tratti da corpora e di stabilire, attraverso l'analisi dei contesti in cui occorre la parola, quali sono i significati e gli usi più diffusi. Va tuttavia detto fin d'ora che si tratta di imprese di grande respiro che solo gruppi di ricerca agguerriti e con finanziamenti adeguati possono affrontare. Qui si vuole trattare dei dizionari già fatti che l'utente comune può comprare su dischetto, su CD-ROM o incorporati in traduttori elettronici e in sistemi di videoscrittura. Un simile progetto è stato abbozzato col VELI (Vocabolario Elettronico della Lingua Italiana) realizzato nel 1989 dalla IBM Italia con la consulenza scientifica di De Mauro. È fuori commercio, ma è stato generosamente diffuso fra i linguisti. È un prototipo che incorpora informazioni grammaticali relative a 10.000 parole della lingua italiana e programmi che interagiscono con l'utente. Si possono richiedere tutte le parole che possono aver prodotto una determinata forma flessa; tutte le forme flesse che possono venire prodotte da una data parola; la divisione di una parola in sillabe; gli elenchi dei sinonimi e dei contrari di una parola; e una lista di tutte le parole che iniziano con una data stringa (sequenza di lettere). Nel volume che accompagna i 2 dischetti in cui è contenuto il VELI vi sono varie liste:

la classifica ordinata secondo il valore del fattore d'uso per i primi 10.000 lemmi (fattore d'uso = frequenza complessiva del lemma moltiplicata per il suo fattore di dispersione)

la classifica dei 10.000 lemmi con fattore d'uso più elevato, ordinata alfabeticamente

altre liste fra cui un confronto fra i primi 2000 lemmi classificati secondo il LIF e secondo il VELI (si tratta di un confronto interessante perché il corpus del LIF è molto più piccolo, ma più bilanciato)

Questo prototipo di dizionario elettronico non ha definizioni e non ha esempi: potrebbe servire per esercitarsi sulle forme flesse dell'italiano e per la correzione di testi scritti al computer e i suoi programmi potrebbero essere sfruttati per la lemmatizzazione automatica o per l'etichettatura grammaticale delle forme presenti in un testo. Non stupisce che non sia stato commercializzato, poiché è utile soprattutto agli addetti ai lavori: linguisti, glottodidatti che preparino corsi di lingua che implichino l'uso del calcolatore, programmisti di programmi di videoscrittura.


V.I.   Dizionari su dischetto e su CD-ROM in commercio.

La casa editrice che per prima ha messo sul mercato un CD-ROM contenente dizionari è stata la Zanichelli con il CD-ROM Multilingue apparso nel 1987 con 8 lingue coinvolte. Comprendeva allora 12 dizionari bilingui generali e speciali: una delle 2 lingue di ciascun bilingue è l'inglese, l'altra è di volta in volta il cinese, il francese, il giapponese, l'italiano, l'olandese, lo spagnolo, il tedesco. L'edizione attualmente in commercio (1995) comprende 4 lingue in più: danese, finlandese, norvegese, svedese e i dizionari coinvolti sono diventati 18. Il software di interrogazione consente di consultare in pochi secondi ciascuno dei 18 dizionari, voce per voce; visualizzare le sole traduzioni di ciascun lemma; cercare parole e locuzioni all'interno di ciascuna voce; tradurre parole da un lingua all'altra tramite l'inglese; elencare sinonimi; visualizzare le parole cinesi e giapponesi in caratteri Kanji. È un calepino, cioè un dizionario plurilingua, dell'era informatica. Ai tempi dei calepini a stampa la lingua che faceva da cerniera era il latino, ora è l'inglese. A differenza però dei calepini a stampa che avevano una voce lessicografica sviluppata solo in corrispondenza del lemma in latino, e un lemmario unico in latino voltato nelle varie lingue, qui ci troviamo di fronte a dizionari autonomamente concepiti (con voci più o meno articolate, a seconda della mole del dizionario, e con lemmari non totalmente sovrapponibili), messi in contatto dal software di interrogazione. La possibilità di richiamare su video non soltanto la traduzione, ma le intere voci all'interno delle quali il programma di ricerca ha individuato il traducente, offre all'utente un mezzo per controllare il percorso attraverso cui si è passati (poniamo, da una parola italiana a quella tedesca col tramite dell'inglese). Si tratta di uno strumento di consultazione molto potente che nasconde dietro la rapidità e ampiezza di ricerca la qualità diseguale dei dizionari bilingui a stampa su cui è basato. Presenta inoltre l'inconveniente comune a tutti i dizionari concepiti per essere stampati e poi consultati attraverso il video di un computer: il numero di righe che si possono vedere insieme è limitato, anzi più il dizionario di partenza è complesso e ha voci lunghe e articolate, più è raro che una voce stia per intero sul video. Come per gli altri dizionari su CD-ROM di cui parleremo, è possibile accedervi da determinati programmi di videoscrittura e quindi consultarlo, mentre si sta scrivendo un testo, per essere sicuri della correttezza delle proprie scelte linguistiche.

Nel 1989 è stato immesso sul mercato, sempre dalla Zanichelli, Lo Scaffale Elettronico Dizionari, un CD-ROM che contiene:

Il Nuovo Zingarelli Minore

Sinonimi e contrari

Dizionario inglese-italiano

Dizionario di false analogie e ambigue affinità fra inglese e italiano

Dizionario francese-italiano

Dizionario di false analogie e ambigue affinità tra francese e italiano

Il Manuale di stile

Guida alla redazione di documenti, relazioni, articoli, manuali, testi di laurea

Vi è uno specifico software di consultazione, e il CD-ROM può essere usato contemporaneamente con molti programmi di videoscrittura verso i quali permette di trasferire (parti di) voci di dizionario, di incollarle nel documento che si sta componendo o di salvarle in un file. Si tratta di uno strumento che riunisce opere omogenee (dizionari monolingui e bilingui minori), perché prodotte all'interno della stessa casa editrice con un disegno di voce pressoché identico. Quando fu lanciato se ne immaginava un uso da ufficio, più che l'utilizzo da parte di uno studente o di un insegnante a fini didattici, perché allora i lettori di CD-ROM non avevano ancora prezzi contenuti e quindi non avevano la diffusione attuale. La facilità con cui oggi una scuola si può dotare di un lettore di CD-ROM, che potrà servire anche per opere di consultazione relative a materie scientifiche, ha fatto sì che Lo Scaffale Elettronico Dizionari attirasse l'attenzione di chi si occupa di glottodidattica assistita dal computer. Nella loro recensione, Degl'Innocenti e Ferrari osservano che il prodotto risente dell'arretratezza dell'interfaccia grafica del periodo in cui è stato confezionato e che la ricerca sull'intero testo (full text) come unica procedura ammessa, se per un verso è inebriante per la totale libertà di ricerca che offre, per altro verso risulta insufficientemente pertinente sotto il profilo lessicografico (per la riduzione ad un unico campo informativo dell'intera voce) e in ogni caso implica un utente esperto della struttura informativa del dizionario e del suoi codici, capace altresì di formulare l'input per il full text in modo tale da rappresentare coerentemente una domanda di ricerca complessa.

La casa editrice Garzanti ha nel 1995 fatto il suo ingresso nel mercato dei dizionari su CD-ROM con il Dizionario Garzanti di inglese (1994), un'opera bilingue da 75000 voci. Il software di interrogazione si propone di aiutare il più possibile chi deve tradurre, infatti oltre a dare la voce del dizionario bilingue permette, interrogando un apposito campo, di trovare tutti gli esempi in cui la parola cercata viene tradotta, anche se questi esempi di trovano nella voce di un lemma diverso. Gli inserti grammaticali e lessicali che nell'edizione a stampa stavano inseriti nell'ordine alfabetico (auguri nella A, al telefono nella T) sono nell'edizione elettronica accessibili dalle voci in cui compaiono parole che figurano in tali inserti; anche l'inserto lessico per immagini, che nel volume sta al centro fra la sezione inglese-italiano e quella italiano-inglese, è accessibile dalle voci. Quindi se per una parola è disponibile il disegno di ciò a cui si riferisce, cliccando in un determinata sezione della voce è possibile vedere questo disegno. Il software permette di passare da una forma verbale al passato o irregolare al lemma all'infinito, così come la ricerca con caratteri jolly consente di cercare parole di cui non si conosce perfettamente la grafia. La pubblicità insiste sul fatto che è un dizionario che parla: infatti la trascrizione in IPA non compare nel CD-ROM ed è sostituita dalla pronuncia udibile attraverso l'apparecchiatura multimediale. Il software consente di registrare la propria pronuncia di una parola e di confrontarla con la pronuncia (britannica) data dal dizionario. Sono previste edizioni elettroniche su CD-ROM dei dizionari Garzanti francese e tedesco della stessa grandezza.

L'ultima edizione (1995) del Dizionario dei sinonimi e dei contrari di Cinti è venduta con un dischetto che contiene un estratto del dizionario ed è dotato del rispettivo software. Contiene meno voci dell'edizione a stampa, ma la rapidità con cui si passa da un sinonimo all'altro, da un sinonimo al contrario, semplicemente cliccando sulla parola, è davvero efficace. Mette in luce pregi e difetti del procedimento sinonimico meglio di una dotta lezione sull'argomento: già al secondo o terzo passaggio si constata che un sinonimo di un sinonimo della parola di partenza non è necessariamente un sinonimo della parola di partenza. Poiché il campo Ricerche effettuate registra tutte le parole che sono state oggetto di ricerca, è possibile una rapida esecuzione del percorso a ritroso. Una volta installato il dischetto, l'estratto del dizionario di Cinti rimane in memoria e può essere richiamato dall'interno di una documento che si sta scrivendo con un sistema di videoscrittura. Se la parola che abbiamo usato non ci soddisfa, possiamo vedere che sinonimi ci propone l'estratto e sostituirla con quella contenuta nel campo Parola selezionata. Anche per questo estratto elettronico del Cinti vale quanto si dirà più avanti a proposito dei dizionari dei sinonimi incorporati in sistema di videoscrittura.

Il primo grande dizionario monolingue generale dell'italiano in commercio su CD-ROM è stato il Devoto-Oli nell'edizione del 1990. Si è poi nel 1994 messa a disposizione del pubblico una versione ricca di quegli accorgimenti che aggiungono molta efficacia alla consultazione (icone, menu, possibilità di aprire sullo schermo numerose finestre con altrettante voci). Oltre alla ricerca sull'intero testo, consente una ricerca limitata all'area della voce lessicografica in cui è data l'informazione grammaticale e all'area in cui è data l'etimologia. Inoltre, se si possiede una scheda audio, è possibile ascoltare la pronuncia di numerosi lemmi. Per l'utente curioso, ma con poca familiarità con la sintassi della ricerca con operatori logici, il dizionario prevede liste precostituite di:

prestiti suddivisi per lingua donatrice

termini regionali, dialettali, meridionali, toscani

termini arcaici, poetici, onomatopeici

parole derivate dal latino, dal greco, dal francese, .., da nomi propri, da incroci

termini appartenenti a determinati sottocodici (medicina, alpinismo, zoologia, ..)

Quando apparve la versione a stampa del DIR, molti dissero che era il dizionario ideale per essere trasformato in versione elettronica: nel 1996 è stato immesso sul mercato C-Dir che, con un bel gioco di parole, è appunto il titolo della versione su CD-ROM. Il software consente di navigare agevolmente da una voce all'altra guidati dal filo rosso dell'etimologia. Già la versione a stampa aveva una fitta ed efficace rete di rimandi: su quella ha costruito chi ha disegnato il software. Anziché sfogliare basta cliccare sulla parola e si arriva alla voce che interessa. L'interfaccia grafica è molto amichevole e si può scrivere nel dizionario come una volta di glossava ai margini della edizioni a stampa: cliccando sull'icona che rappresenta una stilografica rossa, si possono aggiungere al lemma notazioni personali, che poi si possono recuperare durante successive consultazioni. Interessante è anche la possibilità di ripetere all'incontrario il percorso di navigazione effettuata tramite il click sulle parole evidenziate in blu. Purtroppo però chi ha disegnato il software ha privilegiato solo la caratteristica di raggruppamento etimologico ragionato a sfavore di altre possibili ricerche: impostando una ricerca di parola con carattere jolly non si ottiene, come ad esempio nel Devoto-Oli elettronico, una lista di lemmi che nel dizionario presentano quelle lettere più altre, ma il programma ci porta sulla prima voce in ordine alfabetico che soddisfa la nostra richiesta. Una ricerca che volesse tutti i lemmi terminanti per -to-re nel C-Dir non li ottiene con la richiesta *tore, né in altro modo. Non è possibile fare ricerche su tutto il testo del dizionario, la ricerca è condotta soltanto sui lemmi e, ovviamente, non sono possibili ricerche complesse. Non è possibile richiedere l'elenco dei verbi transitivi o delle parole contrassegnate dall'etichetta letter(ario) e, fatto stupefacente per un dizionario che tanta importanza dà all'etimologia, non è possibile avere una lista di tutte le parole che hanno, supponiamo, un'origine francese. È in corso di preparazione una nuova edizione del C-Dir che dovrebbe consentire le ricerche ora menzionate.

Le recensioni di strumenti lessicografici su CD-ROM apparse nelle riveste specializzate in software e hardware spesso sono carenti nei giudizi sulle procedure di ricerca della informazioni. Non così le recensioni di riviste attente alle nuove tecnologie didattiche. Degl'Innocenti e Ferrari criticano che questi dizionari elettronici:

pur offrendo più percorsi di ricerca, privilegiano, come nel dizionario stampato, il dato già ordinato e perciò statico e oggettivo, la logica chiusa dell'opera scritta sulla logica aperta dell'opera letta

sono poco più che versioni elettroniche dell'opera a stampa, con limiti a concepire un dizionario elettronico come un'opera concettuale diversa da quella cartacea, rivolta a lettori che vanno messi in grado di scoprire e assumere nuovi punti di vista e capaci di porre nuove domande al dizionario

Hanno ragione, ma anche così i dizionari su supporto elettronico sono strumenti meravigliosi

a saper sfruttare bene le possibilità offerte dalla ricerca con gli operatori logici sull'intero testo o su campi particolari si ottengono risultati notevolissimi, imprevedibili, stimolanti; la ricerca di sequenze di lettere all'inizio o in fine di lemma permette di fare morfologia in modo impensabile prima

aprono nuove via alla consultazione del dizionario, fanno venire idee e sviluppano il senso metalinguistico di chi li usa

anche senza considerare gli indubbi vantaggi che offrono sul piano ludico e didattico-educativo, permettono ai linguisti di fare ricerche su quei particolari tipi di testi che sono l'esempio e la definizione di dizionario

consentono inoltre ai linguisti una verifica dell'uso delle etichette grammaticali di parte del discorso o di registro o di sottocodice e inducono a riflettere sull'opportunità di certe innovazioni teorico-terminologiche

infine se, da un lato, esaltano quanto c'è di buono in un dizionario, liberandolo dalla camicia di forza dell'ordine alfabetico, facendolo risaltare anche quando è nascosto tra le pieghe di una definizione lunga e complessa, dall'altro impietosamente rivelano all'occhio attento i difetti di un dizionario, le sue incongruenze, e sono quindi un ottimo strumento di igiene lessicografica, di allenamento per i futuri lessicografi


V.II.     Dizionari nei programmi di video-scrittura e nei traduttori elettronici.

Si apprezza meglio quanto importante sia la qualità del dizionario a stampa trasformato in versione elettronica, quando si consultano i dizionari espressamente creati per i programmi di videoscrittura. Spesso non sono veri dizionari, ma mere liste di parole che servono unicamente a correggere errori di grafia. Hanno un numero piuttosto limitato di lemmi: stabilire quanti è arduo, perché non è quasi mai detto nei manuali dei programmi ed è già tanto se si riesce ad individuare la fonte da cui provengono, spulciando i copyright. Difficilmente superano i 10.000 lemmi: se ben scelti coprono più del 90% del lessico di un testo. Chi veramente vuole usare un buon dizionario, con tanto di esempi e definizioni, mentre compone testi al computer, deve procurarsi quelli italiani su CD-ROM e per le lingue straniere quelli offerti sul mercato da case editrici lessicografiche di prestigio. Ormai l'ambiente Windows consente di accedere dal sistema di videoscrittura al dizionario su CD-ROM in modo agevole. In Word è stato immesso un dizionario dei sinonimi italiani creato appositamente dalla Zanichelli per essere consultato attraverso tale sistema di videoscrittura. È uno strumento modesto ma utile; non è un dizionario apparso prima a stampa. L'utente deve sapere scegliere da solo il sinonimo giusto per il contesto in cui sta scrivendo, perché il dizionario non dà grandi aiuti (mancano abbreviazioni, etichette di registro, ..) e si limita a raggruppare i sinonimi di un'accezione, separandoli da quelli di un'altra. Paradossalmente nel campo dei dizionari dei sinonimi e analogici (generalmente indicati come Thesaurus anche nelle versioni italiane dei sistemi di videoscrittura) la differenza fra dizionario a stampa e dizionario incorporato nel sistema di videoscrittura è meno visibile, perché si tratta di opere quasi sempre senza esempi e senza definizioni anche nelle tradizionali versioni stampate.

Quanto ai traduttori elettronici sono per il momento l'equivalente dei dizionari bilingui tascabili, ma stanno migliorando. Già allo stato attuale offrono molto di più di un dizionario tascabile perché i modelli più costosi parlano, cioè hanno un dispositivo che permette di sentire la pronuncia in un auricolare. Ci sono quelli inseriti, tramite schede vendute a parte, in agende elettroniche e che quindi sono potenziati dalla vicinanza di un calcolatore, di programmi che fanno la conversione in gradi, in lunghezze, .. e che calcolano il cambio delle valute. Non esistono ancora ricerche sul loro uso presso il pubblico italiano, ma c'è da immaginare che:

chi li usa li considera uno status symbol, li trova più pratici dei dizionari tascabili a stampa perché la ricerca è più rapida

le lamentele riguardano la velocità con cui le batterie si scaricano, la cattiva qualità della pronuncia, la piccolezza e la scarsa nitidezza del visualizzatore, il lemmario ridotto e la mancanza di esempi, ma questi ultimi 2 inconvenienti sono condivisi anche dai dizionari tascabili a stampa

Come dimostrano studi recenti, si sta cercando di immettere in questi dizionari elettronici portatili tutta l'esperienza fatta con i dizionari bilingui a stampa diretti ad una sola comunità linguistica: si sviluppano dizionari in cui la parte B-A non è il ribaltamento della parte A-B, ma può essere formata da un lemmario 3 volte più ampio, dal momento che quando si usa il dizionario passivamente, cioè si traduce da una lingua straniera nella propria, è opportuno avere un lemmario più esteso. Sono venduti dalle stesse case che producono dizionari tascabili e da quelle che vendono agende elettroniche e calcolatori tascabili. Nel corso del tempo sono diventati strumenti più seri: a versioni, tuttora sul mercato, che sono poco più che videogiochi, sono stati ora affiancati utili strumenti di consultazione (indicazione di parte del discorso e segnalazione dell'accento; funzione di scorrimento per facilitare la ricerca di parole; disponibilità di frasi utili). Il loro miglioramento è già prefigurato dai modelli le cui prestazioni possono essere allargate da schede:

l'effetto visivo di questi dizionari elettronici tascabili si avvicina a quello offerto dalla pagina stampata, la qualità dei dizionari a stampa presi come fonte è decisamente più alta e quindi la consultazione elettronica ne potenzia il valore

il correttore ortografico permette di trovare una parola anche senza sapere esattamente come si scrive ed è possibile creare una sezione di dizionario personalizzato, memorizzando parole e definizioni specialistiche di cui si sente il bisogno

vi sono anche modelli che oltre al dizionario monolingue contengono un Thesaurus con numerosissimi sinonimi e hanno batterie al litio con una maggiore autonomia: insomma la miniaturizzazione fa entrare in tasca il contenuto di non pesantissimi, ma comunque ragguardevoli, volumi a stampa

le modalità d'interrogazione sono ancora piuttosto rudimentali, vuoi perché si suppone che i bisogni degli utenti di un tascabile siano semplici (come si traduce, come si scrive, come si pronuncia), vuoi perché con visualizzatori così ridotti non ha senso prevedere ricerche che diano come risultati liste di voci

Quanto all'atteggiamento degli insegnanti nei confronti dell'uso in classe di questi strumenti, alcuni li vietano, altri li tollerano, ma se la loro qualità migliorerà, com'è prevedibile, gli insegnanti dovranno prendere in considerazione il fatto che il loro impatto sull'apprendimento delle lingue potrebbe essere tanto grande quanto quello dei calcolatori tascabili sull'apprendimento dell'aritmetica.


VI.   La linguistica dei corpora e le sue ricadute lessicografiche.

Linguistica dei corpora (dall'inglese corpus linguistics) = branca della linguistica che si occupa di elaborare i dati provenienti da larghi insiemi di testi immagazzinati su supporti leggibili dal computer. È dunque una linguistica dei corpora elettronici; una linguistica che si serve del computer come contenitore di grandi quantità di testi e dei programmi informatici per organizzare queste grandi quantità di testi in modo che gli studiosi possano ricavare il più grande numero di informazioni possibili sui testi e sulla lingua in cui sono scritti. I primi passi nella pratica degli spogli elettronici sono stati fatti proprio in Italia su un insieme di testi in latino. In questa sede ci soffermeremo soprattutto sui risvolti lessicografici delle ricerche basate su corpora elettronici, poiché questa utilizzazione a fini lessicologici-lessicografici è stata, e continua ad essere, quella più conosciuta. In considerazione dell'ampio spettro di utilizzazioni linguistiche di un corpus è necessario che il modo in cui i testi sono archiviati venga studiato con cura, da informatici non digiuni di linguistica, meglio ancora da un gruppo di linguisti computazionali che abbiano la pazienza di intervistare i possibili utenti del corpus circa i quesiti che vorrebbero porre. Alcuni esempi concreti chiariranno quanto sia importante per chi disegna i programmi di ricerca prevedere un'ampia gamma di utenti: i CD-ROM contenenti intere annate di giornali sono stati archiviati pensando unicamente alle esigenze di chi ricerca contenuti, MA i giornali, oltre ad essere fonti di informazione, sono anche un esempio autorevole di lingua. Aggiungere al programma d'interrogazione anche la possibilità di fare concordanze sarebbe stato sufficiente per consentire più agevoli ricerche di tipo formale, linguistico. Allo stato attuale si ottiene una lista di titoli d'articoli in cui compare la parola ricercata, ma per vedere il contesto in cui è usata bisogna scorrere gli articoli uno per uno. La parola è evidenziata in colore diverso e questo facilita il suo reperimento, tuttavia il procedimento è macchinoso. Al linguista tocca esportare gli articoli, creando un file da elaborare successivamente con i programmi che consentano di redigere concordanze e statistiche per lui interessanti. Accade lo stesso con i CD-ROM contenenti dizionari italiani: ricercando una parola o una sequenza di caratteri compare una lista di lemmi nei cui articoli si trova quanto richiesto, ma non è possibile avere direttamente una lista di contesti. Si potrebbe obiettare che trattandosi di voci lessicografiche avere i contesti è meno importante. Quando però il dizionario è un dizionario storico con numerosissime e ampie citazioni poter avere le concordanze è molto utile, come si può verificare utilizzando alcuni CD-ROM di dizionari inglesi, il cui programma di interrogazione prevede appunto la possibilità di avere la lista di lemmi affiancati dal contesto in cui compare la parola cercata. Anche il CD-ROM che contiene la Letteratura Italiana Zanichelli (LIZ) è dotato di un programma di interrogazione (il DBT) che consente di redigere concordanze e fare le altre ricerche di tipo formale che si suppone possano interessare ad uno studioso di lingua. Il CD-ROM che contiene la LIZ è la dimostrazione dei vantaggi che derivano da una meditata fase di progetto dei modi di archiviazione e reperimento dei dati.

La storia dei grandi corpora elettronici di testi, ospitati solitamente in centri di calcolo universitari, mostra che ci sono voluti anni per raggiungere l'attuale maturità nelle tecniche d'archiviazione e reperimento di dati e che è sempre opportuno conservare accanto a versioni etichettate (per argomenti, per genere testuale, grammaticale, ..) una versione del corpus poco elaborata, perché in futuro si potrebbero scoprire modi migliori di organizzarlo o semplicemente potrebbero affermarsi diverse esigenze di interrogazione. Quando questa versione non strutturata non esiste o non esiste più, chi vuole unire il corpus ad altri o applicare ad un corpus dei programmi applicati su altri corpora, per confrontare i risultati, incontra dei problemi. Ad esempio, prima dell'avvento della composizione a stampa elettronica, chi voleva costruire un corpus doveva preparare i testi stampati in modo che diventassero accessibili al computer (li trascriveva oppure li faceva leggere da un lettore ottico). Nel corso di questa operazione si aggiungevano manualmente delle informazioni che costituivano un primo fondamentale tipo di etichettatura (data dell'immissione nel corpus, data di composizione del testo, autore, luogo di pubblicazione, argomento, genere, ..). Ora che un corpus viene alimentato da quotidiani, manuali o altri testi già su supporto leggibile da computer, l'etichettatura dev'essere fatta ugualmente, ma si sono sviluppate tecniche automatizzate di estrazione dei dati più semplici da ritrovare. L'unione di un corpus archiviato nel modo tradizionale con un corpus archiviato di recente riserva sempre problemi di compatibilità di etichettatura. Gli autori del LIP hanno accluso al volume 2 dischetti con la trascrizione del corpus di italiano parlato su cui si sono basati. In questo modo tutti si possono rendere conto del materiale da cui provengono le statistiche del volume e soprattutto possono utilizzarlo per trarne altre diverse informazioni. L'ideale sarebbe avere anche le registrazioni da cui sono tratte le trascrizioni, per verificare come sono state fatte, ma già così è un bello e raro esempio di diffusione pubblica di un corpus.

Questo tipo di problemi richiama la nostra attenzione su un dato fondamentale della linguistica dei corpora: i lettori ottici, la composizione elettronica dei testi a stampa e altre conquiste dell'hardware hanno reso la costituzione di corpora elettronici più agevole, ma la qualità di ciò che un linguista, e in particolare un lessicografo, può ricavare dall'interrogazione di un corpus sta in requisiti che sono a monte della tecnologia:

per corpora di testi letterari o di epoche passate importantissima è la scelta di edizioni filologicamente valide

per corpora di parlato la trascrizione è cruciale

altrettanto importante è disporre per la lingua recente di archiviazioni fatte con programmi che consentano interrogazioni molto differenziate

Il lessicografo può trarre molti vantaggi dall'interrogazione di corpora formati di testi

quando si tratta di stabilire quanti e quali lemmi debbono far parte di un dizionario fondamentale

se un'accezione di una parola polisemica è più frequente di un'altra

se si sono elencati tutti i più comuni composti, collocazioni, modi di dire in cui rientra una parola

se conviene scegliere questo o quell'esempio per illustrare un certo uso di una parola

per tutti quei casi, insomma, in cui un gruppo ristretto di parlanti non può esprimere un giudizio sicuro è meglio poter fare affidamento sui dati offerti da un corpus rappresentativo della lingua che si vuol descrivere.

Una branca particolarmente promettente della linguistica dei corpora è quella che sta cercando di fornire materiali per la traduzione che un tempo si diceva automatica e che adesso viene definita, più realisticamente, assistita dal computer. Si tratta di predisporre corpora di testi paralleli, cioè di testi di lingue diverse che trattino lo stesso argomento (non devono necessariamente essere la perfetta traduzione uno dell'altro, ma il contenuto deve corrispondere, paragrafo per paragrafo), coindicizzando i paragrafi paralleli e studiando tecniche di scoperta automatica delle parole o dei sintagmi che indicano gli stessi concetti, oggetti, processi. Per testi moderni ci si serve di vocabolari bilingui elettronici (ricavati da dizionari bilingui a stampa) inseriti nel programma di ricerca ed è così possibile interrogare i testi di ciascuna lingua separatamente o chiedere di visualizzare un testo e la sua traduzione. Per lingue per cui non esistono liste bilingui elettroniche si sfrutta la matrice greco-latina, o il fatto che molti termini sono degli internazionalismi. Questa tecnica è stata usata per approntare la concordanza bilingue di testi latini o volgari italiani: la macchina ricava la radice di ogni parola sottraendone la desinenza da una speciale lista di desinenze preparata appositamente e propone quindi agganci tra parole che abbiano le prime 5 lettere uguali, l'aggancio di parole di forma totalmente diversa è avviato invece manualmente.

Uno dei risultati di una concordanza bilingue è la preparazione di una lista bilingue elettronica che permetterà in seguito di fare concordanze bilingui di testi diversi in modo più rapido e sicuro. Non solo, grazie alla possibilità di avere concordanze bilingui con contesti piuttosto larghi e significativi, si sta affermando fra i traduttori scientifici la tendenza a consultare le concordanze stesse, poiché spesso è inutile estrarre i 2 termini corrispondenti dalle 2 frasi per poi ricostruire frasi molto simili nella traduzione. Specie per i testi scientifici, in cui i termini hanno la tendenza a comparire in contesti piuttosto fissi, con minime variazioni, le concordanze bilingui facilitano la traduzione sintagma per sintagma e addirittura frase per frase.

Utili al linguista, al glottodidatta e al lessicografo, soprattutto a quello che progetta dizionari consultabili attraverso il computer, sono le basi di dati linguistici come quelle prodotte in centri che si occupano di linguistica computazionale applicata all'italiano in Italia e all'estero. Si tratta di liste di lemmi con etichettature grammaticali, sintattiche, semantiche di vario tipo. È questo un campo in espansione e in divenire: ogni riferimento bibliografico diventa obsoleto nel volgere di poco tempo, per cui conviene consultare la rubrica della rivista Italiano & oltre che seleziona l'editoria elettronica e i programmi interessanti per lo studioso e per la scuola, periodici specializzati, atti dei congressi delle associazioni di linguistica computazionale e di intelligenza artificiale. L'augurio che la linguistica computazionale non venga più considerata in Italia come staccata dal corpo centrale della linguistica, sembra essersi realizzato grazie alla maggior possibilità di acquistare computer di medie dimensioni a costi contenuti, all'immissione sul mercato di ottimo software per l'elaborazione di dati linguistici testuali, ai nuovi mezzi di memorizzazione più pratici dei nastri (CD-ROM, dischi magneto-ottici riscrivibili), e anche grazie all'accesso a banche di dati linguistici ampie e lontane resto possibile dalla telematica.

VI.I.     Concordanze, dizionari inversi, dizionari di frequenza.

I prodotti lessicografici più noti fra quelli ottenuti attraverso l'impiego della linguistica computazionale restano:

i volumi di concordanze§

i dizionari inversi o retrogradi: elencano le parole partendo dall'ultima lettera*

i dizionari di frequenza

I primi dizionari inversi furono in un certo senso i rimari compilati a mano: Alinei è il primo dizionario inverso non limitato al linguaggio poetico e frutto del calcolatore. Al di fuori delle ricerche sulle rime e assonanze, i dizionari inversi sono utilissimi per lo studio della produttività dei suffissi. Un dizionario inverso è un dizionario per modo di dire, perché non presenta glosse, non è costituito da voci lessicografiche, ma solo da una lista di lemmi.

concordanza o concordanze = liste di contesti in cui una determinata parola appare. Ci possono essere concordanze per forme e concordanze lemmatizzate; quelle per forme sono più diffuse per i testi filologicamente complessi. La pratica di fare concordanze per facilitare il commento dei testi è antica. Nei volumi di concordanze vere e proprie c'è al massimo l'indicazione di parte del discorso e, adesso che lo spoglio è fatto dal calcolatore, ci sono quasi sempre indici di frequenza e le parole sono anche ordinate in liste in base alla loro frequenza.

Un esempio di concordanze per lemma, fatte elettronicamente, è quello tratto dalle concordanze dei Canti di Leopardi (ermo). Sono raggruppate le occorrenze di erme, erma, ermo usati come aggettivi; il contesto è limitato, per questioni di spazio, al verso in cui compare la parola. Le concordanze dei Canti di Leopardi fatte manualmente selezionavano invece un contesto ristretto al sintagma. Alcune concordanze non riportano il contesto: si limitano a dare una serie di indicazioni da sciogliere (come se avessimo solo CA 001 002, che sta per Canti, primo componimento, secondo verso). Oggi le concordanze senza contesto sono sempre più rare, anzi la tendenza è ad aumentare la lunghezza del contesto. Gli unici lemmi per cui nelle concordanze a stampa si continuano a dare solo i luoghi in cui trova la parola, senza dare il contesto, restano le preposizioni a, di, da, gli articoli e le altre parole cosiddette vuote che, essendo frequentissime, richiederebbero pagine e pagine di contesti.

Una concordanza per forme è invece quella preparata per Le Vite del Vasari (accettata). A fianco della forma stanno le frequenze assolute. Sotto vi sono i passi di prosa nei quali si è trovata la parola. Del verbo accettare sono attestate le forme accettò, accettai, accettarono, accettasse, ..; tutte queste hanno le loro concordanze a parte, come a parte sono registrati i contesti in cui compare accettar e quelli in cui è usato accettare, quelli in cui c'è accettarla e quelli in cui c'è accettarlo. Le concordanze di accetto aggettivo sono separate da quelle delle forme accetti e accette. Trattandosi di prosa, il contesto è più ampio, ma comunque troncato, preso contando un certo numero di parole prima e dopo la forma. L'esempio tratto dalle Concordanze dei Promessi Sposi mostra un diverso modo di ritagliare il contesto: il testo è stato suddiviso per necessità operative in commi numerati; questi tendono a rispettare l'unicità semantica della frase e sono costituiti da sequenze di parole racchiuse tra la lettera iniziale di periodo e un segno di punteggiatura forte. Tanta abbondanza porta però a concordanze in molti volumi: la concordanza accessibile via computer non ha praticamente limiti di contesto.

Per i maggiori autori italiani disponiamo di spogli manuali o elettronici già da tempo. Uno dei centri più attivi nel settore dell'elaborazione e pubblicazione di concordanze è ovviamente l'Accademia della Crusca. La Crusca e il Centro di Ricerche Informatiche per i Beni Culturali della Scuola Normale di Pisa hanno avviato dal 1991 una sezione Strumenti e testi con la quale si intende offrire agli studiosi analisi lessicografiche di testi artistici, letterari e tecnici elaborati informaticamente e resi accessibili in stampa o su supporti magnetici sotto forma di banca dati testuale. Il Vocabolario della poesia italiana del Novecento è uno strumento che, riguardando autori fra i più popolari, dovrebbe finalmente far varcare alle concordanze le porte delle aule scolastiche, farle diventare davvero uno strumento per accostarsi ai testi. Di solito il filologo e il linguista non hanno dubbi sull'utilità delle concordanze; le perplessità provengono piuttosto dai critici letterari, che se ne domandano l'utilità nel commento e nella comprensione dell'opera letteraria: è necessario immaginare come potrebbe cambiare il lavoro del critico letterario se egli, invece che scavalcare, come spesso fa, la parola, credendo di poter cogliere, quasi per divinazione, le ideologie, la storia, la psiche o altro, fosse invece costretto a fare sempre i conti con il concreto del linguaggio in cui vivono le ideologie, la storia e tutte il resto. È necessario quindi poter disporre di una serie di guide alle parole della letteratura che coprissero tutto il territorio della nostra storia letteraria. In pratica, oggi, lo studioso che può consultare la LIZ può anche ricercare le concordanze delle parole che lo interessano in tutti i 500 testi ivi inclusi, testi che rappresentano una buona parte del territorio della nostra storia letteraria. Certo un volume di concordanze a stampa fa venire più idee, sfogliandolo. Però con le interrogazioni per singolo testo e per corpus, possibili all'interno della LIZ, il ricercatore paziente può cercare le parole più frequenti in una data opera, in un autore, in un genere, in un secolo, stamparsi questa lista e poi costruirsi le concordanze di quelle parole che gli paiono più interessanti. Può anche fare una ricerca che le concordanze a stampa non gli permettono se non con complesse ricerche incrociate, e cioè richiedere le concordanze di quei contesti in cui la parola appare adiacente ad un'altra o a distanza di un certo numero di parole.


  1. LESSICO E DISCORSO NELL'INSEGNAMENTO DELL'ITALIANO.

I.   Una via testuale alla didattica del lessico.

Negli ultimi 10 anni c'è stato un risveglio dell'interesse per l'insegnamento del lessico nella glottodidattica sia di una lingua madre che di lingua straniera. Dietro questo interesse per il lessico non sta (solo) l'antica convinzione che chi sa i nomi, sa le cose e quindi chi sa più nomi, sa più cose, quanto la consapevolezza che in un mondo di immagini la scuola ha il compito di stimolare l'accrescimento del patrimonio lessicale degli allievi.

I programmi attuali della scuola italiana elementare e media inferiore, nei paragrafi dedicati alla riflessione sulla lingua, danno rilievo all'insegnamento del lessico, anzi il livello lessicale-semantico ha una netta priorità rispetto agli altri livelli d'analisi, contrariamente alla posizione del tutto subordinata che occupava nella didattica tradizionale. Nelle grammatiche si evidenziano le regolarità che sussistono nel lessico (i meccanismi di formazione delle parole) e nelle operazioni mentali sul significato (generalizzazioni, spostamenti di senso, specializzazioni, ..): e, poiché alla base dell'educazione all'uso della lingua vi è l'attivazione di meccanismi mentali, nella riflessione sulla lingua la semantica occupa un ruolo centrale. Rispetto alla grammatica tradizionale, si passa da un procedimento di classificazione-imitazione ad un procedimento di attivazione di meccanismi cognitivi. Negli stessi programmi si insiste sul processo induttivo, sulla lingua dell'uso, sulla dimensione sociolinguistica.

Portare ad una buona comprensione dei testi più che un compito è un obbligo della scuola dell'obbligo, perché scrivere bene ed esprimersi oralmente in modo efficace sono obiettivi sacrosanti e sanciti dai programmi, ma comprendere testi prodotti da enti statali o cartelli, regolamenti, contratti, .. è vitale per il cittadino. Senza un lessico passivo, sia pur modesto, la comprensione dei testi non si raggiunge. Però il lessico passivo e attivo di una persona si allarga attraverso la lettura, la manipolazione di testi, la conversazione con persone dal lessico non coincidente. Non è un circolo vizioso: è soltanto la constatazione che una didattica efficace del lessico non può che passare prevalentemente attraverso testi scritti e orali e pertanto parlare di didattica del lessico come di un momento separato dalla didattica di altri aspetti linguistici non ha senso in pochissime occasioni. Soltanto quando dietro alle parole stanno concetti, processi, oggetti che interessano la persona si può avere qualche certezza sul fatto che una parola è entrata stabilmente nel lessico mentale. Di fronte a questa labilità di risultati non conviene insegnare il lessico di per sé, ma è opportuno fare lessico e semantica mentre si fa riflessione sul testo, almeno alla fine gli allievi avranno comunque letto dei testi, avranno sperimentato delle tecniche di smontaggio e rimontaggio del testo, avranno visto in contesto la grammatica della parola e della frase. Le parole in un processo di acquisizione naturale non si apprendono mai isolate, ma sempre almeno a coppie, se non a grappoli. È conveniente che gli allievi non si accostino a gruppi di parole in vitro, ma li vedano calati in testi ben scelti, così avranno maggiori motivi per ricordarle. Infine l'approccio testuale è quello che meglio consente la ciclicità, essendo applicabile dalla scuola elementare alla secondaria superiore e oltre, con gradi diversi di approfondimento e di complessità. Per quanto concerne il lessico dei testi, poi, l'osservazione è doppiamente vera, perché conoscere il significato di una parola non significa affatto conoscerlo tutto: con l'età, lo studio e l'esperienza il patrimonio lessicale non dovrebbe aumentare solo quantitativamente, ma anche qualitativamente.

L'unica altra via efficace di arricchimento lessicale, da affiancare e alternare all'approccio testuale, è il gioco di parole, l'approccio ludico. È tuttavia un approccio che privilegia i parlanti di lingua madre e può rivelarsi frustrante anche per stranieri di livello avanzato, se proposto attraverso giochi da risolvere. Proporre giochi di parole con le loro soluzioni, per analizzarne i meccanismi, può invece essere divertente e utile per allievi di madrelingua inesperti e per stranieri.

Un apprendimento del lessico in situazione extrascolastica imbocca inevitabilmente la via testuale perché l'individuo non si imbatte mai in liste di parole, ma sempre e solo in testi.


II.     Lessico attivo e lessico passivo.

Esiste sempre un grande divario fra il numero di parole che comprendiamo e quelle che usiamo, ma l'attenzione degli studiosi si concentra soprattutto sul divario fra

lessico attivo e passivo nei momenti aurorali dell'apprendimento linguistico, cioè nei bambini o nei ragazzi che imparano la lingua madre

e negli studenti che affrontano, da principianti, una lingua straniera

La ragione di questa focalizzazione è più che altro pratica: si tratta di situazioni in cui l'input lessicale è maggiormente controllabile. Nel caso di studenti principianti di lingua straniera, che studino la lingua lontano dalla comunità che la parla, che abbiano come unica fonte l'ora di lingua e i testi messi a disposizione dalla scuola, l'input è totalmente controllato, sia per il lessico come per le strutture sintattiche.

Più di recente le ricerche sul lessico passivo si sono estese anche a fasce di soggetti adulti, sulla spinta

della necessità di riscrivere dispense più leggibili per la formazione a distanza

della volontà di redigere testi informativi destinati a portatori di handicap

del tentativo di migliorare la comprensibilità di testi burocratici (le istruzioni per la dichiarazione dei redditi)

I modi con cui si misura il lessico passivo sono vari

completamento di frasi o testi con parole da scegliere in un gruppo dato

dichiarazioni (conosco/non conosco questa parola) dei soggetti intervistati di fronte ad una lista di parole generalmente scelte in base alla loro frequenza e dispersione

somministrazione di domande di comprensione a scelta multipla riguardanti testi di cui si conosce l'indice di leggibilità, la frequenza e la dispersione dei vocaboli usati

Gli studi sul lessico attivo invece consistono perlopiù nello spoglio di

elaborati scolastici

trascrizioni di conversazioni orali

Le ricerche sul lessico attivo e passivo in lingua madre da un lato mirano a verificare se esiste una correlazione fra ambiente sociale e patrimonio lessicale, se l'aumento è costante con l'età o va a salti, dall'altro presentano un risvolto propositivo, cioè fornire elenchi di parole che un allievo deve assolutamente riconoscere (e/o saper usare) alla fine di un ciclo di studi.

Per l'italiano gli studi più approfonditi sono stati fatti in relazione alla costruzione del Glottokit e da altri ricercatori che hanno collaborato con De Mauro alla redazione del Vocabolario di base e alla formulazione dell'indice di leggibilità GULPEASE.

Nell'introduzione del Lessico elementare vengono forniti elenchi dettagliati delle parole che gli allievi delle elementari usano nei loro temi, ma non trovano nelle loro letture, e viceversa delle parole che gli scolari non hanno usato nei loro scritti, ma leggono nei testi scolastici, nei libri per bambini, nei fumetti. Un'idea abbastanza chiara della povertà del lessico attivo scritto degli scolari delle elementari italiane è data dal fatto che i primi 500 lemmi più frequenti coprono quasi l'85% di tutte le parole usate nei temi. Significa che gli allievi si servono molto di poche parole.


III.   Apprendimento del lessico italiano da parte di italiani e di stranieri.

L'Italia ha il privilegio mondiale di essere in un regime di coppia massima di 2 tipi di difficoltà

massima sofisticazione tecnologico-terziaria

massima persistenza di svantaggio linguistico

Queste 2 difficoltà sono create dal lessico colto anche per l'uso comune (commestibile, potabile, tossico) e dal lessico burocratico (obliterare) difficile per una popolazione in cui diplomati e laureati sono pochi e dal fatto che sul mercato del lavoro oggi si richiede la padronanza di linguaggi tecnici anche da parte di personale con impieghi non molto qualificati. La scuola non può far aumentare notevolmente in quantità il lessico attivo di un individuo: può essere invece determinante nel migliorare la qualità del lessico già in possesso degli allievi, nello scegliere letture che amplino il lessico passivo e soprattutto nel fornire tecniche per ricavare dalla forma delle parole e dalla loro posizione nel contesto indizi sul loro possibile significato. Per miglioramento qualitativo si intende far capire agli allievi che una parola può avere altri significati oltre a quello che loro conoscono, che le parole intrattengono relazioni con altre parole sia per via della loro forma (derivazione, composizione, alterazione), sia per via del loro significato. Questo miglioramento si può ottenere con esercizi tradizionali come quelli che si trovano nei testi scolastici o con tecniche di discussione in classe che simulino i processi naturali di acquisizione del significato, o che sviluppino, raffinandoli, i processi spontanei di definizione. Non ricorrere soltanto agli esercizi tradizionali ma perdere un po' di tempo a discutere in classe i processi mentali che portano a definire, classificare, a indovinare un significato è consigliabile in vista dell'apprendimento del lessico di una lingua straniera e dell'autoistruzione che un individuo consapevole può ricavare dalle letture extra- e post-scolastiche.

La sperimentazione di educazione linguistica in verticale ha messo in evidenza un effetto secondario e certamente indesiderato della politica perseguita dall'educazione linguistica negli ultimi 15 anni. Uno degli scopi era distruggere l'immagine di un italiano unitario, letterario, a favore di un riconoscimento delle varietà (regionali, di sottocodice, scritte, orali, di registro). L'esperienza pare consigliare che, invece, gli sforzi dell'insegnante dovrebbero essere rivolti prima di tutto ad assicurare un comune denominatore linguistico ai ragazzi, rappresentato dalla conoscenza dei fenomeni costanti della lingua, o meglio di quelli statisticamente più frequenti. Il risultato negativo di tanta insistenza sui vari linguaggi (burocratico, tecnico-scientifico, giornalistico, pubblicitario, ..) è che molti ragazzi manifestano difficoltà nel comunicare a quel livello medio e neutro (cioè scarsamente caratterizzato) che è il più necessario sul piano di una comunicazione usuale: quotidiana senza essere familiare, informale senza essere familiare, informale senza essere popolare. Non è neppure certo che quei ragazzi acquistino padronanza dei linguaggi speciali.

Tuttavia c'è da chiedersi se la difficoltà a comunicare in un linguaggio medio sia veramente da attribuirsi all'insistenza sulle varietà linguistiche o non piuttosto ad una didattica delle varietà mal condotta. Ricerche sulla lingua degli studenti universitari mostrano che lo sforzo didattico per far apprendere le varietà dell'italiano non ottiene grandi effetti nemmeno dopo 5 anni di medie superiori, in compenso gli studenti sono arrivati ad impadronirsi di un linguaggio medio, anzi mediocre: l'italiano degli studenti universitari è monocorde, anche se hanno frequentato la scuola dell'obbligo quando già era previsto dai programmi un insegnamento delle varietà linguistiche dell'italiano. Lo studente possiede e usa un solo registro, medio-basso, con una variante leggermente più formale per gli usi della scrittura, e qualunque sia il testo che deve produrre esibisce quel registro, nobilitandolo con i frammenti dei sottocodici coi quali via via è venuto a contatto. La didattica delle varietà di registro resta vuoto esercizio, se non riesce a mobilitare motivazioni sufficienti nell'allievo. Se deve scrivere qualcosa che abbia importanza per il gruppo a cui appartiene, allora lo studente potrà interiorizzare i registri e le strategie espressive. Altrimenti arriverà all'università (quando ci arriva) con un italiano monocorde. Quanto alla discreta padronanza di sottocodici disciplinari (materie scientifiche, geografia, storia dell'arte, ..) si tratta di un lavoro da svolgere soprattutto durante la didattica di ciascuna disciplina: un insegnante di geografia dovrebbe rendersi conto che i manuali di geografia che adotta per i suoi allievi oggi sono molto più irti di linguaggi settoriali di quelli su cui ha studiato lui quando aveva l'età dei suoi allievi. Deve quindi rassegnarsi a spendere del tempo per spiegare i termini e per verificarne la comprensione, preoccuparsi del fatto che il sapere della sua materia è comunque mediata dalla lingua naturale: non può delegare al collega di lettere l'intero peso della cosiddetta trasversalità della lingua.

Se il lessico dei parlanti nativi è in queste non brillanti condizioni e richiede una maggiore attenzione, che si può pretendere dagli stranieri?? Dall'apprendente straniero bisogna pretendere molto, soprattutto per quanto concerne il lessico passivo dello studente adulto. È necessario che l'insegnante conosca a grandi linee l'input lessicale di ciascun allievo (es: per appurare il grado di conoscenza di una lingua da parte di uno straniero adulto immigrato è stato elaborato il GSK, ovvero Glottokit italiano per immigrati stranieri) o almeno disporre di liste quali il LIF, il LIP, il VdB, il Vocabolario Fondamentale di Sciarone, il Lessico Elementare che forniscano le liste di vocaboli cosiddetti indispensabili. È anche raccomandabile servirsi di programmi che permettano di calcolare automaticamente il grado di leggibilità di un testo. Esistono anche per l'italiano testi di lettura semplificati che conservano la trama di un racconto, ma ne semplificano il lessico e la complessità sintattica. L'utilità di tali riduzioni è oggetto di discussione. Gli studenti possono attraverso i testi semplificati anticipare l'esperienza di leggere un libro in lingua straniera; si ha tuttavia l'impressione che l'operazione sia più redditizia e più consigliabile per lingue molto distanti, in cui l'accesso al libro intero sarebbe altrimenti ritardato al 4°/5° anno di studio. Può darsi che la considerazione (benché talvolta accompagnata da giuste critiche sui modi concreti di attuazione di tali operazioni testuali) con cui si incominciano ad accogliere in Italia operazioni di adattamento all'italiano moderno di opere scritte in un italiano oggi incomprensibile a molti italiani (ammodernamenti del Decameron, o de Il Principe di Machiavelli) porterà gli insegnanti di italiano lingua straniera a riconsiderare i testi semplificati. Delle liste di frequenza e dei vocabolari fondamentali bisogna ancor più tener conto quando si vuole stabilire un lessico attivo da raggiungere al termine del corso. Se per la progressione nella complessità sintattica i libri di testo si sono già adeguati da tempo ai risultati degli studi in materia, per il lessico la tradizione dell'insegnamento dell'italiano a stranieri ha finora seguito più il buon senso che le statistiche derivanti da corpora. Chi è italiano e insegna italiano a stranieri in Italia ha problemi diversi da chi, non essendo talvolta di madrelingua italiana, insegna italiano fuori d'Italia. Non ha meno problemi, perché se da un lato ha il vantaggio di insegnare a studenti che anche fuori dell'aula sentono e leggono italiano, dall'altro si trova a fronteggiare sia le conseguenze di un'esposizione a modelli non sempre edificanti di italiano parlato e scritto, sia le tentazioni di semplificazione, e la conseguente fossilizzazione-cristallizzazione, derivanti dalla scoperta che tanto gli italiani mi capiscono bene lo stesso, non mi correggono quasi mai. Il processo di fossilizzazione e la conseguente cristallizzazione di forme non corrette investe maggiormente la sintassi: gli errori lessicali tendono a diminuire notevolmente, rispetto a quelli di costruzione di frase, man mano che l'individuo vive nel paese, interagendo con parlanti nativi, ascoltando la televisione. Senza contare che, al di fuori degli obblighi dei compiti scolastici, un parlante di livello medio riesce più agevolmente ad adottare strategie di evitamento lessicale e a mascherare queste strategie (meccanismi di parafrasi, di sostituzione di una parola di cui non si è sicuri, evitamento un argomento di cui non si sa parlare). In situazione di acquisizione spontanea, però, sarà soprattutto l'errore di formazione di parola a sparire; gli errori nella comprensione del vero significato di una parola italiana, specie di una che ha un falso amico in altre lingue note all'apprendente, saranno meno facilmente corretti, perché non c'è l'insegnante a verificare se la parola è ben compresa e lo straniero non si rende conto che sta indebitamente trasportando significati da una lingua all'altra. L'errore lessicale a livello di significante richiede un intervento puntuale di memorizzazione e si corregge più facilmente di un errore di sintassi: infatti un parlante nativo non particolarmente colto può notare e correggere un errore lessicale. Lo straniero ha più probabilità di essere corretto quando sbaglia una parola, anche se sta apprendendo spontaneamente al di fuori di una classe. È un bene tanto per gli insegnanti che lavorano in Italia, quanto per quelli che insegnano italiano all'estero il poter far riferimento ad un certificato di italiano L2, con indicazioni e prove di lettura, conversazione, composizione in italiano. Finora esistevano prove elaborate all'esterno o in Italia dalle Università per stranieri; da tempo si disponeva del livello soglia, ma da qualche anno il dibattito e la sperimentazione si sono intensificati portando anche all'individuazione di certificati per livelli intermedi e per livelli alti. La diffusione e l'affermarsi del valore di questi certificati se non altro serve a fissare delle soglie, anche per l'ampiezza del lessico, sotto le quali non scendere. Soprattutto serve a risollevare una proficua discussione: chi si prefigge di insegnare soprattutto a parlare e a capire, più che scrivere, l'italiano, chi redige un certificato per studenti di livello avanzato, o chi insegna italiano per scopi specifici dovrà tenere in maggior considerazione frequenza e dispersione di una parola. Circa l'acquisizione dell'italiano in situazione non scolastica, da parte di immigrati, gli studi mostrano le difficoltà che la ricca morfologia derivativa dell'italiano crea agli stranieri. Parlanti nativi di lingue imparentate con l'italiano, come lo spagnolo e il portoghese, e parlanti di lingue tipologicamente distanti dalle neolatine, producono spesso errori da interferenza frutto di passaggi plurimi, perché arrivano alle parole italiane attraverso adattamenti del francese, dello spagnolo, dell'inglese, lingue più internazionali, apprese prima della nostra.


IV.   Gli errori lessicali.

Malapropismo = storpiature o scambi di significante che suscitano ilarità; giochi di parole in cui un cambio d'accento, una minima differenza grafica producono divertenti, e spesso scurrili, ambiguità. Forme simili a malaproposmi emergono talvolta nell'italiano popolare che presenta non solo un lessico intriso di dialettismi, di interferenze del dialetto (chiamare per chiedere in parlanti piemontesi, cecato per cieco in parlanti meridionali), ma anche termini ricostruiti per analogia (autobilancia per autoambulanza, febbrite per flebile). Il fenomeno dell'interferenza e della ricostruzione diventano nella didattica dell'italiano, sia come lingua madre, sia come lingua straniera, degli errori lessicali. Individuare questi errori è relativamente semplice: tutto dipende dalla conoscenza che l'insegnante ha dei dialetti o delle lingue di partenza degli studenti e dal suo fiuto nel capire che cosa voleva veramente dire lo studente che ha usato un significante strano. Negli studenti stranieri e nei parlanti nativi giovani c'è poi una certa creatività nel tentare derivazioni regolari che sfociano in errori lessicali da analogisti, là dove la lingua italiana ha scelto un processo derivativo differente o non ha derivato affatto. Un esempio del primo caso è ululìo per ululato (derivazione prodotta da uno straniero) e marcimento o andamento a male per deperimento (proposti da allievi italiani delle medie inferiori alle prese con un testo bucato). I dati spontanei rivelano un maggior numero di interferenze della lingua nativa, soprattutto se neolatina, nella base della parola.

In sede di produzione, gli errori lessicali dovuti a falsi amici tendono a perdurare soprattutto in situazione di apprendimento formale. Nella comunicazione vera le affinità sul piano del significante (es: spagnolo equipaje = bagaglio, italiano equipaggio = personale di bordo), ma con significati molto diversi, danno spesso luogo a qui pro quo talmente divertenti e imbarazzanti che lo straniero li individua e memorizza più facilmente: riuscire ad evitare l'umiliante esperienza di far ridere i parlanti nativi è una delle motivazioni più forti ad imparare meglio una lingua. Il vocabolo falso amico è difficile da smascherare quando, oltre ad essere simile nel significante, ha anche un significato non totalmente distante (l'aggettivo spagnolo ilustrado, che riferito a persona significa istruito, e non certo illustrato o illustre; il sostantivo spagnolo dormitorio, che non è il dormitorio italiano, ma la camera da letto; l'inglese actually che non significa attualmente, ma in effetti). L'analogia tra spagnolo e italiano è talmente forte che conviene riportare una lista, sottolineando che i casi più pericolosi sono quelli del tipo (b) e (d):

a)     vocaboli esattamente uguali nella forma e completamente distinti quanto al significato (amo, burro, camino, carta, gamba, rata)

b)     vocaboli uguali nella forma e con significato coincidente solo in parte (lucido, dormitorio)

c) vocaboli leggermente diversi nella forma e con significati completamente distinti (boia/boya, messa/mesa)

d)     vocaboli leggermente diversi nella forma e con significato coincidente solo in parte (abitazione/habitación, disattenzione/desatención)

Il tipo (d) è quello più comune non solo fra spagnolo e italiano, ma anche quando si confronta l'italiano con l'inglese, il francese o il tedesco, lingue in cui trovare analogie con l'italiano del tipo (a) o (c) è quasi impossibile. Il caso (b) è invece abbastanza frequente, a prescindere dalla coppia di lingue coinvolte, e si verifica sotto forma di modificazione del significato dei prestiti. La percezione di vicinanza lessicale tra 2 lingue favorisce il ricorso, soprattutto in situazione di apprendimento spontaneo, alla lingua madre come fonte di ipotesi per l'interlingua, perché, nonostante i possibili trabocchetti e la produzione di materiale lessicale ibrido e inesistente, questa strategia aiuta a capirsi in parecchi casi. Se l'apprendimento avviene in contesti istituzionali o è in qualche modo guidato, il parlante diffida dalle parole troppo simili all'italiano, e preferisce selezionare quelle più distanti. Più complesso è il discorso sugli errori di significato. Si è già accennato alla difficoltà per lo straniero di individuarli, specie in situazione di apprendimento non formale e in situazione di ricezione, di ricostruzione del significato di parole straniere. La difficoltà tuttavia nell'individuarne le cause e la tipologia è grande anche nel caso di studenti nativi. Si sono classificati gli errori semantico-lessicali in 7 categorie: si descriveranno qui per esteso soltanto i più frequenti errori apparsi in testi scritti di studenti italiani di prima e seconda media, quelli derivanti da sostituzione di unità, come in La barca si maciullò sullo scoglio, che attribuisce a barca un componente organico assente nelle forme corrette si fracassò o si sfasciò. Le sostituzioni di unità cognitive riguardano le seguenti coppie di tratti:

denumerabile/non-denumerabile: guadagnava un certo numero di denaro ..

animato/non-animato: la barca si maciullò sugli scogli; donne poliziesche

stativo/non-stativo: le condizioni di vita che svolgono i meridionali ..

quantità/qualità: mi piacciono meglio i film ..

spazio/tempo: i più diffusi, cioè che si comprano ogni giorno ..

confronto della quantità con la norma/confronto con un'altra quantità: il programma che mi piace molto è ..

gradabile/non-gradabile: molto avarastro

definito/non-definito: la lettura è un mio hobby preferito ..

dimensione verso l'alto/dimensione verso il basso: dovevano attraversare un fiume molto alto, più dei cavalli

Gli errori di sottrazione di unità presentano spesso la mancanza del predicato CAUSA. L'esempio più famoso è l'uso, dovuto anche ad interferenza col dialetto, di imparare al posto di insegnare, parafrasabile come far sì (CAUSA) che qualcuno impari. Esaminando gli esempi, si coglie immediatamente la difficoltà di spiegare ai ragazzi perché alto mare va bene tanto quanto mare profondo, ma fiume alto non si può dire per fiume profondo. Forse oltre al ragionamento, andrebbe invocata anche la norma (inspiegabile oppure spiegabile su base etimologica) che sta dietro alle collocazioni. L'esempio proposto per gli errori derivanti dallo scambio dello spazio per il tempo è poco efficace, ciò non toglie che la tipologia proposta resta uno dei tentativi più riusciti di affrontare lo spinoso problema degli errori semantici; basandosi su unità cognitive costituite da predicato e argomenti, è abbastanza comprensibile per i docenti, un po' meno per gli allievi giovani.


V.     Arricchire il patrimonio lessicale: strumenti e tecniche.

Un'azione didattica volta a far aumentare soltanto quantitativamente il lessico non ha molto senso; le uniche tecniche specifiche raccomandabili per esercizi di lessico fuori dai testi sono:

quelle dedicate alle abilità di consultazione di opere lessicali

quelle che mirano alla spiegazione di tratti semantici o di significati prototipici

Per il resto se si vuole affrontare il lessico all'interno di una riflessione linguistica sulla lingua gli strumenti e le tecniche sono quelle comuni all'insegnamento della lingua in generale

Si suggerisce di far fare ad allievi delle elementari un'inchiesta fra i familiari e gli amici per capire quanti e quali vocaboli ci sono nelle famiglie italiane: indagare sugli oggetti che sono specchio del lessico di una lingua è utile per capire che gli specchi vecchi danno un'immagine un po' offuscata della lingua d'oggi, che gli specchi piccoli non ritraggono tutta la lingua, .. È un'inchiesta che dà sempre buoni frutti perché mentre le grammatiche e le antologie scolastiche si buttano, i dizionari vecchi si conservano come pure le enciclopedie e quindi è possibile fare confronti fra definizioni di dizionario e definizioni di enciclopedia, fare confronti diacronici e di sottocodice (il figlio dell'infermiera magari troverà un dizionario di anatomia in casa e la figlia di un appassionato di ferromodellismo potrebbe trovare un dizionario di tale hobby; in che differiscono dai dizionari generali?? Chi ha un dizionario enciclopedico si chiederà, e discuterà in classe, se è davvero un dizionario).

Con allievi più grandi però si può fare questo tipo di inchiesta sugli specchi della lingua e poi passare alla lingua stessa, magari alla lingua di cui gli studenti sono più esperti, quella dei giovani. L'insegnante può distribuire un questionario sul linguaggio giovanile, o farlo modificare dalla classe, adottare lo stesso tipo di schedatura o semplificarlo, discutere sulla lista di parole sul cui uso e significato gli allievi devono interrogarsi e interrogare i coetanei (quali sono le parole già passate di moda?? Invece cosa c'è da aggiungere??). Fare inchieste sul lessico è più facile che fare inchieste sulla correttezza grammaticale, ma l'insegnante si accorgerà che dalla discussione verranno fuori interessanti discussioni sulla sinonimia contestuale (es: i mille modi molto gergali e bassi di dire drogato o drogarsi), sulla polisemia e sull'uso delle parole in frasi, che allargheranno inevitabilmente l'indagine dal lessico alla sintassi giovanile. Però se l'inchiesta partisse dalla sintassi probabilmente non approderebbe neanche ad un decimo dei risultati. Alla fine dell'inchiesta ci si può interrogare sulla prospettiva di vita di ciascun termine del linguaggio giovanile; confrontando i risultati del passato con quelli della classe si potrebbero fare proposte circa i termini da inserire in una nuova edizione di dizionario monolingue, magari tenendo conto di fattori come l'uso in scrittori contemporanei, o la penetrazione nella stampa quotidiana. Qualunque tipo di tecnica (registrazione di conversazioni o trasmissioni televisive e trascrizioni delle medesime; confronto tra versioni distanti nel tempo della stessa opera letteraria straniera, ..) che attiri l'attenzione sul materiale linguistico darà come primo frutto, immediato, spontaneo, osservazioni sul lessico: compito dell'insegnante è guidare con domande opportune verso riflessioni che obblighino a tener conto di quanto ciò che sta intorno alla parola influenza le osservazioni formulate dagli allievi come relative ad una parola singola. Ci sono fondamentalmente 2 modi di guardare intorno alla parola:

una è una ricerca a corto raggio caratteristica dei bambini di madrelingua e in genere dei parlanti nativi alle prese con un testo non troppo difficile

l'altra è una ricerca a largo raggio, per trovare i fili del discorso, le reti, i nodi, e tutte le altre metafore della tessitura, della trama, che si applicano alla comprensione della testualità questo tipo di ricerca è caratteristico degli apprendenti stranieri e dei parlanti nativi adulti alle prese con un brano di difficile comprensione


VI.   Far attenzione al contesto immediato.

L'attenzione rivolta alle parole adiacenti porta a seguire 2 filoni principali di attività didattiche

uno più morfosintattico volto a sottolineare la grammatica delle parole (accordo, reggenza)

l'altro più lessicale teso a sottolineare come nelle lingue naturali ci siano spesso parole che compaiono quasi sempre in compagnia di altre, per cui le frasi sembrano formate da pacchetti di parole più che da parole singole


VI.I.     La grammatica delle parole.

I dizionari italiani si stanno appena ora evolvendo verso una descrizione della grammatica non solo dei verbi, ma anche degli aggettivi e dei nomi e naturalmente degli altri elementi strutturali della lingua; soprattutto nella didattica dell'italiano a stranieri già da tempo c'è chi suggerisce di insegnare una parola con la preposizione di cui ha bisogno (aderire a, capace di, incidenza su) o, nel caso di sostantivi con terminazioni ambigue, con l'articolo che ne riveli il genere (il sisma, la foto). Di solito, fino a poco fa, le indicazioni grammaticali di tipo sintattico nei dizionari venivano date implicitamente, e moderatamente, attraverso gli esempi. Il dizionario che più palesemente ha sancito l'ingresso delle valenze nella didattica dell'italiano è il Sabatini-Coletti. In questo le voci dei verbi sono strutturate in modo da rendere evidente il rapporto tra il verbo e i suoi argomenti, ossia i complementi necessari per la formazione di una frase minima di senso compiuto intorno a quel verbo, secondo i diversi significati che esso può assumere. La numerazione delle accezioni non è più all'interno della solita suddivisione in transitivo, intransitivo, riflessivo, ma riparte da 1 tutte le volte che cambia il quadro degli argomenti (il numero dei complementi necessari richiesti dal significato del verbo). Il Sabatini-Coletti segna così una svolta nella presentazione delle voci relative ai verbi italiani e si pone come uno strumento importante per la didattica. Una voce di questo tipo, infatti, obbliga insegnanti e allievi (e ovviamente, prima, ha costretto allo stesso severo esercizio il linguista-lessicografico) a chiedersi sempre quali complementi un verbo deve avere e sono soltanto, come nelle descrizioni precedenti, quali può avere. Anche in altri dizionari capita di trovare indicazioni dell'obbligatorietà di un complemento, ma la descrizione tradizionale non costringe a dare sempre tale importante indicazione. L'indicazione del quadro degli argomenti porta invece ad esplicitare per ogni accezione del verbo i complementi obbligatori. È un compito impegnativo.

Un tipo di esercizio utilissimo per allievi delle secondarie potrebbe consistere nel proporre voci di verbi, tratte dal Sabatini-Coletti, bianchettare le indicazioni degli argomenti e chiedere agli allievi di integrare tale informazione. Per farlo dovranno esaminare gli esempi con cura e contare gli argomenti, il che significa distinguere bene sia il soggetto, sia gli altri argomenti dipendenti dal verbo e inoltre gli altri elementi dipendenti da tali costituenti primari. Per meglio far capire agli allievi le differenze fra i vari complementi, il loro diverso tipo di rapporto col verbo, si possono produrre discussioni sul perché nel Sabatini-Coletti un esempio come mi lavo spesso, alla voce lavare/lavarsi, o un esempio come sul prezzo ci intenderemo sicuramente, alla voce intendere/intendersi, sono al di fuori di accezioni con quadro di argomenti. Non è detto che gli allievi non entrino in polemica con alcune delle scelte del dizionario: in ogni caso si farà una lezione di grammatica, anzi di raffinata analisi logica, facilitata dall'esplicitezza delle indicazioni del dizionario.

Fra gli esercizi non prettamente lessicali che meglio obbligano l'allievo a svolgere ricerche di relazioni a corto raggio sono gli esercizi di riempimento di frase, quelli in cui manca l'articolo o la preposizione necessaria o il morfema di accordo.

Già più complessi sono gli esercizi di parafrasi su preposizioni ad ampia polisemia quali di e con, sull'esplicitazione di gerundi, su nominalizzazioni e aggettivazioni. Nominalizzazioni e aggettivazioni sono al confine tra parola e frase, perché permettono di trasformare frasi in sintagmi nominali (il ministro dichiara diventa la dichiarazione del ministro e si può inserire in nuove frasi: la dichiarazione del ministro ha fatto scalpore), di mutare complementi del nome in aggettivi (le feste di Natale, le feste natalizie).

È bene far fare questo tipo di esercizi dapprima con frasi perché poi gli allievi sappiano usare le procedure di sintesi lessicale nei riassunti o nelle parafrasi di testi; in corsi di italiano per stranieri dovranno essere proposti non in chiave produttiva, ma di riconoscimento. La familiarità con le procedure di sintesi/parafrasi lessicale serve anche per esercitare più consapevolmente la tecnica definitoria parafrastica, molto utile per rispondere in qualche modo a domande di comprensione (es: che significa nutriente?? Risposta: che nutre), quando non si conoscono sinonimi contestuali o definizioni più ampie.


VI.II.     Modi di dire, frasi fatte, proverbi, collocazioni ristrette.

Da sempre sfoggiare qualche proverbio, qualche frase fatta qui e là, senza eccedere, è stato un modo per cavarsela ricorrendo alla vox populi senza esprimere pareri personali impegnativi, o un espediente per creare una complicità con gli ascoltatori ricorrendo al sapere comune; la locuzione latina, poi, viene considerata la ciliegina sulla torta. Chi non si può permettere studi che lo mettano in grado di esercitare in proprio la retorica delle figure retoriche, si attacca a brandelli di cultura classica e giudeo-cristiana (le fatiche di Ercole, il tallone di Achille, il filo di Arianna, la strage degli innocenti, il non plus ultra, il sine qua non). Impara a memoria queste espressioni e ne infiora i propri discorsi. Oggi al latino si sta sostituendo l'inglese (work in progress, on the road), così oltre a usi fuori luogo sul piano del significato si sentono anche spropositi di pronuncia. I dizionari e i corsi di lingua hanno sempre dato un certo spazio alla fraseologia = tutto ciò che va al di là della parola singola e della parola composta, che presenta una certa fissità e a volte scarsa trasparenza semantica. Ci sono dizionari appositi che raccolgono e spiegano frasi fatte e modi di dire. Ora ci sono dizionari basati sullo spoglio di un corpus che danno i modi di dire con esempi d'autore; è un bel passo avanti perché gli esempi selezionati a volte mostrano usi tranquilli, altre volte propongono un uso estremamente creativo e ammiccante del modo di dire e forniscono così materiale per liberare almeno parzialmente l'insegnamento della fraseologia dall'accusa di essere un'educazione al conformismo linguistico. I dizionari hanno elenchi di proverbi e i bilingui talvolta provano a fornire degli equivalenti dei modi di dire e dei proverbi, altre volte si arrendono e li spiegano soltanto. Si tratta comunque di un grosso problema traduttivo, perché non sempre l'equivalente ha lo stesso tipo di distribuzione nella frase.

Ciò che costituisce una novità rispetto allo studio tradizionale della fraseologia è invece l'attenzione riservata negli ultimi 10 anni alle collocazioni ristrette = fraseologia meno appariscente, senza parole straniere, personaggi mitici o parole tipiche come carlona, gnorri, soppiatto, veci che compaiono solo in alla carlona, fare lo gnorri, di soppiatto, fare le veci. La collocazione ristretta sfugge di solito al parlante nativo, perché sembra una normale combinazione dettata dalle regole della sintassi e dalla solidarietà lessicale, ma appare in tutta la sua idiosincrasia non appena ci si arrischia a tradurla letteralmente in un'altra lingua. Si tratta infatti di una combinazione di una o più parole tale per cui, avendo scelto, per esprimere un certo significato complesso, la parola A, la scelta della parola B è lessicalmente vincolata. Sono collocazioni ristrette le formule di augurio e di saluto. Uno scapolo che non vuol saperne di sposarsi è in italiano uno scapolo incallito o impenitente, in francese un célibatarie endurci (letteralmente = indurito), in spagnolo un soltero empedernido (lett = incorreggibile, duro come la pietra), in inglese a confirmed bachelor (lett = convinto). Un'espressione come scapolo convinto, è in italiano accettabilissima, ma non è una collocazione ristretta. Le collocazioni sono la manifestazione della norma linguistica: il sistema permette l'espressione lanciare un concorso, l'uso registra enunciati come Lanciato un nuovo concorso di bellezza, ma la norma è che i normali concorsi per posti di lavoro, borse di studio siano banditi; la collocazione è bandire un concorso. Così è una collocazione lanciare un prodotto nel senso di farne un lancio pubblicitario. Le parole che compongono le collocazioni mantengono il loro significato e, rispetto alle frasi idiomatiche vere e proprie, presentano a volte una limitata possibilità di sostituzione: se scagliare un prodotto sul mercato fa ridere, patire/soffrire la fame, avanzare/formulare un'ipotesi, indire/bandire un concorso sono sostituzioni normali, ammesse dalla norma. Le collocazioni sono formate da:

Verbo + None (pronunciare i voti)

Nome + Verbo (il telefono squilla o suona, la mente vacilla)

Nome + Aggettivo (sanguinosa vendetta, sonno ristoratore, piatto freddo)

Verbo + Avverbio (russare sonoramente, pagare profumatamente)

In qualche caso ci sono collocazioni Verbo + Nome in cui un cambio dell'articolo o l'inserzione dell'articolo cambiano significato (dare una mano, dare la mano, dar mano a). Tanta sensibilità alla sostituzione, unita al fatto che si tratta di solito di verbi come dare, fare, mettere, prendere, mentre le collocazioni ristrette scelgono piuttosto verbi specifici, poco frequenti, pone il problema di come considerare queste espressioni multilessicali. Sono più vicine alle locuzioni idiomatiche che alle collocazioni ristrette vere e proprie: non per niente sono, a differenza delle collocazioni, da sempre registrate nei dizionari mono- e bilingui.

Possono considerarsi alla strega di collocazioni anche espressioni con quantificatori molto specifici come un pizzico di sale, uno spicchio d'aglio, una risma di carta.

Si devono insegnare le collocazioni?? I parlanti nativi le apprendono come i modi di dire e certo sono coscienti del fatto che costituiscono un segno di accuratezza espressiva (una risma di carta/un banco di pesci è più ricercato e preciso di un pacco di carta/un gruppo di pesci). Quanto ai discenti di italiano come lingua straniera, se nessuno segnala loro che si tratta di collocazioni (per ora i dizionari monolingui d'italiano non lo fanno o lo fanno casualmente, mentre i dizionari bilingui cominciano a segnalarle più sistematicamente) non le individueranno mai. Indicativo a questo proposito è il fatto che i recenti eserciziari lessicali, soprattutto quelli per stranieri, dedichino ampio spazio alle collocazioni, mentre prima non lo facevano. Oltre che per via contrastiva, le collocazioni sono emerse dalle concordanze estratte da corpora elettronici. Ad esempio, cercando le concordanze di contesti in cui appare cuore, si nota che a cuore aperto e cuore di sono collocazioni piuttosto frequenti. Secondo alcuni la frequenza con cui appare una collocazione non deve influenzare il giudizio dei parlanti sul suo status di collocazione, ma è certo che l'essere molto usato è uno dei fenomeni che decreta il passaggio dall'uso alla norma. In ogni caso le ricerche nei corpora possono influenzare la decisione del lessicografo circa l'ordine di presentazione delle collocazioni e dei modi di dire o la loro inclusione in dizionari ridotti. Grazie alla possibilità di calcolare le co-occorrenze statistiche ora è possibile individuare facilmente le collocazioni nei testi (esempio di casa legata a bianca, e di bianca legata a casa: se non corrispondono il valore di co-occorenza diminuisce). Per distinguere le locuzioni idiomatiche dalle collocazioni ristrette e queste ultime dalle semplici combinazioni sintagmatiche molto frequenti resta valida la prova della sostituibilità:

se è nulla, è una locuzione idiomatica

se è limitata e se la traduzione in altre lingue non è letterale, è molto probabilmente una collocazione ristretta.

Con il calcolo della co-occorrenza statistica in un corpus si possono mettere le collocazioni su una scala che va dal massimo valore di co-occorrenza al minimo.

Da un punto di vista didattico è utile chiedersi se le preposizioni richieste da verbi, aggettivi o sostantivi formano con tali parti del discorso delle collocazioni ristrette. Certo lo stare insieme delle parole è idiosincratico anche in questi casi, l'apprendimento è perciò mnemonico ed è un dato di fatto che capace si può collocare solo con la preposizione di o più raramente con in. Da questa angolazione è una collocazione ristretta anzi ristrettissima; se si considera invece la natura dell'errore che si commette nel dire o scrivere la partenza di Milano anziché da Milano, rispetto all'errore insito nel dire gioioso Natale o scapolo indurito o convinto, appare evidente che il primo è davvero sentito come errore di grammatica dai parlanti, i secondi sono visti come una mancanza (o un eccesso) di stile, come una combinazione sintagmatica corretta, un po' sbiadita o un po' troppo vistosa, usata là dove la norma imporrebbe un collocazione. Le collocazioni Verbo + Nome e Nome + Verbo sono un potente legame tra enunciati e creano coesione nei testi. Di fronte ai 2 enunciati: La situazione non consentiva di prendere in esame quell'ipotesi; e Era stata avanzata da gente inaffidabile; solo la conoscenza della collocazione avanzare un'ipotesi esclude a priori la situazione come soggetto del secondo enunciato; uno straniero che non la conoscesse dovrebbe tentare di capire se La situazione era stata avanzata da .. si può dire e ha un qualche senso in italiano.


VII.   Individuare le reti semantico-lessicali: la cerniera fra coesione e coerenza testuale.

Coerenza nei testi = a parte subiecti, cioè non è una caratteristica che i testi possiedono, ma è loro attribuita da chi li interpreta. La caratteristica propria dei testi, a parte obiecti, è più correttamente detta coesione. Possiamo avere un testo lessicalmente coeso come la seguente tripletta di enunciati:

in chiesa c'è un matrimonio

gli sposi si devono amare finché morte non li separi

tra moglie e marito non mettere il dito

che risulterà non coerente per i più e invece coerente per chi giudica sufficiente l'associazione di idee fra vedere un matrimonio e snocciolare proverbi e luoghi comuni sul matrimonio in generale. Possiamo decidere di considerare coerenti dei testi non coesi; ad esempio, per convenzione l'opera poetica viene considerata libera di non assoggettarsi a condizioni di accettabilità semantico-lessicale o di grammaticalità. Di solito però coerenza e coesione vanno insieme. La coesione che privilegia i rapporti lessicali viene detta coesione lessicale. La coesione lessicale (per ora indirettamente descritta dai dizionari monolingui) è una coesione già stabilita, derivante da rapporti sistematici del lessico di una lingua e attualizzata nel testo con:

l'apporto di articoli determinativi e dimostrativi

l'uso di certi tempi verbali

la struttura tema-rema

Fornendo informazioni di tipo pragmatico ed enciclopedico, i dizionari cercano di dare un'idea di quello che i parlanti nativi hanno in mente quando individuano la coerenza anche nei testi poco coesi. Ad esempio, un'antonomasia non si riconosce attraverso descrizioni del sistema lessicale della lingua, ma attraverso informazioni di carattere enciclopedico su espressioni lessicali che appartengono alla norma (es: l'Avvocato per Giovanni Agnelli). Vi sono però riprese coesive create dal testo, ovviamente su basi linguistiche ed enciclopediche plausibili, che non possono venir registrate dai dizionari (capsule anaforiche). Si tratta di legami coesivi per spiegare i quali occorre andare oltre al concetto di sinonimi e sovraordinati in termini di sistema e considerare i valori equivalenti in termini testuali che si istituiscono di volta in volta nei testi specifici. La tendenza di questi gruppi nominali usati in senso prevalentemente anaforico è quella di riprendere una porzione estesa di testo precedente e non un elemento soltanto, il che li fa rientrare nel fenomeno dell'incapsulazione. Dalle incapsulazioni il lettore maturo acquisisce nuove informazioni, mentre per il lettore inesperto o straniero questo tipo di legami testuali sono altrettante fonti di difficoltà. È indispensabile quindi che l'insegnante aiuti gli allievi a riconoscere questi legami coesivi tanto più difficili quanto richiedono la combinazione di conoscenze semantico-lessicali ed enciclopediche. Inoltre molti degli incapsulatori che riprendono porzioni di testo sono parole che indicano la forza illocutoria o l'effetto perlocutorio di un atto linguistico (promessa, minaccia, difesa, accusa, giudizio, ..) o danno una valutazione di un evento (disgrazia, catastrofe rispetto ad avvenimento, fatto), giocando sul livello metacomunicativo o metalinguistico. Va comunque detto che queste strategie espressive sono comuni alla cultura scritta di molte lingue, sia pure in misura differente, e quindi se si è in grado di scovare capsule anaforiche in brani di lingua madre si cercherà di trasportare questa abilità anche nella comprensione di brani in lingua straniera. Improbo è doverlo fare subito su testi in lingua straniera, come accadeva agli studenti italiani di inglese o francese o tedesco 20 anni fa. Allora la didattica delle lingue straniere cominciava ad adottare l'approccio testuale, mentre lo studio dell'italiano restava ancorato ad attività produttive (riassunti, parafrasi) che davano per scontata la comprensione del testo, senza precedenti esercitazioni per chiarire i fili del discorso. Ormai da un decennio, invece, la linguistica testuale è entrata nelle grammatiche italiane e nelle attività proposte per i brani antologici e costituisce un terreno su cui insegnanti di lingua madre e di lingua straniera possono proporre attività coordinate. Mentre vi sono dizionari che ancora non hanno accolto per gli avverbi la dicitura avverbio frasale (probabilmente, forse sono avverbi frasali perché il loro ambito è l'intera frase, non il solo sintagma verbale), una svolta è segnata ora dal Sabatini-Coletti, il quale non solo ha frasale, ma anche testuale nel proprio metalinguaggio relativo alle parti del discorso: i lemmi benché, intanto, ma, ad esempio, sono etichettati anche cong.[iunzione] testuale, quando svolgono appunto funzioni di raccordo a livelli diversi da quelli in cui operano normalmente le congiunzioni. Indubbiamente chiarimenti di questo tipo richiedono spazio e molti esempi. L'attenzione al testuale nei dizionari comporterà un ripensamento della struttura della voce lessicografica a stampa (presenza, appunto, di specifiche note in seguito alla voce; aumento e raffinamento delle etichette grammaticali) e sicuramente livelli di lettura diversi in dizionari consultabili tramite computer. In qualche caso si scoprirà che la struttura andrebbe ribaltata, con l'uso testuale posto in primo piano, perché più frequente e importante (es: chiaramente, politicamente; dunque in esordio di discorso; e in apertura di frase, ..).

Fra gli esercizi per sviluppare l'abilità di individuare le catene anaforiche e le funzioni svolte da avverbi e congiunzioni c'è il rimettere in ordine un testo i cui enunciati sono stati scompigliati. Sul piano produttivo far costruire storie dando i mattoni (verbi, sostantivi, aggettivi, avverbi con eventuali rapporti lessicali fra loro), e imponendo dei vincoli sull'utilizzo ripetuto dello stesso mattone, obbliga l'allievo a scrivere storie in cui ci sono catene anaforiche con riprese pronominali e riprese piene. Questi tipi di esercizi hanno il pregio di poter venir proposti a vari livelli di complessità e quindi si possono adattare alle caratteristiche dei discenti. La costruzione di storie impossibili per mettere in rilievo, attraverso il paradosso, i legami semantici normali è un'attività efficace con allievi giovani, ma che non si può proporre ad allievi cresciuti. A questi si possono proporre le relazioni assurde presenti in testi poetici, sempre con lo scopo di farli riflettere e discutere sulle relazioni date per scontate. Esiste inoltre la possibilità di far riflettere gli allievi sui rapporti di senso fra le parole chiedendo loro come sono organizzate le parole nella nostra mente (coincidenza notevole fra le teorie ingenue esposte dagli allievi e le ipotesi più screditate in campo psicologico e cognitivista sui meccanismi di funzionamento della memoria semantica).


VIII.     Insegnare con i dizionari.

Esiste una didattica del dizionario, volta a potenziare le abilità di consultazione, che è attualmente inserita nei testi scolastici, i quali dedicano un capitolo di esercizi:

alla formazione del lessico

ai rapporti semantici fra parole

e in parallelo propongono esercizi per imparare a servirsi meglio dei dizionari, soprattutto di quelli monolingui

Una parte di questa didattica è invece affidata a pubblicazioni specifiche che le case editrici di dizionari affiancano agli stessi: si tratta di opere utilissime anche quando sono usate con dizionari diversi da quelli per cui sono state concepite. Altre pubblicazioni sono invece insiemi di esercizi indipendenti da un dizionario, riguardati vari aspetti del lessico. Col tempo in questi sussidi didattici il numero di esercizi basati su comprensione del lessico nei testi è aumentato, la maggioranza degli esercizi proposti resta però incentrata su gruppi di parole. Sono molto utili all'insegnante perché la preparazione di esercizi sul lessico, senza disporre di dizionari elettronici, è lunga e penosa. Vanno usati cercando di non generare noia nella classe e come avviamento ad esercizi su testi che contemplino, in mezzo ad altro, sezioni di quesiti o attività imperniate sul lessico. Questi eserciziari, salvo poche eccezioni, sono un po' troppo ancorati al dizionario monolingue o bilingue generale e trascurano di sfruttare altri tipi di opere lessicografiche che si presterebbero a riflessioni metalinguistiche:

le concordanze e i loro contesti possono essere utili per una discussione sul concetto di sintagma e di frase principale o secondaria, su che cosa sia la completezza sintattica e su che cosa si basi invece la completezza semantica

le concordanze di parole omografe o polisemiche possono essere raggruppate per sottoinsiemi omogenei: saranno da scegliere prima i contesti di 2 omonimi con diverse parte del discorso, perché distinguerli è più facile; poi si sceglieranno i contesti di 2 omonimi perfetti, per avviare la discussione sulla differenza fra omonimia e polisemia

facendo confrontare l'elenco delle arti e dei mestieri di un dizionario onomasiologico del secolo scorso con l'indice delle pagine gialle, se ne può trarre materia di riflessione sulla diacronia, sui geosinonimi, sui rinvii da iponimo e iperonimo o da parte a tutto

non ci si dilungherà sugli esercizi legati alla ricerca dell'etimologia, perché sono fra i più diffusi e praticati. Si dirà soltanto che utilizzando il DIR (Dizionario Italiano Ragionato), e ancor più il C-Dir (la sua versione su CD-ROM), si possono facilmente ricostruire famiglie lessicali

la storia dell'evoluzione del significato di una parola così come viene presentata da un dizionario storico o da uno etimologico può costituire lo spunto per far ricostruire la storia della parola presentando i contesti con gli autori: si rifletterà così sulla formazione del neologismo semantico e sulle modalità, non sempre lineari, di tale formazione; in classi di allievi più grandi si potrà discutere sui criteri per distinguere un'accezione da un'altra e sull'utilità di farlo

per riflettere sulla lingua si possono inoltre sfruttare gli indici statistici presenti nei vocabolari di frequenza: stabilendo se è avvenuta l'interiorizzazione della differenza fra numero dei lemmi diversi, numero delle forme e numero delle occorrenze cogliere la differenza fra parole funzionali (vuote) e parole piene e il fatto che articoli, preposizioni, congiunzioni, pronomi appartengono a classi chiuse o quasi, mentre aggettivi, sostantivi e verbi appartengono a classi affollate e in cui la neologia è più attiva D la ripartizione delle categorie grammaticali è valida in assoluto, perché riflette la situazione del lessico di una lingua dove si registrano, in numero decrescente, nomi verbi, aggettivi e avverbi

il concetto di diversità lessicale (numero di lemmi usati in un testo), che serve tra l'altro a distinguere i testi più formali da quelli meno formali e il parlato dallo scritto, si può introdurre citando dati del LIP


VIII.I.   La Crusca risponde.

L'Accademia della Crusca dal 1990 ha fondato un foglio periodico attraverso il quale colloquia col pubblico su questioni di lingua. Numerosi sono gli interventi su diversi temi di lessico. L'importanza del foglio semestrale è notevole perché le risposte sono autorevoli, provengono dagli accademici della Crusca o dai soci corrispondenti, ma sono accessibili e didatticamente spendibili. I quesiti posti o provengono direttamente da insegnanti e allievi o hanno rilevanza per chi insegna. Particolarmente interessanti sono le domande a cavallo fra lessico e morfosintassi che ricevono risposte ampie e documentate. Il foglio dell'Accademia, a differenza delle rubriche linguistiche dei giornali e dei settimanali, non ha problemi di spazio o di tempo. Avendo una cadenza semestrale, si prende il tempo necessario per scegliere lo specialista a cui affidare la risposta e gli accorda lo spazio di cui ha bisogno. I primi 5 anni di risposte sono state pubblicate in un volume corredato da un pratico indice tematico e da un indice dei nomi. L'iniziativa ha anche un altissimo valore simbolico di impegno, di apertura sociale da parte della prestigiosa Accademia a difesa della lingua italiana.


IX.   Insegnare con i dizionari elettronici.

Gli studi condotti all'estero da centri di ricerca appositi sull'impatto del computer nell'insegnamento delle lingue non sono consolanti, ma c'è da chiedersi se ciò non sia dovuto alla mancanza di immaginazione di quelli che creano i software e di quelli che li utilizzano. D'altra parte la richiesta di apprendimento linguistico autonomo spinge a considerare o a riconsiderare la glottodidattica assistita dal computer. Esperienze recenti svolte in Italia tendono a privilegiare l'aspetto creativo della composizione di testi, la manipolazione di testi preesistenti, l'analisi della trama di un racconto. La didattica della lingua madre o straniera attraverso dizionari elettronici è ancora agli albori, ma già si profila come qualcosa di molto diverso dai laboratori di cosiddetta scrittura elettronica. Non deve quindi essere investita da pregiudizi negativi perché, anche in assenza di attività originali, il computer e i software per la ricerca sull'intero testo permettono operazioni altrimenti impossibili per l'insegnante e l'allievo. Quanto ai dizionari veri e propri riprodotti in versione elettronica, ci dev'essere un periodo di esercitazione per le abilità di consultazione durante il quale è meglio avere a fianco una copia a stampa del dizionario. In questa fase si possono assegnare gli esercizi proposti dai manuali per la consultazione dei dizionari a stampa, ma la rapidità di ricerca consentita dal computer rende più efficaci e appetibili quegli esercizi che fatti a mano risultavano alquanto noiosi. Seguendo poi i manuali di istruzione dei dizionari su dischetto o su CD-ROM si fanno ricerche che solo queste versioni elettroniche consentono. Ricerche su tutto il testo, non solo sul lemma, per trovare la fraseologia, le unità multilessicali, i campi semantici. Ricerche circoscritte all'etimologia o alle indicazioni grammaticali, ricerche di tipo morfologico attraverso interrogazioni con caratteri jolly (importanti per la produttività dei morfemi derivazionali). La ricerca con caratteri jolly può risultare utile anche quando non si sa con precisione come è scritta un parola, ma si suppone che, oltre alle lettere conosciute, ne abbia un certo numero di altre non note (es: kitsch " ki* " kiwi, kit, ..). Nel Devoto-Oli elettronico è stata predisposta tutta una serie di liste di prestiti non adattati da varie lingue, di toscanismi, di regionalismi, di etimi contenenti incroci, nomi propri, .., di parole appartenenti a determinati sottocodici. Consultare queste liste è molto istruttivo, ma l'insegnante deve portare gli allievi a chiedersi come è stato possibile costruire queste liste, deve cioè condurre gli allievi ad analizzare i componenti delle voci di dizionario, ad individuare dove di trovano certe informazioni e ad impostare infine delle ricerche complesse. La sintassi di interrogazione, benché resa più facile dalla possibilità di cliccare sugli operatori logici e sui campi da selezionare (grammatica, etimologia, lemma, tutto il testo) è delicata: basta saltare uno spazio e si ottengono risultati indesiderati (o lo sconcertante messaggio nessuna parola trovata). Inoltre se si vogliono fare ricerche congiunte su campi diversi non sempre si può usare la griglia di selezione predisposta, ma è necessario selezionare la modalità di ricerca tutto il testo e scrivere per esteso la ricerca, tenendo conto degli spazi, dei 2 punti, ricordandosi di chiudere le parentesi all'interno di altre parentesi, .. Si passa attraverso un certo numero di ricerche mal formulare, ma la rapidità con cui si può correggere una domanda, e soprattutto la rapidità con cui arriva la nuova risposta, aiuta a proseguire fino al successo. Cliccando su parole delle liste ottenute si può avere la voce intera e sapere cosa significano. È spesso necessario usare oltre all'operatore E l'operatore O. Esiste anche la possibilità di isolare le parole che hanno una caratteristica senza presentarne un'altra (caratteristica A e non B e non C). Una ricerca che voglia isolare fra le parole di una lista, ad esempio, solo quelle che indicano degli strumenti o dei meccanismi porta l'allievo a dover stilare una lista di iperonimi (strumento, dispositivo, meccanismo, ..) che il lessicografo può aver usato nella definizione; così facendo riflette sulle tecniche definitorie, sull'iperonimia, sulla sinonimia, .. Arrivare a formulare delle buone strategie di interrogazione è un risultato molto gratificante per l'allievo che si rende benissimo conto di non fare solo lezione di italiano, ma di star sperimentando modi si ricerca che poi potrà esportare in ricerche su altre banche di dati. Al docente e all'allievo principianti in questo settore va detto che le istruzioni che accompagnano i CD-ROM di dizionari italiani non aiutano molto nell'imparare le strategie di ricerca complessa (se l'utente interpella sui propri problemi di interrogazione chi ha disegnato il software, questi ultimi potranno conoscere gli utenti e inquadrare meglio le loro esigenze, scrivendo programmi più trasparenti e istruzioni più efficaci). Usando bene, e non solo al 5% delle loro potenzialità, i dizionari su supporto elettronico, un allievo imparerà a conoscere la struttura interna di un dizionario molto meglio di quanto avrebbe potuto fare con l'edizione a stampa.




Privacy




Articolo informazione


Hits: 33309
Apprezzato: scheda appunto

Commentare questo articolo:

Non sei registrato
Devi essere registrato per commentare

ISCRIVITI



Copiare il codice

nella pagina web del tuo sito.


Copyright InfTub.com 2024