da ANALITICI & CONTINENTALI, FEBBRAIO 1998

di CARLO CECCHETTO
Ricercatore presso il DIPSCO, Istituto Scientifico H San Raffaele e presso la Kanda Univesity of International Studies di Tokyo
LOGICA E LINGUISTICA
Possono andare d'accordo?
L'autore di questo articolo sostiene, mediante un piccolo esempio, che l'utilizzo della logica matematica permette di scoprire delle proprietà del linguaggio naturale che non si potrebbero vedere "occhio nudo". Dunque, la logica può avere in una scienza umana come la linguistica un ruolo non dissimile da quello che ha la matematica nelle scienze della natura

In questo articolo farò qualche osservazione su una storia per certi versi singolare, ovvero quella dei rapporti fra la logica (e i logici) e il linguaggio naturale.
Una lingua naturale è qualsiasi lingua che un bambino può apprendere integralmente senza istruzioni esplicite. Così l'italiano, il giapponese o lo swahili sono lingue naturali mentre il basic o altri linguaggi di programmazione per computer non lo sono (quando questo non creerà ambiguità parlerò semplicemente di linguaggio o di lingua, ma si tenga presente che con questi termini intendo sempre linguaggio naturale nel senso appena specificato).
Con logica intenderò la logica matematica moderna, quella. per intenderci, che ha avuto fra i suoi fondatori personaggi come Boole. Frege o Russell. Chi non ha nessuna familiarità con questa disciplina può farsene un'idea, molto approssimativa ma sufficiente per seguire questo articolo, pensando che una parte della logica moderna è costituita da quella teoria degli insiemi di cui più o meno tutti conoscono i rudimenti.
Che ci possano essere dei rapporti fruttuosi fra logica e linguaggio naturale è un punto sul quale non tutti sono d'accordo. Molti per esempio temono che l'unico risultato possibile di una tale relazione sia una pericolosa contaminazione, dato che la logica è il regno della precisione e del rigore mentre il linguaggio naturale sarebbe il regno delle sfumature e delle ambiguità.
Dunque uno del timori è, che avvicinandolo alla logica, il linguaggio sia irreggimentato e in definitiva, diventi meno ricco ed espressivo. Mi sembra che questo timore sia abbastanza irrazionale. È curioso che si abbia verso il linguaggio un atteggiamento diverso da quello che si ha verso altri domini sottoposti ad indagine scientifica. In fondo, nessuno pensa che un arcobaleno rischi di diventare meno bello se uno scienziato si mette a studiare le basi fisiche del fenomeno, magari utilizzando la strumentazione matematica sofisticata che si rende necessaria. Non si capisce perché, utilizzare la strumentazione molto sofisticata della logica nello studio del linguaggio debba essere visto come un torto che si fa, tanto per fare un esempio, alla dimensione metaforica o poetica della lingua.
Certo resta da vedere se, oltre a essere i priori legittimo, l'utilizzo della logica nello studio della lingua naturale sia anche fruttuoso. Un timore che può sembrare fondato è quello di chi terne che la logica, proprio perché rigorosa e precisa, sia inapplicabile con profitto allo sfuggente linguaggio che parliamo tutti i giorni. Il fine di questo articolo è proprio quello di mostrare con un piccolo esempio che anche questo secondo timore, per quanto noti irragionevole, non è davvero motivato. Uno dei temi più appassionanti nelle ricerche in linguistica è quello degli universali linguistici. Per quanto le lingue naturali sembrino essere superficialmente molto diverse l'una dall'altra, c'è una importante tradizione di studi che ha scoperto delle proprietà che tutte le Iingue devono rispettare (o, per essere più cauti, delle proprietà che tutte le lingue che sono state studiate finora sembrano rispettare).
Un tema indipendente, ma che ha una parziale sovrapposizione con quello degli universali linguistici, è relativo all'innatismo del linguaggio. È notorio che la tradizione linguistica che è associata al nome di Noam Chomsky ha sottolineato che le componenti innate nel linguaggio sono molto maggiori di quanto si potrebbe pensare a prima vista e che la variabilità linguistica è in realtà limitata a pochi fattori.
Ora., è ovvio che una proprietà può benissimo essere universale senza essere innata. Ci possono essere fattori ambientali (intesi in senso ampio) che forzano qualsiasi lingua ad avere una qualche proprietà P, anche se tale proprietà P non è innata. Tuttavia,, in questo articolo sosterrò che, se si fa uso della logica nello studio delle lingue (e, crucialmente, solo se se ne fa uso) si è in grado di individuare un certo universale linguistico che è così astratto che la stia origine può molto difficilmente essere riconducibile a fattori ambientali. L'uso della logica, cioè , contribuisco a mostrare che c'è una proprietà linguistica che, plausibilmente, è innata. Generalizzando, si può sostenere che utilizzare la logica può permettere (fra le altre cose) di distinguere ciò che è innato da ciò che non lo è.
Per arrivare a formulare l'universale linguistico che è individuabile solo mediante l'uso delle categorie logiche è necessario introdurre due tipi di informazione preliminare. Cercherò di evitare ogni tecnicismo e di ridurre all'essenziale queste informazioni (al costo, temo inevitabile, di introdurre delle semplificazioni che non rendono giustizia alla complessità dell'argomento). La prima informazione riguarda la categoria di determinante e i metodi per arrivare a individuarla. La seconda informazione riguarda il modo in cui è organizzata la semantica logica moderna.
Un metodo per identificare le classi di parole (o, come tradizionalmente si dice, le arti del discorso) è quello distribuzionale. Grosso modo, il metodo consiste nell'attribuire una parola a una certa categoria se essa può comparire in tutti e soli i contesti sintattici in cui le altre parole appartenenti alla medesima categoria compaiono. Per esempio, nella frase Il gatto è sul tappeto la parola "gatto" può essere sostituita con le parole "cane"' o ."vaso", ma non con le parole "un", "sapeva" o "lentamente".
Il metodo distribuzionale ha degli indubbi vantaggi rispetto ad altri criteri per identificare le parti del discorso. Si pensi per esempio alla definizione tradizionale secondo cui un nome (comune) è ciò che si riferisce a una sostanza, mentre un aggettivo è ciò che si riferisce a una qualità. Questa definizione, introduce problemi molto seri (e di principio) quando si considerino parole come leggerezza che, pur riferendosi a qualità, sono dei nomi. Ma., dato che la parola leggerezza comparirà nei contesti sintattici in cui anche gli altri nomi possono comparire, adottando il metodo distribuzionale essa sarà correttamente classificata come appartenente alla categoria dei nomi. Non si deve però pensare che il metodo distribuzionale si limiti semplicemente a individuare in modo più elegante le parti del discorso che sono già note dalla grammatica tradizionale. Esso a volte conduce a sostituire categorie nuove, (e più adeguate a categorie vecchie e meno adeguate.
Un caso è quello della coppia articolo/determinante. In italiano, un articolo può precedere immediatamente un nome (o una sequenza nome-aggettivo). Per esempio indicando con un trattino una sorta di posto vuoto, che può essere variamente riempito, scriveremmo _SV, che può stare indifferentemente, per un uomo corre, la lepre corre1 oppure una lepre, corre. Con procedura analoga, indichiamo con V_O un posto vuoto tra il verbo e l'oggetto (vedo un uomo, vedo l'uomo). Ma espressioni come ogni, nessuno, due, molti, meno di tre, alcuni ecc. compaiono esattamente nei medesimi posti. Per convincersene, si sostituiscano queste espressioni nel contesto di poco fa. Il risultato è sempre una frase, accettabile: ogni uomo corre, nessun uomo corre, due uomini corrono, molti uomini corrono. meno di tre uomini corrono ecc. Ma questa medesima distribuzione, che accomuna in modo interessante gli articoli e queste altre parti del discorso, chiamate "quantificatori", ha una conseguenza: se prendiamo sul serio il metodo distribuzionale, la categoria di articolo non è più adeguata e va sostituita con un'altra categoria, più ampia, che comprenda tutte le espressioni che compaiono nei contesti tipici degli articoli. Questa nuova categoria più ampia è quella di determinante. Dunque saranno determinanti un e il ma anche ogni, nessuno, tre ecc.. La tradizione di semantica che ha inizio con Frege, e che è spesso identificata con il termine di semantica modellistica (model-theorethic semantics), si fonda sulla nozione di riferimento. A ogni termine della lingua naturale deve essere assegnato un riferimento nel modello di interpretazione (il modello di interpretazione è, intuitivamente, ciò di cui la lingua parla). Per semplicità assumiamo di avere a che fare con un linguaggio rudimentale. Esso ha solo tre nomi propri (Beppe, John e Maria), due nomi comuni come maschio e femmina, un'espressione come essere italiano e le sue forme flesse (sono italiano/a, sei italiano/a, è italiano/a ecc.) e due determinanti come un e ogni. Il dominio su cui viene interpretato il nostro linguaggio rudimentale sarà l'insieme A formato dalle seguenti tre entità:
A = {Seppe, John, Maria}
Il modello di interpretazione della nostra lingua rudimentale sarà fornito esplicitando, oltre al dominio che abbiamo detto essere A, il riferimento, o denotazione di ognuna delle espressioni della lingua.
La denotazione di un nome proprio è l'individuo che porta quel nome . Perciò, la denotazione dei nomi Beppe, John e Maria è rispettivamente la persona Beppe, John e Maria.
Nomi comuni come maschio e femmina e un'espressione come essere italiano esprimono una proprietà (rispettivamente, la proprietà di essere maschio o femmina e la proprietà di essere italiano). Assumiamo di identificare la loro denotazione con l'insieme delle entità che godono della proprietà che essi esprimono. Perciò, diremo che la denotazione di maschio è l'insieme B delle entità che hanno la proprietà di essere maschi, la denotazione di femmina è l'insieme C delle entità che hanno la proprietà di essere femmine e la denotazione di essere italiano è l'insieme D delle entità che hanno la proprietà di essere italiane (sto implicitamente assumendo che, come suggerito dal suo nome, John non è italiano):
B = {Beppe, John}
C ={Maria}
D = {Beppe, Maria}
Procediamo ancora di un passo. Ho detto poco fa che una delle caratteristiche della semantica modellistica è quella di voler assegnare una denotazione a ogni espressione che compare nel linguaggio. Ma non è questa una pretesa assurda? Anche limitandoci al nostro rudimentale linguaggio sorgono dei problemi: per esempio, che cosa sarà mai la denotazione del determinante un nel modello di interpretazione che abbiamo introdotto poco fa? Una specifica entità? un insieme? E quale mai? Sembra di essere di fronte a una difficoltà molto seria. Una risposta tuttavia c'è . Si tenga presente che stiamo usando la strumentazione della teoria degli insiemi. Cerchiamo dunque di sfruttarla a fondo e facciamo entrare nel quadro anche le relazioni fra insiemi (essere sottoinsieme, essere sovrainsieme, avere un intersezione vuota ecc.).
Pensiamo ora alla frase del nostro ipotetico linguaggio un maschio è italiano. Essa è vera se valutata rispetto al modello di interpretazione che abbiamo introdotto poco fa? Evidentemente sì, perché c'è (almeno) un maschio che è italiano (nella fattispecie è Beppe a essere italiano e maschio). In altri termini, la frase è, vera perchè l'insieme B dei maschi e l'insieme D degli italiani hanno un'intersezione che è diversa dall'insieme vuoto. Generalizzando questa conclusione, possiamo arrivare a rispondere alla domanda o lasciata in sospeso su quale sia la denotazione di un. Diremo che questo articolo denota una relazione R che sussiste fra due insiemi qualsiasi a e b quando la loro intersezione è diversa dall'insieme vuoto.
Passiamo ora all'altro determinante del nostro linguaggio, cioè ogni. Consideriamo l'enunciato: ogni maschio è italiano e chiediamoci se esso è vero nel modello di interpretazione. La risposta è negativa, dato che c'è almeno un maschio (John) che non è italiano. Questo ci suggerisce quale sia la denotazione del determinante ogni: esso denota una relazione R che sussiste fra due insiemi qualsiasi a e b quando il primo è un sottoinsieme del secondo (perché, la frase ogni maschio è italiano potesse essere vera nel modello di interpretazione, l'insieme B dei maschi avrebbe dovuto essere un sottoinsieme dell'insieme D degli italiani). Seppure non lo mostrerò, il lettore tenga presente che anche per gli altri determinanti è possibile trovare una relazione fra insiemi che essi dcnotano. Il passo successivo del nostro ragionamento consiste nel definire una proprietà di relazioni fra insiemi (le relazioni, infatti, come gli individui, possono godere di proprietà: possono essere riflessive, transitive, simmetriche ecc.).
La proprietà di relazioni che ci interessa quella di conservatività: diremo che una relazione qualsiasi R fra due insiemi a e b è conservativa se essa rispetta la seguente condizione:2
(1) a R b se e solo se a R (a Ç b)
In parole ordinarie, questa formuletta ci dice che, la relazione R tra a e b vale, se e (si noti bene) solo se essa vale anche tra a e l'iritersezione tra a e b.
Spieghiamo cosa questo vuol dire facendo dei semplici esempi. Partiamo proprio dalla relazione fra insiemi che abbiamo appena detto essere la denotazione del determinante ogni, ovvero la relazione di essere sottoinsieme. Poiché essa si indica con il simbolo Í: sostituiamo Í alla R nella condizione (l), ottenendo (2). La relazione Í sarà conservativa se (2) qui di seguito è vero:
(2) a Í b se e solo se a Í (a Ç b)
Di nuovo in parole ordinarie si ha che a è un sottoinsieme di b se e solo se a è un sottoinsieme della intersezione tra a e b. Perché una formula contenente un se e solo se sia vera, devono essere veri i due sensi dell'implicazione, quello da sinistra a destra quello da destra a sinistra. Nella fattispecie, perché (2) sia vera deve essere vera sia (3) che (4):
(3) se a Í b allora a Í (a Ç b)
(4) se a Í (a Ç b) allora a Í b
In (5) fornisco una raffigurazione grafica, che possa aiutare a verificare se la relazione di essere un sottoinsieme, cioè Í è conservativa o no:

Il diagramma in (5) mostra in modo molto immediato che. se a c: b, (a è un sottoinsieme di b ) allora (a Ç b) (l'intersezione di a e di b) non è altro che a stesso. Ma, per definizione, un insieme è un sottoinsieme di sè stesso e dunque (3) è vera. Concentriamoci ora su (4): è vero che se si dà a Í (a Ç b) allora si dà anche a Í b? Cioè, se a è un sottoinsieme dell'intersezione di a e di b, allora è anche il caso che a è un sottoinsieme di b? La risposta è positiva. Basta un attimo di riflessione per rendersi conto che, perché a sia un sottoinsieme di (a Ç b), tutti gli elementi di a devono essere anche elementi di b, che è come dire che a Í b.
Con ciò abbiamo dunque dimostrato che (2) è vera. La relazione Í (che a sua volta la denotazione del determinante ogni) è dunque conservativa. Lasciamo al lettore di verificare che la relazione che denotazione di un è anch'essa conservativa e arriviamo al cuore di questo articolo introducendo l'universale linguistico a cui ho fatto riferimento più sopra. L'universale linguistico che possiamo finalmente introdurre dice che i determinanti delle lingue naturali denotano sempre delle relazioni fra insiemi che sono conservative (cfr. l'articolo di Barwise e Cooper citato nei suggerimenti bibliografici). In altre parole, gli articoli come un , il, la e una hanno in comune con i cosiddetti quantificatori (come ogni, tutti, ciascuno, tre, meno di sette ecc.) non solo la proprietà di poter comparire nelle stesse posizioni della frase, ma anche quella (strettamente collegata., ma tutt'altro che evidente a prima vista) di denotare, appunto, sempre delle relazioni conservative tra insiemi.3
Vediamo di capire perché questo universale linguistico è interessante. Prima di tutto, la proprietà di conservatività non è una proprietà ovvia o scontata o, tantomeno, logicamente necessaria. Ci sono relazioni fra insiemi molto naturali che non sono conservative per esempio quella di identità tra insiemi.
Quindi, relazioni molto semplici e fondamentali come quella di identità possono non essere conservative. Ne deduciamo che non ci sono ragioni di tipo logico che spingono le relazioni denotate dai determinanti a essere conservative. Se tutte le relazioni semplici fra insiemi fossero conservative si potrebbe dire che i determinanti esprimono relazioni conservative perché esprimono delle relazioni fra insiemi semplici. Ma così non è. Ma. d'altra parte, non è facile immaginare un fattore ambientale presente nel contesto in cui un bambino apprende una lingua che forzi i determinanti a essere conservativi. Per esempio. una lingua non è più facile, più semplice da imparare, più efficace come veicolo di comunicazione, più adattativa in senso darwiniano se i suoi determinanti esprimono relazioni conservative. Quella di conservatività, cioè , è una relazione troppo astratta per poter pensare che esista un fattore ambientale che la favorisca (per non parlare del fatto che questo fantomatico fattore dovrebbe essere presente nei contesti di apprendimento di ogni singola lingua, ovunque nel mondo).
Quello che ne discende è che l'ipotesi più plausibile sull'universale linguistico della conservatività dei determinanti, è che esso sia il frutto diretto delle dotazioni linguistiche di partenza di cui ogni bambino dispone. La proposta di un universale linguistico suscita spesso una reazione (che, sia detto per inciso, è perfettamente naturale e razionale): quella di cercare di invalidarlo trovando un controesempio. E in effetti non c'è alcuna garanzia che davvero tutti i determinanti delle lingue naturali esprimano relazioni conservative. Domani un linguista potrebbe confutare questo universale mostrandoci una lingua i cui determinanti non sono conservativi. Va però detto che sono passati ormai quasi una ventina di anni da quando questo universale è stato proposto e finora non sembrano essere stati individuati credibili controesempi.
In questo articolo, ho cercato di mostrare con un esempio che l'uso di categorie logiche nell'analisi linguistica, lungi dall'essere un pericolo, è invece una strategia euristica che si rivela fruttuosa.
Qualcuno potrebbe chiedere perché mai le cose stiano così. La lingua è forse organizzata secondo la medesima logica di cui trattano logici matematici? Anche solo tentare di rispondere a questa domanda ci porterebbe troppo lontano. Una parola di cautela va comunque espressa. Non si deve pensare che ci sia qualcosa di speciale o di unico nel dominio di cui stiamo parlando. La domanda che ho posto poco fa senza tentare di dare una risposta, è analoga, mi sembra, a quella circa l'utilizzo (oggi universalmente accettato) della matematica nelle scienze della natura. Che cosa lo rende legittimo o necessario? Forse il fatto che il libro della natura è davvero scritto in caratteri matematici. (come diceva Galileo? La lezione che ne esce è che i problemi epistemologici posti dalle scienze umane come la linguistica moderna, per quanto ardui e forse inquietanti, non sono poi così dissimili da quelli posti da scienze ben più mature. Una conclusione, questa, di cui molti linguisti avrebbero ragione di rallegrarsi.

Bibliografia ragionata a cura dell'autore
Una discussione più accurata sull'universale linguistico della (conservatività dei determinanti si può trovare nel volume Semantica di Gennaro edito dal Mulino nel 1997 (si veda in particolare il capitolo 2). Questo testo fornisce un'introduzione completa alla semantica, cioè al territorio di incontro privilegiato fra logica e linguistica. Per chi voglia invece avventurarsi nella letteratura primaria su questi temi, il riferimento d'obbligo è J. Barwise e R. Cooper (1981) "Generalized Quantifiers Language in Linguistics and Philosophy; 4: 159-219.

note
1 Adottando una notazione molto comune, assumo che S stia per soggetto, V stia per verbo, O stia per oggetto: con _ segnalo invece la posizione che può essere occupata dall'articolo.
2 Il simbolo Ç indica l'intersezione fra insiemi, Dunque A Ç B indica l'intersezione fra A e B.
3 Perché la relazione di identità sia conservativa, (i) qui sotto dovrebbe essere vera:
(i) a = b se e solo se a = (a Ç b)
Si ricordi che perché (i) sia vera, devono essere vere sia (ii) che (iii), cioè i due sensi dell'implicazione:
(ii) se a b allora a = (a Ç b)
(iii) se a=(a Ç b) allora a = b
Lascio al lettore la verifica che (ii) è vero. Quanto a (iii), ci sono, in effetti, diverse situazioni che lo invalidano. Una di esse è rappresentata dal diagramma in (5) del testo: nella situazione, descritta in (5), è, vero che a = (a Ç b) ma è falso che a = b.

inizio
pagina