Caricare documenti e articoli online 
INFtub.com è un sito progettato per cercare i documenti in vari tipi di file e il caricamento di articoli online.


 
Non ricordi la password?  ››  Iscriviti gratis
 

Il linguaggio naturale PARTE II: L'Agente - Introduzione generale

informatica



Il linguaggio naturale PARTE II: L'Agente


Introduzione generale |


Il linguaggio come "Veicolo"

Il problema "Significato"

Il problema "Significato in informatica"

Il problema della classificazione automatica

Sintesi e considerazioni


Il linguaggio naturale è lo strumento comunicativo che normalmente viene usato

nella vita di tutti i giorni, in forma scritta ed in forma parlata. Nonostante



ciascuno di noi sia un veterano del suo utilizzo, rimane ancora avvolta da una

spessa coltre di nebbia la sua essenza profonda.

Fin dall'antichità è stata riconosciuta al linguaggio questa fama di Dr Jekill.

Platone, Aristotele, Socrate, per citare alcuni grandi pensatori, si sono

cimentati nei labirinti delle sue stanze, ma ancora oggi il linguaggio fa

discutere.

Effettivamente molti passi avanti sono stati fatti con il trascorrere degli

anni, al punto da far passare il linguaggio da elemento di speculazione

meramente filosofica a branca autonoma della scienza: la LINGUISTICA. In realtà

l'ambito di studio che tale disciplina circoscrive è solo una parte di ciò che

il linguaggio offre come campo studio. Per essa sono stati identificati tre

obiettivi di studio1:

a) specificare la natura del linguaggio mettendo in luce le potenzialità e le

limitazioni che esso possiede;

b) identificare le regole che i parlanti di una lingua applicano nel produrre e

ricevere un messaggio linguistico;

c) descrivere e spiegare i cambiamenti che si attuano nel tempo,

nell'organizzazione e nella struttura delle lingue.

La linguistica si occupa pertanto dello studio della forma del linguaggio, cioè

descrive e analizza la meccanica di questo articolato sistema.

Manca all'appello una scienza che tenti di descrivere una parte essenziale del

linguaggio: come esso sia in grado di svolgere così bene il ruolo di strumento

comunicativo. Il nome proprio di tale disciplina è SEMANTICA. L'idea di

semantica è anch'essa antica, forse più di quella di linguistica, ma il suo

definirsi come scienza è nettamente più recente.

Il motivo di un tale ritardo è da imputare alla difficoltà che si trova

nell'identificare, definire, descrivere, catturare, enumerare il significato.

Nessuno ha mai visto il significato nonostante tutti ne facciamo continuamente

esperienza.

Intorno agli anni '50, di fronte al crescente entusiasmo per il fenomeno

INFORMATICA, anche la linguistica ha cominciato a fare i conti con il computer.

Il primo problema che si tentò di risolvere fu quello della traduzione

meccanica. In poco tempo il fervore dei ricercatori andò deluso. Si resero conto

che l'impresa era notevolmente più difficile del previsto. Tra alti e bassi,

oggi, il connubio tra informatica e linguaggio è divenuto inscindibile, anzi la

soluzione di alcuni problemi trasversali ai due campi, uno per tutti

l'interazione in lingua corrente con la macchina, è divenuta un imperativo

categorico.

Un'altra disciplina scientifica che ha a cuore il problema del linguaggio è la

PSICOLOGIA. In realtà il linguaggio non è il cardine della ricerca psicologica,

ma certamente per essa assume un ruolo fondamentale in quanto è l'unico

strumento che permette di sondare la psiche umana, suo vero soggetto d'indagine.

Inoltre il linguaggio ha grande importanza per la psicologia poiché le sue

patologie condizionano profondamente la persona e segnalano molte disfunzioni

mentali.


Il Linguaggio come Veicolo


Iniziamo con il dare una definizione corretta di linguaggio traendola dalla

linguistica:

Il linguaggio può essere inteso come la facoltà di associare due diversi ordini

di entità2:

1- l'ordine dei contenuti mentali, che di per sé solo non ha alcun mezzo per

manifestarsi agli altri, essendo per sua natura interno (ordine del contenuto o

semplicemente contenuto);

2- l'ordine delle realtà sensoriali che permette ai contenuti mentali di

manifestarsi all'esterno (ordine dell' espressione o semplicemente espressione).

In questi termini possiamo dire che il linguaggio è la facoltà di associare il

contenuto all'espressione allo scopo di manifestarlo.

Con parole meno specialistiche e più intuitive il linguaggio è il veicolo che

trasporta il significato.

Di questi suoi due aspetti il primo, quello di veicolo o più propriamente di

espressione, è soggetto specifico della linguistica. Le conoscenze, per quel che

riguarda l'espressione, sono a buon punto. Ne è testimonianza il fatto che sono

disponibili una terminologia ed una serie di strumenti di analisi comuni e

specifici per ogni livello, a partire dallo studente fino ad arrivare al

ricercatore.

Quando entriamo nel campo del secondo, quello di trasporto del significato o più

propriamente piano del contenuto, non troviamo, ancora, quell'ordine e quel

rigore tipico delle discipline ben formate. Esistono molti punti di vista e

nessuno che riesca a prevalere. D'altronde gli elementi del piano del contenuto,

o più semplicemente del trasportato dal linguaggio, non sono facilmente

oggettivabili. Non si è ancora riusciti a darne una rappresentazione tangibile,

sensorialmente evidente. Eppure una tale rappresentazione deve esistere dato che

viene usata dal nostro cervello per produrre ed interpretare il linguaggio, più

in generale per comunicare con altri esseri, e per manipolare e conoscere la

realtà.

Per riuscire a fare un vero salto di qualità nello sviluppo di applicazioni

informatiche è necessario tentare di sollevare il velo di mistero che ammanta il

contenuto, più comunemente noto con il nome di significato. Come dicevamo, il

significato esiste, dato che si manifesta attraverso il linguaggio che è in

grado di trasportarlo, ma nessuno lo ha mai visto.

Data la molteplicità e non univocità delle voci che convivono a proposito

dell'essenza del significato ritengo necessario proporre un percorso storico e

multidisciplinare che consenta di cogliere l'origine delle diverse correnti di

pensiero e di discernere quelle che meglio possono portare alla meta.


Il Problema "Significato"


Senso, contenuto, significato, signifié, signified, meaning, bedeutung,

denotazione, connotazione, intensione, referenza, sense, sinn, denotatum,

significatum sono tutti termini che riportano alla mente con diverse sfumature

il concetto di "significato". Nei prossimi paragrafi tenteremo di cogliere

l'essenza di questo concetto analizzando il punto di vista di quelle discipline

di pensiero che sostanzialmente dalle loro origini hanno avuto a che fare con

questo rompicapo.


Il Significato in Filosofia


Il dibattito sul significato ha sempre avuto grande importanza nell'arena della

filosofia, fin dalla nascita della stessa. Iniziamo ad affrontare il problema

dalle origini ripercorrendo il pensiero filosofico moderno e contemporaneo e

cercando di concentrarci su "che cosa è il significato" (o contenuto).

Partiamo esaminando il punto di vista fenomenologico: i suoi esponenti tentano

di condurre l'analisi della coscienza nella sua intenzionalità esercitando

l'Epoché, ossia la sospensione dell'affermazione della realtà del mondo

spostando l'attenzione dal mondo stesso, dalla sua realtà, ai fenomeni con cui

il mondo si annunzia e si presenta nella coscienza stessa (Nicola Abbagnano

"Storia della Filosofia" volume III). Sotto tale prospettiva la coscienza è

sempre "coscienza di qualcosa" pertanto la sua analisi non può prescindere dal

considerare i "fenomeni" cui essa assiste.

Edmund Husserl (1859-1938) massimo esponente della fenomenologia, definisce la

coscienza come una corrente di esperienze vissute, in cui ciascuna esperienza

possiede una sua "essenza".

Secondo questa idea il significato sembra nascere quale frutto dell'esperienza

fatta del "mondo". In base a questa interpretazione, attraverso le sensazioni,

la coscienza costruisce (e non semplicemente conosce) il suo mondo. Il

significato emerge, appunto, come frutto dell'esperienza fatta del mondo: l'idea

del mondo che ognuno di noi ha cambia in funzione delle proprie esperienze.

Conseguentemente i significati posseduti da ciascuno cambiano a seconda del

mondo considerato.

Il modello di pensiero fenomenologico ci permette di riconoscere l'esperienza

come elemento necessario all'essere: l'esperienza conquista il ruolo di "cava di

significati".

Maurice Merleau-Ponty (1908-1961), quale esponente della corrente

esistenzialista capeggiata da Martin Heidegger (1889-____), ha rivolto le sue

indagini al rapporto tra l'uomo e il mondo, inteso come rapporto tra coscienza e

natura. In particolare ci interessa vedere come egli corregge in senso

esistenzialista la fenomenologia di Husserl.

La coscienza non è per Merleau-Ponty il colpo d'occhio gettato sul mondo da uno

spettatore disinteressato ma è sempre la coscienza di un io "votato al mondo".

Scrive Merleau-Po 848j92i nty: "io sono a me stesso in quanto io sono al mondo; io sono

tutto ciò che vedo, io sono un campo intersoggettivo, non a dispetto del mio

corpo e della mia situazione storica, ma al contrario, in quanto sono questo

corpo e questa situazione e tutto il resto attraverso di essi"3.

Il pensiero di Merleau-Ponty ci suggerisce quanto sia importante considerare il

corpo come elemento di intersezione tra la coscienza ed il mondo: "il corpo è il

nostro mezzo generale di avere un mondo".

Per completare l'excursus filosofico segue una panoramica di definizioni di

significato redatte nel corso degli ultimi 200 anni.


PRAGMATISMO

Charles Sanders Peirce (1839-1914): il significato di una cosa è dato

dall'insieme delle disposizioni ad agire che tale cosa produce. Ogni significato

anche il più astratto è una regola di azione per l'uomo: "Non esiste distinzione

di significato così sottile che non consista in una possibile differenza

pratica"; se due conoscenze diverse danno luogo ad azioni dello stesso tipo

allora la distinzione è apparente, e se due conoscenze apparentemente identiche

producono azioni distinte allora la loro identità è apparente4.

John Dewey (1859-1952): i significati di tutti gli aspetti del mondo si formano

all'interno dell'indagine, anzi ne sono condizione imprescindibile: essi sono

gli strumenti fondamentali che consentono all'uomo di agire nella realtà e di

dominarla5.


NEOPOSITIVISMO

Ernst Mach (1838-1916): un concetto (significato) non rappresenta un'essenza

della realtà ma è un simbolo per indicare riassuntivamente grandi classi di

sensazioni che altrimenti resterebbero incontrollabili6.

Ludwig Wittgenstein (1889-1951): una proposizione intorno alla realtà ha senso

solo se esiste la possibilità di accertare se essa è vera o falsa, cioè solo se

essa è verificabile o falsificabile attraverso l'esperienza: se non si può, ne

si potrà, stabilire se tale proposizione è vera o falsa allora essa è una

proposizione solo in apparenza, cioè le parole che la compongono legate in

questa proposizione non producono alcun senso. Il senso di una proposizione è

dato dal modo in cui questa è verificata.

Gottlob Frege (1848-1925): Il significato (Bedeutung) di un concetto e in

generale di un segno è l'oggetto (tutto ciò che per relazione non invertibile

cade sotto un concetto; in generale qualsiasi soggetto di giudizio[Eco

"Semiotica..." p61]) designato dal segno stesso; il senso (Sinn) è il modo con

cui l'oggetto ci viene dato o una qualunque indicazione che compia l'ufficio di

nome proprio. La relazione tra senso e significato consiste nel fatto che un

senso ha un unico significato, mentre un significato può avere più sensi. Per

ciò che riguarda la proposizione il suo significato è dato dal suo valore di

verità che a sua volta dipende dalla corrispondenza all'oggetto8.


NEO-EMPIRISMO LOGICO

Rudolf Carnap (1891-1970): il senso è dato come contenuto degli asserti

intensionali (l'Intensione è l'insieme delle proprietà definitorie che

permettono di dire quali oggetti fanno parte di una certa Estensione) e il

significato è dato come contenuto degli asserti estensionali (l'Estensione di

una parola è l'insieme di quegli oggetti ai quali può essere attribuita quella

parola)9.

Karl Popper (1902-____): una proposizione ha senso se non esiste prova empirica

diretta o indiretta in grado di confutarla10.

C.G. Hempel (1905-____): nessun enunciato singolo di una teoria scientifica è

riducibile ad enunciati di osservazione e ciò che una espressione significa

rispetto a dati empirici potenziali dipende da due fattori:

1- dall'Impalcatura Linguistica alla quale l'espressione appartiene e che

determina le regole di inferenza degli enunciati;

2- dal Contesto Teoretico nel quale l'espressione ricorre, cioè dalla classe

delle ipotesi sussidiarie disponibili11.

Willard Van Orman Quine (____-____): l'unità minima che può ritenersi dotata di

significato empirico è la totalità della scienza12.


FENOMENOLOGIA

Edmund Husserl (1859-1938): l'oggetto è per così dire un polo di identità dotato

sempre di un senso preconcepito e da realizzare in ciascun momento della

coscienza esso è l'indice di una intenzionalità noetica... Bisogna distingue tra

un aspetto soggettivo, costituito dagli atti che mirano ad afferrare l'oggetto

(percepire, ricordare immaginare...) che è detto noesis, ed uno oggettivo (il

percepito, il ricordato, l'immaginato...) che è detto noema. Il noema non è

l'oggetto, è il complesso dei predicati o dei modi d'essere dati all'esperienza.

L'oggetto costituisce il polo attorno a cui vengono a orientarsi e a

raggrupparsi i noemi dell'esperienza vissuta. Il senso di un noema può rimanere

vuoto cioè non realizzato, privo dell'oggetto corrispondente. Quando l'oggetto

di presenta si ha l'intuizione in cui la cosa è data adeguatamente cioè è

presente "in persona"13.



ESISTENZIALISMO

Maurice Merleau-Ponty (1908-1961): "Ogni percezione di una cosa, d'una forma o

d'una grandezza come reale, ogni costanza percettiva, rinvia alla posizione di

un mondo e di un sistema dell'esperienza in cui il mio corpo ed i fenomeni sono

strettamente legati"14.

FILOSOFIA DEL LINGUAGGIO

Umberto Eco (____-____): il significato è il vertice del sottostante triangolo

semiotico:

X


Y-Z

Dove Y è una espressione e Z è una cosa o Stato di cose15.

Scorrendo la lista, che non ha la pretesa di essere esaustiva, si notano diverse

posizioni ma per tutte vale l'idea che il significato è una "essenza

trasportata". Il Significato è un ente che si manifesta esclusivamente durante

l'atto comunicativo.

Il significato, da un punto di vista generale, è la materia prima del pensare, è

quell'insieme di oggetti ci permette di pensare, far pensare, agire e far agire.

Infatti nel momento in cui penso comunico con me stesso ed il risultato di

questa operazione sarà o una azione o una "modifica interna" che in potenza

determina una azione futura (comunicazione interna); quando poi parlo con

qualcuno, produco nel mio interlocutore delle "modifiche interne" che lo

porteranno a pensare e pertanto a vivere le conseguenze proprie di tale

operazione (comunicazione esterna).

La natura del significato è indubbiamente legata alla esperienza, al punto che

esperienze diverse relative ad uno stesso oggetto, quando poi si comunicherà a

proposito di tale oggetto, richiameranno significati diversi. Fortunatamente

nella vita di tutti i giorni le esperienze che viviamo si somigliano

notevolmente. Più è ristretta la comunità linguistica e più è facile che i

significati legati alle esperienze siano prossimi e di conseguenza è più facile

che la comunicazione avvenga in modo corretto ed efficace. Il linguaggio

permette di potenziare le facoltà percettive, di sopperire ai limiti fisici del

fare esperienza. Laddove non sussiste comunicazione la sopravvivenza si riduce

notevolmente.

Gli elementi che terremo maggiormente in considerazione nel proseguimento

dell'esposizione sono i seguenti:

il modello fenomenologico di Husserl e poi riveduto da Merleau-Ponty;

la definizione di significato proposta da Umberto Eco;


Il Significato in Linguistica


Ripercorriamo in questa sezione le idee sulle quali si fonda il modello di

significato proposto dalla linguistica.

Scrive Raffaele Simone (R.S.) nel suo libro "Fondamenti di linguistica":

La lingua (ogni lingua) è un grande apparato di primordiale semanticità, la cui

funzione originaria è quella di trasmettere e scambiare significati 16

Le lingue verbali si distinguono rispetto agli altri codici per la proprietà di

permettere di esprimere qualsivoglia significato (onnipotenza semantica)17 -.

Se ne evince che la comunicazione verbale è uno strumento di eccezionale

efficacia per condividere significati (potenzialmente tutti).

La linguistica separa il significato in due componenti:

il Significato Strutturale

il Significato Lessicale

La prima componente rappresenta l'insieme dei morfemi lessicali estratti; la

seconda componente invece individua quella parte di significato che sopravvive

all'estrazione dei morfemi lessicali.

Ad esempio la frase "il presentatore ha annunciato il cantante" può essere

scomposta in:

1. il ...tore ha ...to il ...ante

2. presenta... annuncia... cant...

Nonostante nell'esempio riportato al punto 1 non siano presenti elementi dotati

di significato a se stante, il loro insieme,che forma una struttura, permette di

ricavare informazioni importanti per quel che riguarda il significato

dell'intera frase; d'altro canto al punto 2 abbiamo dei morfemi che, nel loro

complesso, contribuiscono a costruire significato alla frase.

Nell'approccio allo studio del significato, dal punto di vista linguistico,

R.Simone propone di considerare tre correnti specifiche:


1. La semantica referenzialista

1. Secondo Aristotele nel linguaggio entrano in gioco tre ordini di entità:

2. le cose,

3. le immagini mentali delle cose,

le parole foniche con le quali denominiamo le immagini mentali.

Tra questi tre ordini sussistono differenze importanti:

* le cose sono uguali per tutti,

* le imagini mentali sono 'fotografie' delle cose racchiuse nella mente

anch'esse uguali per tutti,

* le parole foniche sono come etichette attaccate alle immagini mentali in modo

arbitrario, nel senso che popoli diversi assegnano alle stesse cose parole

foniche diverse.

Il linguista Ferdinand de Saussure ha definito questo orientamento "lingua come

nomenclatura". L'inadeguatezza di tale modello è evidente. Essa infatti non

tiene conto che le lingue cambiano nel tempo, nello spazio e che da una lingua

all'altra il passaggio non è una pura sostituzione di termini.

2. Il significato come costrutto mentale

Questa concezione è stata elaborata da John Locke e corregge radicalmente il

punto di vista referenzialista. Locke distingue i significati in due grandi

categorie:

1. Significati Semplici: propri delle parole che si riferiscono a percezioni

sensoriali immediate oppure ad enti puramente razionali;

2. Significati complessi: propri di parole che si riferiscono a combinazioni di

percezioni.

Mentre i significati semplici possono essere considerati uguali per tutti, dato

che derivano direttamente da modelli presenti in natura, i significati complessi

sono frutto di una operazione arbitraria della mente che unisce idee diverse.

Qui con 'mente' Locke intende la collettività, e sostiene che tale mente generi

combinazioni di significati semplici ogni volta che sente il bisogno di farlo,

producendo un nome specifico per ogni combinazione. Tale interpretazione del

significato prevede che le combinazioni di idee possano dissolversi, così come

sono state create: quando non se ne avverte più la necessità sociale le idee

semplici, che componevano il costrutto complesso, tornano a ad essere l'una

separata dall'altra.

Tale modello spiega bene le seguenti evidenze semantiche:

lingue diverse possono dare espressione a significati diversi;

i significati di una stessa lingua possono cambiare nel tempo a seconda delle

necessità che la società presenta;

la traduzione da una lingua all'altra è difficile a causa della differenza di

combinazioni di idee.

3. Significato come sistema di relazioni

Questo modello si deve a Ferdinand de Saussure. Egli aggiunge alcuni gradi di

libertà alla arbitrarietà della lingua: mentre normalmente veniva considerata

solo la relazione verticale significante-significato mentre De Saussure afferma

che è arbitraria anche la relazione tra significante e significante e tra

significato e significato. Questo nuovo piano considerato è detto orizzontale. I

significati nelle diverse lingue si toccano l'un con l'altro, come confini di

una cartina geografica: modificandone uno necessariamente se ne modificano

altri. Se ne deduce che i confini tra i significati sono instabili: chi decide

della loro posizione, in linea di massima, è la società con la sua storia e la

sua evoluzione.

Anche attraverso questo modello è possibile produrre una giustificazione per la

variabilità del significato nel tempo e per le differenza esistenti tra una

lingua e l'altra. Tuttavia non si riesce a dare spiegazione alla regionalità

delle lingue. Per modellare anche il fenomeno della regionalità è necessario

condiderare la lingua come sistema di sottosistemi più piccoli e localizzati.

Vediamo ora quali sono gli strumenti che la linguistica moderna propone per

l'analisi del significato18.

Partiamo con l'elencare le unità di misura utili per questo arduo compito:

1A- INTENSIONE = Insieme degli oggetti a cui una particolare parola può essere

attribuita, si riferisce a quella "parte di mondo" extra-linguistico che viene

designata da essa.

1B- ESTENSIONE = Insieme delle proprietà definitorie che permettono di stabilire

quali oggetti fanno parte di una certa estensione e quali no.

2A- SENSO = Insieme delle associazioni personali ed irripetibili che si legano

inestricabilmente agli enunciati e sono dovute all'esperienza personale di chi è

coinvolto in una comunicazione.

2B- SIGNIFICATO = Elemento che 'dice' delle cose che sono uguali per tutti

coloro che condividono il codice del quale ci si sta' servendo.

3A- DENOTAZIONE = Significato 'primario' (originario) di un dato enunciato.

3B- CONNOTAZIONE = Significato 'spostato' di un dato enunciato.

Veniamo ora a mostrare il metodo che prende il nome di analisi componenziale.

Essa poggia sull'ipotesi che il significato delle parole possa essere

disaggregato in elementi di significato più piccoli detti Componenti Semantici.

L'insieme dei componenti semantici di una parola prende il nome di Matrice

Semantica. Sono formulate le seguenti ipotesi:

I- I componenti semantici sono in numero finito.

II- La natura dei componenti semantici è binaria (+ -, 0 1, A B...).

III- Il significato di una parola può essere descritto come somma di componenti

semantici;

IV- I componenti semantici di ogni parola sono tra loro simultanei.

V- I componenti semantici di ogni parola possono variare di numero via via che

si espande la comparazione a coppie tra le parole.

VI- Esiste la possibilità di guardare al significato in due direzioni: dalla

parola ai componenti e dai componenti alla parola (possono pertanto esistere

parole senza significato e significati senza parole).

VII- Parole con maggior numero di componenti in comune sono semanticamente più

affini.

Non tutto però è così chiaro come sembra, infatti:

1- Non è stata ancora codificata la procedura attraverso cui i componenti

semantici vengono estratti dal significato delle parole; persone diverse di

fronte ad una medesima lista di componenti semantici tra i quali scegliere

genera differenti matrici semantiche.

2- Tale tipo di analisi non sembra effettivamente praticabile a causa delle

enormi dimensioni dello spazio dei campioni costituito dal vocabolario.

3- I componenti semantici di cui parliamo, con grande probabilità, non hanno

carattere universale.

Analizziamo in dettaglio le caratteristiche dei componenti semantici e le

relazioni esistenti tra essi:

1- Componenti Assoluti ( come p(X) ).

2- Componenti Relazionali (come p(X,Y,...,Z) ).

3- Rapporti gerarchici tra componenti semantici.

Oltre ai componenti semantici si possono individuare:

1- i Componenti Pragmatici che si riferiscono alla speciale tonalità

dell'interazione che ha luogo tra i parlanti oppure al tipo di contesto nel

quale le parole considerate vengono adoperate.

2- i Componenti Proposizionali costituiti da combinazioni di elementi in

relazione tra loro ( ad esempio p(q(X,Y),Z) ).

3- le Restrizioni che specificano le limitazioni di applicazione delle parole.

Definiamo ora alcune Relazioni Semantiche:

A- Gradazione = alcuni gruppi di parole possono essere disposti in scala secondo

il grado di presenza di una particolare proprietà ( ex. nessuno, uno, qualcuno,

parecchi molti, infiniti). Non tutti i posti della gradazione sono

necessariamente occupati;

B- Iponimia // Iperonimia = Una parola X è Iponima di Y quando il suo

significato è incluso in quello di Y (ex. automobile è iponimo di veicolo). Se è

vero un enunciato contenete un iperonimo lo stesso enunciato deve

necessariamente essere vero anche dopo la sostituzione dell'iperonimo con un

iponimo nella stessa posizione. Due parole Iponime di uno stesso iperonimo

vengono dette Co-Iponime. Una definizione di iponimia che sfrutta la matrice

semantica è la seguente: X è iponima di Y se quando nella sua matrice semantica

occorrono almeno tutti i componenti intensionali di Y più altri specifici. Ne

deriva che gli Iperonimi sono intensionalmente più poveri degli iponimi ma

estensionalmente più ricchi. Non sono infrequenti parole che pur essendo

co-iponime non abbiano un corrispondente iperonimo che le comprenda

intensionalemnte tutte, esse sono raggruppate da un Iperonimo Virtuale che può

essere uno dei due co-iponimi.Il Lessico è organizzato iponimicamente per

favorire una risorsa enunciativa essenziale agli utenti linguistici, detta

"mobilità semantica". Questa permette al parlante di produrre enunciati con

diverso grado di ricchezza intensionale, spostandosi con una sorta di effetto

zoom lungo una scala ai cui estremi stanno la massima generalità e la massima

specificità.

C- Sinonimia, Antonimia, Complementarità, Simmetria: Due parole si dicono

sinonime se hanno esattamente la stessa matrice semantica. La sinonimia completa

è un evento estremamente raro per cui ci si deve accontentare spesso e

volentieri della quasi-sinonimia nel senso che due parole possono avere in

comune uno o più pacchetti di componenti semantici (a partire da quelli

intensionali), ma difficilmente li condivideranno tutti. L'antonimia è il nome

che si dà alla relazione per la quale il significato di una parola è il

contrario (o l'opposto) di quello di un'altra. Spesso la relazione di antonimia

include una gradazione proprio per come è stata definita. La complementarità è

una relazione che si istituisce tra co-iponimi che si presentano in coppia. La

simmetria è quel tipo di relazione che sussiste tra X e Y quando si può dire A

=> X => B e anche B => Y => A; esistono anche parole che sono implicitamente

simmetriche.

Torniamo ora ad un discorso più generale che mostri il perché dell'esistenza di

tali principi di ordinamento. Da un punto di vista puramente astratto essi

servono a non lasciare che il lessico sia una massa disordinata di parole e a

far si che le parole si possano classificare secondo qualche principio. C'è però

una ragione più profonda e più strettamente legata all'utente che giustifica

l'esistenza dei principi di ordinamento. Infatti essi favoriscono:

1. la memorizzazione del lessico da parte dell'utente, offrendogli delle piste

per associare le parole tra loro e per ricercarle quando occorrono;

2. l'Attivazione nell'utente di un complesso sistema di meccanismi di attesa che

gli è indispensabile sia per produrre che per interpretare gli enunciati.

Specifichiamo meglio il punto 2. I meccanismi di attesa predispongono l'utente

alla ricezione di un certo tipo di informazione, generano una aspettativa, che

frequentemente risulta corretta soprattutto in contesti estremamente familiari,

quotidiani. Essi permettono inoltre di circoscrivere il campo di ricerca delle

successive possibili parole. Infatti, una volta individuato il campo semantico

di riferimento, la comprensione di un testo o di un discorso avviane in modo

molto più efficace.

Ad esempio sentendo parlare di ruote, di motore, di sportello, di volante

veniamo indotti ad attendere in modo esplicito od implicito che si parli di una

automobile di un qualche modello. Tale tipo di relazione è chiamata meronimia

(relazione Tutto <=> Parti).

In conclusione i principi di ordinamento semantico risultano essere al servizio

della coesione e della coerenza dei testi in quanto offrono all'utente piste

preferenziali per la loro produzione e interpretazione.

Un altro fenomeno importante della lingua è quello delle famiglie semantiche.

con questo termine si intendono gruppi di parole di significato affine tra loro.

Su questa semplice intuizione poggiano diversi fenomeni:

1. La percezione che esistano gruppi di parole talmente correlate dal punto di

vista semantico da formare terminologie compatte;

2. Nell'apprendimento della lingua alcune famiglie devono avere precedenza su

altre.

3. La percezione che una parola può migrare da una famiglia all'altra estendendo

il suo significato.

Per avere una famiglia semantica è necessario che le parole siano correlate

attraverso uno o più dei principi di ordinamento ora descritti. In altri

termini, una famiglia semantica è costituita da tutte le parole le cui matrici

semantiche condividono almeno una componente intensionale. Tanto più alta è la

cardinalità di questa intersezione tanto più densa è la famiglia.

E' bene chiarire cosa intendiamo per campo semantico. Esso è una raggruppamento

di parole in opposizione paradigmatica reciproca, che possono cioè occupare lo

stesso posto in un enunciato. l'appartenenza ad un dato campo semantico non è

esclusiva, anzi una stessa parola può appartenere a più campi semantici

differenti. Anche per i campi semantici è possibile definire una quantificazione

per l'appartenenza. Aggiustiamo pertanto la definizione di famiglia semantica

"densa" introducendo l'idea di campo semantico. Una famiglia semantica per

essere tale deve:

a- verificare le proprietà di campo semantico.

b- essere organizzata in base ad uno o più principi di ordinamento semantico.

A loro volta anche tra i campi "densi" è possibile definire una gradazione che

considera più densi quelli che sono correlati da un maggior numero di principi

di ordinamento. Se ne può dedurre che una stessa parola può figurare in più

campi semantici, che l'intero lessico di una lingua sia composto da un insieme

illimitatamente esteso di campi di dimensioni e densità diverse.

Tutte le considerazioni sin qui presentate fanno pensare che il lessico di una

lingua sia interamente rappresentabile come una struttura ordinata, in cui non

ci siano elementi isolati, in cui ogni posto immaginabile sia riempito da una

parola. Tale punto di vista è però scorretto in quanto è praticamente

impossibile dimostrare che l'organizzazione strutturale presentata valga su

tutta una lingua. In realtà è più opportuno vedere il lessico come un sistema

sparso, ricco di vuoti e di asimmetrie, incongruenze, ambiguità, vaghezze.

Per superare i limiti di una struttura così inconsistente, nel nostro comunicare

quotidiano, facciamo riferimento a quattro risorse non strettamente

linguistiche:

* la capacità metalinguistica: che consiste nella possibilità di spiegare la

lingua attraverso la lingua stessa.

* la contestualità interna (che designa il mondo esterno): che permette di

restringere lo spazio dei significati cui si sta facendo riferimento

considerando ad esempio il significato generale del discorso che si sta

ascoltando.

* la contestualità esterna (che evoca il mondo esterno): che ha anch'essa la

funzione di restringere lo spazio dei significati, questa volta guardando alla

situazione in cui avviene una certa comunicazione (in treno, a casa, con un

amico, con il datore di lavoro...)

* la mobilità lessicale: che consiste nell'usare parole in molteplici modi e

posizioni trasmettendo particolari sfumature di significato.

Per concludere, grazie alla linguistica sappiamo che è possibile gestire in modo

egregio la sintassi e la morfologia delle parole e del testo. Il suo contributo

alla comprensione del problema del significato è fondamentale in quanto le

soluzioni proposte trovano fondamento nella indiscutibile familiarità di questa

disciplina con il fatto linguistico. Il limite che si può individuare in questo

approccio è una non completa formalizzazione dal punto di vista matematico del

problema che non permette immediate applicazioni nel campo della automazione

informatica.

In generale però possiamo dire che il numero di spunti sui quali avviare

approfondimenti sistematici non mancano. Per il proseguimento del discorso è

importante tenere presente i seguenti aspetti:

* la due componenti che caratterizzano il significato.

* le unità di misura dell'analisi semantica.

* l'idea di componente semantico e di matrice semantica

* le ipotesi sottostanti l'analisi componenziale

* l'idea di famiglia semantica

* le quattro risorse semiotiche.


Il Significato in Psicologia 


Per proseguire il discorso sul significato è importante considerare anche il

punto di vista della psicologia, la quale studia in modo scientifico e

sperimentale la realtà "uomo". Per questa sua peculiare caratteristica si

possono attingere da essa importanti informazioni a proposito del significato

che, come abbiamo visto fino a questo punto, è un componente centrale per la

sopravvivenza e il progresso dell'umanità.

Partiamo introducendo gli elementi chiave della psicologia generale19:

La Percezione: consiste nella valutazione della realtà; è difatti attraverso la

percezione che noi estraiamo e organizziamo tutte le informazioni che ci

provengono dal mondo in cui siamo inseriti ed in cui agiamo; la psicologia tenta

in questo campo non solo di studiare il ruolo delle informazioni che riceviamo

attraverso i cinque sensi ma anche quello delle informazioni che ci vengono

fornite dai sensi interni, dell'equilibrio etc.

L'Intelligenza: la sua principale caratteristica è la capacità di trovare

soluzioni originali a problemi che si pongono per la prima volta; essa ha

permesso all'uomo di superare le difficoltà che ha incontrato e che incontra nel

corso della sua evoluzione, traendo profitto dall'esperienza accumulata. Il suo

grado più alto è il pensiero espresso che è proprio ed esclusivo dell'uomo. Ciò

consente di distinguere l'intelligenza dall'istinto e dal semplice

apprendimento, dote quest'ultima, che si può constatare anche nel mondo animale.

Il Linguaggio: strumento che permette di trasmettere da società a società e da

generazione a generazione la somma delle esperienze acquisite arricchendole con

nuove ed incessanti scoperte.Il linguaggio umano, a differenza di quello animale

fatto esclusivamente di segni, è caratterizzato dal processo di simbolizzazione

che si accompagna all'evoluzione del pensiero. Privato del linguaggio,

l'individuo presenta difatti gravi ritardi mentali.

Le Motivazioni: I nostri comportamenti non sono mai determinati dal caso bensì

sempre da una ragione, sia essa cosciente o meno. Le motivazioni entrano in

gioco quando decidiamo di fare o non fare una certa azione.

La Personalità: è considerata in psicologia come una sorta di abito non fisso

che si modella giorno per giorno, secondo il vario gioco delle esperienze da

ciascuno vissute.

Il Comportamento Sociale: è il comportamento di un individuo all'interno di una

comunità di suoi simili; tale comportamento risente degli influssi che "gli

altri" esercitano sul modo di pensare, di sentire e di agire dei singoli, nonché

delle interazioni tra gli individui e i gruppi sociali stessi, come pure del

gioco di forze all'interno dei gruppi. L'evoluzione psicofisica,

l'apprendimento, lo sviluppo della personalità ed ogni altro aspetto psicologico

dell'individuo sono strettamente correlati al gruppo sociale di appartenenza.

Conflitti e Disturbi del Comportamento: Il comportamento umano si caratterizza

essenzialmente dal modo in cui un individuo agisce nell'ambiente in cui vive e

come ad esso reagisce. Il comportamento è espressione di una attività "totale"

della persona considerata nelle sue componenti somatiche e psichiche. Un buon

"adattamento" di tali componenti all'ambiente determina da un lato un armonioso

equilibrio del soggetto con la realtà e dall'altro un ordinato svolgersi della

vita sociale. Quando perciò conflitti interiori o situazioni esterne di disagio

alterano tale equilibrio si ha il "disadattamento", cioè condizioni in tutto o

in parte incompatibili con la vita sociale.

Cerchiamo di approfondire i seguenti tre punti: la percezione, il linguaggio e

le motivazioni. Tali elementi sono in stretto rapporto con il problema del

significato in quanto la percezione abbiamo visto essere la prima fonte di

significati, il linguaggio rappresenta lo strumento che permette lo scambio di

significati e le motivazioni sono il motore che attiva l'uso del linguaggio e

l'elaborazione dei significati.

LA PERCEZIONE

Nella nostra comune attività quotidiana abbiamo continuamente a che fare con la

percezione anche se ci sembra naturale che un tale fenomeno non presenti nulla

di straordinario, visto che esso avviene e ce ne serviamo per lo più senza

accorgercene, come un fatto del tutto spontaneo ed ovvio. La percezione è

infatti il mezzo attraverso il quale ci colleghiamo alla realtà. In altre

parole, è il mezzo con cui noi riceviamo le infinite informazioni che ci

provengono dal mondo e che, spesso inconsapevolmente, usiamo per regolarci ed

adattarci alla realtà presente. Senza tali informazioni agiremmo in modo del

tutto assurdo con conseguenze facilmente intuibili. Per valutare l'importanza

del fatto percettivo basta che ci riferiamo, come semplice esempio, alla

circolazione stradale: se il nostro meccanismo della percezione fosse alterato

non saremmo più in grado di stimare la distanza del nostro veicolo da quello che

ci precede, la larghezza della carreggiata sulla quale stiamo transitando,

l'avvertimento derivante da un colpo di clacson e così via.

Volendo definire l'idea di percezione si può dire che consta di un processo di

selezione e di organizzazione. Noi siamo costantemente bombardati da

innumerevoli messaggi provenienti dalla realtà e di cui facciamo uso per

svolgere la nostra attività. Ebbene se tutti questi messaggi fossero recepiti ci

troveremmo nel caos più completo. Diventa perciò naturale pensare che esista un

meccanismo di selezione che ci consenta di scegliere tra questi messaggi, quelli

che, in un determinato momento, ci interessano maggiormente ai fini del compito

che ci proponiamo di eseguire. Organizziamo le informazioni filtrate attraverso

il processo percettivo in modo da tradurle a nostro vantaggio per raggiungere

quello scopo e non un altro.

La percezione in definitiva altro non è che il primo anello della catena che

unisce quanto si trova nel mondo esterno con la nostra azione: apprendere,

ricordare, immaginare, raccontare e così via risulterebbero impossibili se prima

non avessimo immagazzinato tutti questi dati con la nostra esperienza

percettiva.

Dal punto di vista fisico la percezione consiste nella decodificazione e quindi

nell'interpretazione delle stimolazioni esterne che in un primo momento vengono

in contatto con i nostri organi di senso (vista, udito, olfatto, gusto e tatto).

Esse vengono immediatamente trasmesse ai centri nervosi superiori e sono

interpretate in base all'istinto e alle esperienze precedenti. Solo a questo

punto lo stimolo produce la risposta considerata adeguata. Bisogna puntualizzare

che gli organi di senso in realtà sono più di quelli che normalmente siamo

abituati a riconoscere: ricordiamo gli organi sensoriali somatici, quelli

cutanei, il senso labirintico e quello cinestetico. Studi sulla deprivazione

sensoriale hanno mostrato che questa provoca gravi scompensi organici

(temporanei) che si manifestano attraverso disturbi nella organizzazione

percettiva, del comportamento e del pensiero. Anche la sovrabbondanza di stimoli

provoca disfunzioni non trascurabili quali irascibilità, stress, nervosismo,

disturbi del sonno etc.

Approfondiamo ora il discorso relativo alla struttura della percezione.

Proponiamo di seguito una serie di punti importanti che riassumono il

funzionamento percettivo:

- non sempre uno stimolo è in grado di suscitare una percezione nella persona;

- lo stimolo esiste solo quando è presente una risposta;

- gli stimoli non si presentano isolati: i singoli eventi percettivi sono

organizzati in gruppi significativi cioè in un contesto;

- tali gruppi si formano secondo alcune regole:

a) Vicinanza: tendiamo a cogliere come un tutto le parti percepite più vicine

tra loro;

b) Uguaglianza: tendiamo a raggruppare stimoli simili tra loro;

c) Forma Chiusa: siamo indotti a percepire come unità superfici delimitate da

linee chiuse anziché aperte.

d) Esperienza: condiziona le nostre percezioni proponendo soluzioni già

incrociate.


- l'informazione viene percepita quando supera una soglia assoluta provocando

una risposta nel soggetto; per la precisione si possono identificare tre

tipolgie di soglia:

a) Minima: definita per stimoli appena percettibili;

b) Massima: oltre la quale si manifesta il dolore;

c) Differenziale: minimo oltre il quale siamo in grado di classificare come

diverse due sensazioni.

Grande importanza nel processo percettivo svolge l'attenzione. L'attenzione è

quel meccanismo attraverso il quale focalizziamo, isoliamo, soltanto un

particolare aspetto della percezione. Molti psicologi ritengono che l'attenzione

sia l'aspetto direttivo della percezione. Tale strumento permette di esaminare

con maggiore precisione solo quelle porzioni di realtà che vengono ritenute

importanti accentrando le risorse fisiche e mentali e distogliendole da altro.

Il processo della focalizzazione dell'attenzione fa parte di una risposta

generalizzata cosiddetta di "allarme" (o riflesso di orientamento) che viene

evocata in qualunque individuo per far aumentare l'intensità e la chiarezza

della percezione. In questo processo assumono grande importanza due tipi di

fattori:

- Interni: l'interesse...

- Esterni: la novità, la ripetizione,l'intensità...

IL LINGUAGGIO

La peculiarità del linguaggio umano è descritta dalle seguenti caratteristiche:

- Spostamento: capacità di potersi riferire ad avvenimenti lontani nello spazio

e nel tempo.

- Produttività: capacità digenerare e comprendere espressioni mai incontrate o

prodotte.

- Combinazione: capacità di collegare suoni distinti.

- Dipendenza: necessità di dipendere da processi di insegnamento ed

apprendimento.

- Simbolicità: si caratterizza come insieme di simboli legati a significati, a

segni e a comportamenti.

Il linguaggio ha subito lungo i millenni stupefacenti mutazioni; si è passati

dalla produzione delle prime fonazioni gutturali emesse dall'uomo preistorico

alle complesse combinazioni di suoni che costituiscono a tutt'oggi il panorama

linguistico mondiale. Pur esistendo una miriade di lingue differenti, è

possibile inquadrare una serie di caratteristiche comuni alla lingua:

- Il Canale vocale-auditivo;

- La Specializzazione: il linguaggio ha come obiettivo fondamentale la

comunicazione;

- L'Arbitrarietà: il rapporto tra suoni e cose non è univoco;

- Lo Spostamento (vedi sopra);

- La Produttività (vedi sopra);

Il linguaggio si sviluppa nell'uomo seguendo una serie di passi, identificati

attraverso esperimenti e studi scientifici dalla psicolinguistica. Grosso modo

si possono stabilire quattro fasi importanti:

1. 0-3 settimane: Passaggio dal vagito neonatale, al pianto, ai gorgoglii;

2. 3-16 settimane: Vocalizzazioni che variano in tono, in lunghezza ed

articolazione;

3. 16 settimane - 8 mesi: Lallazione, ovvero articolazione di suoni simili a

parole privi però di contenuto semantico

4. 8-14 mesi: Strutturazione del discorso che consiste nella produzione di

singole parole usate consapevolmente e pertanto aventi un senso.

Alla fase quattro segue una accelerazione impressionante per quel che riguarda

l'apprendimento di nuove parole che porta il bambino, in soli due anni, alla

centuplicazione del suo lessico primordiale. Segue poi la fase

dell'apprendimento di combinazioni sintattiche ed infine, grazie alla scuola, si

ha un raffinamento delle capacità linguistiche. Grande importanza assume

l'ambiente linguistico per lo sviluppo corretto del linguaggio nel bambino.

Veniamo ora a parlare della funzione del linguaggio. Abbiamo già accennato che

il linguaggio ha specializzato la sua funzione nello svolgimento del compito

comunicativo, ma non sono da dimenticare altri aspetti importanti quali il

valore espressivo e la capacità di regolare il comportamento etc. di cui esso

dispone.

Molti studi sono stati fatti a proposito della funzione del linguaggio, in

particolare però si sono affermate due teorie in particolare:

A. per la prima il bambino piccolo apprende in un primo tempo soltanto risposte

a stimoli specifici indipendentemente dal linguaggio e in seguito l'acquisizione

del linguaggio avviene per semplice associazione di uno stimolo condizionato ad

una determinata risposta (psicologi sovietici tra i quali un grande esponente è

Lura);

B. per la seconda l'origine delle operazioni intellettive giace nella fase

pre-verbale, mentre la formazione del linguaggio è contemporanea a quella del

pensiero rappresentativo (J. Piaget).

La seconda teoria è quella più accreditata e prevede quattro stadi di sviluppo

logico:

I) 0 - 2 Anni [fase pre-logica]: Il bambino agisce concretamente cosicché

l'azione precede la verbalizzazione logica del linguaggio.

II) 2 - 8 Anni [fase pre-logica]: Il bambino sa rappresentare mentalmente

oggetti, situazioni e relazioni; predomina ancora il dato percettivo.

III) 8 - 12 Anni [fase logica-concreta]: si assiste alla costruzione di una vera

e propria logica anche se ancora è mantenuta su un piano di concretezza.

IV) 12 - 15 Anni [fase logica-formale]: il ragazzo sa operare logicamente senza

ricorso ad oggetti concreti.

In sintesi, dagli studi di Piaget, emerge che il linguaggio non è una condizione

sufficiente a spiegare la costituzione del pensiero; al massimo potrebbe essere

solo necessaria. Difatti al di la di tutto risulta evidente che tra pensiero e

linguaggio esiste una stretta connessione. Ogni nuova acquisizione del

linguaggio implica anche una nuova conquista del pensiero e conseguentemente una

nuova opportunità di esperienza e di attività. E' stato d'altra parte dimostrato

che nei casi in cui non vi sia la possibilità di apprendere il linguaggio si

hanno profondi ritardi nello sviluppo mentale.


LA MOTIVAZIONE

La motivazione è quel fattore psichico sia esso conscio od inconscio, che spinge

l'individuo a compiere certe azioni o a tendere verso certi scopi. Una cosa

risulta subito evidente: la motivazione è necessaria all'azione. L'uomo è dotato

di due categorie di bisogni:

I. Primari: in comune con tutti gli organismi viventi legati all'ambito

fisiologico come nutrirsi, riprodursi, sopravvivere...

II. Secondari: frutto della cultura, chiamati anche bisogni psicologici o

sociali.

Spesso i bisogni secondari sono così intensi da soverchiare i primari. Questa

distinzione non è così netta come la si può esporre, poiché le diverse

dimensioni, psicologica, sociale, biologica sono strettamente correlate al punto

da risultare inseparabili. L'uomo difatti si sviluppa all'interno di una certa

società, in cui agisce e della quale accetta le regole, anche se talvolta

ritiene di doversi impegnare a correggerle o a modificarle. Ogni azione dunque è

promossa da bisogni che, in definitiva rappresentano l'essenza stessa della

motivazione. Si può completare la definizione di motivazione aggiungendo che

essa è quel fattore che potenziando un bisogno stimola l'individuo ad impegnarsi

a soddisfarlo.

Presentiamo ora il punto di vista della psicologia moderna rappresentato dal

pensiero di Sigmund Freud. Nella sua teoria della motivazione egli suddivide la

personalità in tre regioni adiacenti:

1- Es: il suo bisogno è quello di far prevalere gli impulsi istintivi (neonato)

2- Io: parte della personalità che va costruendosi nell'incontro-scontro

(conflitto) con la realtà nell'esperienza durante il primo anno di età (il

frutto della evoluzione dell'Io è la coscienza)

3- Super-Io: rappresentazione dei desideri degli altri, delle regole imposte

dalla società.

Poiché certi bisogni sono così intensi da non poterci rinunciare a cuor leggero,

ecco che fa la sua comparsa un meccanismo in grado di porre rimedio e che aiuta

ad accettare ciò che viene imposto dall'esterno: la rimozione. Tale meccanismo

permette di trasferire dal conscio all'inconscio i desideri che non vengono

accettati dal mondo esterno. E' dunque il ruolo dell'inconscio ad agire sulle

nostre motivazioni e sul nostro comportamento.

Oltre ai bisogni primari e secondari esiste un terzo tipo di bisogno che si

proietta nel futuro ed è la realizzazione del sé o "autorealizzazione" che

consiste nell'attuazione delle nostre migliori potenzialità attraverso le quali

noi esprimiamo più compiutamente il nostro Io. In questa prospettiva risulta

fondamentale credere in uno scopo.

Abbinata alla motivazione troviamo l'Emozione che è il prodotto dell'azione

motivata, azione che genera una percezione. Tale emozione ha differenti

coloriture più o meno piacevoli e più o meno intense. In definitiva si può

affermare che non esiste comportamento motivato che non produca un qualche stato

emotivo.

Tirando le fila si nota come anche il punto di vista della psicologia, a

proposito di significato, dia grande peso al fatto percettivo, alla esperienza

come chiave dell'essere e dell'agire di ogni persona. A queste conferme si

aggiunge l'idea che esiste sempre una motivazione che spinge la persona ad

interagire con il mondo e contemporaneamente a ricavare, ricercare significati.

Gli elementi chiave da considerare per ampliare il quadro sul significato sono i

seguenti:

* l'idea di selezione ed organizzazione per la percezione;

* le ipotesi sul funzionamento percettivo;

* l'idea di apprendibilità delle facoltà linguistiche;

* l'importanza del linguaggio nello sviluppo intellettivo

* l'idea di motivazione che porta a soddisfare bisogni (primari e secondari)


Il Problema "Significato" in Informatica


Iniziamo con il proporre un breve excursus storico che riassume i passi compiuti

in campo di elaborazione del linguaggio naturale, fino ad arrivare ad inquadrare

le tendenze degli ultimi anni.

Le origini dell'interesse per il linguaggio da parte degli informatici risale al

secondo dopoguerra in corrispondenza con lo sviluppo dei calcolatori stessi.

Tale periodo ha avuto come punti cardine di studio due sistemi fondamentali: gli

automi e i modelli probabilistici.

Gli automi a stati finiti prendono piede negli anni '50 in scia a tre modelli

precedenti:

1.[1936] La Macchina di Turing (Alan Turing è considerato da molti il padre

della informatica moderna): è una macchina astratta costituita da un controllo a

stati finiti e da un nastro sul quale essa può scrivere e leggere in dipendenza

della transizione in cui il controllo si trova a passare.

2.[1948] Teoria dell'informazione di Shannon: egli usa una macchina a stati per

modellare le proprietà di un canale per la trasmissione di informazioni discreto

(un esempio è il telegrafo). Shannon applica anche il lavoro di Markov sui

processi stocastici discreti al problema dell'informazione. Un Discrete Markov

Process può essere visto come una macchina dotata di un numero finito di stati

ed un numero finito di collegamenti tra tutti gli stati. Ad ogni collegamento è

assegnata una probabilità. La modifica di Shannon consistette nell'aggiungere ad

ogni collegamento un simbolo che veiene generato in seguito alla transizione tra

i due stati collegati.

3. [1943] Neurone di McCulloch-Pitts: è un modello semplificato di neurone

biologico usato come elemento di calcolo che può essere descritto mediante la

logica preposizionale. Tale neurone è un dispositivo binario che può assumere i

due stati Attivo o Inattivo, in seguito ad eccitamento o inibizione da parte di

altri neuroni ad esso collegati. Tale elemento, pur essendo poco credibile dal

punto di vista biologico, ha una enorme importanza come modello di calcolo.

(basti pensare che le più moderne teorie sulle reti neurali e connessioniste

hanno preso il via da questa idea).

Ma veniamo ai contributi specifici che questi diversi modelli di calcolo hanno

apportato allo sviluppo delle teorie degli automi e dei modelli probabilistici

nel campo della elaborazione del linguaggio naturale.

Noam Chomsky (uno dei più autorevoli linguisti del nostro tempo), partendo

dall'idea di Finite State Markov Process rivisitata da Shannon, riuscì nel 1956

a descrivere una grammatica e a codificare l'idea di linguaggio a stati finiti

come di un linguaggio prodotto da una grammatica a stati finiti. Da queste prime

intuizioni si è sviluppata la teoria dei linguaggi formali, che usa l'algebra e

la teoria degli insiemi per definire linguaggi formali come sequenze di simboli.

Uno dei prodotti di tale teoria è il concetto di grammatica libera dal contesto

derivato autonomamente da Chomsky (1956) da Backus e Naur (1959) e da altri, in

grado di produrre e descrivere il linguaggio naturale.

Lo sviluppo di algoritmi probabilistici per l'elaborazione del linguaggio trova

le sue basi in un altro contributo di Shannon: la metafora del canale-rumoroso e

la decodifica della trasmissione di informazioni attraverso canali di

comunicazione. Shannon utilizzò l'idea di entropia, presa in prestito dalla

termodinamica, quale elemento per la misura della capacità trasmissiva di un

canale e per la misura del contenuto informativo di un linguaggio.

Tra la fine degli anni '50 e i primi anni '60 ci fu la scissione netta in due

correnti a proposito dell'elaborazione del linguaggio: simbolica e

probabilistica.

La corrente simbolica prese il via da due linee di ricerca. La prima fu quella

legata al lavoro svolto da Chomsky a proposito di linguaggi formali e dei

compilatori, che in breve tempo portò a produrre i moderni sistemi di parsing.

La seconda era costituita dalla nascente idea di intelligenza artificiale

fondata durante l'estate del 1956 da John McCarthy, Marvin Minsky, Claude

Shannon e Nathaniel Rochester. Il cuore della ricerca portata avanti da questa

nuova disciplina era l'idea di ragionamento e di logica definiti da Newell e

Simon per i progetti "The Logic Theorist"20 e "The General Problem Solver"21.

Nacquero così i primi sistemi per l'elaborazione del linguaggio naturale (tra i

quali possiamo citare BASEBALL, STUDENT, ELIZA etc.) applicati a domini

linguistici ristretti utilizzando una combinazione di algoritmi di

pattern-matching e keyword-searching abbinati a semplici algoritmi euristici per

il ragionamento e la risposta a domande.

La corrente probabilistica ebbe come suo naturale habitat di sviluppo in

particolar modo all'interno dei dipartimenti di statistica e di ingegneria

elettronica. Verso la fine degli anni 50 il metodo Bayesiano iniziò a trovare

applicazione nei problemi di OCR (Optical Character Recognition) grazie al

contributo di Bledsoe e Browning (1959) che crearono un sistema per il

riconoscimento elettronico di testi in grado di sfruttare le informazione

statistico-linguistiche contenute all'interno di un dizionario, e di analisi

della autenticità di testi scritti (Mosteller e Wallace 1964). Alla fine degli

anni 60 i lavori di Shanon e Markov vennero integrati dalla teoria dell'Hidden

Marcov-Model e trovarono applicazione nel riconoscimento del linguaggio parlato.

Tali teorie furono poi approfondite e perfezionate dai ricercatori della IBM.

Risale a questo periodo, primi anni '70, la nascita di tutti gli algoritmi alla

base degli attuali sistemi di Speech-Recognition, Spell-Checking e Natural

Language Processing.

Il decennio racchiuso tra i primi anni settanta e i primi ottanta vide lo

sviluppo specifico di molti algoritmi chiave usati nell'elaborazione del

linguaggio naturale (NLP), che è nel frattempo divenuta un campo di studio a sé

stante. Nel 1972 Terry Winograd costruì il famoso SHRLDU che simulava un robot

immerso in un mondo di cubi colorati e di diverse dimensioni. Il programma era

in grado di accettare comandi in linguaggio naturale del tipo "Sposta il blocco

rosso sopra a quello verde più piccolo".

Il modello di Winograd fu la prova tangibile che il problema del parsing era

stato compreso sufficientemente a fondo e che era giunto il momento di dedicarsi

alla semantica e ai modelli di discorso. Gli anni 70 hanno visto nascere diversi

modelli semantici. Tra i tanti ricercatori che si sono dedicati a questa nuova

sfida va citato sicuramente il lavoro di Roger C. Shank e dei suoi colleghi e

studenti alla Yale School. Essi produssero una serie di programmi per computer

con l'obiettivo di modellare la comprensione umana descrivendone la capacità

semantica e la facoltà di conoscenza concettuale mediante le idee di "Scripts"

di "Plans" e di "Goals", e studiandone l'organizzazione della memoria. Durante

questo periodo sono stati prodotti altri modelli formali per la semantica basati

sulla logica dei predicati, ad esempio il programma LUNAR in grado di rispondere

a semplici domande (Woods 1978).

Anche per quel che riguarda l'elaborazione del discorso (discourse processing)

sono stati proposti diversi modelli. Tra questi si può citare l'idea di Grosz a

proposito di focalizzazione del discorso (discourse focus). Infine tra il '79 e

l'82 presso Palo Alto si assiste all'unificazione di alcune correnti di pensiero

tra le quali possiamo citare la definite clause grammar, la functional grammar e

la LFG.

Tra i primi anni 80 e i primi 90 si ha lo sviluppo di diversi progetti e modelli

per la generazione del linguaggio naturale (Appelt 1985; McKeown 1985) e altri

progetti, basati su sistemi a stati finiti, per l'analisi morfologica e la

fonologica.

Durante gli ultimi cinque anni i cambiamenti sono stati radicali. Innanzitutto

il modello statistico, che prima era utilizzato esclusivamente nel

riconoscimento del linguaggio parlato, ora trova molto spazio in applicazioni di

NLP. L'idea di probabilità va diffondendosi anche tra gli algoritmi di parsing,

Part of Speech Tagging, Pronominal anafora Resolution e Discoruse Processing.

Poi con l'aumento della velocità e della memoria dei computer c'è stata una vera

e propria esplosione demografica di sotto-aree collegate all'elaborazione del

linguaggio, in particolare per i campi di Speech-Recognition, Spelling e Grammar

Checking. Infine con l'avvento del World Wide Web si sono venute a creare

esigenze di sistemi Information-Retrieval e Information-Extraction .

In sintesi pare che molte delle soluzioni classicamente ritenute corrette ora

siano tornate in discussione, soprattutto a causa della loro rigidità e della

loro incapacità di adattarsi a situazioni nuove e impreviste, capacità che

peraltro è tipica degli esseri umani.

Le linee storiche precedentemente tracciate lasciano intendere che anche per la

computer-science, così come per la linguistica, per la filosofia e per la

psicologia, la questione sul significato è ancora decisamente aperta.

Consideriamo ora qual è, nello specifico dell'informatica, l'idea si significato

e quali sono i modelli cui attualmente si fa riferimento per creare programmi e

applicativi in grado di tenerne conto.

Attualmente, l'idea sottostante l'approccio informatico alla semantica formula

l'ipotesi che la conoscenza del significato di una frase equivale alla

conoscenza delle condizioni per cui essa risulta vera. In altre parole, la

conoscenza del significato equivale alla conoscenza di come il mondo sarebbe se

la frase fosse vera. Con ciò non si intende asserire che il significato della

frase consiste nell'essere in grado di stabilire se essa è vera o falsa, che è

una questione prettamente empirica, ma si afferma piuttosto che la conoscenza

delle condizioni di verificabilità (truth conditions) è un pre-requisito

necessario affinché una tale risposta sia possibile22.

Il concetto di significato come "insieme di condizioni di verificabilità"

(meaning as truth conditions) attraversa orizzontalmente, in forme diverse,

praticamente tutte le teorie semantiche contemporanee e trova una sua

giustificazione filosofica, ad esempio, in Davidson (1973).

Uno dei più importanti strumenti matematici cui ha fatto (e ancora fa)

riferimento la semantica informatica è la logica dei predicati o "First order

logic". Tale strumento funge da modello per sviluppare in modo rigoroso la

semantica di un linguaggio.

Sul piano pratico risulta facile comprendere perché la questione sul significato

fino ad oggi non è stata obiettivo primario di ricerca. La causa risiede nel

fatto che alcune elaborazioni a proposito di linguaggio naturale (tipo lo

smistamento di messaggi, il reperimento di informazioni testuali, la traduzione)

possono essere eseguite con risultati discreti anche applicando semplici metodi

statistici o di pattern matching, che non fanno uso della semantica intesa così

come è stata sopra descritta.

Resta il fatto che tali elaborazioni producono sensibili miglioramenti quando

sfruttano elementi di semantica. D'altro canto alcuni problemi non possono

essere risolti senza l'utilizzo di strumenti semantici di qualche genere. Uno

esempio tra i tanti è quello della interrogazione di basi di dati in linguaggio

naturale sviluppata per la "Air Travel Information Service" (DARPA 1989).

Si consideri la seguente domanda posta da un utente a tale servizio informativo:

"La sosta a Reykiavik è prevista per tutti i voli da Londra a San Francisco?"

Il sistema deve essere in grado di trasformare la domanda in una query

consistente e valida per il database relazionale dal quale deve essere estratta

la risposta.

Anche il problema della generazione di testi non può prescindere dal considerare

la questione del significato. Tale compito necessita innanzitutto della

costruzione di un appropriato modello del significato di ciò che deve essere

espresso, poi della conversione di tale modello in una forma comprensibile

all'utente finale: la lingua naturale.

Sia gli studi teorici che le applicazioni pratiche mostrano come e quanto sia

intrattabile, dal punto di vista computazionale elaborare il linguaggio naturale

sfruttando un approccio basato esclusivamente sulla logica dei predicati (si

pensi ad esempio al problema della ambiguità semantica e sintattica di un numero

considerevole di frasi).

Per questo motivo sono state sviluppate metodologie che permettono di

interpretare le frasi in modo indiretto. In altre parole la frase da analizzare

viene prima accettata solo se è in una forma compatibile con una grammatica

ristretta definita a priori, in seguito viene trasformata in una espressione

appartenente ad un linguaggio logico artificiale, infine il prodotto di tale

elaborazione viene interpretato facendo capo agli strumenti forniti dalla logica

dei predicati. Possiamo, riassumendo, vedere il processo di interpretazione come

legato a due fasi sequenziali:

- la prima riduce le variazioni sintattiche ad un numero finito di costrutti

(restrizione del linguaggio);

- la seconda chiede che venga generato uno schema di regole semantiche che

permettano di interpretare le frasi sintatticamente corrette rispetto alla

grammatica definita nella prima fase.

Vediamo alcuni esempi di teorie per la semantica proposte di recente in campo

informatico.


DISCOURSE REPRESENTATION THEORY

La Discourse Representation Theory (DRT) vede come un costrutto teorico

indispensabile il passaggio attraverso una rappresentazione intermedia

interposto fra lingua naturale e interpretazione semantica. Inoltre considera

come unità descrittiva fondamentale il discorso nella sua globalità, piuttosto

che le singole frasi isolate. Per discorso si intende un insieme di frasi legate

una all'altra da pronomi, congiunzioni, ellissi o altri connettivi grammaticali.

Tale connettività viene resa visibile grazie alla rappresentazione intermedia,

senza la quale essa resterebbe inesprimibile. Consideriamo il seguente esempio:

il computer ha fatto un errore.

una traduzione naif nella logica del prim'ordine di questa asserzione potrebbe

essere:

esiste(X,computer(X) and ha_fatto_un_errore(X))

che è logicamente equivalente a:

not(per_ogni(X,not(computer(X)andha_fatto_un_errore(X))))

che tradotto in lingua corrente diventa:

non tutti i computer non hanno fatto errori.

Ora, nonostante la frase iniziale possa essere completata come segue:

il computer ha fatto un errore. Esso è stato corretto in fretta.

sostituendo la prima frase con quella derivata per equivalenza dalla logica dei

predicati, non si ottiene un discorso sematicamene equivalente:

non tutti i computer non hanno fatto errori. Esso è stato corretto in fretta.

Se ne ricava che la forma della rappresentazione ha conseguenze linguistiche ben

precise. La DRT ha sviluppato una estesa descrizione formale per una quantità di

situazioni del tipo esemplificato poc'anzi, avendo cura di preservare

l'interpretazione logica e computazionale della rappresentazione intermedia.

DYNAMIC SEMANTICS

La Dynamic Semantics asserisce che il modo di considerare le condizioni di

verità associate al significato di frasi, derivato dal modello della logica dei

predicati, non giustifica il fatto che pronunciando una frase, si influisce sul

contesto in cui questa frase viene detta. L'idea trae spunto in parte dai lavori

svolti intorno alla semantica dei linguaggi di programmazione e si sviluppa

secondo diverse linee di ricerca basate sull'idea che il significato di una

frase è dato dalle modifiche che essa apporta ad un contesto.

Un esempio di applicazione di tale idea è l'Update Semantics, metodo che è stato

sviluppato per modellare gli effetti derivati dall'esprimere più frasi una di

seguito all'altra, in un determinato contesto.

Normalmente l'ordine associato ad una serie di frasi che compongono un discorso,

ha un significato ben preciso. Ad esempio, una frase del tipo:

Qualcuno bussa alla porta. Forse è John. Ma, è Mary!

ha una sua coerenza, ma non tutte le permutazioni associate alle varie frasi la

mantengono:

Qualcuno bussa alla porta. Ma, è Mary. Forse è John.

Un altro metodo degno di nota è il Dynamic Predicate Logic che riesce ad

estendere l'interpretazione delle clausole della logica dei predicati con

l'assegnazione di un valore a sottoespressioni. Tale tecnica permette di

considerare i passaggi da una frase all'altra come sequenza. In questo modo si

riesce a tenere conto delle dipendenze tra le successioni di frasi che vengono

ignorate dalla logica dei predicati. Ad esempio si riesce a descrivere il

rapporto che sussiste tra "qualcuno" e "lei" nella frase seguente:

Qualcuno bussa alla porta. Lei è Mary.



SITUATION THEORY

Questa teoria ha tentato di ristrutturare i fondamenti della semantica

tradizionale, per riuscire a produrre una formulazione soddisfacente del

concetto di stato parziale del mondo (partial state of the world), con

l'obiettivo di formulare una definizione migliore di proposizione. Si è tentato

di colmare le lacune descrittive della logica tradizionale quali l'impossibilità

di considerare insiemi contenenti se stessi. In questo modo si rendono

esplorabili le possibilità offerte dai linguaggi che descrivono se stessi,

dettagli che fino ad ora sono sfuggiti ad una codifica coerente e formale.

Le attuali linee guida per la semantica contemporanea nel campo dell'informatica

possono essere riassunte nei seguenti punti:

1. Ulteriore esplorazione dell'uso di rappresentazioni incomplete al fine di

poter applicare un qualche tipo di elaborazione semantica anche quando

rappresentazioni complete del significato non sono disponibili.

2. Maggiore attenzione al problema della costruzione del lessico e quindi una

più intensa collaborazione tra esperti di semantica e lessicografia

computazionale. Tradizionalmente per la semantica il significato delle parole è

stato un accessorio da appoggiare sopra alle strutture semantiche. Un tale punto

di vista è certamente corretto quando si ha a che fare con strutture del tipo

"per ogni X vale P", ma la questione diventa meno chiara quando si trattano

fenomeni estremamente complessi.

3. Maggiore integrazione tra semantica delle frasi e teoria della struttura del

testo. Diversi lavori in campo semantico hanno posto l'attenzione sul fatto che

il testo, nel suo complesso, possa influire sull'interpretazione semantica delle

singole frasi.

Il Problema della Classificazione Automatica


Con il termine classificazione intendiamo il procedimento attraverso il quale,

dato un insieme eterogeneo di oggetti, si procede ad un raggruppamento degli

stessi in base ad un qualche criterio guida, in sottoinsiemi ciascuno

caratterizzato da una qualche proprietà.

L'idea di classificare la realtà non è affatto nuova, anzi possiamo dire che è

una delle caratteristiche peculiari degli esseri animati ed in particolare

dell'uomo. Classificare in senso lato vuole dire saper distinguere e tale

operazione è una costante nella vita di tutti i giorni, a partire dalle cose più

banali come distinguere l'acqua dal vino o la destra dalla sinistra, fino ad

arrivare a dover distinguere tra bene e male, tra bello e brutto.

L'operazione di classificazione ha una sua motivazione: permette di ordinare la

realtà e di ridurne la vastità. Infatti, legato al processo di classificazione,

troviamo la capacità di generalizzare e di specializzare tanto cara alle

discipline scientifiche, le quali nel loro progredire producono, raffinano

classificazioni e tentano di estenderle attraverso ragionamenti logici formali

(deduttivi, induttivi,...).

Abbiamo visto che anche il linguaggio è caratterizzato da una struttura

gerarchica ordinata per poter ridurre la sua complessità, e trasformarsi in uno

strumento flessibile, maneggevole e di indiscutibile utilità.

Tuttavia per poter classificare un oggetto è prima necessario avere informazioni

a proposito di questo oggetto. Nella vita di tutti i giorni queste informazioni

vengono raccolte attraverso i sensi di cui il nostro corpo è dotato. Se pensiamo

ad uno sperimentatore in fisica, egli per poter classificare utilizza strumenti

di misura (amplificatori di sensazioni). Qualora non sia possibile ricavare

nessun tipo di informazioni su un oggetto allora tale oggetto è come se non

esistesse e pertanto la classificazione non sarà possibile.

Se ci caliamo nel campo dei testi abbiamo a disposizione informazioni le

seguenti:

* Quali parole compongono il testo e con quale frequenza;

* Quali sono le posizioni reciproche delle parole nel testo e con quale

frequenza occorrono l'una accanto al'altra;

* Quali sono le posizioni assolute delle parole all'interno del testo;

* Quali sono le frequenze tipiche delle parole all'interno del lessico di una

data lingua...

Una volta verificato che esistono delle informazioni, è necessario discernere

quali di queste usare per strutturare la classificazione. Infatti, a seconda

delle decisioni che si prendono in proposito, si produrranno classificazioni

anche notevolmente diverse. Ad esempio se sono dati dei bastoncini di diversa

lunghezza, colorati con tinte diverse e fatti di materiali diversi, a seconda

che si scelga di classificare in base al colore, o in base alla dimensione o in

base al materiale si otterranno classi diverse.

Tali criteri poi a loro volta devono essere affiancati da una metrica che

permetta di decidere quanto due oggetti si somigliano tra loro. Torniamo

all'esempio dei bastoncini: ammettendo che sia stato scelto come criterio guida

il colore e assumendo che i bastoncini sono colorati con sfumature tutte

leggermente diverse, per poter produrre delle classi è necessario giudicare se

un colore è più o meno simile ad un altro e decidere così dell'appartenenza di

un oggetto ad un insieme.

Nel campo dell'analisi dei testi sono state sperimentate numerose tecniche per

misurare la somiglianza. Si possono individuare tre grandi categorie:

1. Insiemistica: applicabile quando come risultato dell'analisi del testo si

hanno liste non ordinate di parole.

2. Geometrica: applicabile quando si considerano come risultati dell'analisi dei

testi liste ordinate di parole alle quali è associato il valore 0,1.

3. Statistica: applicabile quando dal testo vengono estratte informazioni

statistiche quali, ad esempio la frequenza di occorrenza dei termini.

Tra le tecniche insiemistiche possiamo citare i seguenti coefficienti di

somiglianza:

Siano X, Y due liste non ordinate di parole chiave,

Sia | | l'operatore unario che restituisce la lunghezza di una lista

Sia uni(x,y) l'operatore binario che restituisce l'unione di due liste

Sia int(x,y) l'operatore binario che restituisce l'intersezione di due liste

Sia min(x,y) l'operatore binario che restituisce il minimo di due numeri

Sia rq(x) l'operatore unario che restituisce la radice quadrata di un numero

DICE'S

2*|int(X,Y)| / |X|+|Y|

JACCARD'S

|int(X,Y)| / |uni(X,Y)|

COSINE

|int(X,Y)| / rq(|X|)*rq(|Y|)

OVERLAP

|int(X,Y)| / min(|X|,|Y|)

Un esempio di metodo geometrico è il seguente:

Siano X e Y due vettori del tipo

casa

gatto

amico

gioco


X






Y







Sia <X,Y> il prodotto interno dei due vettori

Sia || || l'operatore unario che restituisce la norma del vettore

SALTON'S

< X,Y > / ||X||*||Y||

Oss: Il coefficiente quì presentato non indica una somiglianza, ma una

divergenza. Può essere convertito in somiglianza applicando la seguente

equivalenza: S= 1/(1+D) dove D è il coefficiente di divergenza e S è il

coefficiente di somiglianza derivato23.

Ricapitolando, una volta che:

si è verificato che gli oggetti da classificare forniscono delle informazioni e

si è deciso come codificare tali informazioni;

sono state scelte, tra le tante possibili informazioni, quelle che si vogliono

come caratterizzanti la classificazione,

si è decisa la metrica che guiderà il calcolo della somiglianza o della

differenza tra gli oggetti

non resta che decidere quale criterio usare per produrre la classificazione.

Per generare le classi, cioè gli insiemi omogenei di cui la classificazione è

costituita, esistono diversi approcci possibili (alcuni degli algoritmi storici

più famosi sono [cap3 p10 Van Rijsbergen]:Single Link, Rocchio, Single Pass,

Dattola, Litofsky, Bonner) consideriamo le due categorie seguenti:

Top-Down: si parte considerando la collezione di oggetti da classificare come

un'unica grande classe e poi, in fasi successive, essa viene suddivisa in classi

via via più piccole e caratterizzate.

Bottom-Up: si parte considerando ogni singolo oggetto come classe, poi, in fasi

successive, si cercano di accorpare le classi simili Il procedimento viene

ripetuto finchè non sono più possibili fusioni.

Si è scelto di fare riferimento a questa suddivisione perché ciascun metodo

parte da un elemento che per l'altro è finale e viceversa. In questo modo il

problema può essere attaccato dai due fronti che lo confinano ed implementando

ambedue i metodi e confrontando i risultati si può apprezzare la convergenza del

metodo di classificazione.

Esiste un ulteriore parametro importante da valutare, ossia se l'appartenenza di

un oggetto ad una classe deve essere esclusiva o no. Si pensi ad una

classificazione che usa due parametri per valutare l'appartenenza ad una classe:

potrebbe esistere un oggetto che, secondo il primo parametro appartiene ad una

classe, secondo l'altro ad una classe diversa. In questo caso o si istituisce

una gerarchia sull'importanza dei parametri e si assegna l'oggetto alla classe

che ha come riferimento il parametro più importante o si assegna ad ogni classe

che lo conterrebbe l'oggetto conteso.

Il prodotto finale di entrambe gli schemi proposti è un insieme di classi. In

realtà, se si tiene traccia dei differenti passaggi di raffinamento, ci si trova

di fronte ad una struttura gerarchica di classificazioni via via più fini nel

primo caso, via via più generali nel secondo.

Tra i diversi metodi allo studio per classificare automaticamente documenti vano

ricordati per la loro originalità anche i seguenti metodi:

* Logical Imaging24

* Latent Semantic Indexing25

* Dempster-Shafer's Theory of Evidence26

* Neural Networks27

Una volta decise le regole per sviluppare le applicazioni è necessario trovare

delle condizioni che permettano di verificare la bontà di un metodo. Un primo

elemento lo abbiamo già introdotto e consiste nel confrontare i risultati delle

classificazioni con tecnica Top Down w Bottom Up, esitono però altre condizioni

che usualmente permettono di giudicare questi sistemi:

Stabilità = Il metodo produce classi che all'inserimento di nuovi elementi non

subiscono drastiche modifiche.

Tolleranza agli errori = Di fronte a lievi modifiche nella descrizione

dell'oggetto da classificare si devono poter verificare solo lievi modifiche

alla classificazione

Indipendenza dall'ordine dei dati = Le classi prodotte dal metodo non dipendono

dall'ordine con cui vengono processati gli oggetti in input

Facilità di aggiornamento = data una classificazione deve essere possibile

aggiornarla con nuovi oggetti in modo semplice e senza dover rimaneggiare tutta

la struttura creata.


Sintesi e Considerazioni


Arrivati a questo punto si intuisce facilmente perché fior di pensatori si sono

guardati bene dall'affrontare il problema del significato e si intuisce

altrettanto bene perché taluni altri hanno sentenziato che il significato è un

falso problema dicendo che non ha senso parlarne e ricercarlo. Ora, al di là di

tutto ciò che si può pensare in merito al fatto se sia giusto o meno affrontare

il problema a livello filosofico, dal punto di vista pratico la questione è

divenuta assai urgente.

Fare il solito discorso sulla sovrabbondanza d'informazione e sulla necessità di

trovare un sistema per navigare nel modo più efficace ed efficiente possibile in

questo mare decisamente inquinato di dati non è più necessario dato che ormai

tutti siamo, volenti o nolenti, convinti dall'evidenza dei fatti.

Tenteremo invece di proporre un ragionamento intorno alla possibilità di

imbrigliare in modo automatico l'impalpabilità del significato e, se questo

risulterà ottenibile, considereremo il come affrontare la questione della

classificazione automatica e del reperimento automatico di testi.

Parlare di significato quando si lavora con i calcolatori effettivamente fa un

certo effetto. Dire che un computer comprende il significato di una parola è una

affermazione quantomeno bizzarra (al momento). L'attività della percezione dei

significati fino ad oggi è sempre stata prerogativa delle persone in carne ed

ossa. Pertanto è naturale provare un certo disagio nel considerare il problema.

Consideriamo l'idea di produrre una macchina in grado di acquisire significati.

Tenendo presente le indicazioni scaturite dall'analisi del problema significato,

ne deriva che non si può certo prescindere dal fatto percettivo. La percezione

della realtà, lo ricordiamo, è la "cava dei significati" a cui noi attingiamo a

piene mani. Così, per poter permettere ad un computer di acquisire realmente i

significati del mondo, così come ciascuno di noi li conosce, è necessario

dotarlo di apparati sensoriali, possibilmente compatibili con quelli di cui noi

siamo naturalmente dotati, quantomeno dei più importanti: vista, udito e tatto.

Ma questo non sarebbe sufficiente. Infatti come abbiamo visto, ad esempio in

Merleu-Ponty, la questione corpo è fortemente implicata nel processo di

interazione con il mondo. Il computer dovrebbe poter interagire con il mondo

come noi interagiamo con esso. Infatti se noi persone avessimo al posto delle

gambe un set di quattro ruote, concepiremmo certamente in modo diverso l'idea o

meglio il senso della parola "spostamento".

Non basta ancora: se anche il computer fosse dotato di vista, udito, tatto (e a

pensarci bene scartare l'olfatto ed il gusto farebbe perdere al computer una

grande quantità di informazioni per quel che riguarda parecchi significati: si

pensi ad una pasticceria, il suo significato è dato anche dai sapori e dagli

odori che ci ritornano in bocca e nel naso) e potesse camminare su due gambe e

fosse in grado di usare un paio di braccia, ancora gli mancherebbero i bisogni,

l' istinto, quella parte di noi che ci spinge ad andare avanti, che ci dice di

mangiare, che ci porta ad esplorare, a conoscere.

E ancora il discorso potrebbe andare avanti per molto fino a giungere alla

conclusione che il significato è patrimonio "naturale" solo di un gruppo di

agenti "simili" che interagiscono con il loro "mondo" avendo potenzialità simili

e motivazioni confrontabili.

Da questo punto di vista la partita contro il significato pare chiudersi con una

netta sconfitta. In effetti la strada da percorrere non può essere quella di

costruire uomini fatti di silicio, in quanto, essendo da sempre in grado di

generare persone, lo sforzo darebbe vita ad un puro esercizio di stile (peraltro

estremamente complesso... anche se affascinante).

Visto che attaccando frontalmente il problema (dotare un calcolatore di un

sistema che acquisisca naturalmente significati) non è possibile (sempre

attualmente) ottenere vittorie, non ci resta che trovare il modo di ricavare i

significati passando per la porta di servizio: analizzando il mezzo di trasporto

da essi prediletto, il linguaggio.

Prima di tutto occorre ragionare sulla possibilità o meno di una simile

operazione.

La lingua è un sistema di segni che, a partire da un gruppo finito di lettere,

attraverso una serie di regole di concatenamento sempre più complesse a mano a

mano che si sale di livello linguistico (fonetico, morfologico, sintattico,

grammaticale, semantico), è in grado di mappare un insieme potenzialmente

infinito di significati. Ogni parola, frase, testo, discorso che produciamo, di

solito indica un significato che sarà recepito e riconosciuto dal nostro

interlocutore e perché no, anche da noi stessi. Come abbiamo visto il pensiero

può essere considerato una sorta di discorso interiore, anche se non sempre ha

uno svolgimento legato alla lingua in senso stretto.

Nonostante la vastità delle infinite possibilità linguistiche, la lingua tende a

condensare solo attorno ad una parte di esse. Questo principalmente per motivi

di efficienza. Il linguaggio ha come funzione fondamentale di aumentare le

possibilità di sopravvivenza della specie umana, e tende quindi a strutturarsi

in modo ottimale rispetto al suo scopo. Di qui la complessità delle regole che

lo governano e delle eccezioni che l'affollano. Va notato però che

l'acquisizione e la gestione della lingua avviene con estrema immediatezza

grazie al lavoro e alla struttura del nostro cervello che è geneticamente

predisposto a tale compito: si pensi alla lingua parlata, che già raggiunge un

buono stadio di maturazione già intorno ai 5-6 anni di età

Vediamo di giustificare la seguente affermazione: la struttura della lingua

riflette la struttura della percezione. Se proviamo a mettere a confronto le

ipotesi dell'analisi componenziale e le ipotesi che riassumono il funzionamento

percettivo non sarà difficile riscontrare numerose assonanze.

Rivediamo rapidamente quali sono queste ipotesi e mettiamole l'una di fronte

all'altra.

Cerchiamo di rendere più esplicite le somiglianze a cui abbiamo accennato.

Partiamo innanzitutto con il constatare che sia la percezione che l'elaborazione

di un significato necessitano di un evento scatenante per poter essere rilevati.

Nel caso della percezione tale evento consiste nella stimolazione di alcuni

recettori nervosi, nel secondo consiste nella ricezione di elementi linguistici.

Per entrambe si parla di gruppi di significato: nella percezione abbiamo

combinazioni di stimoli su differenti elementi sensoriali che insieme

determinano la sensazione, nell'analisi semantica vi sono gruppi di elementi

linguistici che, combinati insieme, trasportano un significato nuovo, derivato,

ma non in essi contenuto. Poi ancora per entrambe i modelli vale il principio di

vicinanza che nel caso della percezione è ben spiegato dalla definizione, mentre

per l'analisi semantica il fenomeno può essere rilevato sperimentalmente. Si

pensi a quando leggiamo una frase o un paragrafo: il contenuto è ritenuto

omogeneo, i suoi elementi sono visti come correlati (è poi in base a questo

fatto che apprendiamo). Anche il principio di uguaglianza vale per entrambe i

modelli a confronto: si pensi per il linguaggio alle relazioni di

iponimia/iperonimia o a quella di meronimia.

Riassumendo possiamo affermare che l'apparato preposto alla gestione del

linguaggio somiglia fortemente ad un "sensore", come il naso per l'olfatto o la

lingua per il gusto. Da questo punto di vista il significato va considerato alla

stregua di una percezione, la qual cosa non appare affatto strana se pensiamo a

quanto siano simili le reazioni di fronte ad un evento o al racconto ben fatto

di un evento.

Per capire come compiere una analisi efficace del significato, poniamoci di

fronte alla lingua come un bambino di fronte ad una fila di scatole nere

sigillate ed inattaccabili. Tali scatole devono essere esplorate e la loro forma

esteriore non ci aiuta affatto a indovinarne il contenuto. Il contenuto delle

scatole è diverso e la loro disposizione non è casuale, bensì causale. Si prende

la prima scatola, la si "scuote", la si gira, la si rigira, poi si prende la

seconda, la si "scuote", la si gira e la si rigira, e così via finché, a mano a

mano che l'esperienza si accumula, si trovano delle somiglianze tra alcune

scatole, tra alcune sequenze di scatole.

In questo modo non saremo mai in grado di conoscere il contenuto esatto di

ciascuna scatola, ma ci costruiremo in compenso un modello "compatibile" con il

loro contenuto. I problemi che si incontrano adottando un approccio (from

outside) di questo tipo non sono banali. Per prima cosa lo spazio di analisi è

grande, la frequenza assoluta dei singoli eventi è bassissima, la fequenza di

co-occorrenza è altrettanto bassa e lo spazio delle co-occorrenze è vasto e

sparso.

Per toccare con mano il problema è sufficiente fare il seguente esperimento:

Si prenda un paragrafo di un testo, si dispongano come ingressi verticale ed

orizzontale le parole che da esso vengono estratte eliminando le parole

grammaticali (congiunzioni, articoli, preposizioni...) e trasformate nella loro

forma base (ad esempio "cossi" va inserita nella tabella come "cuocere"). Si

barrino quelle caselle che corrispondono a coppie di parole vicine nel testo. Il

risultato dovrebbe somigliare al seguente:

immagine

Torniamo per un attimo a considerare il problema delle scatole nere. Abbiamo

detto che dobbiamo scuotere le scatole, girarle e rigirarle per poter fare

ipotesi sul loro contenuto. Tuttavia, considerando questa azione, si è dato per

scontato di essere in grado di "riconoscere" il suono che l'oggetto all'interno

produce, di avere nozioni sul "come" questo suono viene prodotto. Se non siamo

in grado di "interpretare" le informazione provenienti dall'interno della

scatola l'azione di analisi perde ogni valore.

Diventa fondamentale individuare "cosa" considerare nell'analisi delle scatole e

"come" interpretare le informazioni raccolte.

Abbiamo visto che il significato si lega alle parole attraverso l'esperienza.

Infatti nessuno di noi ne può conoscere a priori il significato. Per riuscire a

conoscere una parola sono disponibili solo due modalità:

1. Diretta;

2. Indiretta;

La modalità Diretta consiste nella indicazione da parte di qualcuno che funge da

insegnante, dell'oggetto o della situazione che una parola dovrà poi significare

(è l'esperienza diretta che crea il significato). La modalità Indiretta invece

permette di costruire il significato di una parola attraverso una descrizione

linguistica che si basa sulla proposta di collegamenti tra significati già noti

al soggetto che deve apprendere.

Prendiamo l'esempio della parola "albero". Per poter trasmettere il significato

di questa parola io posso usare la modalità diretta, portando il soggetto che

deve apprendere in un parco per indicargli un certo numero di alberi. Oppure

posso fare riferimento alla modalità indiretta improvvisando la descrizione di

un albero. Ammettiamo ora che il soggetto cui ci stiamo rivolgendo sia un

bambino che vive in una grande metropoli dove non esistono alberi e neppure la

televisione e che nessuna immagine di albero o di una sua componente sia

disponibile. Ecco un esempio di descrizione potrebbe comunicare l'idea di albero

a questo (sfortunato) bambino:

"Per sapere cosa è un "albero" Immagina una persona con decine e decine di

braccia aperte, sparse per tutto il corpo, alcune più lunghe, altre più corte;

immagina che questa persona abbia una pelle ruvida e di colore marrone; immagina

che le mani siano di colore verde e che i piedi siano nascosti sottoterra"

La descrizione esplicita di un significato non è l'unico tipo di modalità

indiretta disponibile. Si pensi alla estrapolazione di un significato, per una

parola sconosciuta, dal contesto. Restringendo l'analisi al campo della lingua

scritta per contesto (in realtà co-testo sarebbe il nome tecnico) di una parola,

definiamo l'insieme delle parole che la circondano. Se anche non conosciamo

assolutamente cosa si intenda con una data parola, siamo comunque in grado di

intuire il significato ad essa associato, analizzando il contesto in cui esse si

trova. Facciamo un esempio:

"Mercoledì scorso, tornando dalla farmacia, a Gino è caduto un TRASUVIANTE e non

si è rotto, sarebbe stato un disastro, con quel che costa!"

Nessuno conosce la parola TRASUVIANTE perché non esiste, ma tutti dopo aver

letto questa frase, potrebbero fare supposizioni su cosa possa indicare questa

parola. Anzi possiamo dire che si tratta di una operazione talmente naturale,

che diviene necessaria.

La caratteristica peculiare di questo tipo di apprendimento indiretto di

significato è che esso non necessita di un insegnante. Non c'è necessità di

avere qualcuno che indichi o descriva nulla, anche se un feedback potrebbe

rendere l'apprendimento più robusto.

Dunque per apprendere significati abbiamo individuato, in pratica, tre modalità:

1. Diretta

2. Indiretta-Descrittiva

3. Indiretta-Contestuale

Le prime due modalità necessitano di un insegnante che notifichi il collegamento

tra parola (segno più in generale) e situazione, oggetto o descrizione. L'ultima

modalità può essere applicata senza la supervisione necessaria di terzi.

Si potrebbe obbiettare che l'affidabilità di un significato derivato per

deduzione contestuale sia minore di quella che si potrebbe ottenere da una

acquisizione diretta o indiretta-descrittiva. In realtà la validità di tale

affermazione dipende dal grado di affidabilità dell'istruttore che guida la fase

di apprendimento. Se questi deliberatamente propone associazioni errate, allora

la qualità dell'apprendimento supervisionato sarà peggiore di quello non

supervisionato contestuale.

In ogni modo il livello di certezza relativo alla validità delle conoscenze

acquisite dipende da un fattore esterno cioè da un coefficiente di affidabilità

che implicitamente ciascuno di noi assegna all'informazione che recepisce. Tale

coefficiente permette di discriminare tra informazioni da ritenere valide, ai

fini di un ampliamento delle conoscenze attraverso il confronto con una soglia

interna che ci permette di accettare o scartare una informazione.

Facciamo un esempio.

Siano il Sig. A e il Sig. B due agenti di borsa: il primo è diffidente, il

secondo è più fiducioso. Entrambi vengono a conoscenza delle seguenti

informazioni:

1.Un noto esperto di borsa, famoso per le sue intuizioni, afferma che il titolo

XYZ salirà nei prossimi giorni di 5 punti percentuale;

2.Si viene a sapere da un mago che ha letto nella sua sfera di cristallo che il

titolo XYZ crollerà nei prossimi giorni di 10 punti percentuale.

Il Sig. A da credito solo alla prima informazione, ritenendo la seconda poco

attendibile ed investe K milioni sulle azioni XYZ. Il Sig B invece tiene conto

di entrambe le informazioni e ritenendole entrambe attendibili decide di non

acquistare nessun titolo. Chi avrà fatto bene? la risposta la può dare solo una

verifica empirica dell'indice della borsa.

Ci si può chiedere perché queste due persone hanno valori diversi per le soglie

di affidabilità e una delle risposte più plausibili vede nell'esperienza vissuta

da questi signori la motivazione principale.

Sintetizziamo, prima di concludere, alcuni punti essenziali del discorso:

Acquisire significati attraverso l'esperienza è una prerogativa essenzialmente

umana.

La struttura delle produzioni linguistiche fornisce indizi sui rapporti tra i

vari significati.

Lo spazio delle produzioni linguistiche è sparso e vastissimo.

Per poter eseguire una analisi corretta del significato è indispensabile

decidere quali dati considerare nell'analisi delle produzioni e come elaborarli.

E' possibile indovinare il significato di una parola tenendo conto del contesto

in cui essa è immersa.

L' attendibilità di una affermazione è un fattore soggettivo.

Dall'analisi proposta emerge che l'impresa di risalire al significato in modo

indiretto è possibile e le strade che si possono percorrere sono molte.

Nella seconda parte di questa dissertazione proponiamo un prototipo di motore

per l'acquisizione di significati che si basa sull'apprendimento indiretto

contestuale non supervisionato.






Privacy




Articolo informazione


Hits: 1757
Apprezzato: scheda appunto

Commentare questo articolo:

Non sei registrato
Devi essere registrato per commentare

ISCRIVITI



Copiare il codice

nella pagina web del tuo sito.


Copyright InfTub.com 2024