L’illusione epistemica dei modelli di Intelligenza Artificiale Generativa
Quando si chiede a un modello linguistico di spiegare una procedura clinica, di valutare una sentenza, di ricostruire un argomento filosofico, o in genere di esprimere un giudizio su qualunque questione, la risposta ha quasi sempre una forma ben riconoscibile: presenta una tesi, introduce distinzioni, articola passaggi causali, conclude. La superficie del testo è quella del ragionamento competente, anche se in realtà esiste una discrepanza fra il processo generativo dei sistemi LLM e l’apparenza del loro output.
Sul versante del processo, il modello esegue un’operazione di tipo stocastico, ovvero, data una sequenza di input, il sistema calcola le distribuzioni di probabilità apprese durante l’addestramento e produce, token dopo token, la continuazione più plausibile. Il modello non possiede alcuna rappresentazione di significato, non ha alcun accesso ai truthmaker (ciò che, nel mondo, rende vera una proposizione che sto affermando) e di fatto non è in grado di esercitare alcuna distinzione interna fra ciò che è vero e ciò che è falso.
Sul versante della superficie, però, il testo che leggiamo riproduce la struttura tipica dell’inferenza abduttiva: espone premesse, valuta ipotesi, propone conclusioni accompagnate da giustificazioni. Floridi e colleghi parlano però in questo caso di apparenza abduttiva, e descrivono più precisamente questa operazione come zeroth-order abduction. Quando funziona, l’output è accurato, quando non funziona, il sistema confabula, ma lo fa con la stessa eloquenza di quando funziona, costruendo asserzioni false ma circostanziate, fonti bibliografiche inesistenti, ricostruzioni storiche inventate nei dettagli. La forma della spiegazione resta indistinguibile nei due casi.













