[aha] CRITICA DEL WEB SEMANTICO

mannucciales mannucciales at tiscali.it
Mon Dec 31 11:15:50 CET 2007


Original Message From Florian Crame To nettime-l at kein.org Tuesday, December 18, 2007 11:33 PM

[a lecture manuscript written for the "Quaero Forum" on the politics and culture of search engines at Jan van Eyck Academy, Maastricht, 29/9/2007 - thanks to Felix Stalder for useful corrections]

L'arma con cui i progetti di ricerca tecnologici europei sperano di battere Google sono i processi di elaborazione dell'informazione semantica: "pattern recognition" nel progetto francese "Quaero", Semantic Web technology nel tedesco "Theseus". Originariamente, Quaero è nato come una collaborazione Franco-Tedesca, finanziata da entrambi i governi, finchè il progetto Theseus non ha scelto di proseguire per proprio conto, inseguendo una visione duplice, che coinvolge alcuni classici Santi Graal della computer science: 1. fornire la possibilità di effettuare ricerche sulle basi delle metatags del Web Semantico; 2. sviluppare software in grado di riconoscere il contenuto delle pagine Web e automitacamente applicare le tags. Mentre il secondo punto appare ancora utopico, un obiettivo che l'Inelligenza Artificiale insegue da decadi, il primo punto, una nomenclaura universale del tagging semantico, è condannato al fallimento da ogni standard critico di riflessione culturale.

Fondato e perseguito da Tim Berners-Lee, l'architetto originale del World Wide Web, il Web Semantico è un termine ed un progetto che non solo si presta ad una grande confusione, ma è anche emblematico di come agisce l'alienazione tecnologica, svalutando i concetti culturali, e portando ad un totale fraintendimento. Nel 2004, prima di Quaero e Theseus, il governo federale Tedesco aveva deciso di finanziare il Web Semantico con 13.7 milioni di Euro, ritenendo che una "tecnologia semantica" fosse necessaria per consentire ricerche in base al significato, ponendo al computer delle vere e proprie quesioni, dando così anche ad illetterati la possibilità di un più semplice accesso all'immenso archivio di Internet. Ma il Web Semantico non può essere ridotto a questo. Il finanziameno di 13.7 milioni di Euro è stato in raltà un fraintendimento.

L'analisi delle domande in linguaggio naturale è un altro Santo Graal delle ricerche di AI - che è stato parodiato dal software "Eliza" di Weizenbaum - sperimentato da motori di ricerca come "Ask Jeeves" - che poi è diventato "Ask.com", rinunciando al suo concetto originale - e "Powerset". Secondo il ricercatore AI Luc Steels, la comprensione interamente semantica del linguaggio naturale non potrà mai essere raggiunta con l'attuale architettura dei computer, a prescindere dalla velocità. Un sistema di ricerca basato sul linguaggio naturale si riduce ad essere niente di più che una interfaccia inefficiente alla ricerca di espressioni Booleane
contraddistinte dagli operatori logici AND, OR e NOT. Il Web Semantico non può cadere in questa trappola, non deve tradursi in un interprete automatico
di significato. Berners-Lee insiste sul fatto che il suo progetto "non implica qualche magica intelligenza arificiale in grado di comprendere i bofonchiamenti umani", in contraddizione con  gli obiettivi dichiarati dal progetto Theseus. Berners-Lee concepisce il Web Semantico come un sistema universale, unificato, basato sul "meta-tagging": "Invece di chiedere alla macchina di capire il linguaggio umano, si tratta di chiedere alle persone di fare uno sforzo in più". Questo sforzo, il tagging semantico, è stato ben definito ed è diventato popolare su siti di photo-sharing come flickr.com, su aggregatori di notizie come digg.com, o su siti di "social bookmarking" come del.icio.us. Significa semplicemente che gli utenti associano delle keywords a testi, immagini e altro, rendendo l'informazione ricercabile appunto per parole chiave o per particolari combinazioni di parole chiave. Su Flickr, per esempio, la ricerca secondo la combinazione di "birthday", "children" e "clown" produce una lista di immagini di clowns apparsi a feste di compleanno di bambini, senza che la macchina effettui una ricognizione in stile Quaero del contenuto delle immagini, o una mappatura automatica delle parole chiave in stile Theseus, ma solo in base all'assegnazione delle parole chiave effettuata dagli stessi utenti di Flickr. 

Il problema del tagging manuale è che non prevede uno standard o una nomenclatura unificati. Se, per esempio, un utente tagga un'immagine con la parola "kids" invece che "children", i risultati saranno differenti. I tags mancano di astrazione e universalità: la parola bambini, ad esempio, può essere classificato come un sottoinsieme di umani, umani come un sottoinsieme di mammiferi, compleanni come un sottoinsieme di celebrazioni ecc. Con una tale classificazione, le immagini contrassegnate con "compleanni" e "bambini" saranno comprese anche in ricerche più generali riguardanti immagini di celebrazioni. Per questo motivo, i sistemi di
tagging non sistematici, ad-hoc, generati dagli utenti, come quello di Flickr, vengono definiti "folksonomie". Il Web Semantico promette di scavalcare le folksonomie con un sistema unico, unificato e standardizzato, di tagging che possa essere applicato a tutto. Un sistema di classificazione universale gerarchico basato su un albero di metatag. In linea con la terminologia informatica, suonando tuttavia misterioso e idiosincratico,  Berners-Lee chiama tale sistema una "ontologia", creando confusione soprattutto tra quelle persone che hanno dei backgrounds filosofici e umanisti, perché l'ontologia a cui si riferisce Berners-Lee corrisponde piuttosto ad una cosmologia. 

In "The Analytical Language of John Wilkins", Jorge Luis Borges scrive di uno scolaro inglese del 17imo secolo:

"Egli divise l'universo in 40 categorie o classi, poi ulteriormente suddivise a seconda delle differenze, infine suddivise in specie. Egli assegnò ad ogni classe una monosillaba di due lettere; ad ogni differenza, una consonante; ad ogni specie, una vocale. Per esempio: "de" per un elemento; "deb" per il primo degli elementi, il fuoco; "deba" per una parte dell'elemento fuoco, la fiamma".

Simili schemi di classificazione, nel corso del Medio Evo e del Rinascimento, sono stati sperimentati, fra gli altri, da Ramon Llull, Giordano Bruno, l'enciclopedista Johann Heinrich Alsted e il teosofo Jan Amos Comenius, tutte tradizioni a cui si rivolge Wilkins, membro fondatore dell' "Invisible College". Prima della rivoluzione portata da Diderot e d'Alembert con la loro idea di srutturare arbitrariamente la conoscenza umana in ordine alfabetico, le enciclopedie erano state pensate come un complesso sistema di classificazione ad albero della conoscenza {anche il sitema enciclopedico sviluppato da Diderot e d'Alembert contiene ancora tale
schema). La cosmologia, chiamata ontologia, del Web Semantico segue esattamente lo stesso sistema. Le cosmologie classificatorie medievali e rinascimentali
funzionavano sulla base di paragdimi stabili, fissati dalla scienza dell'epoca, derivati dal sistema classificatorio fondato da Aristotele (la scuola scolastica, ndr). Il Web Semantico non è niente altro che un sistema neo-scolastico tecnocratico basato sulla credenza, ingenua, che il mondo possa essere descritto secondo un singolo ed universale punto di vista. In altre parole, corrisponde alla ideologia del controllo cibernetico e alla cecità dell'ingegneria di fronte all'ambiguità delle istanze culturali.

Sebbene non esistesse alcun Web Semantico negli anni Quaranta, lo scritto di Borges colpisce dritto al cuore della questione. Si porebbe perfino rimpiazzare il nome di John Wilkins con quello di Tim Berners-Lee quando Borges, analizzando le categorie, conclude che "queste ambiguità, ridondanze e deficienze ricordano ciò che il dottor Franz Kuhn attribuì ad una certa enciclopedia cinese intitolata 'Impero Celeste della Conoscenza Benevola', in cui era scritto che gli animali si dividono in: (a) appartenenti all'imperatore, (b) imbalsamati, (c) addomesticati, (d) maiali, (e) sirene, (f) favolosi, (g) cani randagi, (h) inclusi nella presente classificazione, (i) frenetici, (j) innumerevoli, (k) disegnati con fini pennellate, (l) eccetera, (m) quelli che hanno appena rotto la brocca dell'acqua, (n) che
assomigliano a mosche".

Anche se si tratta di una fiction, rivela l'arbirarietà delle categorie e delle classificazioni. In "The Order of Things", Michel Foucault comincia con una discussione della sopracitata lista di animali, capace di "mandare in frantumi ogni caposaldo" del suo pensiero, riflettendo su come l'ordine della conoscenza sia cosruito culturalmente e come possa essere concepito in molti modi differenti. Appare ovvio come la logica aristotelica continui ad esistere oggi nella nozione di genere e specie e, in modo ancor più discuibile, nella categorizzazione degli umani in razze biologiche. Ma non funziona nella stessa biologia. Il "platypus", un
mammifero che allatta dal seno, che depone le uova, vive in ambienti acquatici e ha un becco simile a quello degli uccelli, sfida ogni classificazione
riconducibile alla "Zoologia" aristotelica, rompendo le classificazioni di genere e di specie. Che posto occuperebbe nel Web Semantico?

In "Kant and the Platypus", Umberto Eco sottolinea come l'animale rimarchi la differenza tra la scolastica e la scienza empirica. Poi, con un po' di confusione, differenzia "casi culturali" - fenomeni definiti categoricamente - e "casi empirici" - fenomeni osservati non predefiniti. "Per essere riconosciuti come tali", riferendosi ai casi culturali, "devono riferirsi ad una struttura di norme culturali". Per Eco, in qualità di semiotico, ciò significa che l'Essere, l'esistenza, è quella frontiera che
la scienza sistematica non potrà mai conquistare, e questo è proprio ciò che, in un senso filosofico, significa ontologia.

L'innovazione della scienza moderna sin da Galileo, Newton e Cartesio è ciò che opera senza riferirsi a delle norme. Quando Diderot e d'Alembert abbandonarono il vecchio ordine classificatorio della conoscenza rimpiazzandolo con uno alfabetico non-classificatorio e non-sistematico, seguirono precisamente il paradigma empirico, considerando i fenomeni man mano che accadevano, non fissandoli a priori. Per fondare un sistema di investigazione critica e abbandonare i preconcetti,
la scienza ha fornito degli schemi semantici di riferimento.

Tornando alle folksonomie di Internet, in un Web forum del sito tedesco di news heise.de, durante una discussione sul Web Semantico e sul suo schema di
classificazione, un post anonimo portava come ipotetico esempio: "Un musulmano è un potenziale terrorista", per mostrare come una ontologia-cosmologia semantica unificata sia impossibile da realizzare. L'esempio raschia solo in superficie il problema culturale, gettando una luce dubbiosa sui linguisti informatici coinvolti nel progetto del Web Semantico, che non sembrano essersi applicati a dovere su Saussure e le arbitrarietà - ovvero le dinamiche culturali - del significante in relazione al significato. 

Il Web Semantico, ed ogni motore di ricerca o database relativo, si fonda sull'illusione che sia teoricamente possibile stabilire un criterio univoco di valutazione. Oltre la cosmologia, falsamene chiamata ontologia, è metafisica spacciata per fisica.

Su un livello più pratico (ma pur sempre culturale), il Web Semantico si riduce ad una una cultura che uilizza le tags semantiche per lo spamming e la manipolazione dei motori di ricerca, cosa che già avviene su Google e su altri motori di ricerca che ignorano le mettags incorporate nelle pagine Web. E mentre Berners-Lee è abbastanza realista da affermare che il metatagging non può essere fatto tramite bots come vorrebbe il progetto Theseus, il suo Web Semantico implica un incubo di complessità in cui la metainformazione scavalca l'informazione, in cui ogni pezzettino di informazione costringe ad un lavoro estenuante di marcatura semantica, comparabile ad una libreria il cui catalogo supera quantitativamente i libri a cui si riferisce.

"Semantica" e "ontologia" sono termini utili se vengono riferiti a ciò che i computers, in quanto pure macchine sintattiche, non possono processare, a ciò che non può essere mappato in strutture di dati se non in modi soggettivi, diversi, culturalmente controversi e folksonomici. I creatori del cosiddetto Web Semantico e la "next-generation" dei motori di ricerca dovrebbero imparare da Borges, quando conclude:

"Ho rilevato le arbitrarieà di Wilkins, [e] dello sconosciuto (o falso) scrittore dell'enciclopedia cinese [...]; è chiaro che non può esserci alcuna classificazione dell'Universo che non sia arbitraria e piena di congetture. La ragione è molto semplice: non sappiamo che cosa realmene sia l'Universo".

P.S.

Per la cronaca, ultimamente è arrivato "AskWiki", sviluppato da AskMeNow, il primo motore di ricerca basato sul linguaggio naturale, utilizzabile per "porre domande" a Wikipedia, basato sulla tecnologia Cogito, una piattaforma della Expert System nata nel nostro paese e già in uso presso aziende come la Microsoft, la Pirelli e la Vodafone, concepita per fornire "intelligenza" ai processi di ricerca attraverso una rete semantica: si basa infatti su una complessa mappa concettuale, contenente concetti e relativi significati posti in relazione alle voci di Wikipedia..

Personalmente, penso che la critica di Cramer sia esatta, non si può pretendere di stabilire un unico modello di interpretazione del linguaggio, per la natura stessa del linguaggio, la cui forza ma anche la cui debolezza risiede proprio nella pluralità di significati che trasporta, e che, come sappiamo, si ricavano sempre dalle relazioni tra emittente e ricevente, o tra emittenti e riceventi, processo a cui partecipano tanti fattori, naturali e culturali, ad esempio anche il linguaggio del corpo, che su Internet sparisce. Penso anche però che il problema del Web Semantico pone una quesitone fondamentale, che è poi quella dell'Intelligenza Artificiale o Intelligenza Collettiva che dirsivoglia. E cioè: come riuscire ad utilizzare la rete per espandere la coscienza collettiva, come riuscire a trasferire una vera intelligenza alla rete? Secondo me non si può pretendere dalla macchina una intelligenza di tipo umano, questo è sbagliato, per via della natura delle cose, non possiamo chiedere alla macchina di fare il lavoro che solo noi possiamo fare, altrimenti ci auto-eliminiamo; quello che si può fare è usare la nostra intelligenza, la nostra arte, per sviluppare modelli alternativi, in competizione tra loro, in grado di navigare nel diluvio informativo: arte della navigazione, questo secondo dovrebbe essere il vero obiettivo di un Web Semantico. A proposito, ma la Net-Art che fine ha fatto?

Note:

Geert Lovink, search engines on the move, 19/9/2007,
http://www.nettime.org/Lists-Archives/nettime-l-0709/msg00028.html

An interview with Tim Berners-Lee,
http://www.simple-talk.com/content/print.aspx?article=321

"Folksonomia (conosciuta anche come "collaborative tagging", "social classification", "social indexing", "social tagging")
http://en.wikipedia.org/w/index.php?title=Folksonomy

LINKS

http://cramer.plaintext.cc:70

gopher://cramer.plaintext.cc

AskWiki

Ask.com Italia

Powerset

Digg 

Flickr






-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://riot.ecn.org/pipermail/aha/attachments/20071231/75b45d45/attachment-0001.html


More information about the Aha mailing list