Originariamente pubblicato in data 24/11/2001
A
C
C
O
M
A
Z
Z
I
Rifacciamo il Web
Rifacciamo il Web
W3C, World Wide Web Consortium, un ente senza scopo di lucro che elabora e poi emana nuovi standard per far crescere e migliorare il web, sta facendo di tutto per cambiare il modo con cui le pagine si concepiscono, scrivono e navigano
Se lo dice il suo inventore, bisogna crederci: il WWW è da rifare. Tim Berners-Lee -- il ricercatore britannico che nel 1990 (mentre lavorava per il Cern di Ginevra) inventò il World Wide Web -- oggi è presidente di W3C, World Wide Web Consortium, un ente senza scopo di lucro che elabora e poi emana nuovi standard per far crescere e migliorare il web. Il W3C sta facendo di tutto per cambiare il modo con cui le pagine si concepiscono, scrivono e navigano.Facciamo un passo indietro. Quando Berners-Lee lo concepì, il web doveva servire a mettere in linea alcuni semplici ipertesti, cioè pagine di testo collegate tra di loro anche se memorizzate su calcolatori differenti. Tecnicamente, il web classico allora come ora si basava su due pilastri: il protocollo HTTP e il linguaggio HTML. Il primo, lo HyperText Transport Protocol (cioè protocollo per trasportare ipertesti) decreta il formato della richiesta con cui il computer di un visitatore chiede a un sito di inviargli una pagina e il formato con cui la richiesta viene accolta e il contenuto richiesto viene trasferito. È un protocollo semplice e leggero, che noi normalmente ignoriamo perché il nostro programma di navigazione ce lo nasconde, oggi giunto alla versione 1.1.
La pietra dello scandalo è invece lo HyperText Markup Language (cioè linguaggio per etichettare gli ipertesti). Era nato con lidea che lo scrittore (nellesempio originario di Berners-Lee, un dottorando alle presi con la sua tesi) aggiungesse piccole informazioni inframmiste al testo. Cose come questo è il titolo del capitolo oppure qui comincia una tabella, utilizzate poi per mostrare a video quel testo in modo più leggibile e strutturato. Il moderno HTML, giunto alla versione 4.0.1, è un linguaggio barocco e inutilmente complesso, che nessuno scrive più a mano ma che viene (mal) assemblato automaticamente da programmi di impaginazione studiati per il web, interpretato e mostrato a video in modo differente dai differenti browser (come Internet Explorer o Netscape Communicator) che la gente usa. Il W3C vuole pensionarlo e sostituirlo con un linguaggio piuttosto differente, lo XML (Extensible Markup Language, cioè linguaggio espensibile per etichettare). Un primo supporto dello XML è già stato introdotto in Explorer e Netscape dalla versione 5.5 in su, la speranza è che le cose migliorino ancora. Lidea forte: bisogna separare completamente il contenuto delle pagina dal loro formato. Lautore dei contenuti si occuperà esclusivamente di questi e li etichetterà nel modo che gli pare più significativo. Per esempio, chi volesse vendere la sua merce sul web scriverà un catalogo, composto da un elenco di prodotti, e per ciascun prodotto specificherà nome, prezzo, foto eccetera. Separatamente un grafico si preoccuperà di come vestire queste informazioni scegliendo il carattere tipografico, il colore di sfondo, e tutte le altre caratteristiche estetiche e di navigazione. I vantaggi sono numerosi. Per colpa delle limitazioni dello HTML, le odierne pagine del web sono fatte per venire guardate da un paio di occhi umani. Sotto XML, diventa possibile rivedere laspetto di un sito senza necessariamente mettere le mani anche sul contenuto dando anche la possibilità a i portatori di handicap visivi di fruire delle pagine attraverso un formato diverso e specializzato (caratteri più grandi per gli ipovedenti, sintesi vocale per i ciechi) e si lascia la strada aperta per la trasformazione del contenuto in altri formati.
Lo XML poi apre la porta ad XML Schema, un nuovissimo standard approvato da W3C alla metà del 2001, che potrebbe davvero rivoluzionare il web rendendolo ancora più utile per tutti. Lo XML Schema introduce una serie di regole ulteriori che, in sostanza, rendono una pagina XML comprensibile non solo dagli esseri umani ma anche dai calcolatori. Chi usa i motori di ricerca Internet (come Altavista, Yahoo, Virgilio o Google) resta spesso frustrato dai risultati: per esempio, la ricerca della parola calcio restituisce siti che parlano di football, pagine dedicate allelemento chimico e riferimenti anche metaforici alle pedate nel sedere... il tutto mischiato in una accozzaglia inutilizzabile. Aggiungendo intelligenza dentro le pagine, dentro al server e dentro al nostro calcolatore, XML Schema potrà risolvere questa categoria di problemi. Ed è solo linizio. Immaginate di essere un turista ticinese alla ricerca di una economica vacanza a Vancouver per la prossima estate. Trovare le offerte più interessanti oggi è un vero problema di difficile soluzione. Potrebbe esistere una azienda di Zurigo che lista le sue offerte elencando (ma in tedesco) titolo, data di partenza e durata, prezzo, tappe del viaggio e prezzo in franchi; una concorrente di Lugano che pubblica sul web prezzo, elenco degli alberghi disponibili, prezzo in franchi, data di partenza e data di ritorno; una agenzia italiana di Como che presenta la sua campana in italiano ma con prezzo in Euro. Oggi è già un problema trovare le loro proposte; quando esse verranno scritte adottando XML Schema il nostro computer potrà anche analizzarle e applicare regole per trasformare le informazioni rendendole omogenee. Applicare il tasso di cambio dagli Euro in franchi o calcolare la durata del soggiorno sottraendo la data di ritorno da quella di partenza sono compiti banali per il nostro PC, una volta che esso abbia la possibilità di capire. Possiamo aspettarci addirittura che ci presenti una tabella riassuntiva delle tre proposte in termini comparabili.
Berners-Lee, luomo che più di ogni altro ha cambiato il mondo negli anni Novanta, dodici anni dopo tenta una nuova sfida: convincere tutti a trasformare lattuale miliardo (e più) di pagine web in una vera miniera di informazioni sfruttabili, anche automaticamente. Riuscirà a vincere linerzia di una industria del web per la quale il vecchio HTML è lingua franca?