Originariamente pubblicato in data 12/02/2002
A
C
C
O
M
A
Z
Z
I
La prima w del www
La prima w del www
Sappiatelo: se la mattina il vostro capo entra in ufficio urlando Presto! Dobbiamo realizzare una versione in gujurati del sito web aziendale sarà una giornata pesante
Sappiatelo: se la mattina il vostro capo entra in ufficio urlando Presto! Dobbiamo realizzare una versione in gujurati del sito web aziendale sarà una giornata pesante.Lo chiamano www (world wide web, letteralmente la ragnatela mondiale), ma cè ancora molto da fare prima che lInternet si possa usare facilmente con tutte le lingue e gli alfabeti. Concause: errori storici, peculiarità dei linguaggi umani, caratteristiche bizzarre della cultura. Tutte insospettabili per chi non ha un capo amante del gujurati (o del devanagari).
Cominciamo dallovvio: fare un sito di importanza nazionale, per una impresa svizzera, significa pubblicare tutte le informazioni in perlomeno tre lingue. Questa è già una complicazione ma impallidisce se la confrontiamo con altre situazioni: per esempio, in Malesia si parla una sola lingua, ma metà della popolazione la scrive con lalfabeto latino e laltra con lalfabeto arabo (che si scrive da destra verso sinistra). Daltra parte, lazienda svizzera che si aspettasse di poter comunicare grazie al suo sito trilingue con la maggior parte del mondo -- magari aggiungendo semplicemente linglese -- andrà incontro a sorprese sgradevoli. I ticinesi, che condividono la medesima lingua con gli italiani, sanno che ci sono alcune piccole differenze nel linguaggio con le persone doltreconfine: un abitante di Milano resterà perplesso se gli parlate di un Natel e non capirà la felicità di un ragazzo di Lugano appena uscito dalluniversità che si vanti di essere licenziato. Questi piccoli trabocchetti, facilmente evitabili quando si realizza una pagina web nella nostra lingua, contano poco se li paragoniamo a problemi analoghi che assillano il francese e il tedesco. Gli svizzeri romandi, per esempio, per indicare il numero ottanta usano una parola differente rispetto a quanto fanno i francesi. Francesi e svizzeri di lingua francese quando scrivono una parola usando lettere maiuscole tralasciano gli accenti, mentre i canadesi di lingua francese considerano questo un grave errore dortografia. Per la lingua tedesca, le varianti regionali sono ancora più marcate ed è difficilissimo creare un testo scorrevole e ugualmente leggibile dagli abitanti della Svizzera centrale, Repubblica federale tedesca e Austria -- per non parlare di polacchi dellovest e italiani della provincia di Bolzano.
Un detto popolare tra gli informatici sostiene che errare è umano, ma per complicare davvero le cose ci vuole un computer. I calcolatori storicamente nascono negli Stati Uniti dAmerica e così, quando si tratta di studiare un codice che permetta alle macchine di memorizzare ed elaborare i testi, il primo standard ad emergere è linfame ASCII (si pronuncia aschi ed è la sigla di American Standard Code for Information Interchange). Quel codice permette di rappresentare nella memoria degli elaboratori, usando i numeri compresi tra 0 e 127, molte lettere, cifre, simboli dinterpunzione: ma sono comprese soltanto le lettere usate nellalfabeto inglese. Non cè spazio neppure per i caratteri come è, ç, ß o ñ (indispensabili rispettivamente per chi scrive in italiano, francese, tedesco o spagnolo). Quando nacquero i personal computer, i produttori estesero lo standard ASCII con altri 128, in modo da soddisfare le esigenze della clientela extra-americana. Si creò così una babele di codici incompatibili, perché ogni mercato regionale finì per trovarsi con una codifica propria non standard e incompatibile con tutte le altre (perché i codici numerici compresi tra il 128 e il 255 venivano riutilizzati in ogni zona a scopi differenti).
A volte nacquero più non-standard in conflitto tra loro per risolvere il medesimo problema. Esemplare (in negativo) è il caso del cirillico, alfabeto usato da gran parte delle lingue slave. Nel 1981 Microsoft inventò un codice utilizzabile per rappresentare il cirillico allinterno dei PC MS-DOS, impegnando i codici non-ASCII di numero compreso tra il 128 e il 255. Nel 1984 quando Apple presentò Macintosh pensò bene di creare un codice per il cirillico, scegliendo però una rappresentazione differente da quella Microsoft e rendendo impossibile linterscambio di file tra un Mac e un PC. Pochi anni dopo, quando Microsoft creò il sistema operativo OS/2 in società con IBM, reinventò i codici del cirillico creando una codifica incompatibile con quella adottata da MS-DOS. La casa di Bill Gates bissò poi questa pessima idea alla fine degli anni Ottanta quando apparve Windows. Potevano gli utenti Unix essere da meno? No: nasce per essi il codice KOI-8, differente da tutti i precedenti. Finalmente nel 1994, in piena era Internet, lIstituto Mondiale degli Standard (lISO di Ginevra) decide di normalizzare la situazione e stabilisce a tavolino una codifica standard per il cirillico, che è completamente differente da tutti e cinque i metodi precedentemente visti e che per questo motivo è generalmente ignorata. Il risultato pratico di questa selva di incomprensioni e piccole rivalità è che oggi chi voglia creare una pagina Web visibile dal cento per cento dei russi è costretto a realizzarla sei volte: una per ciascuna delle codifiche. La soluzione? Bisognerebbe adottare Unicode, un super-codice esteso che comprende non 256 ma 65.536 caratteri: 10.236 simboli alfanumerici standard (come la frazione "un mezzo" o il pallino ° che usiamo per i gradi) e lettere (di tutti gli alfabeti). Comprende anche 27.786 ideogrammi per le lingue dove a un singolo segno corrisponde una parola. Peccato che sia supportato solo nei sistema operativi più recenti, come Mac OS X e Windows XP. Eppure, Unicode è lunico metodo standard per gestire le lingue che ISO non standardizzò nel 1994, come il cinese o le lingue indiane come quelle citate allinizio dellarticolo.
Tutto sommato, forse sarebbe più semplice mandare il capo a quel paese e cercarsi un altro posto di lavoro.