Apèndix

Conceptes bàsics sobre una Bitblioteca Digital


La revolució en la conservació i difusió de la informació té un motor clau: la Digitalització. Una vegada la informació és alliberada del seu suport material clàssic (paper, pel·lícula o cinta magnètica) i és convertida en bits, pot ser arxivada, gestionada i tramesa de manera cada vegada més senzilla, ràpida i barata per les màquines més poderoses que ha inventat l'home: els ordinadors

Bits i bytes

Un bit (abreviació a l'anglès binary digit) és la unitat bàsica d'informació: 0 o 1, forat o no, magnetitzat o no. Amb un bit podem codificar dos símbols; 0 pot ser a, 1 pot ser b. Amb dos bits en podem codificar 4; 00 pot ser a, 01 pot ser b, 10 pot ser c, 11 pot ser d. Amb tres bits en podem codificar 8 i així successivament. Amb un byte (unitat de 8 bits) en podem codificar 256. Així doncs les lletres, majúscules i minúscules, accentuades o no, els números, els símbols del llenguatge en general (que en total són típicament menys de 256) poden ésser codificats a base de bytes: un text escrit es pot convertir en bits i bytes.

Però el mateix passa amb el so: la intensitat del so en cada instant es pot mesurar, convertir en números, i per tant en bits i bytes. I també amb les imatges fixes o en moviment (que no és més que un cert nombre d'imatges cada segon): la brillantor i el color es converteixen en números i per tant en bits i bytes. El procés de pas de símbols i/o valors numèrics a bits (codificació) i l'invers (descodificació) el fan aquestes màquines cada vegada més ràpides que són els ordinadors.

Per tal de tenir una idea d'ordre de magnitud, una pàgina de text escrit (a un byte per caràcter, en una pàgina de 36 línies de 80 caràcters cada una) pot ocupar uns 3.000 bytes (el que es diu 3 Kilobytes, abreujat 3 Kb). El so i les imatges ocupen molt més: 1 minut de so d'alta fidelitat pot ocupar uns 9.000 Kb (el que es diu 9 Megabytes, abreujat 9 Mb), una fotografia en color d'alta qualitat de mida normal pot ocupar uns 2 Mb, mentre que 1 minut de vídeo de qualitat ocuparia uns 300 Mb.

Aquestes xifres es veuen extraordinàriament reduïdes amb tècniques matemàtiques de compressió (la informació digitalitzada és fàcilment tractable amb tècniques algorísmiques cada vegada més sofisticades) que sovint permeten disminuir en factors de 10 a 1000 les necessitats d'emmagatzematge, aprofitant novament la velocitat dels ordinadors per realitzar les tasques de compressió/descompressió

Discs magnètics i discs òptics

L'emmagatzematge de bits i bytes es du a terme per mitjans magnètics o òptics. En els primers, un capçal magnetitzador i a la vegada sensible a la magnetització, magnetitza un mitjà físic (escriptura) o bé detecta aquesta magnetització (lectura). En els segons un aparell emissor de làser realitza forats micromètrics (escriptura) que després és capaç de llegir. Els avenços en les dues tecnologies són rapidíssims i espectaculars. La primera és, al menys de moment, clarament millor quant a la velocitat d'accés a la informació i també quant a la possibilitat de realitzar les dues funcions de lectura/escriptura mentre que la segona ho és quant a la densitat d'informació (numero de bytes per centímetre cúbic de mitja físic) i a la durabilitat de la informació. De totes maneres, insistim en què els avenços són tant ràpids que és previsible que aquestes valoracions comparatives puguin canviar. El que és absolutament segur és que continuarem tenint mitjans d'emmagatzematge i accés a la informació cada vegada més ràpids, versàtils, segurs, durables i econòmics.

Quant a discs magnètics, avui són accessibles i econòmiques unitats que van des dels 10 fins els 60 Gb (abreviació de Gigabyte equivalent a 1.000 Megabytes). Un CD-ROM estàndard pot incloure 650 Mbytes d'informació, mentre que ja s'estan estandaritzant els DVD, que amb la mateixa tecnologia òptica i respectant el format extern CD arriben a capacitats de fins a 17 Gb.

És previsible en els propers anys un increment en la densitat i en la velocitat d'accés, així com una continuada caiguda dels preus.

Ordinadors

Si els motors haguessin seguit la mateixa evolució que els ordinadors quant a potència de càlcul, velocitat i prestacions avui un ciutadà podria tenir un Rolls-Royce que tindria la potència equivalent als quatre motors d'un gran Boeing 747, amb el qual podria donar la volta al món en mitja hora, gastant 1 litre de gasolina... i el preu d'aquest aparell seria de 100 pessetes. Aquest exercici imaginari (però real quantitativament parlant) ens revela de manera espectacular l'evolució dels microprocessadors. I aquesta evolució continua i no hi ha cap previsió que li auguri un final.

Avui ja hi ha ordinadors personals molt potents en les llars d'un nombre significatiu de ciutadans. La tendència en els preus, prestacions i serveis indica que l'ordinador es pot convertir en un estri tant habitual a les llars com els televisors. Aquesta tendència ja és general a tots els nivells i les modernes estacions de treball donen relacions prestacions/preus que no paren de millorar.

Xarxes d'alta velocitat

Un dels factors de l'èxit de la xarxa Internet, que a la vegada ha donat ales a l'actual revolució tecnològica, ha estat la possibilitat de trametre quantitats d'informació relativament elevades per línies telefòniques convencionals. Avui en dia són habituals i accessibles mòdems (aparells moduladors/demoduladors que permeten la transmissió de senyals digitals per canals analògics tradicionals) que poden trametre a 56 Kbps (kilobits per segon); igualment la tecnologia coneguda com ISDN, RDSI o XDSI (Xarxa Digital de Serveis Integrats), fa accessible al ciutadà mitjà 128 Kbps sense necessitat de mòdems. Durant els darrers mesos comencen a fer-se populars entre la població (de moment només en zones on hi ha un desplegament específic) els accessos a través de la tecnologia ADSL (a través de línies telefòniques convencionals) o amb cable coaxial, que poden arribar als diferents Mbps (megabits per segon). Quant a les línies de transport la tecnologia de la fibra òptica permet assegurar capacitats de transmissió en l'ordre dels milers de Gbps.

Tot plegat, d'ací poc temps és previsible que igual com ara cada casa té una línia telefònica d'accés, aquesta serà una línia d'alta velocitat per la qual arribaran senyals digitals que aniran a parar al telèfon, al televisor, a l'aparell d'alta fidelitat, tots ells controlats per l'ordinador. Els preus d'accés a aquestes veritables autopistes de la informació seguiran baixant degut a la gran quantitat de serveis de pagament que portaran a l'abast del ciutadà. Això facilitarà que a través d'elles puguin arribar al ciutadà altres serveis bàsics com la cultura, l'educació o l'accés a la sanitat pública.

Digitalització i edició electrònica

Els elements bàsics d'una Biblioteca Digital són els que acabem d'esmentar: mitjans d'emmagatzematge de la informació digital (discs), mitjans que controlin la gestió i l'accés a aquesta informació (ordinadors) i connexions a xarxes ràpides (Internet i la seva evolució futura)

Per bé que, com hem dit, és previsible que en els tres elements es vagin produint millores de tot tipus, l'aposta bàsica que marca el abans i el després és una: la digitalització de la informació. Una vegada els textos (i eventualment sons i imatges) s'han convertit a bits, la seva gestió futura i l'accés a la informació seran cada vegada més senzill, més ràpids i més barats. L'evolució tecnològica continuarà; la revolució és ara.

Cal distingir en el món de les Biblioteques Digitals dos conceptes lligats, però diferents: digitalització i edició electrònica. La primera consisteix bàsicament en el procés de convertir en 0s i 1s la informació continguda en suports clàssics, bàsicament el paper. Mitjançant aquest procés, les biblioteques i arxius "clàssics" poden anar passant els seus fonts als nous suports magnètics i/o òptics que permeten, com hem vist, la fàcil gestió i distribució de la informació. Els documents són arxivats com a imatges digitals que poden arribar a la pantalla de l'ordinador a través de la xarxa.

L'edició electrònica és senzillament crear la informació directament (o bé a partir de textos i/o imatges digitalitzats) sobre els nous suports. De fet, avui en dia una gran quantitat de la nova informació que es va generant en ordinadors, i per tant de manera digital o electrònica; posteriorment s'imprimeix i per tant es passa al format suport clàssic. El gran avantatge de tenir o preservar la informació en forma digital es, com hem vist, el seu fàcil tractament posterior. En aquest sentit, tant la nova informació que es va generant (molt d'ella ja digital) com l'antiga (que es pot digitalitzar) és perfectament transparent: la informació digitalitzada (a través d'escàners) i processada amb el programari conegut com OCR (reconeixedor òptic de caràcters) por ésser editada electrònicament.