L’espressione “biblioteca digitale” e la ricerca di una sua definizione è in relazione agli ambiti di interesse in cui viene applicata, ad esempio per gli informatici la biblioteca digitale è un insieme di file oppure sono i software dedicati al loro recupero, per politici e imprenditori il mercato della comunicazione e informazione mondiale. Per i bibliotecari la biblioteca digitale rappresenta la biblioteca del futuro, custode e creatrice di collezioni di documenti immateriali accessibili da qualunque luogo e immediatamente disponibili.[1]
La mancanza di una definizione univoca rispecchia la varietà di progetti e applicazioni e la stessa letteratura di riferimento per il settore biblioteconomico spesso usa come sinonimi di biblioteca digitale formule come “biblioteca elettronica” e “biblioteca virtuale”.[2] In realtà è più corretto intendere la biblioteca elettronica come una biblioteca automatizzata che usa ogni tipo di strumentazione elettronica per il suo funzionamento, quindi il termine elettronico è riferito alla strumentazione necessaria alla lettura dei dati e non ai dati stessi. Quando fonti informative elettroniche e su carta sono parte di uno stesso contesto si parla di biblioteca ibrida o biblioteca multimediale, ad indicare l'integrazione di diverse tecnologie. La biblioteca virtuale, invece, è per il suo stesso inventore, Tim Berners Lee che lo utilizzò per il sito di cui è autore, una collezione di documenti tematici realizzati da migliaia di autori in pagine web e banche dati collegati tra loro.[3] Con il termine “virtuale” si indica quindi la biblioteca che non c'è o una collezione di documenti esterna alla biblioteca o ancora una biblioteca dove l’aggettivo virtuale indica la simulazione tridimensionale di scaffali e personale. Con virtuale si intende quindi l’immaterialità della biblioteca come collezione di libri fisicamente dislocati altrove, come può essere una bibliografia, collezione astratta di documenti, o l’illimitata disponibilità del docuverso attraverso un unico spazio, come l’utopico progetto di Theodor Holm Nelson, Xanadu. [4]
Se per definizione di biblioteca digitale si considera quella data al workshop di Santa Fe nel 1997: “...uno spazio in cui mettere insieme collezione, servizi e persone a supporto dell'intero ciclo di vita della creazione, uso, preservazione di dati, informazioni e conoscenza”[5] si può individuare la biblioteca digitale all'interno del web, come uno spazio ordinato con servizi innovativi, accessibile al suo utente remoto che diviene così l'attore principale del sistema informativo, in grado di modificare, tagliare e accorpare oggetti della collezione digitale, la cui prima caratteristica è l'interoperabilità, e la creazione di nuovi strumenti di conoscenza. [6] L’espressione “biblioteca digitale” indica uno spazio informativo contenente risorse digitali di tipo bibliografico, acquisite o prodotte dalla biblioteca, controllate e valutate da personale specializzato e accessibili attraverso indici e classificazioni, in grado di offrire servizi tradizionali e innovativi ad utenti remoti aderenti al profilo intorno al quale è stata costruita la biblioteca.[7]Quindi una biblioteca, che risponde ad esigenze di una specifica utenza della quale conosce interessi ed esigenze, in base alle quali redige la propria mission per individuare obiettivi e scopi intorno ai cui costruire l'intera architettura digitale.
Le funzioni caratterizzanti la biblioteca digitale sono state identificate in ambito bibliotecario attraverso la definizione data dalla Digital Libraries Federation: “...organizzazioni che forniscono le risorse compreso il personale specializzato, per selezionare, organizzare, dare l'accesso intellettuale, interpretare, distribuire, preservare l’integrità e assicurare la persistenza nel tempo delle collezioni digitali così che queste possano essere accessibili prontamente ed economicamente per una comunità definita o per un insieme di comunità”[8].
Partendo da tale definizione, i principali elementi che caratterizzano una biblioteca digitale sono:
Inoltre, per il buon funzionamento della biblioteca digitale sono elementi importanti la gestione del diritto d'autore e l'interoperabilità di sistemi diversi, tramite standard comuni orientati all'interscambiabiltà dei dati.[9]
[1] Ridi, [2004], p. 1; Tedd-Large, [2005], p. 16-21.
[2] Per alcune definizioni di biblioteca digitale: Schwartz, [1999]; Arms, [2000]; Tedd-Large, [2005].
[5] Salarelli-Tammaro, [2000], p. 107-108.
[6] Salarelli-Tammaro, [2000], p. 108-110.
[7] Ridi, [2004], p. 2.
[8] Digital Libraries Federation, [1998].
[9] Salarelli-Tammaro, [2000], p. 109-113.
La collezione documentaria rappresenta il cuore della biblioteca e incentra su di sè le principali funzioni:
La stessa definizione di collezione digitale ha valenze differenti in ambito bibliotecario, in quanto può essere interpretata come collezione locale ad accesso remoto o come infrastruttura di servizio per l'accesso alle risorse informative distribuite. Anche in questo caso la definizione si allarga a realtà sostanzialmente differenti. La collezione locale ad accesso remoto è spesso un continuo della collezione tradizionale con la costruzione di una “collezione ristretta” che fornisce l'accesso alle risorse elettroniche locali, REL, cioè ad una selezione di accessi remoti indicizzati entro banche dati e dalla produzione di surrogati di documenti cartacei. Le risorse informative distribuite o RER, Risorse Elettroniche Remote, invece, sono intese come "collezione estesa" a tutte le risorse accessibili in Rete, in una biblioteca digitale vicina ad un portale, o ad un repertorio, dove il servizio è la selezione e l'aggiornamento.[1] Una biblioteca digitale può comprendere entrambe le collezioni, a seconda della propria mission e origine ed inserire nel catalogo metadata utili al recupero dei documenti, locali o remoti, utilizzando il tradizionale OPAC o il più innovativo” OPAL, Online Public/patron Access Library, acronimo coniato da Corrado Pettenati nel 1987 per indicare un “futuristico” catalogo da cui accedere a testi completi”.[2]
La biblioteca digitale funge da filtro qualità rispetto ad un utente che ha la percezione di interagire sempre entro la stessa biblioteca, quindi un servizio basato su un’infrastruttura apposita per una risposta just in time. La stessa architettura della biblioteca digitale è costruita intorno alla collezione che può essere interpretata come mediazione o “infrastruttura di servizio” la cui funzione è assistere l’utente nella ricerca e nelle condizioni di accesso.[3]
Un modello di collezione di biblioteca digitale è orientato verso:
Prima di analizzare nel dettaglio la formazione, consistenza e organizzazione delle raccolte digitali è utile definire il concetto di documento digitale per capire vantaggi e limiti del suo impiego nella ricerca e nella comunicazione scientifica.
Il documento digitale, ovvero la rappresentazione di un testo su supporto digitale, “in linea generale è costituito da un flusso di caratteri (o stringa), in cui il carattere è l'unità atomica per la rappresentazione, l'organizzazione e il controllo di dati testuali sull'elaboratore”[4]. Il documento digitale può essere nativo, quindi pubblicato originariamente in digitale o nato in formato analogico e digitalizzato a posteriori in modalità manuale o meccanica. Nel primo caso la trasformazione del documento cartaceo in forma binaria è affidata ad un operatore che tramite tastiera inserirà una lettera alla volta, mentre l'acquisizione meccanica prevede l'impiego di strumenti quali scanner o fotocamere in base alla tipologia di documento destinata alla trasposizione digitale. La modalità manuale è certo la più dispendiosa in termini di tempo, sebbene anche l'acquisizione meccanica preveda spesso un filtraggio manuale, come nel caso di utilizzo di software di riconoscimento ottico dei caratteri, OCR, Optical Character Ricognition, mentre l'acquisizione di immagini è sempre automatizzata.
La scelta delle modalità di digitalizzazione è in primo luogo vincolata dalla tipologia del materiale e al suo supporto, ad esempio la scansione del testo si utilizza per fonti edite su supporti a prova di forti fasci di luce, mentre manoscritti e fotografie vengono riprodotti attraverso speciali apparecchiature in grado di preservare gli originali. La differente modalità di digitalizzazione stabilisce il formato del nuovo documento digitale, da testuale ai linguaggi di marcatura, alle applicazioni per e-book al formato immagine, oltre ai formati audio, video.
Il formato testuale più semplice è ASCII, American Standard Code for Information Interchange, permette di codificare i 128 caratteri più comuni. Lo stesso TXT del blocco note di Windows è un’estensione generica, solitamente indicata per file testuali in ASCII privi di formattazione.
Diffusissimo è il formato testuale proprietario di Microsoft per il programma di video scrittura Word, DOC, il cui limite è non essere comprensibile da tutti gli altri programmi di videoscrittura, comprese le versioni precedenti dello stesso Word, per questo si preferisce il formato RTF, in quanto mantiene la formattazione del testo nel passaggio da un programma all'altro sfruttando caratteri ASCII.
Il passaggio dal materiale al digitale avviene tramite codifica, attraverso un sistema di marcatura, cioè su specifici linguaggi che descrivono l'aspetto di ciascun elemento testuale assicurandosi che nella trasposizione elettronica siano perdute il minor numero possibile di informazioni contenute nella fonte originale. “I linguaggi di marcatura sono costituiti da un insieme di istruzioni, dette tag (marcatori), che servono a descrivere la struttura, la composizione e l'impaginazione del documento. I marcatori sono sequenze di normali caratteri e vengono introdotti, secondo una determinata sintassi, all'interno del documento, accanto alla porzione di testo cui si riferiscono.”[5]
SGML, Standard Generalized Markup Language, ad esempio è un linguaggio di marcatura che prescrive precise regole sintattiche per definire un insieme di marcatori e le loro reciproche relazioni, senza marcare direttamente documenti, e garantendo attraverso le sue applicazioni linguaggi di marcatura specifici, detti DTD, Document Type Definition, tra cui TEI, un progetto internazionale per la codifica dei testi a carattere umanistico.[6]
HTML, Hyper Text Markup Language, è il linguaggio di marcatura utilizzato per costruire pagine web, è composto da tags o marcatori non visibili alla lettura che contengono istruzioni per la visualizzazione del testo. Sviluppato dal più complesso SGML si adatta alle esigenze di ipertestualità della Rete e di internazionalizzazione degli standard. Grazie alla sua semplicità è oggi il linguaggio maggiormente diffuso e indicato dal W3C quale linguaggio ufficiale del World Wide Web, preferibilmente abbinato a fogli di stile CSS che ne dichiarino la struttura.
Sempre da SGML trae origine un altro linguaggio di marcatura, XML, extensible markup language, scelto dal W3C, il World Wide Web Consortium promosso nel 1994 dallo stesso Tim Berners, per le applicazioni testuali del web in sostituzione del linguaggio HTML ritenuto troppo povero per specifiche esigenze e presto sostituito da XHTML, extensible HTML.[7]
PDF, Portable Document Format, e PostScript, invece, sono standard proprietari dell’azienda Adobe e determinano la visualizzazione del documento precedentemente confezionato da altri software. Il documento così prodotto non è modificabile, ma si può scaricare o stampare attraverso la versione gratuita fornita online dalla stessa azienda, mentre per produrre documenti in PDF è necessario acquistare il programma AdobeWriter. Il formato PDF è di solito utilizzato per documenti testuali, anche e-book: libri elettronici, proprio per l’impossibilità di intervenire dall’esterno sul contenuto, anche se i formati specifici per gli e-book, sono OEB, Open EBook, standard elaborato da un’associazione privata, la Open EBook forum cui partecipano case produttrice e case editrici tra cui Mondatori, e LIT che è il formato proprietario per Microsoft Reader.[8]
I formati di immagini digitali standard su Web sono GIF, Graphic Interchange Format, JPEG, Join Photographic Experts Group, PNG, portable network graphics, MNG, Multiple-image Network Graphics, si tratta di sistemi di codifica grafica in grado di comprimere notevolmente la dimensione del file, e pertanto particolarmente adatti a un uso in Rete, mentre per l’archiviazione di immagine è utilizzato TIFF, Tegged Image File Format, sviluppato da Adobe e Microsoft.[9]
Il procedimento di selezione e acquisizione dei documenti è uno dei momenti attraverso il quale si realizza la gestione della collezione documentaria in base alla mission della biblioteca, incentrata sull'utente, attenta alle risorse e ai programmi cooperativi cui aderisce.
Nel caso della biblioteca digitale è importante definire l'utenza da soddisfare, l'uso che ne farà della collezione e le modalità di accesso remoto e quindi formalizzarla in un documento programmatico come avviene per la biblioteca tradizionale. Una dichiarazione di intenti per l'utente e lo staff, che definisce l'identità della biblioteca e permette di verificare nel tempo il raggiungimento degli obiettivi.
Anche in ambito digitale potrebbero essere utili documenti come la carta delle collezioni ed il piano di sviluppo delle collezioni. Dunque proporre gli obiettivi generali della biblioteca ed i principi cui si ispira in modo da valutare:
Inoltre, uno strumento interno, valido per lo staff di una biblioteca digitale quanto per quello di una biblioteca tradizionale, permette di conoscere i criteri di utilizzo delle risorse finanziarie ed il programma di spesa suddiviso per settori necessario per il mantenimento e lo sviluppo della collezione, sia analogica che digitale.
La politica di acquisizione ha come naturale complemento una periodica revisione delle collezioni, intesa come strategia di programmazione a seguito di un'analisi della collezione, che tiene conto di vari fattori come la data di pubblicazione, l'ultimo utilizzo da parte dell'utenza e la presenza di fattori negativi come inadeguatezza, inesattezza, incoerenza. L'attività di revisione è necessaria soprattutto in ambiente elettronico, in cui la volatilità dei documenti che costituiscono le collezioni esterne e l'evoluzione tecnologica che investe i sistemi di conservazione obbligano ad un costante monitoraggio e ad una più frequente esame della politica documentaria perseguita.
La biblioteca anche nel contesto digitale, dunque, necessita della stessa regolamentazione seguita dalle biblioteca tradizionali per la gestione delle raccolte e la loro implementazione. Le stesse griglie di valutazione possono essere adattate alla biblioteca digitale, garantendo anche qui una metodologia per la definizione del grado di copertura bibliografica.[10] La selezione, valutazione della documentazione digitale e l’accesso facilitato garantito nel tempo sono elementi che creano valore aggiunto alla biblioteca che altrimenti avrebbe solo il ruolo di aggregatore di informazioni. Questo percorso deve essere affrontato con professionalità adeguate, con competenze specifiche sia sul piano biblioteconomico che su quello dell’editoria elettronica, un vero “collection management librarian”.[11]
Nel panorama editoriale internazionale l'affermazione dell'editoria digitale ed il conseguente ripensamento della catena del valore tra autore e lettore hanno favorito la sperimentazione e lo sviluppo di modelli di comunicazione scientifica alternativi al modello tradizionale controllato per lo più da editori commerciali e soggetto a fenomeni di concentrazione. Infatti, la necessità di assicurare un'efficace diffusione ed un facile accesso ai contributi scientifici ha spinto molte università ed enti di ricerca a promuovere iniziative editoriali con l'obiettivo di assistere gli autori nell'intero ciclo di vita dell'informazione scientifica, dalla creazione del documento, alla peer review, fino alla distribuzione e all'accesso, proponendosi sul lungo periodo come soluzione strategica alla spirale dei prezzi delle pubblicazioni scientifiche.[12]
I progetti per l'affermazione delle Università e Istituti di Ricerca come editore sono numerosi, orientati a superare i maggiori ostacoli:
Da alcuni anni anche in Italia si registra una tendenza verso la sperimentazione di nuovi uffici editoriali rivolti verso l'editoria digitale, attraverso piani editoriali strutturati in collane e riviste, entro specifiche aree disciplinari.[15] La produzione di pubblicazioni digitali si è sviluppata negli ultimi anni in ambito accademico con lo scopo di favorire la comunicazione scientifica riacquistando i diritti d'autore spesso ceduti ad editori.[16]
La produzione editoriale delle Università impegnate nella sperimentazione del digitale si orienta verso due livelli di comunicazione scientifica:
La biblioteca dell'Università è così “impegnata in una produzione e distribuzione dell'informazione significativa in ambito scientifico, possibilmente in stretta collaborazione con il centro di calcolo ed il centro editoriale di Ateneo”[17].
La collezione digitale, spesso cooperativa, è incentrata soprattutto sulle risorse originariamente digitali, sulla loro organizzazione, accessibilità e preservazione.
Le tipologie di documenti digitali nativi sono:
Per facilitare la ricerca entro questi archivi di preprint sono nati progetti come NCSTRL, indice distribuito che poggia su un motore di ricerca specializzato, DIENST.[22]
Proprio sul versante della ricerca bibliografica si contano le maggiori iniziative degli ultimi anni da parte di editori commerciali. A fronte dell'aumento della produzione editoriale digitale si sono affermati nuovi attori della filiera editoriale, gli aggregatori, che offrono un servizio di intermediazione attraverso banche dati contenenti prodotti di diversi editori, fornendo quindi all'utente un unico punto di partenza attraverso una interfaccia completa di sistema di interrogazione come ADONIS di Elzevire o OVID di EBSCO, e aggregatori di contenuti per un singolo editore, è il caso dei gateway, come ECO di OCLC, inteso dunque come un servizio offerto dall'editore che ne stabilisce il valore commerciale.[23]
La collezione digitale secondaria è formata dalle pubblicazioni elettroniche e copie digitali di pubblicazioni a stampa, prodotte da biblioteche e istituzioni.
La conversione da analogico a digitale è stata largamente adottata nel corso degli anni dal mondo bibliotecario, sia per conservare e proteggere il patrimonio cartaceo sia e soprattutto oggi per facilitarne l'accesso. La conversione del materiale cartaceo posseduto dalla biblioteca in materiale digitale è una parte importante dell'acquisizione del materiale per lo sviluppo della biblioteca digitale. Tali esperienze hanno dato vita a progetti e realizzazioni disomogenee e a fronte di un notevole numero di iniziative intraprese ad ogni livello corrisponde anche una forte frammentarietà, uno scarso coordinamento e la mancanza di un disegno complessivo di riferimento.[24]
Il panorama d'insieme si presenta, dunque, vario per qualità e contenuti determinati da tecniche e strumenti in piena evoluzione. Per questo si sono rese necessarie e preziose le proposte di coordinamento e gli studi sulle modalità e finalità della digitalizzazione, come Guidelines for digitizing archival materials for electronic access[25] o le indicazioni sulla digitalizzazione dell'ICCU per seguire precisi criteri di selezione e modalità per costituire una collezione omogenea in armonia con standard europei, messi a punto dal Manuale di buone pratiche per la digitalizzazione del patrimonio culturale, del Progetto Minerva.[26]
La digitalizzazione è inoltre stata sperimentata come sistema editoriale, sia per la creazione di nuovo collane nate dalla digitalizzazione di opere cartacee appartenenti a diverse collezioni, sia come reprint, conversione delle annate di periodici scientifici, come nel caso dell'editore JSTOR[27].
Molte di queste iniziative sono state sviluppate dalle Università americane, come il progetto Perseus per la Harvard University, o il progetto Alexandria dell'University of California Santa Barbara per la ricerca spaziale, entrambe prese in esame nei capitoli seguenti.
[1] Salarelli-Tammaro, [2000], p. 141-143; Ridi, [2004], p. 15-16.
[2] Ridi, [2004], p. 15, da Pettenati, [1987].
[3] Per la definizione “infrastruttura di servizio” ed i concetti correlati si veda Salarelli-Tammaro, [2000], p. 141-146.
[6] Projects using the TEI, [1996-2005].
[8] International Digital Publishing Forum (formerly Open eBook Forum), [2003-2005].
[9] Arms, [2000], p. 163-185; Ridi, [2004], p. 4-7; Tedd-Large, [2005], p. 100-102.
[10] Whittaker, [2002]; Boretti, [2000].
[11] Weston, [2002], in Biblioteca digitale, [2002], p. 177-180; Morriello, [2005], p. 123-141.
[13] Gargiulo, [2000].
[14] Pellizzari, [2000], p. 46-56.
[15] In Italia i maggiori esempi di University Press fanno capo all'Università di Bari, in accordo con l'editore Laterza, le iniziative editoriali dell'Università di Bologna che comprendono tra le altre la pubblicazione digitale del periodico Bibliotime dedicato agli studi biblioteconomici, il progetto BUP per le attività editoriali, ed il progetto di biblioteca digitale ALMA-DL per l'accesso integrato e la fornitura di documenti digitali. La diffusione dell'editoria scientica attraverso la "riappropriazione" del copyright è alla base del progetto FUP dell'Università di Firenze
[19] De Robbio, [1998], p. 40-56.
[21] International Digital Publishing Forum, [2003-2005].
[22] NCSTRL, Networked Computer Science Technical Reference Library, [2001] ; Arms, [2000], p. 218-220.
[23] Online Computer Library Center, [aggiornato al 2005]; Al di fuori del mercato editoriale i termini aggregatori o gatway si equivalgono, riferendosi ad interfacce che permettono una ricerca in un'unica banca dati i cui contenuti sono disseminati nella Rete.
[24] La biblioteca digitale, [2002], p 10-12.
[25] Linee guida elaborate da National Archives and Records Adminastration, NARA - U.S. National Archives and Records Administration, [1995-2005].
[26] Falchetta, [2000], p. 52-67; Manuale di buone pratiche per la digitalizzazione del patrimonio culturale,[2004].
L'informazione presente in Rete è ingente e in continuo aumento, nella maggior parte dei casi non è di qualità, spesso non è strutturata. Le innovazioni tecnologiche e telematiche applicate alla comunicazione scientifica hanno in questi anni modificato la catena documentaria, più simile ad una rete ipertestuale. In questo reticolo la biblioteca diviene mediatore all'informazione e non più solo conservatrice del proprio patrimonio in attesa di un utente interessato "just in time". La biblioteca oggi deve essere in grado di fornire risposte "just in case", documenti al momento attraverso ILL, DD e accessi controllati alle risorse digitali. E' dunque necessario filtrare e organizzare le informazioni attraverso la professionalità del bibliotecario, da sempre intermediario tra utenti e docuverso.[1]
La biblioteca digitale è orientata verso utenti remoti, interessati ad una porzione di docuverso che risponde a precisi criteri, accessibili attraverso un catalogo e interamente fruibili.
L'organizzazione dell'intera biblioteca digitale come in quella tradizionale è imperniata sul catalogo, ossia su un insieme organizzato di informazioni per permettere il recupero dei documenti bibliografici coerentemente descritti, attraverso accessi controllati.
Il futuro del bibliotecario consiste dunque nell’indicizzare le informazioni disponibili in Rete attraverso l’intermediazione catalografica, descrivere formalmente le fonti di informazione, soggettarle e classificarne il contenuto.[2]
Da un punto di vista catalografico le difficoltà presentate dalle risorse elettroniche sono rappresentate da
I metadati sono letteralmente dati su dati, come ad esempio le schede bibliografiche cartacee di un tradizionale catalogo di biblioteca. Sono usati per identificare e descrivere risorse informative e localizzarle. La descrizione dei documenti, ossia dei data, permette di individuare, selezionare, localizzare e recuperare l'informazione, attraverso cataloghi, bibliografie e repertori, sistemi di dati su dati o meta-data, permettendo ad ogni lettore di individuare il suo libro salvando il suo tempo.
I metadati digitali sono usati come:
e si dividono in:
Nei progetti di biblioteca digitale sono impiegati i metadati descrittivi e tra essi più diffusi sono:
TEI, Text Encoding Iniziative. Intestazione nata in area dell'informatica umanistica grazie ad un progetto sponsorizzato da ACL, Association for Computational Linguistics, ALLC, Association for Literary and Linguistic Computer, ACH, Association for Computer and Humanities, per sviluppare uno schema di codifica testuale per complessi oggetti elettronici costituiti dal testo.[7] La finalità del progetto Tei è di definire uno standard di codifica specifico per i dati umanistico-letterari e creare una normalizzazione dei formati di memorizzazione al fine di consentire l’interscambio dei documenti.[8]
Le linee guida TEI[9] sono un'applicazione dello standard SGML-TEI e indicano quali parti del testo codificare dettandone le modalità. Le specifiche TEI forniscono i metadati necessari ad un uso multifunzionale, documentando revisioni, fonti, registrazioni di elementi bibliografici con possibilità di utilizzare la registrazione delle informazioni relative al documento indipendentemente dal documento stesso.
Ogni testo codificato in base allo standard Tei è costituito da due parti:
In particolare i bibliotecari sono interessati alla sezione “file description” che fornisce la descrizione bibliografica del documento e della sua fonte, descrizione modellata sullo standard AACR con campi che corrispondono approssimativamente alle aree ISBD:
- <titleStmt> comprende campi title, author, sponsor, funder, principal, respstmt, utilizzando le liste di autorità della Library of Congress Name authority list per tutti i nomi personali comuni
- <pubblicationStmt> informazioni sulla pubblicazione e distribuzione di un testo elettronico o meno
- <sourceDesc> descrizione bibliografica del testo di copia da cui un testo elettronico è stato derivato o generato.
La sezione “Profile description” include invece dati non prettamente bibliografici, ma utili per il reperimento o analisi del testo supportata dalla macchina, spesso utilizzati per registrare voci di soggetto.[11]
Dublin Core è un progetto nato dalla conferenza tenuta nel marzo del 1995, a Dublin, Ohio, sede di OCLC, Online Computer Library Center, con l’obiettivo di definire uno standard per permettere la descrizione delle risorse online da parte degli stessi autori e l’eventuale l’indicizzazione.[12]
Per descrivere le risorse disponibili è stato individuato un set di metadata standard individuati come core, per l'identificazione e la definizione ad uso di autori/editori.[13]
Il core è attualmente strutturato in 15 elementi che si possono dividere in tre classi con relativi elementi:
così riportati dalla traduzione italiana curata dall’ICCU:
Ogni elemento è definito usando un set di attributi ricavati dalla norma ISO-11179 e può essere collocato ad esempio nel file Html, il più diffuso per le risorse catalografiche online, entro il tag <Meta> nell’Header, per essere letto dai motori di ricerca.[15]
MAG, Metadati Amministrativi Gestionali, sviluppati da Gruppo di studio sugli standard e le applicazioni di metadati nei beni culturali promosso dall’ICCU nell’ambito del progetto BDI, Biblioteca Digitale Italiana, come modello di base per l’accesso, la gestione e la conservazione delle risorse digitali.[16]
Includono elementi finalizzati alla descrizione standardizzata dei metadati amministrativi gestionali in formato XML, relativi ad elementi quali le condizioni d'uso, le licenze, i diritti di proprietà e l'utilizzo nel tempo delle risorse digitali. [17]
Lo schema generale è composto dalle sezioni:
Nel campo editoriale si è affermato il formato DOI, Digital Object Identifier, principale metadata per identificare il proprietario, realizzato dall'Association of American publischer che intende sviluppare un identificatore per la gestione di materiale protetto da diritto d'autore. [19]
Il Doi è uno strumento che serve ad identificare in modo persistente un frammento di proprietà intellettuale sulle reti digitali costituito da quattro compenenti:
La politica generale è controllata dalla Internation Doi Foundation, mentre l'assegnazione del codice è curata da varie agenzie che offrono ai loro clienti anche alcuni servizi, come l'infrastruttura utile per mantenere i metadati. Tali agenzie sono numerose, vale però la pena citare il consorzio di società europee, coordinato dall'Associane italiana editori, MEDRA e l'agenzia di maggior successo, CrossRef che fornisce un'applicazione per l'identificazione degli oggetti ed il loro recupero in full text.[20]
Il problema aperto è l'interoperabilità tra i sistemi di metadata sviluppati autonomamente dai vari attori della catena. Secondo P. Gabriele Weston le condizioni essenziali affinché i sistemi possano interoperare tra loro sono la struttura coerente delle registrazioni ed i criteri di normalizzazione per l'immissione e la gestione dei dati.[21]
Per favorire l'uniformità della descrizione dei documenti in qualunque formato o supporto essi si presentino l'IFLA ha fornito un quadro concettuale in cui possono essere armonizzati i diversi ruoli dei metadata: FRBR, Functional Requirements Bibliographic Records.
FRBR definisce le entità e permette di associare le manifestazioni che materializzano la medesima espressione, eventualmente su supporti diversi, o le espressioni che realizzano la medesima opera sia pur in lingue o edizioni differenti. [22]
Proprio la difficoltà di interscambio tra diverse biblioteche digitali e le rispettive collezioni è uno dei grandi limiti della biblioteca digitale. Il passaggio dell'utente da un interfaccia ad un altra con differenti modalità di ricerca è il risultato della mancanza di interoperabilità dell'infrastruttura tecnologica e mancanza di collaborazione di cui spesso soffrono i progetti di biblioteca digitale. La tendenza è dunque quella di identificare il documento più che descriverlo per superare diversi livelli di difficoltà per una piena interoperabilità, da quella tecnica a quella semantica, a quella multidisciplinare.
Dal punto di vista tecnologico invece, vista le difficoltà di accordarsi su in insieme di standard e convertire il sistema esistente, ci si concentra sui servizi di ricerca più facilmente adattabili a standard condivisi da opac e banche dati, dai comuni marcatori e identificatori web, come HTML e URL, allo standard z39.50 e SGML ai metadata più familiari ai bibliotecari come al già visto Dublin Core. L'ambizione dei curatori delle biblioteche digitali è di rendere possibile la ricerca integrando diversi sistemi, in un sistema di ricerca distribuito, Network information discovery in grado di fornire il servizio di controllo unificato degli accessi, di facilitare la gestione della collezione in cooperazione, i servizi di localizzazione, attraverso l'identificazione della risorsa ed i thesauri. Negli ultimi anni si sono visti numerosi progetti di catalogazione delle risorse internet nel mondo bibliotecario, come The Scorpion project[23], compatibile con il Dublin Core, l’americano Intercat (1991-1996), promosso da OCLC, ALA e Library of Congress, la cui impostazione è oggi ripresa da CORC (1999-2002), Cooperative on line resource catalog, il progetto Catriona (1994-1995) in gran Bratagna, e le raccomandazioni del W3C per la descrizione di un documento online, raccolte in Rdf, Resource description framework[24].[25] Dal 2004 è stato approvato dal W3C anche un altro importante standard legato alla costruzione del Web semantico OWL, Web Ontology Language.[26]
I metadati sono la chiave di accesso alle risorse e nel loro utilizzo risiede l'efficienza delle biblioteche digitali. Per questo di fronte alla vasta produzione di documentazione e alla incapacità degli standard descrittivi di matrice bibliotecaria di coprire l'intera informazione, una strada percorribile sembra quella dell'autocatalogazione attraverso semplici elementi standard inseriti nel codice e non visualizzabili graficamente.
La diffusione di tali elementi standard permette, infatti, non solo di identificare le risorse grazie ad una sorta di carta d'identità compilata dall'autore, ma anche il recupero da parte di agenti intelligenti in grado di individuare le parole chiave contenute nel titolo e nei campi standard. La semplicità di detti campi permette dunque agli autori di catalogare e gestire il proprio documento, anche se nulla vieta all'autore di inserire dati non veritieri per favorire il recupero dell'informazione da essi prodotta in sintonia con i criteri di recupero dei motori di ricerca che considerano metatag quali:
<Author> indica l'autore della pagina o di chi ha responsabilità sul contenuto.
<Copyright> indica chi detiene i diritti relativi al documento
<Generetor> indica il software utilizzato per la creazione della pagina.
<Robot> forniche indicazione ai motori di ricerca su come "catturare" la pagina
<Title> indica la risorsa attraverso termini significativi che i motori di ricerca permettono di visualizzare in seguito ad interrogazione, appare inoltre nei bookmark e in testa alla finestra del browser, è importanet dunque che indichi il soggetto del documento.
<Description> una breve sintesi del contenuto della pagina, visualizzato dai motori di ricerca, è sostituito dalle prime parole del BODY in caso di assenza del metatag
<Keyword> parole chiave per caratterizzare il contenuto.
I metatags che risiedono nella parte iniziale del codice HTML, HEAD, rispondono ad alcuni criteri utilizzati dai motori per effettuare l'ordinamento o ranking dei risultati, fondamentale se si pensa che ogni ricerca viene effettuata su decine di milioni di documenti e produce migliaia di risultati dei quali un utente medio prende in considerazione solo le prime decine.[27]
In realtà gli autori potrebbero non essere in grado di catalogare bene, non riuscendo a creare i giusti legami con altre opere o non seguendo gli standard o peggio introducendo falsi elementi descrittivi per avere un pubblico più vasto.[28] L’estraneità di una figura preposta ad estrarre i metadati di data creati da altri, come il bibliotecario, garantirebbe la fedeltà della descrizione attraverso standard stabiliti ai soli fini della conservazione e del recupero del documento. La professione del bibliotecario, rimane dunque centrale nella catena documentaria, ma più complessa la sua formazione sulla valutazione e descrizione delle risorse digitali.
Qualsiasi risorsa internet è individuata da un identificativo, unico e persistente, come standard entro il progetto Word Wide Web del CERN di Ginevra dallo stesso Tim Berners Lee, sperimentata nell'architettura URI, Uniform Resource Identification, comprende tre elementi: URN, Uniform Resource Name, che identifica la risorsa, URC, Uniform Resource Characteristics, riguardante la semantica, URL, Uniform Resource Locators, per localizzare la risorsa e PURL per garantire l’uso del documento anche a seguito di uno spostamento.[29] PURL, Persistent URL è un localizzatore che rimane immutato anche quando la risorsa si sposta nel cyberspace , grazie al controllo di agenzie incaricate di tenere sotto controllo le frequenti migrazioni e renderle trasparenti agli utenti.[30] Questa complessa architettura, attualmente al centro degli interessi bibliotecari, è stata sperimentata dalle biblioteche nord europee e recentemente in realizzazioni europee, come la BN Digital portoghese, di cui si parlerà nel seguente capitolo.[31]
[1] Ridi, [1998], p. 15.
[2] Bassi, [2002], p. 34.
[3] Bassi, [2002], p. 48 -53.
[4] Ridi, [1999].
[5] Bassi, [2002], p. 27-35; Salarelli-Tammaro [2000], p. 181-185.
[7] TEI, The Text Encoding Initiative, [2000-2005].
[8] Numerico-Vespignani, [2003], p. 144-147.
[9] The TEI Guidelines, [2002].
[10] Numerico- Vespignani, [2003], p. 147.
[11] Bassi, [1999], p. 142-145.
[12] Dublin Core Metadata Initiative (DCMI), [1995-2005].
[13] Tedd-Large, [2005], p. 88-97.
[14] Bassi, [2002], p. 155
[15] Dublin Core element set, version 1.1: reference description, [1999].
[19] Tajoli, [2005], p. 77-81 ; The Digital Object Identifier System, [2003-2005].
[20] Vitiello, [2004], p. 67-80; mEDRA,[2003-2005]; Crossref.org: the reference linking backbone, [2003-2005].
[22] Ifla Study Group on the Functional Requirements for Bibliographic Records, [1998], p. 7-10.
[28] Ridi, [1999].
[29] De Robbio, [2002b], p. 31-32.
[30] Metitieri-Ridi, [2002], p. 54-55.
[31] Persistent URL, [1997-2005].
La capacità di trasferire dati da una parte all'altra del globo in pochi secondi e l'universo di risorse digitali più che una rivoluzione destinata a soppiantare la rivoluzionaria scoperta della stampa come annunciato da alcuni, per ora è una rivoluzione per l'organizzazione di biblioteche e centri di documentazione per far fronte alle nuove esigenze. In particolare è necessario affrontare la fornitura dei servizi, a seguito di collaborazioni tra biblioteche attraverso consorzi e accordi, la concentrazione aziendale, i cambiamenti cui è soggetta la proprietà intellettuale, l'affermarsi dell'informazione come prodotto commerciale, l'accesso e la conservazione di tali prodotti.
L'accesso alla biblioteca digitale, inteso come servizio, dovrebbe consentire tre funzionalità primarie per l'utente:
L'accesso alla biblioteca digitale può avvenire:
Gli accessi alla collezione digitale possono essere molteplici, in virtù di accordi con editori o tipologia di utenti, il caso più frequente è l'accesso libero ad opere digitalizzate non coperte da diritto d'autore e la richiesta di identificazione, o accesso limitato per le altre risorse informative, in particolare e-journals.
I servzi che una biblioteca digitale offre ai propri utenti sono ancora una volta i servizi essenziali della biblioteca trasposti in ambiente elettronico. Dal tradizionale reference service o servizio di ricerca dell’informazione bibliografica che permette agli utenti di soddisfare i propri desideri informativi attraverso, Virtual Reference Service, o servizio di assistenza a diversi livelli, dall'orientamento alle indicazioni bibliografiche non tralasciando l'istruzione dell'utente remoto per un miglior utilizzo degli strumenti di ricerca, come indici e repertori attraverso l'allestimento di una Virtual Reference Desk, o servizi di assistenza personalizzata tramite posta elettronica o le più sofisticate virtual reference software che integrano attività di front office con quelle di back office.
Altri servizi all’utente nati in biblioteche ibride sono il servizio di Print on demand, stampa controllata dalla biblioteca o dall'editore per un prodotto tipografico a richiesta, ed il prestito, che deve essere gestito dalla biblioteca, interprete della legislazione riguardante copyright e documenti digitali, in modo da poter definire anche le modalità di fornitura di documenti, DD, Document Delivery, la cui gestione da parte delle biblioteche digitali è strettamente legata alle problematiche relative al copyright.
Accanto a questi servizi “tradizionali”, l'ambiente elettronico può favorire altri servizi come la gestione dei documenti digitali per particolari categorie di utenti come gli studenti, servizi di Data mining o KDD, Knowledge discovery in databases, per la ricerca semi-automatica dei documenti.
La biblioteca digitale è inoltre in grado di fornire servizi personalizzati grazie al profilo utente che permette un costante monitoraggio dell'uso della collezione e una disseminazione dell'informazione automatizzata la cui efficacia risiede soprattutto nei termini di ricerca preimpostati, facilmente verificabile in base alla quantità di informazioni recuperate.[2]
Repertori di collezioni digitali
Paradossalmente la molteplicità della biblioteche digitalizzate realizzate ha reso essenziale il servizio di filtro alle collezioni digitali disponibili, da parte delle biblioteche stesse o come servizio autonomo, come i repertori, in questo modo l’attività del bibliotecario non è più solo filtrare l’informazione disponibile, ma costruire strumenti per rendere utile l’informazione disponibile.[3]
Digital Iniziatives Database, realizzato da ARL, progetti realizzati in ambito bibliotecario e accademico entro le istituzioni accademica o di ricerca statunitensi.
Directory of Electronic Text Center, del CETH, per progetti di biblioteca digitale curato da Mary Mallery.[4]
Projects Using the TEI, raccoglie le esperienze di biblioteche digitali in base al codice usato.[5]
Academic Project and Applications, curato da Robin Cover per le applicazioni delle tecnologie SGML in ambito scientifico.[6]
Berkley Digital Library SunSITE, proposta di fornitura in ambito tecnico logistico per favorire lo sviluppo della biblioteca digitale oltre al repertorio generale di biblioteche.[7]
Metacataloghi
The Online Books Page, di Mark Ockerbuom dell'Università della Pensilvania, per la ricerca di opere in lingua inglese disponibili gratuitamente in internet, inoltre contiene repertori di biblioteche e archivi generali e progetti di editoria elettronica.[8]
Alex Catalogue of Electronic Texts, di Eric Lease Morgan, è un archivio indipendente, è possibile consultare la copia locale, fare ricerca per parola all'interno, generare PDF o e-book.[9]
Anche per la fornitura dei servizi all'utente, così come per la creazione e gestione della collezione e la progettazione dell'infrastruttura è auspicabile la cooperazione tra diverse biblioteche o istituzioni che propongono iniziative come la biblioteca digitale, per progettare coerenti progetti di digitalizzazione, politiche di acquisto e strategie di conservazione.
La biblioteca digitale intesa come sistema cooperativo è determinata dalla tipologia di biblioteca cui afferisce:
Nei casi di cooperazione la condivisione della collezione potrebbe non coincidere con la condivisione dell'utente e dar vita a collezioni con modalità di accesso diverso, in cui progetti di digitalizzazione di parte del patrimonio sono rese gratuitamente accessibili per una utenza remota con richieste diverse dall'utenza interna della stessa biblioteca digitale.[10]
La formazione e lo sviluppo della collezione digitale da parte di una biblioteca impone dei costi aggiuntivi per questo le biblioteche scelgono la strategia della cooperazione per condividere le risorse in Rete, come CILEA[11] e CASPUR[12] anche attraverso un'interfaccia condivisa. Per molti di questi consorzi c'è un coordinatore di lista, per l'Italia ad esempio è BURIONI per il consorzio italiano INFER.[13] Sono importanti anche le alleanze con produttori e fornitori che oggi propongono servizi disponendo del proprio materiale.
Il tema del diritto d'autore ed altri temi legali sono frequentemente dibattuti a livello internazionale da quando l'introduzione del media digitale ha investito il campo giuridico, in particolare in relazione alla percezione di bene immateriale, quale è appunto la proprietà intellettuale. Tale percezione varia dal contesto giuridico, il quadro normativo vigente in Italia è denominato sistema latino-germanico ed inteso a tutelare forma e contenuto, differente dal sistema anglosassone, in cui la legislazione concernente il copyright si concentra maggiormente sul contenuto.
In Italia la proprietà intellettuale dell'opera è sancita dalla legge n. 633 del 1941, aggiornata da leggi e decreti che dagli anni Novanta tentano di introdurre la vecchia legge nel nuovo contesto informatico e telematico (es. legge n. 248/2000) oggi ricomposte sul sito dirittodautore.it.
Le norme sul diritto d'autore hanno come fondamenta il riconoscimento di diritti morali ed economici sull'estensore dell'opera d'ingegno. Di questi, i diritti morali sono inalienabili, mentre quelli economici possono essere ceduti a terzi che ne divengono titolari a tutti gli effetti. A questi principi generali di salvaguardia dei diritti dei titolari del bene, coesistono eccezioni per la salvaguardia dell'accesso all'informazione nell'interesse collettivo.
Alcune caratteristiche del mezzo digitale, come facilità di duplicazione dell'opera e malleabilità del documento, si contrappongono alla fissità del testo su cui si basano le leggi attuali e richiedono una maggior specificità volta a definire i confini del “dualismo” del diritto d'autore che vede coinvolte le biblioteche.
Nello specifico, gli interventi sulla legge 633, che riguardano le biblioteche sono:
Di maggior interesse per le biblioteche sono le modifiche relative alle utilizzazioni libere introdotte dalla L. 248/2000 in cui l'equo compenso per le riproduzioni pone gravi limiti alle funzioni bibliotecarie.[14]
La globalizzazione della comunicazione scientifica attraverso la Rete ha reso necessaria la ricerca di un'armonizzazione delle diverse legislazioni nazionali, avviata dalla Convenzione di Berna del 1886, aggiornata nel 1971 a Parigi, fondamento dell'organizzazione non governativa per l'armonizzazione, promozione e protezione dell'opera intellettuale, WIPO, World Intellectual Property Organization,[15] OMPI per l'Italia, Organizzazione Mondiale della Proprietà Intellettuale.
La conoscenza della legislazione su tale diritto è necessaria per pianificare l'utilizzo e la distribuzione dell'informazione, e sul piano tecnologico per costruzione di banche dati, strumenti per la didattica e pagine web. [16]
In particolare gli aspetti che coinvolgono maggiormente la biblioteca digitale sono il progressivo aumento della produzione di documentazione elettronica ed alla possibilità di connessione di questi con contenitori di altro tipo attraverso l'ipertestualità reticolare, la facilità con cui la documentazione in formato digitale può essere copiata, modificata e trasferita. Il problema riguarda soprattutto le opere digitalizzate che necessitano di una previa autorizzazione di chi detiene i diritti, questione spesso disattesa, mentre è necessario prevedere la regolamentazione attraverso licenze. Tali licenze d'uso sono frutto di negoziazione tra biblioteche e chi detiene i diritti legali, autori, editori, curatori e spesso rintracciare tutti gli autori diviene dispendioso in termini di tempo e denaro, così come la difficile concertazione delle differenti legislazioni nazionali, Comunitarie e internazionali in materia.
Lo sviluppo della biblioteca digitale è quindi strettamente legato alla definizione di leggi e indicazioni atte a regolare la contrattazione del copyright per garantire l'accesso alle risorse, in particolare alla comunità scientifica internazionale.[17]
In attesa di equiparazione tra beni immateriali analogici e digitali, la legislazione europea si è arricchita di una preziosa Direttiva sull'armonizzazione di taluni aspetti del diritto d'autore e dei diritti connessi nella società dell'informazione del 2001[18] conosciuta come la “Sesta direttiva”, che riconosce agli stati membri la possibilità di prevedere eccezioni ai diritti di riproduzione ai fini una comunicazione accessibile ad un maggior numero di persone, per favorire la comunicazione scientifica e facilitare l'accesso all'informazione ai disabili.[19] Direttiva di difficile ricezione per il sistema latino-germanico che inserisce la proprietà intellettuale ed i diritti connessi in un contesto commerciale, in cui le biblioteche difficilmente trovano lumi per la distribuzione e diffusione dell'informazione accessibile al maggior numero di utenti rispettando i diritti degli attori della filiera editoriale. Per le biblioteche si rende dunque necessario affidarsi alla consulenza di esperti, in campo giuridico e digitale in ambito bibliotecario, ed attenersi ad alcune raccomandazioni come la verifica dei diritti di autori ed editori prima di procedere alla digitalizzazione o commercializzazione dei propri fondi, citare per intero le fonti delle digitalizzazioni reso disponibile sulle proprie pagine web, rispettare le clausole dei contratti stipulati con editori o fornitori e trasmettere ai propri utenti i limiti connessi al diritto d'autore, in particolare in ambiente digitale.[20]
Infine, la personalizzazione del servizio e la necessità di conoscere il profilo dell'utenza devono rientrare nel rispetto della legislazione vigente in tema di privacy per memorizzare e conservare i dati personali dell'utente e per il loro trattamento.[21]
Uno snodo cruciale per il futuro delle biblioteche digitali sono certamente i sistemi per la gestione dei diritti ed il controllo degli accessi come dimostrano i vari progetti comunitari degli ultimi anni, dal capostipite CITED (1990-1993), Copyright In Trasmitted Electronic Documents, a IMPRIMATUR, Intellectual Multimedia Property Rights Model and Terminology for Universal Reference, (concluso nel 1998) o CANDLE, Controlled Access to Network Digital Libraries in Europe, ai più recenti ECUP, European Copyright User Platform, (1996-1998) e la prosecuzione TECUP. L’esperienza di questi progetti, rivolta alle problematiche del copyright per la comunità bibliotecaria e in particolare alla gestione delle eccezioni al diritto d'autore in ambito bibliotecario sono state raccolte dall’iniziativa EBLIDA, European Bureau of Library, Information and Documentation Associations[22].[23]
[1] Ridi, [2004], p. 30.
[2] Ridi, [2004], p. 17-19.
[3] Gargiulo, [2005].
[5] Projects using the TEI, [1996-2005].
[10] Questa la considerazione di Anna Maria Tammaro in Salarelli-Tammaro, [2000], p. 149 per il progetto American Memory della Library of Congress, ma si può estendere a biblioteche esclusivamente digitali in cui le collezioni possono essere destinate ad utenti diversi e con diverse modalità di accesso.
[11] Cilea - Consorzio Interuniversitario Lombardo per l'Elaborazione Automatica, [2003-2005].
[12] CASPUR-Consorzio interuniversitario per le Applicazioni di Supercalcolo per Università e Ricerca, [1992-2005].
[18] Approvata dal Parlamento europeo il 14 febbraio del 2001 e dal Consiglio il 9 Aprile, è stata pubblicata sulla Gazzetta Ufficiale: Direttiva 2001/29 in G.U. CE n. L. 167 del 22 giugno 2001.
[19] De Robbio [2001a], p. 93-108.
[20] Ridi [2004], p. 34-36.
[21] La legge sulla privacy n. 675/1996 è stata abrogata e contestualmente sostituita dal 01/01/2004 dal Codice della privacy, d. lgs.30 giugno 2003, Garante per la protezione dei dati personali,[2000(?)-2005].
[22] Eblida, [1998-2005].
[23] Bardi, [1999], p. 28-36.