Uno storico collaboratore di Liber Liber, Claudio Paganelli, ci ha segnalato la suggestiva testimonianza di un volontario del Distributed Proofreaders. La riportiamo qui di seguito perché sono parole nelle quali molti in Liber Liber si riconoscono.
I miei 25 anni in Distributed Proofreaders
1 marzo 2026
25 anni di dilemmi
Quando mi sono iscritto il 18 gennaio 2001 a un sito nuovo ed entusiasmante con il nome allora poco familiare Distributed Proofreaders, non riuscivo a immaginare di essere ancora lì 25 anni dopo, con oltre 1200 ebook pubblicati su Project Gutenberg. Quasi una a settimana, per tutto il periodo.
Il modello base di produzione degli ebook dei Distributed Proofreaders è semplice: utilizzando immagini di pagine scansionate e testo OCR fornito da un content provider, i volontari correggono e formattano una pagina alla volta in tre turni di correzione e due turni di formattazione. Successivamente, un post-processore assembla le pagine completate in un ebook che viene inviato alla collezione Project Gutenberg. I miei ruoli principali presso Distributed Proofreaders sono quello di Content Provider e Post-Processor.
Invece di parlare di tutte le sottigliezze del processo, lasciatemi approfondire i dilemmi che ho affrontato lavorando come volontario per così tanto tempo.
Quali contenuti fornire
Ottenere libri interessanti da trasformare in ebook può essere una vera sfida. Anche se nella maggior parte dei casi siamo costretti a lavorare con libri che hanno circa un secolo o più, spesso cerco di trovare libri che abbiano un legame con eventi attuali. Quando una calamità colpisce una certa regione, spesso cerco libri su quella regione, specialmente se quel libro fornisce un po’ di contesto sugli eventi. Il terremoto ad Haiti mi ha spinto a cercare alcuni libri sulla curiosa storia di quella nazione insulare. L’invasione russa dell’Ucraina mi ha ispirato a raccogliere una serie di opere su quel paese assediato, come Ucraina, la terra e il suo popolo.
A parte questo, spesso mi rivolgo ai miei preferiti di lunga data: esplorazione, antropologia, folklore, natura e scienza in generale, e opere relative all’India o alle Filippine in particolare, tra cui The Reign of Greed, una traduzione inglese del potente romanzo del 1887 del nazionalista filippino José Rizal, che rimane una lettura obbligatoria nelle scuole filippine. (Ho anche fornito la versione ebook della traduzione olandese di quest’importante opera, Noli me tangere: Filippijnsche roman.)
Comprare o non comprare
I libri d’epoca possono essere costosi, quindi acquistare libri da scansionare e gestire da Distributed Proofreaders è spesso fuori discussione. La mia fonte più significativa di libri fisici negli anni sono stati i negozi dell’usato, ma quello che puoi comprare lì è spesso molto limitato. Le buone scoperte sono rare, ma non impossibili, e richiedono una scansione rapida e regolare. Circa cinque o sei negozi dell’usato sono a meno di mezz’ora di distanza ciclabile da casa mia o dal mio ufficio nei Paesi Bassi, il che li rende raggiungibili durante la pausa pranzo. La seconda fonte più importante sono gli annunci online. I libri provenienti da quella fonte tendono a essere più economici rispetto alle librerie professionali. La mia strategia abituale non è cercare un titolo particolare, ma sfogliare gli scaffali o gli annunci online e chiedermi: è idoneo (libera il copyright, niente duplicato), è fattibile e aggiunge valore alla collezione di Project Gutenberg? Se sì, comprerò il libro, per lo più per pochi euro.
Purtroppo, alcune categorie di libri hanno molte più probabilità di finire nei negozi dell’usato. I bei vecchi libri illustrati sulla natura sono una rarità, mentre i vecchi libri per bambini sono relativamente comuni. I romanzi classici (o ex classici) occupano una posizione intermedia, e una gran parte sono testi religiosi, che normalmente non pubblico.
Per scansionare o scaricare
Nei primi tempi, prima che grandi archivi di scansioni come Internet Archive apparissero online, scaricare un set di scansione non era un’opzione: tutto doveva essere scansionato a mano. Negli anni, credo di aver posseduto più di sei o sette scanner diversi, ognuno con le proprie stranezze e abilità. Oltre ai libri stessi, sono l’investimento più grande, e la maggior parte non è fatta per durare migliaia di pagine.
La scansione richiede molto tempo. Tuttavia, il vantaggio dell’auto-scansione è duplice. Ovviamente, se un libro non è mai stato scansionato prima, non hai scelta e puoi davvero rendere qualcosa più disponibile immediatamente. Ma anche con libri già scansionati, avere le illustrazioni disponibili in alta risoluzione e senza i manufatti di compressione o il vignetting causati dagli scanner overhead usati per i grandi progetti aiuta a ottenere un risultato finale migliore.
Può sorprendere alcuni, ma la maggior parte del tempo dedicato alla preparazione degli ebook non serve per correggere o formattare il testo, bensì per l’elaborazione delle illustrazioni scansionate. Dato che mi piacciono le opere fortemente illustrate, e alcune immagini individuali possono richiedere fino a un’ora per essere sistemate, quelle immagini si sommano a più ore di qualsiasi altra attività.
Olandese o inglese o…
La mia lingua madre è l’olandese e mi piace preparare i libri olandesi per la lavorazione presso Distributed Proofreaders. Avere abbastanza materiale disponibile per i volontari olandesi, e abbastanza volontari olandesi per quei libri, è sempre un paradosso senza parole. Senza libri, i volontari non verranno, e senza volontari, i libri si fermeranno in giro. Per ora cerco di bilanciarli, metà olandese, metà inglese e un piccolo sparso di altre lingue nel mezzo. Quando pubblico un libro olandese, cerco di trovare un’edizione inglese della stessa opera e li pubblico vicini tra loro. Il mio interesse particolare riguarda le traduzioni inglesi di opere olandesi.
Duplicare o minor sforzo
Nei primi tempi, Project Gutenberg era uno dei pochi posti a offrire ebook completamente digitalizzati. C’erano alcuni altri siti, spesso con pochi libri, che si concentravano su un solo argomento o autore. Anche questo è cambiato. Sono stati creati grandi depositi sovvenzionati dal governo. Per l’olandese, abbiamo la Digital Library of Dutch Literature (DBNL), che include trascrizioni integrali di migliaia di libri. Sembra piuttosto inutile replicare quel lavoro in Distributed Proofreaders. Tuttavia, ci sono diversi motivi per cui a volte prendevo ancora in mano un libro già scritto altrove:
- Legale. Project Gutenberg ha una licenza molto liberale per i termini d’uso che impone quasi nessuna restrizione al riutilizzo, mentre altri archivi potrebbero rivendicare dubbio il copyright o (nell’UE) diritti di database sui testi che offrono. È bello avere una copia di un ebook disponibile senza tali ostacoli.
- Accessibilità. Project Gutenberg ha alcune regole rigide che rendono gli ebook più accessibili: un unico file HTML e testo semplice, utilizzando solo tecnologie mature e stabili, e senza componenti attivi. Questo è un grande vantaggio per l’accessibilità, e a questo è collegato:
- Durabilità. Il Progetto Gutenberg esiste da oltre mezzo secolo e probabilmente rimarrà ancora più a lungo. Ho visto molti progetti di ebook andare e venire, e poi sparire completamente dalla rete.
- Qualità. Gli ebook di Project Gutenberg preparati dai Distributed Proofreaders sono spesso di qualità migliore rispetto a quelli disponibili in altre collezioni. Per alcune opere che ho duplicato da altri archivi di ebook, ho usato software per trovare tutte le differenze rilevanti tra il nostro e il loro, e ho raccolto statistiche piuttosto precise sugli errori in entrambe le versioni. È stato soddisfacente trovare molti meno errori nelle versioni dei Distributed Proofreaders, dimostrando la cura che i nostri volontari prestano nei cinque round di correzione e formattazione.
Difficile o facile
Come sanno i veterani di Distributed Proofreaders, non evito opere difficili, come la Fornander Collection of Hawaiian Antiquities and Folk-Lore (vedi questo post sul blog per dettagli su come è stato preparato questo ebook impegnativo). Il valore aggiunto dalla revisione manuale di opere difficili è spesso molto più alto rispetto a quello di testi semplici come i romanzi. D’altra parte, è anche utile avere a disposizione opere semplici come romanzi. Sono ottimi per i volontari alle prime armi e facili da post-elaborare, quindi mi permettono di completare regolarmente i lavori, mentre i lavori più impegnativi progrediscono lentamente nei turni e poi nella post-elaborazione.
Per finire il vecchio o per iniziare qualcosa di nuovo
Sono un procrastinatore senza speranza. Avendo oltre 100 progetti in corso presso Distributed Proofreaders, ho ancora molte voglie di iniziare nuovi progetti, man mano che nuovi libri interessanti incrociano il mio cammino e altri argomenti devono essere esplorati. Allo stesso tempo, so che diversi grandi progetti sono bloccati in post-produzione. Sono difficili, spesso richiedono qualche passo finale ma noioso per raggiungere i miei standard di qualità. Essendo perfezionista, spesso devo ricordarmi quel detto di Voltaire, “Le mieux est l’ennemi du bien“, il perfetto è nemico del bene. Poi cerco di rendere l’ebook abbastanza buono e di pubblicarlo. Eventuali problemi rimasti possono essere meglio visti e risolti dagli occhi e dalle mani del collettivo quando sono alla luce del sole. Tuttavia, ci sono voluti anni per considerare i miei testi pubblicati completamente pronti per il pubblico, dato che potrebbe comunque esserci qualche virgola confusa per un periodo nascosta in un testo, o qualche strana confusione OCR sopravvissuta nelle profonde catacombe di un libro.
Hobby o famiglia
Infine, forse il dilemma più grande di tutti: passare del tempo su Distributed Proofreaders, o con la mia famiglia. I bambini sono ormai grandi e hanno trovato una casa tutta loro, ma vogliono comunque ricevere un po’ di aiuto dal padre ogni tanto, e mia moglie non apprezzerà essere una “vedova del computer”, quindi le attività congiunti sono sempre in discussione. E, naturalmente, l’elefante nella stanza: le bollette devono essere pagate, quindi serve anche un lavoro a tempo pieno. Queste alte priorità non sono affatto dilemmi.
Cosa mi motiva…
Tutti questi dilemmi sono pratici, ma dopo 25 anni la domanda più interessante potrebbe essere perché continuo a tornare a questo lavoro.
Tutti gli esseri umani, in un certo senso, bramano qualche tipo di riconoscimento, e la maggior parte delle persone costruisce le proprie piccole cattedrali in una forma o nell’altra. C’è un racconto breve di Tolkien, “Leaf by Niggle“, che esplora alcuni temi di questa caratteristica. In esso, un artista dipinge un grande albero, ma il suo lavoro non è né compreso né apprezzato, e il lavoro su di esso spesso è frustrato dai bisogni quotidiani. Alla fine, rimane solo una piccola foglia, incorniciata e appesa in un angolo di un museo locale. Già è più di quanto la maggior parte delle persone riuscirà mai a ottenere. Nomen est omen, e il mio nome deriva da quello di San Girolamo, il santo patrono dei bibliotecari, quindi è forse ovvio che la mia piccola cattedrale sarebbe una biblioteca.
Viviamo in un mondo in cui il testo è spesso considerato superato o superfluo, sommerso dal flusso di immagini e suoni che la tecnologia moderna ci riversa addosso a un ritmo senza precedenti. Credo che questa idea sia sbagliata. Il testo è un linguaggio fisso: condensato, rifinito e raffinato. È il più vicino che possiamo arrivare a immortalare i nostri pensieri. L’atto di scrivere non solo corregge quei pensieri in un mezzo, ma ci costringe anche a ripensarli, ci mette di fronte alle loro incongruenze e li rende disponibili per essere esaminati, criticati e migliorati dagli altri. Ecco perché credo che il testo non sparirà, e perché la lettura rimarrà un’attività importante.
I pensieri sono pericolosi. I pensieri sono contagiosi: ci motivano, danno potere agli altri e, di conseguenza, sono stati spesso repressi. Le biblioteche raccolgono pensieri — condensati in testo, raggruppati nei libri. Le biblioteche sono, in un certo senso, l’antitesi della soppressione. Sono costruiti per condividere pensieri, per raccogliere idee spesso contrastanti e permettere loro di stare fianco a fianco, così che altre menti possano assorbirle, scrutarle, vedere le loro contraddizioni e produrre qualcosa di nuovo dal risultato. Le biblioteche possono persino ispirare e aiutare i movimenti a porre fine alle ingiustizie e portare cambiamenti sociali.
L’accesso alla conoscenza non dovrebbe essere un privilegio. Le comunità svantaggiate dovrebbero poter accedere a opere storiche difficili da trovare, opere che possiedono il proprio patrimonio ma sono rinchiuse in costosi tomi, conservate in edifici imponenti e situate in paesi lontani. Le scansioni delle pagine sono solo a metà in questo senso, poiché i testi completamente corretti sono molto più accessibili — un aspetto particolarmente importante per le persone disabili. La digitalizzazione non riguarda solo la preservazione del patrimonio culturale; si tratta di renderla accessibile, accessibile e onnipresente, mantenendo così viva la cultura e la diversità culturale.
La mia selezione di testi è impulsiva, come spiegato sopra, ma poco a poco la biblioteca cresce — e sto imparando e apprezzando il lavoro. Ancora meglio, non sono solo. Per 25 anni ho condiviso questo impegno con i tanti meravigliosi volontari di Distributed Proofreaders. Anche questo è una grande motivazione: far parte di una comunità di persone con idee simili che lavorano per un obiettivo comune, pur avendo opinioni molto divergenti su molti altri argomenti — più simile a un bazar che a una cattedrale.
Questo post è stato scritto da Jeroen Hellingman,
un volontario dei Distributed Proofreaders.




