Portabilità di un Documento Informatico

Pubblichiamo l’estratto “Portabilità di un documento informatico” tratto dall’eBook Il Documento informatico e le firme elettroniche (Altalex Editore, 2015).

Cosa significa firmare un documento oggi? Si può rinunciare alla carta?

Questa monografia vuole spiegare quali siano le vie per formare una firma con pieno valore legale e se queste vie siano percorribili. Affronta, altresì, i problemi della vulnerabilità degli strumenti e, soprattutto, come l’incessante progresso tecnologico obblighi ad una corposa e continua normazione. Definisce cosa implichi il “documento informatico” e quale sia il valore della sua sottoscrizione secondo le leggi attuali.

L’eBook commenta, inoltre, le normative con esempi e considerazioni tecniche, fornisce alcune conoscenze informatiche di base, ben correlate da dimostrazioni facili e pratiche, per discutere sulla motivazione delle regole tecniche emanate. Da ultimo, affronta l’annoso problema della gestione delle firme, suggerendo un metodo di “delega” della firma a terzi.

(Altalex, 6 settembre 2016)


Portabilità di un documento informatico

Valutiamo innanzitutto la necessità che un file di tipo testuale debba mantenere inalterata la sua riproducibilità nel tempo e su supporti diversi.

In modo empirico l’utente forse ritiene, a torto, che il formato di documento testuale più indicato per la conservazione sia quello indicato genericamente con l’acronimo di PDF.

L’utente sa che scegliendo la cosiddetta “stampante pdf” può ottenere come risultato di qualsiasi programma un documento informatico PDF pronto, con la semplicità di un comando di stampa.

Questa parentela logica produce già nell’utilizzatore l’idea che il documento PDF sia la forma digitale esatta di quello che sarebbe uscito dalla comune stampante, ossia un cartaceo.

Quasi tutti i software ormai permettono di salvare il documento, preparato in formato PDF.

Questo documento informatico è empiricamente quello che i nostri colleghi più facilmente riescono a leggere attraverso i più vari dispositivi digitali (PC, smartphone, cellulari di ultima generazione, tablet, etc.), indipendentemente dal sistema operativo installato.

Il formato PDF è considerato, sempre per esperienza quotidiana, un formato non facilmente ed immediatamente modificabile: il file che si ottiene è prontamente leggibile, ma se si prova a modificarne i contenuti, con gli strumenti normalmente a disposizione, non ci si riesce.

È esattamente così semplice e sicuro parlare genericamente di formato PDF per la conservazione e la digitalizzazione?

In realtà il formato PDF, nella sua forma standard, non può essere considerato compatibile con i processi di conservazione digitale (manca infatti della caratteristica di riproducibilità a lungo termine) neppure nella forma della conservazione dell’aspetto visivo.

Questo avviene perché i file PDF standard non sono esattamente immagini, fotocopie digitali immobili ed immutabili, ma possono presentare dipendenze da altri file (come i cosiddetti font, o altri oggetti) installati sul proprio Personal Computer ed esterni al documento stesso.

Il PDF standard, inviato ad un collega, è esattamente uguale a quello che abbiamo noi sul nostro Personal Computer, solo a patto che il collega abbia installati sul suo dispositivo gli stessi oggetti che sono presenti nel nostro.

Nel tempo, la dismissione di certi oggetti informatici, potrebbe causare la differenza visiva di un documento PDF da quello originariamente prodotto.

In parole povere per un PDF standard può succedere che, impaginato originariamente con un certo tipo di carattere, risulti dopo un certo periodo di tempo (o se letto su un altro dispositivo digitale), visualizzato e stampato con un altro tipo di carattere. Questo perché il carattere utilizzato non è in realtà contenuto sempre in un PDF, ma risulta autonomamente installato sul Personal Computer.

L’esperienza diretta ha dimostrato che un documento PDF, impaginato originariamente con un carattere non troppo consueto e di dimensioni molto piccole, risultava, riletto in altra sede, con un carattere così diverso da non rispettare non solo lo stile visivo, ma neppure i contenuti. Questo perché il carattere diverso e più grande in dimensione, portava i testi a sovrapporsi, modificando così gli stessi contenuti.

“La stampa di documenti in formato PDF generico può dare problemi se si utilizzano dei caratteri locali (ad esempio le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su di una lingua differente”.

Un formato di file di tipo testuale contiene sempre in sé informazioni quali: formato, carattere, dimensione, colore, posizione, immagini contenute, lingua, accenti…; tutte informazioni che se poi non trovano la corrispondenza nelle caratteristiche del computer che li visualizza, danno risultati visivi differenti.

Ricordiamoci che la normativa (CAD – Decreto Legislativo 7 marzo 2005, n. 82. Testo vigente al 12/08/2012. Art.1 e successivi) richiede di affidare all’archiviazione sostitutiva un formato di tipo immagine. Il formato di tipo immagine, ad esempio il cosiddetto Bitmap (BMP), riporta in forma digitale esattamente quello che appare in video. Nel file ottenuto è presente, in sostanza, una matrice che dice quale colore ha ciascun punto del video del personal computer, e quindi il risultato è assolutamente fedele.

Questa via però presenta due spiacevoli inconvenienti rispetto al PDF generico:

  1. Il documento diventa un’immagine, quindi non sono più possibili ricerche di testo all’interno del documento (fra i vantaggi del formato PDF c’è la possibilità di ricercare una parola scritta all’interno del documento stesso, senza doverlo manualmente leggere e scorrere per tutta la sua lunghezza)
  2. Il formato immagine è uno standard definito, quindi non si possono aggiungere al file informazioni di altra specie, quali i dati grafometrici di una Firma Elettronica Avanzata (il formato PDF prevede invece la possibilità di aggiungere nel documento elementi digitali di interesse, quali Firme, Certificati Digitali, elementi di sicurezza, …).

Nel Gennaio 2007 si è intrapresa la strada per rendere il formato uno standard ISO sono stati così introdotti i seguenti sotto-formati:

  • • PDF/A (PDF/Archiving) per l’archiviazione a lungo termine;
  • • PDF/X (PDF/eXchange) per le arti grafiche e la prestampa;
  • • PDF/E (PDF/Engineering) per la documentazione di tipo ingegneristico;
  • • PDF/H (PDF/Healthcare) per il settore sanitario;
  • • PDF/UA (PDF/Universal Accessibility) per l’accessibilità.

Si verifica ora, in base a quanto detto, l’applicabilità di uno standard PDF/A (definito come standard per l’archiviazione sostitutiva) ai processi di conservazione digitale definita oggi alternativa all’archiviazione manuale di un foglio di carta firmato.

In primis è importate sottolineare che scegliere uno standard PDF/A vuol dire servirsi di software di scrittura e di lettura capaci di lavorare esattamente con questa forma di documento. Non è automatico pensare che tutti i software attualmente in commercio, per la produzione di un documento in formato PDF generico, supportino questo formato. Utilizzare un software non conforme allo standard PDF/A vuol dire riportarsi nella situazione di ottenere un risultato non fedele all’originale.

Lo standard PDF/A identifica le caratteristiche che il documento elettronico in formato PDF deve avere per ottenere che la riproduzione dia sempre gli stessi risultati a distanza di tempo. Per fare questo lo standard prevede che i documenti contengano all’interno tutti gli oggetti ed i font necessari alla loro corretta visualizzazione. In un documento PDF/A devono essere inglobati tutti i contenuti: testi, immagini c.d. raster e di grafica vettoriale, caratteri, colori, informazioni…

Altri elementi di compatibilità includono:

  • Contenuti audio e video sono vietati;
  • Java script ed invocazioni di file eseguibili sono vietate;
  • tutti i caratteri devono essere incorporati e devono poterlo essere senza limiti di copyright. (Questo vale anche per quelli standard PostScript, come i caratteri True Type Times o Helvetica);
  • gli spazi dei colori sono specificati in un modo indipendente dal dispositivo;
  • la crittografia è soppressa;
  • l’utilizzo di meta-dati standard è obbligatorio.

Lo standard, poi, specifica due livelli di conformità per i file PDF:

  • • PDF/A-1a – Livello A rispetto alla parte 1;
  • • PDF/A-1b – Livello B rispetto alla parte 1.

PDF/A-1b ha l’obiettivo di garantire la riproduzione affidabile dell’aspetto visivo del documento. PDF/A-1a include tutti i requisiti di PDF/A-1b, e vi aggiunge il vincolo dell’inclusione della struttura del documento (conosciuto anche come “tagged”), con l’obiettivo di garantire che il contenuto del documento possa essere cercato e presentato.

In pratica, assieme al documento testuale viene memorizzata un’immagine TIFF (Il Tagged Image File Format, detto anche TIFF, è un formato immagine di tipo raster) dello stesso, che quindi risulta essere fedele nella riproduzione visiva ed in stampa.

È chiaro che le variabili in gioco per garantire la perfetta fedeltà all’originale nel tempo non sono poche e neppure di semplice interpretazione ed applicazione.

Possiamo a questo punto sottolineare che gli svantaggi dell’applicazione di uno standard PDF/A sono quindi relativi alla scelta di un software di lettura/scrittura dei documenti compatibile allo standard PDF/A, alle limitazioni nei contenuti dei documenti per mantenere la compatibilità, ma soprattutto alle dimensioni del documento (il documento è più grande in dimensione dovendo contenere molte più informazioni).

Riassumendo quindi quanto scritto finora, si può dire, a mio parere, che per poter dare garanzia di una corretta archiviazione sostitutiva dei documenti è inevitabile ad oggi servirsi esclusivamente di uno standard PDF/A-1b, in quanto è ad ora quello che dà più garanzie di una corretta e precisa riproducibilità nel tempo (confidando che tutte le variabili in gioco siano state correttamente valutate nello standard PDF/A-1b).

Stabilendo lo standard PDF/A-1b come necessario per le forme dell’archiviazione sostitutiva, occorre valutare che i limiti introdotti dallo stesso al fine di garantire la corretta riproducibilità, possano far sì che il documento prodotto sia sì potenzialmente inalterabile nel tempo, ma abbastanza dissimile dall’originale prima del salvataggio in formato PDF.

Lo strumento di esportazione PDF presente nella suite Microsoft Office 2007 eliminerà, ad esempio, la trasparenza di ogni immagine contenuta nel documento stesso, perché tale caratteristica è vietata nel PDF/A-1.

In sostanza, elaborato un documento attraverso un programma software, potremmo trovarlo dissimile una volta tradotto nel formato PDF/A-1.

Ad esempio: due loghi parzialmente sovrapposti per un gioco di trasparenze, potrebbero dare come risultato che uno copra completamente l’altro nel PDF/A-1 generato.

È quindi necessario dare una validazione al documento PDF/A-1 generato, prima di affidarlo a qualsiasi operazione di firma elettronica o archiviazione sostitutiva, considerando che questo possa essere differente da quanto voluto.

Ad un certo punto è stato necessario chiarire, ad esempio, se la frase “d) la possibilità di verificare che il documento informatico sottoscritto non abbia subito modifiche dopo l’apposizione della firma;” contenuta all’Art. 56 dello “decreto del Presidente del Consiglio dei Ministri 22 febbraio 2013 Regole tecniche in materia di generazione, apposizione e verifica delle firme elettroniche avanzate, qualificate e digitali, ai sensi degli articoli 20, comma 3, 24, comma 4, 28, comma 3, 32, comma 3, lettera b), 35, comma 2, 36, comma 2, e 71. GAZZETTA UFFICIALE 21-5-2013”, debba essere rivalutata considerando che il documento, pur non essendo stato fisicamente modificato nel contenuto, possa mostrarsi a video o in stampa (cosa abbastanza improbabile ma pur sempre possibile) visibilmente differente da quanto atteso e stampato in un’altra sede ed in tempi diversi.

Questo anche perché è d’obbligo sottolineare come nel medesimo D.P.C. 22 febbraio 2013 sia stato tolto il vincolo all’immagine come formato di conservazione aprendo la strada di fatto anche al formato PDF/A-1a.

La confusione da me qui segnalata permane anche nel recente “decreto del Presidente del Consiglio dei Ministri 13 novembre 2014 – Regole tecniche in materia di formazione, trasmissione, copia, duplicazione, riproduzione e validazione temporale dei documenti informatici nonché’ di formazione e conservazione dei documenti informatici delle pubbliche amministrazioni ai sensi degli articoli 20, 22, 23-bis, 23-ter, 40, comma 1, 41, e 71, comma 1, del Codice dell’amministrazione digitale di cui al decreto legislativo n. 82 del 2005. (GU n.8 del 12-1-2015)”, specialmente riferendosi all’allegato 2.

L’allegato 2, D.P.C. 13/11/2014 infatti fornisce “indicazioni iniziali sui formati dei documenti informatici che per le loro caratteristiche sono, al momento attuale, da ritenersi coerenti con le regole tecniche del documento informatico, del sistema di conservazione e del protocollo informatico.

I formati descritti sono stati scelti tra quelli che possono maggiormente garantire i principi dell’interoperabilità tra i sistemi di conservazione e in base alla normativa vigente riguardante specifiche tipologie documentali.

Il presente documento, per la natura stessa dell’argomento trattato, viene periodicamente aggiornato sulla base dell’evoluzione tecnologica e dell’ob­solescenza dei formati e pubblicato online sul sito dell’Agenzia per l’Italia digitale”.

La formalizzazione dell’allegato 2, D.P.C. 13/11/2014 mostra quanto sia necessario ormai elencare e dettagliare precisamente i tipi di file utilizzabili, al di là delle generalizzazioni necessarie per le regole a carattere normativo.

L’allegato 2, D.P.C. 13/11/2014 alla voce “PDF” titola: “PDF – PDF/A”. Sebbene non sia esplicitato il vincolo all’uso del solo PDF/A (non esiste alcuna nota di esclusione degli altri formati di PDF), per il fatto che l’elenco riporta solamente le informazioni riguardanti il formato PDF/A, se ne deduce che questo sia l’unico formato di PDF ammissibile ad oggi.

Come detto precedentemente sarebbe per me opportuno sottolineare come in realtà sia solamente lo standard PDF/A-1b a garantire la riproduzione affidabile dell’aspetto visivo del documento

Questo mi induce a pensare di aver correttamente agito quando già nel 2012 ho pubblicato questo articolo su Altalex: Conservazione sostitutiva dei documenti: usare il PDF è sicuro? (13 settembre 2012).

(Articolo di Carlo Tenca tratto dall’eBook Il Documento informatico e le firme elettroniche, Altalex Editore, 2015)