Documenti presenti in tutti i canali

Nella distribuzione il digitale sta sostituendo il fisico. Di conseguenza i documenti devono essere multicanale, indipendentemente dal formato e dalla fonte. E possibilmente fin dalla loro creazione. Le chiavi di ciò sono l’Html5 e il Pdf.

In tutta Europa il volume dei documenti fisici si sta riducendo. Le più recenti survey dell’Upu (Universal Postal Union) riportano un calo a percentile in doppia cifra. Molte aziende sono già passate all’invio di fatture e estratti conto come allegati alle email o tramite download da portali in rete.

Ed è un trend in crescita. Con l’eliminazione dei costi di stampa e invio, la distribuzione digitale possiede un potenziale di risparmio molto elevato. Per i documenti transazionali questo risparmio si calcola in numeri a 6 cifre, motivo per cui la digitalizzazione sta accelerando a vista d’occhio in questo campo. Con tutta probabilità in pochi anni oltre il 50% dei documenti saranno inviati per via digitale. Anche polizze assicurative, cancellazioni di contratti e documenti che, per motivi giuridici, sono legati alla carta un giorno saranno completamente digitalizzati.  La stampa e la distribuzione fisica saranno riservati per questi materiali che enfatizzano sensazioni tattili e visive, in particolar modo mailing, cataloghi premium, e brochure illustrate. La carta sta sempre più diventando un prodotto di lusso.

HTML5 per ogni occasione
In ogni caso il rapporto fra invii fisici e invii digitali sta mutando e influenzando l’intero processo della loro creazione. La sfida è chiara: preparare ogni documento, non importa il tipo, con dati che possano essere facilmente inviati per ogni possibile canale. Questo implica che i sistemi di output management devono staccarsi dalla metafora dell’A4 e rifornire di contenuti anche i device digitali, senza limiti di dimensione dovuta allo schermo o alla risoluzione. Sempre più spesso smartphone e tablet svolgone le funzioni di “uffici portatili” per le operazioni di business. I documenti che un tempo erano creati on in mente il solo output della stampa, ora devono diventare multicanale, arricchendosi nel loro viaggio di quante più informazioni possibili (metadati, hyperlink, istruzioni per la strutturazione del testo).

In questo contesto, l’Html5 svolgerà un ruolo fondamentale nella strutturazione e nella descrizione semantica dei testi. Non c’è di che stupirsi, l’Html5 può essere facilmente processato da ogni canale digitale, che sia uno smartphone o un sito web. L’Html5 può essere stampato o essere convertito in un’altra forma fisica, se necessario. Così come può diventare un pdf di qualunque dimensione di pagina.

I documenti multicanale sono anche intelligenti
Attualmente, l’Html5 è il formato più intelligente per la creazione e la visualizzazione di documenti, senza differenziazione di dimensione o canale di output. Permette riformattazione (da una dimensione A4 a una da smartphone) o la conversione da formati di pagina a formati text-oriented. Si possono estrarre dati singoli (compresi dati di fatturazione) e si possono costruire tanelle e indici. E non solo. Si possono inserire contenuti audiovisivi, link al web, grafici. Questo permette di creare documenti che non solo sono multicanale, ma che offrono altresì all’utente un valore aggiunto al mero testo.

Logicamente, tutto indica che l’adozione di un sistema di output management (OMS) è la via da battere – se non per la creazione direttamente in Html5 almeno in pdf. Tuttavia molte azienda rimandano ancora questo passaggio. Generalmente, avendo investito tempo e denaro nei sistemi che usano, non vedono di buon occhio nuovi tool di formattazione. La domanda che si trovano a fronteggiare è: come possiamo catturare almeno alcune delle informazioni strutturali delle attuali applicazioni per un uso futuro? I fornitori e i service provider di sistemi di output management come Compart si sono specializzati nella “lettura” dei dati base partendo dal risultato finale in sistemi preesistenti, e poi nella conversione degli stessi in Html5 o Xml, formati che possono essere arricchiti con una maggior gamma di informazioni.

Di nuovo alla fonte
Tirando le somme, bisogna individuare le fonti testuali all’interno dei documenti. Dove sono stati originati questi dati? Le fonti permettono l’estrazione di informazioni sufficientemente strutturate per essere riutilizzate? Sono le prime domande da porsi quando si vuole creare documenti “intelligenti”. Il punto è che spesso in fase di output i dati vengono persi, non importa tramite quale canale – una situazione non più al passo coi tempi. Spesso i documenti digitali vengono prima convertiti in forma analogica (ad esempio una stampa), quindi passati in documenti tif o jpg. I contenuti diventano “nuvole di pixel”, passando da una forma raster a una leggibile tramite sistemi di riconoscimento caratteri (Ocr). Perdendosi per via dati strutturali necessari per futuri utilizzi. Sono cose che non possono succedere quando i documenti portano con sé tutti i dati necessari all’output su qualsivoglia canale, da una pagina web a un mobile device a una stampa.