Portable Document Format

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search
Nota disambigua.svg Disambiguazione – "PDF" rimanda qui. Se stai cercando altri significati, vedi PDF (disambigua).
PDF file icon.svg Portable Document Format
Adobe PDF.svg
Estensione.pdf
Tipo MIMEapplication/pdf
Sviluppato daAdobe
1ª pubblicazione1993
Ultima versione2.0 (2017)
Esteso aPDF/A, PDF/E, PDF/VT, PDF/UA, PDF/X, PDF/Raster
StandardISO/IEC 32000-2
Formato aperto?

Il Portable Document Format (comunemente indicato con la sigla PDF) è un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe negli anni 1990 per rappresentare documenti di testo e immagini in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli.

Storia[modifica | modifica wikitesto]

Creato da Adobe nel 1993, ha avuto una serie di evoluzioni; nel 2005 venne creato il sottoformato PDF/A e nel gennaio 2007 Adobe ha intrapreso la strada della standardizzazione[1] per far diventare il PDF un formato standard ISO[2][3]; a luglio 2008[4] è stata approvata la norma ISO 32000.

Descrizione generale[modifica | modifica wikitesto]

Un file PDF può descrivere documenti che contengono testo e/o immagini in qualsiasi risoluzione. È un formato aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti (Royalty) ad Adobe. Adobe ha un numero elevato di brevetti relativamente al formato PDF, ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati. Ogni documento PDF contiene una completa descrizione del document bidimensionale (e, con la comparsa di Acrobat 3D, documenti 3D incorporati) composta da proprietà (Titolo, Autore, ecc.), testo, stili di carattere (font), immagini e oggetti di grafica vettoriale 2D che compongono il documento.

Il documento PDF non dovrebbe includere informazioni specifiche per software, hardware e sistema operativo usato. Ciò permetterebbe al documento di venire visualizzato e renderizzato nella stessa esatta maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Anche questo fatto ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione immediata dei documenti. In realtà il PDF nella sua forma standard è un formato che non può essere considerato compatibile con un processo di conservazione digitale (l'archiviazione digitale dei documenti al fine di eliminare o ridurre l'uso della carta), in quanto non è in grado di garantire la riproducibilità a lungo termine e neanche la conservazione dell'aspetto visivo. Questo aspetto dipende da vari fattori come, ad esempio, il fatto che i file PDF standard non sono necessariamente auto-contenuti, ma possono presentare dipendenze dai font utilizzati o da oggetti esterni al file stesso[5]. Pertanto, se si cerca di visualizzare questi file su sistemi informatici diversi da quelli sui quali sono stati creati, non è garantita la loro riproduzione in maniera coerente, da cui consegue che il loro utilizzo a lungo termine non è pensabile se non associato ad uno standard preciso[6].

La stampa di documenti in formato .pdf può dare dei problemi se si usano dei caratteri locali (ad esempio le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su una lingua diversa.

Formato file[modifica | modifica wikitesto]

Un file PDF contiene caratteri ASCII a 7 bit , ad eccezione di alcuni elementi che possono avere contenuto binario. Il file inizia con un'intestazione contenente un numero magico (come una stringa leggibile) e la versione del formato, ad esempio %PDF-1.7. Il formato è un sottoinsieme di un formato COS ("Carousel" Object Structure). Un file albero COS consiste principalmente di oggetti , di cui esistono otto tipi[7]:

  • Valori booleani, che rappresentano vero o falso
  • Numeri
  • Stringhe, racchiuse tra parentesi ( (...)). Le stringhe possono contenere caratteri a 8 bit.
  • Nomi, che iniziano con una barra ( /)
  • Matrici, raccolte ordinate di oggetti racchiusi tra parentesi quadre ( [...])
  • Dizionari, raccolte di oggetti indicizzati da nomi racchiusi tra doppie parentesi angolari ( <<...>>)
  • Flussi, solitamente contenenti grandi quantità di dati binari opzionalmente compressi, preceduti da un dizionario e racchiusi tra le parole chiave streame endstream.
  • L'oggetto "null"

Inoltre, potrebbero essere presenti commenti, introdotti con il segno di percentuale ( %). I commenti possono contenere caratteri a 8 bit.

Gli oggetti possono essere diretti (incorporati in un altro oggetto) o indiretti . Gli oggetti indiretti sono numerati con un numero di oggetto e un numero di generazione e definiti tra le parole chiave obje endobjse risiedono nella radice del documento. A partire dalla versione PDF 1.5, gli oggetti indiretti (ad eccezione di altri flussi) possono anche essere posizionati in flussi speciali noti come flussi di oggetti (contrassegnati /Type /ObjStm). Questa tecnica consente agli oggetti non flusso di applicare filtri di flusso standard, riduce le dimensioni dei file che hanno un numero elevato di piccoli oggetti indiretti ed è particolarmente utile per PDF con tag. I flussi di oggetti non supportano la specifica di un oggetto numero di generazione (diverso da 0).

Una tabella indice, chiamata anche tabella dei riferimenti incrociati, si trova in genere vicino alla fine del file e fornisce l'offset di byte di ogni oggetto indiretto dall'inizio del file[8]. Questo design consente un accesso casuale efficiente agli oggetti nel file e consente anche di apportare piccole modifiche senza riscrivere l'intero file ( aggiornamento incrementale ). Prima della versione PDF 1.5, la tabella sarebbe sempre stata in uno speciale formato ASCII, sarebbe stata contrassegnata con la xrefparola chiave e avrebbe seguito il corpo principale composto da oggetti indiretti. La versione 1.5 ha introdotto flussi di riferimento incrociato opzionali, che hanno la forma di un oggetto stream standard, eventualmente con filtri applicati. Tale flusso può essere utilizzato al posto della tabella dei riferimenti incrociati ASCII e contiene gli offset e altre informazioni in formato binario. Il formato è flessibile in quanto consente la specifica della larghezza intera (utilizzando /Warray), in modo che, ad esempio, un documento di dimensioni non superiori a 64 KiB possa dedicare solo 2 byte per gli offset degli oggetti.

Alla fine di un file PDF c'è un piè di pagina contenente:

  • La parola chiave startxref seguita da un offset all'inizio della tabella dei riferimenti incrociati (che inizia con la parola chiave xref) o l'oggetto flusso di riferimenti incrociati
  • L'indicatore di fine-file %%EOF .

Se non viene utilizzato un flusso di riferimenti incrociati, il piè di pagina è preceduto dalla parola chiave trailerseguita da un dizionario contenente informazioni che altrimenti sarebbero contenute nel flusso di riferimenti incrociati del dizionario dell'oggetto :

  • Un riferimento all'oggetto radice della struttura ad albero, noto anche come catalog ( /Root)
  • Il conteggio degli oggetti indiretti nella tabella dei riferimenti incrociati ( /Size)
  • Altre informazioni facoltative

Ci sono due layout per i file PDF: non lineare (non "ottimizzato") e lineare ("ottimizzato"). I file PDF non lineari possono essere più piccoli delle loro controparti lineari, sebbene l'accesso sia più lento perché parti dei dati necessari per assemblare le pagine del documento sono sparse in tutto il file PDF. I file PDF lineari (chiamati anche file PDF "ottimizzati" o "ottimizzati per il Web") sono costruiti in modo da consentirne la lettura in un plug-in del browser Web senza attendere il download dell'intero file, poiché vengono generati in modo lineare (come nell'ordine delle pagine)[9]. I file PDF possono essere ottimizzati utilizzando il software Adobe Acrobat o QPDF .

Caratteristiche[modifica | modifica wikitesto]

  • Può contenere qualsiasi combinazione di testo, elementi multimediali come video o audio[10], elementi ipertestuali come collegamenti e segnalibri, collegamenti e miniature di pagine.
  • I file PDF non perdono la formattazione quando vengono inviati ad altri utenti, come nel caso dell'invio di documenti di testo (pagine disordinate, paragrafi ingombranti, ecc.).
  • È uno dei formati più diffusi su Internet per lo scambio di documenti. Pertanto, è ampiamente utilizzato da aziende, governi e istituzioni educative.
  • È una specifica aperta, per la quale sono stati adattati strumenti software commerciali come Microsoft Office e WordPerfect Office suite e altri creati in software gratuito che consentono di creare, visualizzare o modificare documenti in formato PDF, come Openoffice.org, LibreOffice e Calligra Suite e il sistema di composizione del testo LaTeX.
Un video incorporato in un PDF
Un video incorporato in un PDF
  • Può essere crittografato per proteggere il suo contenuto e persino firmarlo digitalmente[11].
  • Un file PDF può essere creato da diverse applicazioni esportando il file, come Openoffice.org e Microsoft Office (a partire dal 2007, se aggiornato a SP2)[12].
  • Può essere generato da qualsiasi applicazione installando una "stampante virtuale" nel sistema operativo, in caso di utilizzo di applicazioni senza questa funzionalità integrata.
  • È lo standard ISO (ISO 19005-1: 2005) per i file del contenitore di documenti elettronici in vista della loro conservazione a lungo termine[12].
  • I file PDF sono indipendenti dal dispositivo, quindi possono essere stampati su una stampante ad aghi, a getto d'inchiostro, laser o microfilm. Per l'ottimizzazione della stampa, durante la creazione del file PDF vengono impostate le opzioni appropriate.
  • È multipiattaforma, ovvero può essere presentato sui principali sistemi operativi (GNU / Linux, MacOS, Unix, Windows ), senza modificare l'aspetto o la struttura del documento originale.

Gli standard[modifica | modifica wikitesto]

Il formato è stato effettivamente standardizzato in una serie di sottoformati, che sono:[6]

  • PDF/A (PDF/Archiving) per l'archiviazione a lungo termine;
  • PDF/X (PDF/eXchange) per le arti grafiche e la prestampa;
  • PDF/E (PDF/Engineering) per la documentazione di tipo ingegneristico;
  • PDF/H (PDF/Healthcare) per il settore sanitario;
  • PDF/UA (PDF/Universal Accessibility) per l'accessibilità.

Quindi, se si vuole archiviare o inviare un file PDF in modo stabile e con la massima possibilità di diffusione, si deve utilizzare il formato PDF/A, che è articolato in ulteriori sottoformati; questo formato è stato codificato il 28 settembre 2005 come standard ISO 19005-1:2005 Document management - Electronic document file format for long-term preservation - Part 1: Use of PDF (PDF/A1)[13]

La norma ISO 19005-1 specifica comunque due possibili diversi livelli di conformità allo standard:

  • PDF/A-1a (ISO 19005-1 Level A Conformance in Part 1)
  • PDF/A-1b (ISO 19005-1 Level B Conformance in Part 1)

Entrambi sono implementati nella più blanda versione 1.4, che è certo più flessibile dal punto di vista dell'inseribilità dei contenuti, ma comunque instaura un certo livello di dipendenza dal sistema informatico sul quale viene creato il documento.

La norma ISO 19005-2 specifica invece tre possibili diversi livelli di conformità allo standard:

  • PDF/A-2a (ISO 19005-2 Level A Conformance)
  • PDF/A-2b (ISO 19005-2 Level B Conformance)
  • PDF/A-2u (ISO 19005-2 Level U Conformance)

La norma ISO 19005-3 specifica altri tre possibili diversi livelli di conformità allo standard:

  • PDF/A-3a (ISO 19005-3 Level A Conformance)
  • PDF/A-3b (ISO 19005-3 Level B Conformance)
  • PDF/A-3u (ISO 19005-3 Level U Conformance)
Modello 3D incorporato in un PDF
Modello 3D incorporato in un PDF

Il formato è oggetto di ulteriori evoluzioni in fase di sviluppo come la PDF/E ed il PDF/VT (dove “V” sta per “Variable” e “T” per “Transactional”)[14] nel quale dovrebbero essere inclusi anche formati come U3D (Universal 3D), un formato scalabile finalizzato alla condivisione e visualizzazione di progetti 3D interattivi[15][16], provenienti dai settori del CAE (Computer-Aided Engineering) e del CAM (Computer-Aided Manufacturing). Si può per esempio creare un modello 3D tramite software come Blender e incorporarlo in un PDF[17].

Nella programmazione[modifica | modifica wikitesto]

Le specifiche del formato PDF sono state rese pubbliche, per questo motivo è possibile creare file.pdf in diversi linguaggi di programmazione.

Tecnologie[modifica | modifica wikitesto]

PostScript[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: PostScript.

Il PDF eredita molte delle funzionalità del PostScript, un linguaggio di descrizione della pagina anch'esso sviluppato da Adobe. Postscript permette di descrivere una pagina come il risultato di un'esecuzione di un programma, che contiene istruzioni su come e dove disegnare linee, punti, lettere dell'alfabeto e altri elementi grafici. In questo modo, ogni apparecchio capace di eseguire il programma (ossia, che abbia un interprete Postscript), sarà in grado di riprodurre tale immagine al meglio delle sue capacità. Questo processo, tuttavia, richiede grandi risorse da parte del terminale.

PDF, invece, è un formato, non un linguaggio di programmazione, e per questo motivo non ha bisogno di essere interpretato (per i dettagli vedi Linguaggio compilato e Linguaggio interpretato). Per esempio, il controllo di flusso esercitato dai comandi come if e loop è stato rimosso, mentre comandi grafici come lineto rimangono.

Questo significa che il processo di creare o trasformare un PDF nella sua immagine grafica è semplicemente dato dalla lettura delle descrizioni, invece che dall'esecuzione di un programma con l'interprete PostScript. Tutte le funzionalità del PostScript come i caratteri, layout e misure rimangono invariate.

Spesso il codice PDF è generato da un file sorgente PostScript. I comandi grafici che vengono generati dal codice PostScript vengono raccolti così come tutti i file, risorse grafiche e riferimenti di caratteri nel documento e, finalmente, tutto viene compresso in un singolo file.

Come linguaggio di documenti, il PDF ha molti vantaggi rispetto al PostScript:

  • Un singolo file: Un documento PDF consta di un singolo file, mentre in PostScript un documento può necessitare di essere rappresentato da molti file (grafica ecc.) che probabilmente occupano più spazio.
  • Già interpretato: PDF ha un contenuto già interpretato, cosicché richiede meno costi computazionali e la sua apertura è più veloce, oltre al fatto che c'è una corrispondenza diretta tra i cambiamenti degli oggetti nella descrizione della pagina PDF e cambiamenti nel rendering risultante.
  • Trasparenza degli oggetti: Il PDF (a partire dalla versione 1.4) supporta la trasparenza reale degli oggetti, caratteristica che invece non è supportata nel formato PostScript.
  • Sostituzione dei caratteri: Se viene visualizzato con Adobe Reader, una strategia di sostituzione dei caratteri assicura che il documento sia leggibile nonostante l'assenza sul sistema dell'utente dei font "corretti".

PDF garantisce che vengano visualizzati font sostitutivi affini a quello mancante. Mentre questo è possibile con PostScript, questi file non possono essere normalmente distribuiti per accordi di licenza dei font.

  • Pagine indipendenti: PostScript è un linguaggio di programmazione, così le istruzioni su una pagina possono influenzare la visualizzazione di pagine seguenti. È pertanto necessario interpretare tutte le pagine precedenti per determinare l'aspetto di ogni pagina data. In PDF, invece, ogni pagina del documento non viene influenzata dalle altre.

Protezione, crittografia e descrizione[modifica | modifica wikitesto]

All'interno del file PDF vengono tenute informazioni sulla sicurezza (documento stampabile o non stampabile, protetto da password, con selezione di testo bloccata o non bloccata, ecc.) e l'indicizzazione.

La protezione di un documento PDF presenta una chiave di crittografia attualmente fino a 128 bit (tempo fa era di 40 bit), e per il futuro non è escluso che possa aumentare in relazione all'aumento di potenza dei calcolatori in grado di elaborare chiavi di accesso random a più di 128 bit.

La protezione crittografica dei PDF è molto debole, ed esistono numerosi programmi che riescono a rompere la chiave in tempi strettissimi[18][19]. La protezione password PDF è sconsigliata per salvaguardare l'informazione al suo interno.

È possibile incrementare le possibilità di indicizzazione e posizionamento di un file PDF attraverso alcuni interventi di ottimizzazione compilando correttamente i campi della descrizione.

Software per PDF[modifica | modifica wikitesto]

Nel sistema operativo macOS sono integrate sia la lettura che la scrittura (da qualsiasi tipo di documento) di file PDF; analoga situazione sulle distribuzioni GNU/Linux di maggiore diffusione; su altri sistemi operativi sono necessari programmi appositi.

Un file PDF presente su Wikipedia visualizzato in un browser web.
Un file PDF presente su Wikipedia visualizzato in un browser web.

Per visualizzare i file PDF esistono molti software disponibili anche liberi, come Evince, Sumatra PDF e Ghostscript, oppure proprietari, come Adobe Acrobat, Foxit Reader e Nuance PDF Reader. Tra i programmi freeware per esportare il contenuto di un documento PDF in vari formati vi è la suite GhostScript. Per convertire i PDF in formato HTML5, leggibile con un browser di ultima generazione c'è PDF.js.

Molte applicazioni e sistemi operativi consentono di salvare direttamente in PDF, o hanno una pseudo-stampante[20] che salva in PDF. In mancanza di questa funzione, per realizzare un documento PDF occorrono programmi come Adobe Acrobat, oppure suite come Microsoft Office, OpenOffice.org o LibreOffice, oppure stampanti virtuali, disponibili anche liberi come PDF Creator[21].

Sono presenti online servizi gratuiti di modifica, gestione e salvataggio dei PDF in formati come jpg, png, HTML e molti altri[22][23][24].

Metadati[modifica | modifica wikitesto]

I file PDF possono contenere due tipi di metadati[25]. Il primo è il Dizionario delle informazioni sul documento, un insieme di campi chiave/valore come autore, titolo, oggetto, data di creazione e aggiornamento. Questo è memorizzato nel trailer informativo opzionale del file. Viene definito un piccolo insieme di campi e può essere esteso con valori di testo aggiuntivi, se necessario. Questo metodo è deprecato in PDF 2.0.

In PDF 1.4, è stato aggiunto il supporto per Metadata Streams, utilizzando Extensible Metadata Platform (XMP) per aggiungere metadati estensibili basati su standard XML utilizzati in altri formati di file. Ciò consente di allegare metadati a qualsiasi flusso nel documento, come le informazioni sulle illustrazioni incorporate, così come l'intero documento (allegando al catalogo del documento), utilizzando uno schema estensibile.

I documenti PDF possono contenere impostazioni di visualizzazione, incluso il layout di visualizzazione della pagina e il livello di zoom. Adobe Reader utilizza queste impostazioni per sostituire le impostazioni predefinite dell'utente all'apertura del documento[26]. Adobe Reader gratuito non può rimuovere queste impostazioni.

Annotazione[modifica | modifica wikitesto]

Adobe Acrobat è un esempio di software proprietario che consente all'utente di annotare, evidenziare e aggiungere note a file PDF già creati. Un'applicazione UNIX disponibile come software gratuito (sotto la GNU General Public License) è PDFedit. Il freeware Foxit Reader, disponibile per Microsoft Windows, macOS e Linux , consente di annotare i documenti. Il visualizzatore PDF-XChange di Tracker Software consente annotazioni senza restrizioni nella sua alternativa freeware. PDF-XChange Viewer di Tracker Software, visualizzatore PDF integrato, abilita anche le annotazioni così come il software open source Skim , con quest'ultimo che supporta l'interazione con LaTeX , SyncTeX e PDFSync e l'integrazione con il software di gestione dei riferimenti BibDesk. Il freeware Qiqqa può creare un rapporto di annotazione che riassume tutte le annotazioni che l'utente ha fatto nella sua libreria di PDF. Lo strumento di verifica del testo esporta le differenze nei documenti come annotazioni e markup.

Esistono anche sistemi di annotazione web che supportano l'annotazione in pdf e altri formati di documenti. Nei casi in cui ci si aspetta che i PDF abbiano tutte le funzionalità dei documenti cartacei, è necessaria l'annotazione dell'inchiostro.

Moduli[modifica | modifica wikitesto]

Moduli interattivi è un meccanismo per aggiungere moduli al formato di file PDF. Attualmente esso supporta due diversi metodi per l'integrazione di dati e moduli PDF[27][28][29][30]. Entrambi i formati oggi coesistono nella specifica PDF:

Esempio di form creabile in PDF
Esempi di moduli creabili in PDF
  • AcroForms (noto anche come moduli Acrobat), introdotto nella specifica del formato PDF 1.2 e incluso in tutte le specifiche PDF successive.
  • Moduli XML Forms Architecture (XFA), introdotti nella specifica del formato PDF 1.5. I moduli Adobe XFA non sono compatibili con AcroForms[31]. XFA è stato deprecato da PDF con PDF 2.0.

Gli AcroForm sono stati introdotti nel formato PDF 1.2. Gli AcroForm consentono l'utilizzo di oggetti (ad esempio caselle di testo, pulsanti di opzione, ecc. ) E del codice ( ad esempio JavaScript ). Oltre ai tipi di azione PDF standard, i moduli interattivi (AcroForms) supportano l'invio, il ripristino e l'importazione dei dati. L'azione "invia" trasmette i nomi e i valori dei campi del modulo interattivo selezionati a un URL (Uniform Resource Locator) specificato. I nomi e i valori dei campi del modulo interattivo possono essere inviati in uno dei seguenti formati (a seconda delle impostazioni dei flag ExportFormat, SubmitPDF e XFDF[32]):

Formato modulo HTML
Specifiche HTML 4.01 a partire da PDF 1.5; HTML 2.0 dalla 1.2
Forms Data Format (FDF)
basato su PDF, utilizza la stessa sintassi e ha essenzialmente la stessa struttura di file, ma è molto più semplice del PDF poiché il corpo di un documento FDF è costituito da un solo oggetto richiesto. Forms Data Format è definito nella specifica PDF (dal PDF 1.2). Il formato dei dati dei moduli può essere utilizzato quando si inviano i dati del modulo a un server, si riceve la risposta e la si incorpora nel modulo interattivo. Può anche essere utilizzato per esportare i dati del modulo in file indipendenti che possono essere reimportati nel modulo interattivo PDF corrispondente.
Formato dati XML Forms (XFDF)
(Specifica esterna del formato dei dati dei moduli XML, versione 2.0; supportato da PDF 1.5; ha sostituito il formato di invio dei moduli "XML" definito in PDF 1.4) la versione XML di Forms Data Format, ma XFDF implementa solo un sottoinsieme di FDF contenente moduli e annotazioni. Alcune voci nel dizionario FDF non hanno equivalenti XFDF, come lo stato, la codifica, JavaScript, le chiavi della pagina, i file PDF incorporati, le differenze e la destinazione. Inoltre, XFDF non consente la generazione, o l'aggiunta, di nuove pagine in base ai dati forniti; come si può fare quando si utilizza un file FDF. La specifica XFDF è referenziata (ma non inclusa) nella specifica PDF 1.5 (e nelle versioni successive). È descritto separatamente in XML Forms Data Format Specification[33]. La specifica PDF 1.4 consentiva l'invio di moduli in formato XML, ma questo è stato sostituito da invii in formato XFDF nella specifica PDF 1.5. XFDF è conforme allo standard XML. XFDF può essere utilizzato allo stesso modo di FDF; ad esempio, i dati del modulo vengono inviati a un server, vengono apportate modifiche, quindi rinviate e i nuovi dati del modulo vengono importati in un modulo interattivo. Può anche essere utilizzato per esportare i dati del modulo in file indipendenti che possono essere reimportati nel modulo interattivo PDF corrispondente. A partire da agosto 2019, XFDF 3.0 è uno standard ISO / IEC con il nome formale ISO 19444-1: 2019 - Gestione documenti - Formato dati moduli XML - Parte 1: Uso di ISO 32000-2 (XFDF 3.0)[34]. Questo standard è un riferimento normativo della ISO 32000-2.
PDF
È possibile inviare l'intero documento anziché singoli campi e valori, come definito nel PDF 1.4.

AcroForms può mantenere i valori dei campi del modulo in file indipendenti esterni contenenti coppie chiave: valore. I file esterni possono utilizzare file Forms Data Format (FDF) e XML Forms Data Format (XFDF). Le firme dei diritti di utilizzo (UR) definiscono i diritti per importare i file di dati del modulo nei formati FDF, XFDF e di testo (CSV / TSV) e esportare i file di dati del modulo nei formati FDF e XFDF[35].

In PDF 1.5, Adobe Systems ha introdotto un formato proprietario per i moduli; Adobe XML Forms Architecture (XFA). I moduli Adobe XFA non sono compatibili con la funzione AcroForms di ISO 32000 e la maggior parte dei processori PDF non gestisce il contenuto XFA. La specifica XFA è referenziata da ISO 32000-1 / PDF 1.7 come specifica proprietaria esterna ed è stata completamente deprecata da PDF con ISO 32000-2 (PDF 2.0).

File InDesign esportato in PDF con livelli visualizzati in Acrobat
File InDesign esportato in PDF con livelli visualizzati in Acrobat
Effetto flipbook
Effetto flipbook

Livelli[modifica | modifica wikitesto]

È possibile visualizzare, navigare e stampare contenuto su più livelli nei PDF creati da software come InDesign, Illustrator, Photoshop, Gimp, Inkscape, AutoCAD[36].

Effetto sfoglia-pagina[modifica | modifica wikitesto]

L'effetto sfoglia-pagina (o "flipbook") dei PDF (online e su Acrobat) consiste in un opuscolo digitale che permette all'utente di sfogliare il documento in modo simile a uno sfogliabile cartaceo[37]. Viene creato in modo automatico tramite appositi software online e non, per la maggior parte a pagamento. Questo effetto si può ottenere anche con HTML5 Canvas e convertire un PDF sfogliabile in Canvas.

Licenza[modifica | modifica wikitesto]

Chiunque può creare applicazioni in grado di leggere e scrivere file PDF senza dover pagare royalty ad Adobe Systems; Adobe detiene i brevetti per PDF, ma li concede in licenza per l'uso gratuito nello sviluppo di software conforme alle sue specifiche PDF[38].

Riconoscimento ottico[modifica | modifica wikitesto]

Con le funzionalità di OCR integrate in programmi quali Microsoft OneNote, PDF-XChange Viewer, Google Keep, è possibile estrarre il contenuto non grafico (testo e tabelle) dalle immagini salvate in formato .pdf. L'autore dei singoli file può tuttavia escludere questa funzionalità.

Tale funzione può essere utile in modo particolare per l'archiviazione di documenti cartacei in formato digitale, che prima vengono sottoposti a scansione, generando un file immagine, che è successivamente analizzato e convertito dall'OCR in un file .txt o .xml[39], a sua volta elaborabile con un programma di videoscrittura o un foglio di calcolo.

Alternative[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: XML Paper Specification.

L'Open XML Paper Specification è un formato concorrente utilizzato sia come linguaggio di descrizione della pagina che come formato nativo dello spooler di stampa per Microsoft Windows a partire da Windows Vista.

SEO[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: Ottimizzazione per i motori di ricerca.

L'ottimizzazione dei documenti in formato PDF prevede alcuni interventi al momento della creazione del file.

Gli elementi più importanti da compilare correttamente ai fini del posizionamento sulle SERP di un documento PDF sono:

  • il nome del file, se è composto da più chiavi utilizzare il trattino per separarle; ad esempio, se il file PDF parla di animali domestici utilizzeremo il seguente nome file: animali-domestici.pdf
  • le proprietà interne al documento: cliccare su "File" – "Proprietà" e compilare necessariamente "Titolo", "Oggetto" (che sarebbe la description), "Autore" (potete mettere il nome del sito) e "Parole chiave".
  • Il titolo all'interno del documento: se il documento non dovesse avere un titolo, sarà Google ad attribuirne uno. Meglio, quindi, indicare il titolo che si vuole dare al documento utilizzando per il font: Verdana, Italico e Centrato.

Per quanto riguarda l'inserimento di un link cliccabile all'interno delle pagine, si noti che un file pdf viene letto da Google come una sorta di pagina web a sé stante e risulta, pertanto, un backlink al proprio sito. L'importante è tematizzare il link, cioè inserire l'esatta pagina di riferimento. Per esempio, se abbiamo un PDF che parla di animali domestici su un portale di animali, sarà meglio inserire il link alla pagina che parla esattamente di quelli domestici.

Note[modifica | modifica wikitesto]

  1. ^ (EN) ISO Ballot for PDF 1.7 Passed!
  2. ^ Adobe vuole trasformare il PDF in uno standard ISO, su macitynet.it.
  3. ^ PDF cerca la benedizione di ISO, su punto-informatico.it.
  4. ^ Copia archiviata, su iso.org. URL consultato il 30 gennaio 2017 (archiviato dall'url originale il 3 marzo 2016).
  5. ^ (EN) How to embed fonts in a PDF document – PDF Studio Knowledge Base, su kbpdfstudio.qoppa.com. URL consultato il 2 febbraio 2021.
  6. ^ a b Copia archiviata (PDF), su iter.it. URL consultato il 25 marzo 2010 (archiviato dall'url originale il 1º giugno 2010). iged.it online 02 2010 - pag. 11
  7. ^ Adobe Systems, PDF Reference, p. 51.
  8. ^ Adobe Systems, PDF Reference, pp. 39–40.
  9. ^ Adobe Developer Connection: PDF Reference and Adobe Extensions to the PDF Specification, Adobe Systems. URL consultato il 13 dicembre 2010.
  10. ^ Aggiungere audio, video e oggetti interattivi ai file PDF in Adobe Acrobat, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
  11. ^ Firmare i PDF in Adobe Acrobat Reader., su helpx.adobe.com. URL consultato il 31 gennaio 2021.
  12. ^ a b support.microsoft.com, https://support.microsoft.com/en-us/help/953195. URL consultato il 18 maggio 2020.
  13. ^ iged.it online 02 2010 (PDF), su iter.it. URL consultato il 25 marzo 2010 (archiviato dall'url originale il 1º giugno 2010).pag. 11 - La norma, composta da circa 290 pagine, è disponibile per l'acquisto presso diversi siti, tra cui: http://www.iso.org; http:// www.ansi.org; http://www.npes.org/standards/orderform.html Archiviato il 17 marzo 2010 in Internet Archive.; Copia archiviata, su aiim.org. URL consultato il 25 marzo 2010 (archiviato dall'url originale il 30 luglio 2010).. Una versione draft della norma è tuttora disponibile all'indirizzo Copia archiviata (DOC), su aiim.org. URL consultato il 28 marzo 2016 (archiviato dall'url originale l'11 dicembre 2006)..
  14. ^ iged.it online 02 2010 (PDF), su iter.it. URL consultato il 25 marzo 2010 (archiviato dall'url originale il 1º giugno 2010).pag. 18
  15. ^ Visualizzazione di modelli 3D nei file PDF, Adobe Acrobat, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
  16. ^ Misurazione di oggetti 3D nei file PDF, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
  17. ^ (EN) Sharing blender models as interactive 3D PDF files, su Blender Artists Community, 14 aprile 2010. URL consultato il 31 gennaio 2021.
  18. ^ (EN) smallpdf.com, Unlock PDF – Free Online PDF Password Remover, su Unlock PDF – Free Online PDF Password Remover. URL consultato il 31 gennaio 2021.
  19. ^ (EN) Unlock PDF - Free PDF Password Remover Online, su Soda PDF. URL consultato il 31 gennaio 2021.
  20. ^ Pseudo stampante: quando il programma viene installato nel computer, compare come una stampante. Selezionandolo in fase di stampa non si ottiene fisicamente una stampa ma un file in formato PDF che può essere salvato come un qualsiasi altro file nella cartella che si sceglie.
  21. ^ (EN) pdfforge GmbH, pdfforge | The free PDF Creator, Converter and PDF Editor, su www.pdfforge.org. URL consultato il 28 agosto 2018.
  22. ^ ilovepdf.com, iLovePDF | Strumenti PDF online gratuiti, su iLovePDF - Strumenti online per PDF. URL consultato il 29 gennaio 2021.
  23. ^ PDF editor Online facile da usare, su Sejda.com - We help with your PDF tasks. URL consultato il 29 gennaio 2021.
  24. ^ smallpdf.com, Modificare PDF - Modifica PDF gratis direttamente dal browser, su Modificare PDF - Modifica PDF gratis direttamente dal browser. URL consultato il 29 gennaio 2021.
  25. ^ Adobe PDF reference version 1.7, section 10.2
  26. ^ Getting Familiar with Adobe Reader > Understanding Preferences, su adobepress.com. URL consultato il 22 aprile 2009.
  27. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part 1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
  28. ^ Gnu PDF – PDF Knowledge – Forms Data Format, su gnupdf.org. URL consultato il 19 febbraio 2010 (archiviato dall'url originale il 1º gennaio 2013).
  29. ^ About PDF forms, su livedocs.adobe.com. URL consultato il 19 febbraio 2010 (archiviato dall'url originale il 29 aprile 2011).
  30. ^ Peter Demling, Convert XFA Form to AcroForm?, su forums.adobe.com, 1º luglio 2008. URL consultato il 19 febbraio 2010.
  31. ^ Migrating from Adobe Acrobat forms to XML forms, su partners.adobe.com. URL consultato il 22 febbraio 2010 (archiviato dall'url originale il 6 ottobre 2010).
  32. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part 1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
  33. ^ XML Forms Data Format Specification, version 2 (PDF), September 2007. URL consultato il 19 febbraio 2010 (archiviato dall'url originale il 30 luglio 2018).
  34. ^ ISO 19444-1:2019(en), su www.iso.org. URL consultato il 3 dicembre 2020.
  35. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part 1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
  36. ^ Livelli PDF, Adobe Acrobat, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
  37. ^ Free Adobe Flipbook Maker for PDF Magazines and Brochures | Flipbuilder.com, su www.flipbuilder.com. URL consultato il 31 gennaio 2021.
  38. ^ Developer Resources, su adobe.com (archiviato dall'url originale il 27 febbraio 2016).
  39. ^ OCR da PDF, come estrarre il testo in poche mosse, su ilsoftware.it, 15 luglio 2015 (archiviato il 21 luglio 2015).

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autoritàLCCN (ENsh00002670 · GND (DE4523240-4