[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico] [home] [volume] [parte]


Capitolo 752.   Contenitori e contenuti

Per tradizione, i nomi dei file seguono la regola per cui l'estensione del nome serve a determinare il tipo del contenuto. Tuttavia, questa pratica è insufficiente e inattendibile, pertanto, i file con cui l'utente medio ha a che fare quotidianamente, contengono informazioni aggiuntive rispetto a quelle apparenti, che servono principalmente per automatizzarne la procedura di riconoscimento.

Sono pochi i file che non dispongono di tali informazioni; a questi tipi si fa riferimento generalmente con il termine di «formato grezzo». Tra tutti, il formato «grezzo» più importante è il testo puro, ma capita di utilizzare anche formati grezzi per rappresentare immagini, audio e video. In ogni caso, per accedere a tali dati, occorre conoscerne esattamente le caratteristiche, perché i programmi non possono stimarle (per esempio, nel caso del testo puro, bisogna conoscere la codifica, perché questa informazione non è determinabile, se si tralascia l'ipotesi di un'analisi statistica).

752.1   Impronta

Quando non si tratta di formati di file grezzi, si utilizza normalmente una sigla di riconoscimento, nota nei sistemi Unix come magic number, collocata in una posizione prestabilita, di solito all'inizio del file. Con questa sigla si determina il tipo di file con cui si ha a che fare. È così che funziona il programma file che comunque nei sistemi GNU non si limita all'analisi del solo magic number:

file xxx.*[Enter]

xxx.jpg:  JPEG image data, JFIF standard 1.01
xxx.html: HTML document text
xxx.midi: Standard MIDI data (format 1) using 2 tracks at 1/384

A titolo di esempio, un file JPG, contiene la sigla «JFIF» tra il settimo e il decimo byte; nello stesso modo, un file PNG contiene la sigla «PNG», tra il secondo e il quarto byte. Nelle figure successive vengono mostrati alcuni esempi; si tenga conto che ogni carattere rappresentato individua esattamente un byte.

Figura 752.2. Impronta di un file JPG.

......JFIF......................................
C................................... $.' ",#..(7
...
...

Figura 752.3. Impronta di un file PNG.

.PNG........IHDR...^...U........E....bKGD.......
.......pHYs.................tIME.....$...QG....t
...
...

Figura 752.4. Impronta di un file GIF (versione «89a»).

GIF89a^.U..P...........................". ..%  .
."."!".&&&/-2)0)/400-/1+212.665:A9?C@B;BAA?FFFJQ
...
...

Figura 752.5. Impronta di un file PDF (versione «1.4»).

%PDF-1.4
...
...

Figura 752.6. Impronta di un file ZIP (archivio compresso).

PK........5.o5................LogicSim/UT...&E[E
...
...

752.2   Intestazioni

Quando un formato di file prevede l'inserimento di informazioni aggiuntive, spesso queste trovano posto all'interno di intestazioni, ovvero nella parte iniziale del file. Per esempio, un file HTML divide il proprio contenuto proprio tra gli elementi HEAD e BODY, dove nel primo trovano posto tante informazioni che non vengono visualizzate in condizioni normali.

Il mettere le informazioni sul contenuto del file nella parte iniziale consente ai programmi che si interessano di accedere a queste di leggere velocemente solo quella porzione, quando le condizioni particolari di accesso al file consentono esclusivamente una lettura sequenziale.

Figura 752.7. Esempio di un file JPG, che nella sua parte iniziale contiene un commento, oltre ad altre informazioni espresse in forma numerica binaria, non distinguibili nella figura.

......JFIF..............Created with The GIMP...
C................................... $.' ",#..(7
),01444.'9=82<.342...C...........2!.!22222222222
...
...

752.3   Etichette

Succede spesso che i formati di certi file siano stati progettati poco prudentemente, senza pensare alla necessità di aggiungere certe informazioni particolari. In quei casi, se le informazioni iniziali di questi file consentono comunque di determinare la collocazione dei contenuti previsti originariamente, capita che vengano definite delle estensioni, per le quali si aggiungono delle informazioni in coda al formato preesistente, come se si trattasse di etichette appiccicate.

Questa tecnica, quando viene usata, serve a consentire la lettura e l'interpretazione di questi file anche a programmi che non possono essere a conoscenza di nuove estensioni del formato, pur rimanendo la possibilità che in alcuni casi si manifestino dei problemi di compatibilità.

752.4   Involucri

A volte, i formati dei file non rappresentano il modo in cui le informazioni salienti di questi sono state codificate, ma solo la forma esteriore di contenerli. Ciò succede normalmente con i formati audio-visuali, dove un certo contenitore esterno può avvolgere formati video e audio abbastanza differenti.

A titolo di esempio, il formato Ogg è un contenitore progettato per dati audio-visuali e testuali, secondo varie codifiche. Spesso viene usato per contenere solo sequenze audio in formato Vorbis, ma non si limita necessariamente a questo.

752.5   Exif

Exif sta per Exchangeable image file format e definisce uno standard per l'introduzione di informazioni addizionali in alcuni formati di immagini digitali. Lo scopo principale è quello di consentire alle macchine fotografiche di annotare automaticamente tutte le informazioni salienti sullo scatto che si esegue.

Figura 752.8. Esempio di informazioni contenute all'interno di un'immagine JPG, secondo lo standard Exif.

Manufacturer        FUJIFILM                                                  
Model               FinePix A205S                                             
Orientation         top - left                                                
x-Resolution        72.00                                                     
y-Resolution        72.00                                                     
Resolution Unit     Inch                                                      
Software            Digital Camera FinePix A205S  Ver1.00                     
Date and Time       2004:08:07 21:24:52                                       
YCbCr Positioning   co-sited                                                  
Copyright           [None] (Photographer) -  (Editor)                         
Compression         JPEG compression                                          
Orientation         top - left                                                
x-Resolution        72.00                                                     
y-Resolution        72.00                                                     
Resolution Unit     Inch                                                      
YCbCr Positioning   co-sited                                                  
Exposure Time       1/2 sec.                                                  
FNumber             f/4.8                                                     
ExposureProgram     Normal program                                            
ISO Speed Ratings   200                                                       
Exif Version        Exif Version 2.2                                          
Date and Time       2004:08:07 21:24:52                                       
Shutter speed       120/100 sec. (APEX: 1)                                    
Aperture            f/4.8                                                     
Brightness          -148/100                                                  
Exposure Bias       0.0                                                       
MaxApertureValue    3.20                                                      
Metering Mode       Pattern                                                   
Light Source        0                                                         
Flash               Flash did not fire, compulsatory flash mode.              
Focal Length        16.5 mm                                                   
Maker Note          286 bytes unknown data                                    
FlashPixVersion     FlashPix Version 1.0                                      
Color Space         sRGB                                                      
PixelXDimension     1600                                                      
PixelYDimension     1200                                                      

752.6   ID3

La sigla ID3 individua lo standard per l'inserimento di informazioni addizionali nei file audio MP3. Attraverso l'uso di «etichette» (tag) ID3 è possibile incorporare nei file le informazioni sull'autore, il titolo e altri dati affini.

Figura 752.9. Esempio di informazioni contenute all'interno di un file MP3, secondo lo standard ID3.

Title:   BWV 1041 / I. Allegro          Track: 1
Artist:  Lara St. John
Album:   Bach Violin Concertos          Year:  2001
Comment: From www.magnatune.com         Genre: Classical [32]

752.7   Riferimenti


Appunti di informatica libera 2008 --- Copyright © 2000-2008 Daniele Giacomini -- <appunti2 (ad) gmail·com>


Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome contenitori_e_contenuti.htm

[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico] [home]

Valid ISO-HTML!

CSS validator!

Gjlg Metamotore e Web Directory