07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
1
Mehr als nur scharfe Aufnahmen:Bildformate verstehen und für die richtige Verwendung inDigitalisierungsprojekten auswählenGoobi Tag, 13.09.2016
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
2
Einleitung
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
3
Fagestellungen
● Welche Bildformate werden im Digitalisierungsworkflow erzeugt, und zu welchem Zweck?
● Gibt es sinnvolle Alternativen?● Was ist Jpeg2000 und welche Rolle kann es in der
Digitalisierung spielen?● Wie biete ich effektiv Bildinhalte in einer
Präsentationsoberfläche an?
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
4
Übersicht● Übersicht über die wichtigsten Bildformate
– TIFF– PNG– JPEG– JPEG2000
● Das Bild im Digitalisierungsworkflow– Archvierung– Texterkennung– Präsentation
● Bildformate im Vergleich– Datenkompression– Zugriffsgeschwindigkeit
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
5
Übersicht über die wichtigsten Bildformate
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
6
TIFF (Tagged Image File Format) - Baseline● Verbreitetes, bewährtes Format● Spezifikation unter Adobe-Copyright, aber viele quelloffene Implementierungen
● Schneller Zugriff● Der TIFF-Standard ist komplex (erlaubt z.B. verschiedene Kompressionsmethoden)
● Keine oder nur minimale Kompression in der Baseline-Spezifikation
● Nicht für die Anzeige in Web-Browsern geeignet● Unterstützt viele Farbräume und Farbprofile
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
7
TIFF (Tagged Image File Format) – LZW-Kompression● LZW ist die in GIF verwendete Kompression (ehemals patentgeschützt)
● Verlustfreite Kompression● Geringe Kompressionsrate● Langsamer Zugriff
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
8
TIFF (Tagged Image File Format) JPEG-Kompression
● Bilddaten sind mit der Jpeg-Kompression (DCT) komprimiert
● Gute, aber verlustbehaftete Kompression● Kein Jpeg!
– Teilt nicht die Einschränkungen des Jpeg-Formates, z.B Alpha-Kanal erlaubt
– Etwas größer als ein vergleichbares Jpeg– Andere Ladezeiten als ein Jpeg– Tiff Metadaten-Format
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
9
PNG (Portable Networks Graphics)
● Offenes, einfaches Format● Verlustfreie Kompression● Geringe Kompressionsrate bei typischen Scans
– Gute Kompression bei bitonalen Bildern● Kann direkt im Browser angezeigt werden● Sehr langsamer Zugriff● Eigenes Metadatenformat (nicht Exif oder IPTC)● Unterstützt nicht alle Farbräume (kein CMYK)
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
10
JPEG/JFIF (JPEG File Interchange Format)
● Sehr verbreitetes, inzwischen patentfreies Format● Der JPEG-Standard definiert verschiedene
Kompressionsmethoden, auch verlustfreie. Unterstützt wird jedoch in der Regel die verlustbehaftete DCT-Kompression
● Gute Kompressionsrate für typische Fotos oder Scans
● Kann direkt im Browser angezeigt werden● Schneller Zugriff● Unterstützt keinen Alpha-Kanal (Transparenz)● Begrenzte Farbtiefe
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
11
JPEG2000 – Part 1 (JP2)
● JPEG2000 ist ein Coding-Standard, der verschiedene Bild- und Viedoformate unterstützt.– JP2: Basis-Bildformat: Sollte keine
gebührenpflichtigen Patente beinhalten– JPX: Erweitertes Bildformat– MJ2: Videoformat– JP3D: 3D-Bildformat– JPM: Format für Bildgruppen
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
12
JPEG2000 – Part 1(JP2)
Vorteile● Hohe Kompressionsrate bei geringen
optischen Verlusten● Möglichkeit für verlustfreie
Kompression● Mehrere Qualitäts- und
Auflösungsebenen für schnellen Zugriff
● Bessere Fehlerbeständigkeit als JPEG oder TIFF
● Große Farbtiefe● Keine Größenbeschränkung● Erweiterte Kodierungsoptionen, z.B.
– Höherauflösende Regionen– Verschiedene Kompressionsmodi
für optimierten Zugriff oder bessere Bildqualität
Nachteile● Künftige Patentansprüche
können nicht ausgeschlossen werden
● Aufwändige Komprimierung und Dekomprimierung
● Geringe Softwareunterstützung
● Feine Unterschiede in der Implementierung des Standards
● Limitierte Unterstützung für Farbprofile
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
13
Das Bild im Digitalisierungsworkflow
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
14
Das Bild im Digitalisierungsworkflow
Physisches Objekt
Rohbild aus Scanner
Archivierung OCR Präsentation
Nachbearbeitung
Kompression
Kompression?
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
15
Archivierung: Was brauchen wir?
● Geringer Speicherbedarf– Kompression
● Originalgetreue Wiedergabe des Objektes– Unkomprimiertes Scannerbild– Oder komprimiertes Bild ohne optische Verluste
● Langlebigkeit– Verbreitetes und offenes Datenformat– Fehlerbeständigkeit (Resistenz gegen
Pixelfehler)
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
16
Archivierung: Lossless oder ‚visually lossless‘?Datenverlust im Digitalisierungsvorgang
Physisches Objekt
Internes Scannerbild
Ausgeliefertes Bild
Kompression?
Speicherung
Da
ten
verlu
st Spezielles, proprietäres Format des Scannerherstellers
Raw-TIFF
JP2?
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
17
Archivierung: Lossless oder ‚visually lossless‘?Optischer Qualitätsverlust bei Kompression
Original: TIFF – unkomprimiert
JPEG: Qualität 80% (1:8.6) Qualität 30% (1:14.7)
JP2: 1:8 1:15
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
18
Archivierung: Lossless oder ‚visually lossless‘?Auf welche Information kann ich verzichten?● JPEG und JPEG2000 werden im Frequenzraum komprimiert● Es werden also keine Bildpunkte ausgelassen sondern
Frequenzbereiche● Aber: Höhere Kompression können Artefakte erzeugen
Quelle: [7]
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
19
OCR: Was brauchen wir?
● Geringes Datenvolumen– Daten werden mehrfach über Internetverbindungen
verschickt und auf externen Servern zwischengespeichert
– Komprimierte Bilder● Korrekte Angabe der Bildauflösung (dpi)
– Zu geringe Auflösung führt zu mehrfach berechneten OCR-Seiten
– Zu große Auflösung kann zu schlechter Schrifterkennung führen
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
20
Presentation: Was brauchen wir?
● Hinreichend gute Qualität für die Browserdarstellung– Bilder dürfen komprimiert sein. Die benötigte Qualität richtet
sich nach der Darstellung im Browser– Browser unterstützen nur bestimmte Bildformate: Bitmap, Png,
Jpeg, Gif● Schnelle Auslieferung der Daten
– Schnell lesbares Dateiformat – keine Aufwändige Dekomprimierung
– Geringes Datenvolumen– Caching
● Geringer Speicherverbrauch– Komprimierung– Geringere Auflösung
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
21
Präsentation: Wie kommt das Bild zum Betrachter?
Auslieferung eines Bildes an einen Internet-Browser
●als Bildpyramide●als Originalbild●als gekacheltes Bild
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
22
Ausliefern einer Bildpyramide
Dateisystem
Verkleinern
Browser
WWW
Format-Konvertierung
Content-Server
TIFF
JPEG
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
23
Ausliefern des originalen Datenstroms
Dateisystem
Browser
WWW
Content-Server
PNG
PNG
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
24
Ausliefern eines gekachelten Bildes
Dateisystem
Verkleinern
Browser
WWW
Format-Konvertierung
Content-Server
TIFF
Ausschneiden
JPEG
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
25
Bildformate im Vergleich
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
26
Größenverhältnisse der Formate
TIFF-Raw TIFF-LZW PNG JP2 (lossless) TIFF-JPEG (92%) JPEG (92%) JP2 (1:20)0
10
20
30
40
50
60
RGB
Grayscale
Bitonal
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
27
Auslieferungszeit von Bildern:Vollständige Farbbilder – niedrige Auflösung
TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20
1
2
3
4
5
6
7
8
9
10
Karte/w=500px
Karte/w=500px/Subsampling
Lad
ezei
t [s]
TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Buch/w=500px
Buch/w=500px/Subsampling
Lad
ezei
t [s]
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
28
Auslieferungszeit von Bildern:Vollständige Farbbilder – hohe Auflösung
TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
Buch/w=3000px
Buch/w=3000px/SubsamplingLad
ezei
t [s]
TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20
2
4
6
8
10
12
14
16
18
20
Karte/w=3000px
Karte/w=3000px/Subsampling
Lad
ezei
t [s]
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
29
Auslieferungszeit von Bildern:Vollständige schwarz/weiß Bilder
TIFF-raw TIFF-LZW PNG JPEG0
0.05
0.1
0.15
0.2
0.25
0.3
Buch/w=3000px
Buch/w=3000px/Subsampling
Lad
ezei
t [s]
TIFF-raw TIFF-LZW PNG JPEG0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Buch/w=500px
Buch/w=500px/Subsampling
Lad
ezei
t [s]
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
30
Auslieferungszeit von Bildern:Farbbilder – Kacheln
TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
512x512px/1:1
4096x4096px/1:8
Lad
ezei
t [s]
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
31
SubsamplingZum schnelleren Lesen einer Datei werden in regelmäßigen Abständen Pixel übersprungen→ erhebliche Zeitersparnis beim Einlesen und Skalieren→ Erzeugt deutliche Artefakte
Quelle: Die digitale Landesbibliothek Oberösterreich, http://digi.landesbibliothek.at/viewer/
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
32
Fazit
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
33
Archivierung: Perspektiven für Jpeg2000 und mögliche Alternativen
● TIFF bleibt das verlässlichste Archivierungsformat, wenn Speicherbeschränkung keine wesentliche Rolle spielt
● Jpeg2000 bietet effektive Möglichkeiten– Zur Datenkompression– Zum Datenzugriff
● Jpeg2000 hat wesentliche Einschränkungen– Mangel an verlässlichen offenen Implementierungen– Komplexität des Standards und der Implementierung
● Ist verlustbehaftete Kompression eine Alternative bei teurem Speicherplatz in der Langzeitarchivierung?
● PNG bietet ein offenes und verbreitetes Format mit verlustfreier Kompression. Ist dies eine Alternative zum unkomprimierten TIFF?
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
34
Präsentation: Die Inhalte bestimmen das geeignete Format
● TIFF/JPEG bietet insgesamt den besten Zugriff auf Inhalte● JPEG oder PNG können als schnelle Darstellungsformate für
bestimmte Inhalte dienen– Bitonale Bilder: PNG– Thumbnails: JPEG
● Techniken wie Kachelung und Subsampling können die Zugriff auf Inhalte beschleunigen
● Jpeg2000 bietet großes Potential für– Datenkompression– Zugriffsgeschwindigkeit– Bildqualität
● Aktuelle offene Implementierungen können dieses Potential noch nicht effektiv nutzen
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
35
Fragen/Bemerkungen?
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
36
Danke :)
07.1
0.20
15Ja
n Vo
nde,
intr
anda
Gm
bH
37
Quellen1) Adobe: Developer/TIFF
http://partners.adobe.com/public/developer/tiff/index.html2) Aware Systems: TIFF, Tag Image File Format, FAQ
http://www.awaresystems.be/imaging/tiff/faq.html3) Aleks Jakulin: Baseline JPEG and JPEG2000 Artifacts Illustrated
http://www.stat.columbia.edu/~jakulin/jpeg/artifacts.htm4) Johan van der Knijff: Ensuring the suitability of JPEG 2000 for preservation, 2010
http://blog.wellcomelibrary.org/2010/12/guest-post-ensuring-the-suitability-of-jpeg-2000-for-preservation/5) Johan van der Knijff: ICC profiles and resolution in JP2: update on 2011 D-Lib paper, 2013
http://openpreservation.org/blog/2013/07/01/icc-profiles-and-resolution-jp2-update-2011-d-lib-paper/6) Joint Photographic Experts Group: Overview of JPEG 2000
https://jpeg.org/jpeg2000/index.html7) Paolo Buonora/Franco Liberati: A Format for Digital Preservation of Images - A Study on JPEG 2000
File Robustnesshttp://www.dlib.org/dlib/july08/buonora/07buonora.html
8) Joint Photographic Experts Group: Overview of JPEGhttp://jpeg.org/jpeg/
9) Eric Hamilton: JPEG File Interchange Format, 1992http://www.w3.org/Graphics/JPEG/jfif3.pdf
10)Wikipedia: Portable Network Graphicshttp://en.wikipedia.org/wiki/Portable_Network_Graphics