Bilder aus der Deutschen Fotothek abfassen

Bild- und Kartenmaterialien sächsischer Archive sind in der Deutschen Fotothek der Sächsischen Landes- und Staatsbibliothek digitalisiert. Diese zentrale Zugriffsmöglichkeit ist ein entscheidender Schritt in Richtung offener Archive im Sinne der OpenData-Bewegung. Der Vorteil besteht vor allem in der Suche anhand von Metadaten.
Ärgerlich ist es nur dann, wenn man keinen uneingeschränkten Zugriff auf die Materialien erhält. Im Falle einiger historischer Karten ist dies der Fall. Man kann sie auf der Seite der SLUB nur durch ein kleines Fenster einer Flash-Applikation betrachten und nicht download.
Im folgenden Tutorial zeige ich, wie man an die Rohdaten gelangt und sie zu einem Gesamtbild zusammen fügt.

Für den folgenden Dreischritt benötigt man folgende Tools:

  • Firefox und das AddOn FireBug
  • wget als Kommandozeilen-Graber für diverse Webseiten und Daten im Netz
  • montage als Bestandteil der ImageMagick-Bibliothek

Wählen wir diese Flurkarte von Schlauroth als Beispiel.

1. URL der Rohdaten identifizieren
Dazu startet man FireBug (Rechtsklick >> Element mit Firebug untersuchen). Im Quelltext (oder via select) sucht man das Element  ‘<object id=”theMovie” …’. Darin enthalten ist ein <embed>, welches widerum mehre <parameter> beinhaltet. Gesucht ist der Parameter:
<param name="FlashVars" value="zoomifyImagePath=http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/" />
Daraus entnehmen wir uns die URL.

2. Rohdaten downloaden
Beim Öffnen der URL erwarten einen in dem Fall zwei Ordner mit 500 Bildausschnitten, die zusammen die gesuchte Flurkarten in fünf verschiedenen Vergrößerungsstufen ergeben. Uns interessieren die Ausschnitte mit dem größten Detailgrad “5-0-1.jpg” bis “5-20-16.jpg”. Per Copy Paste der beiden Ordnerseiten sowie einigen Ersetzungsoperationen entsteht eine Textdatei, in der zeilenweise alle Bild-URLs stehen:
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-0.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-1.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-2.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-3.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-4.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-0-5.jpg
http://fotothek.slub-dresden.de/zooms/gr/olb/0000000/gr_olb_0000040/TileGroup0/5-1-0.jpg
...

Mit dieser Textdatei kann man wget füttern und alle 500 Bilder lokal verzeichnen.
wget -i bildliste.txt

3. Rohadten zum Bild zusammenfügen
Dazu gilt es die Bilder zunächst zu betarchten und heraus zufinden, aus wievielen Zeile und Spalten sie bestehen. In dem Falls sind es 20 Zeilen und 16 Spalten.

Spalten bilden:
for (i=0, i < 20, i++){
montage -geometry +0+0 -tile 1x20 5-$i-*.jpg 00_fin_$i.jpg
}

Spalten zusammenfügen:
montage -geometry +0+0 -tile 21x1 00_fin_*.jpg 00_final.jpg

Am Ende bekommt man ein 5234 x 4183 Pixel großes Bild.

Feine Links

geocoding
Unter diesem Begriff verbirgt sich der Versuch real existierende Orte auf der Welt mit ortsspezifischen Informationen zu verknuepfen (geonames, exploreOurPlanet). Neben Satelitenbildern und Karten diverser Anbieter, werden die Koordinaten der Orte mit einer Vielzahl von Daten kombiniert, z.B.: Wetter, Hotels, Geschichte, andere Ortsbezeichnungen, Nachrichten, Google-Ergebnisse, Wikipedia-Eintraege je Sprache, …. Darueber hinaus werden die Orte ganz klassisch geografisch klassifiziert (Stadt, Fluss, Berg, Park, Strasse, Wald, …). Es ist ueberraschend, wie viele Orte gelisted sind. Das Beste ist: man kann selbst dazu beistragen das Angebot zu verbessern. Der Idee eines autonomen Reiseagentens, im Sinne des Semantic Webs, ist man damit schon ein Stueck naeher gekommen.

filesfrom
Wenn das Postfach vor lauter Attachments ueberquillt oder die 10MB Bilddatei gar nicht erst versendet werden kann, weil der billige E-Mail-Account das nicht zulaesst, dann hilft filestrom. Eine simple Webseite auf welcher man Datein hochladen kann, deren Download-Link im Anschluss an die angegebenen Mailadresse versendet wird. Eine prima Loesung – vor allem, weil man sich nicht registrieren muss. Allerdings wuerde ich keine sensiblen und Daten auf dieser Weise verschicken ohne sie zu verschlüsseln. Dennoch glaube ich nicht, dass jener non-profit Betreiber beabsichtigt die E-Mail-Adressen zu verkaufen.

bestsharing
Wer keinen eigenen Webserver betreibt oder ueber aussergewoehnlich grossen Speicherplatz im Netz verfuegt, dem sei bestsharing empfohlen: Unbegrenzt viele Uploads, keine Registrierung, gespeichert “fuer immer”, wobei dies mittlerweile zwei Tage sind.
Ich habe kuerzlich mal zwei alte Radiosendungen (1, 2) hochgeladen, die nun aber doch gelöscht wurden.

Zum verschicken größerer Dateien empfiehlt sich ebenso das Firefox AddOn AllPeers. Es handelt sich dabei um ein Bittorrent-Client, der den privaten Dateiaustausch unter freunden ermöglicht.

power cast
Strom ohne Kabel und ohne Batterie? Zumindest fuer kleine Geraete gibt es Ende des Jahres eine marktreife Loesung geben, so dass man beispielsweise einen Laptop oder einen mp3-Player ohne Kabel aufladen kann. Ebenso interessant ist power cast fuer drahtlose Sensornetzwerke, deren Lebenszyklus bisher von der Laufzeit der angefuegten Batterien abhing. Vielleicht lassen sich auf diese Weise aber auch unsere Throwies betreiben.

Mahalo
Das Wort ist hawaianisch und bedeutet Danke. Aehnlich wie Yahoo in den 90er Jahren findet man unter Mahalo einen “user generated web catalog”, also ein Verzeichnis von qualitativ hochwertigen und handverlesenen Webseiten. Mahalo bedient sich dabei bestehender Verzeichnisse bei Wikipedia und diverser Social-Bookmarking Verzeichnisse, wie del.ico.us. Angesichts der Tatsache, dass Google und Yahoo zunehms durch Werbung und irrefuehrende Artikel zugemuellt wird, ist dieser Ansatz durchaus wieder aussichtsreich. Im Moment gibt es jedoch nur 4000 Suchbegriffe, allerdings wird alternativ auch das Google-Suchergebnis dargestellt.