Umzug von MyHeritage zu webtrees

MyHeritage ist ein interessanter Provider, der mehr bietet, als nur Stammbäume zu pflegen. Der Preis ist aber hoch - wortwörtlich und im übertragenen Sinne. Aus verständlichem Geschäftsinteresse sollen Anwender möglichst auf der Plattform verbleiben und nicht abwandern. Zum inhärenten Leistungsversprechen, das Anwender in Sicherheit wiegt, gehört jedoch, dass ein Export der Daten, und damit implizit auch der Wechsel der Plattform, möglich ist. Und tatsächlich - in der Stammbaumverwaltung existiert eine Möglichkeit zum Export der genealogischen Daten als GEDCOM-Datei.

Manchmal kommt aber der Moment, wo man den Abo-Preis nicht mehr zahlen will oder kann. Dann bietet sich es z.B. an, die Daten auf einem eigenen Server im Internet mithilfe von webtrees zu präsentieren.

Aber wie so oft - der Teufel liegt im Detail und eine einfache Migration zu einer anderen Plattform erscheint mir für den Normalanwender fast unmöglich. 

Nachfolgend beschreibe ich, wie der Umzug von MyHeritage zu webtrees dennoch gelingt. Das Verfahren ist nicht auf die Zielplattform webtrees beschränkt, sondern sollte überall anwendbar sein, wo ein Import von GEDCOM-Dateien möglich ist. Eigene Erfahrungen können gern in den Kommentaren ergänzt werden.

Der eingangs dargestellte Export-Dialog suggeriert bei flüchtiger Betrachtung, dass bei einem Export sowohl die Daten als auch die Fotos bereitgestellt werden. Weiter gedacht legt das beruhigend die Schlussfolgerung nahe, dass danach sowohl die GEDCOM-Datei als auch auch die Fotos zur weiteren Verwendung -  beispielsweise für einen Re-Import auf einer anderen Plattform oder einer anderen Anwendung - vorliegen.

Datenexport bei MyHeritage 

Für den von MyHeritage vorgesehenen Datenexport existieren zwei Möglichkeiten ...

Meine Beschreibung bezieht sich auf den Export von der Webseite.

Tücken des Datenexports

Die Bezeichnung der Export-Optionen mit...

  • Persönliche Fotos exportieren und
  • Stammbaum-Fotoalbum exportieren

...sind gelinde gesagt irreführend, da nahegelegt wird, dass danach die Fotos und Alben physisch, als Dateien oder ZIP-Archiv zur Verfügung stehen. Dem ist mitnichten so. Ehrenhalber muss man zugestehen, dass der aufmerksame Nutzer von MyHeritage darüber auch aufgeklärt wird - es gibt einen entsprechenden Hilfe-Artikel.

Dort wird ganz klar darauf hingewiesen:

Eine GEDCOM-Datei ist eine Textdatei und enthält nicht die tatsächlichen Fotos. Sie kann aber Links enthalten, die auf den Speicherort der Fotos auf Ihrem Computer oder der Familienseite verweisen

Quelle: MyHertiage

Nun, das ist ja schon mal ein Anfang, der immer noch hoffnungsfroh stimmen könnte - wenn...

  • die Fotos auf anderem Wege einfach exportiert werden könnten
  • und die Referenzen in der GEDCOM-Datei mit den Datensätzen so korrelieren, dass sie einerseits beim Import in ein anderes System (hier webtrees) korrekt den jeweiligen Datensätzen zugeordnet werden und die Bezeichnungen mit denen unter MyHertiage übereinstimmen.

Dem ist leider nicht so. Schauen wir es uns näher an.

Fotos exportieren

Um es kurz zu sagen - ich habe keine Möglichkeit gefunden, die Fotos direkt "in einem Rutsch" aus der Fotoverwaltung zu exportieren. Man müsste jedes Foto einzeln anwählen und dann auch im normalen Browserdialog abspeichern. Das zieht zwei Probleme nach sich: bei mehr als 10 Fotos wird das beliebig mühsam; und viel wichtiger noch, die Dateibezeichungen korrespondieren nicht mit jenen, die als Referenz in der GEDCOM-Datei erhalten sind. Das führt dann zu einem schwerwiegenderem Problem...

Systembedingt muss jede Plattform eine eineindeutige Referenz zwischen einem Datensatz (z.B. einer Person, einem Ergebnis oder einer Quelle) und einem illustrierendem Foto, oder einem Foto und mehreren Datensätzen (wenn das gleiche Foto mehrfach zugeordnet ist) besitzen. Deshalb vergeben praktisch alle datenbankbasierten Systeme einem Foto eine unique Dateibezeichung, die von der ursprünglichen abweicht und nicht doppelt vorkommt. Aus "Oma Anna.jpg" wird systemintern bspw. "P162_2136_2848.jpg". Fotos mit der Bezeichnung "Oma Anna.jpg" werden von verschiedenen Anwendern in verschiedenen Stammbäumen sicher zig-fach hochgeladen. Also benötigt das System Dateinamen, die sich gegenseitig nicht ins Gehege kommen und Fehlzuordnungen vermeiden helfen. Das System weiß aber, dass die Bezeichnung im Stammbaum "Oma Anna" lauten soll, weil es den intern vergebenen Dateinamen "P162_2136_2848.jpgdieser Bezeichnung zuordnet. Dann ist es auch kein Problem, dem Anwender die Möglichkeit zu geben, die Foto-Bezeichung in "Oma Anna mit Hut" zu ändern, ohne das der Dateiname geändert werden muss. Konsequenterweise werden als Referenz in der GEDCOM-Datei diese internen Dateinamen auftauchen - eine reverse Dateiumbenennung in die Bezeichnung an der Web-Oberfläche erfolgt nicht.

Was nutzen uns aber Referenzen, die auf eine Datenbank bei MyHeritage verweisen und kryptische Namen tragen, wenn wir ohne MyHeritige auskommen wollen?

Wir benötigen...

  • Fotos mit Datenamen, die in der die GEDOM-Referenz enthalten sind, aber nicht auf MyHeritage verweisen!
  • Und wir brauchen überhaupt erst einmal alle Fotos - mit vertretbarem Aufwand heruntergeladen.

Wir benutzen dazu einen Trick, oder neudeutsch "workaround".

Sehr versteckt besteht nämlich auch bei MyHeritage die Möglichkeit, alle Fotos am Stück und mit sauberer Referenz in der GEDCOM-Datei zu beziehen. Dazu bedienen wir uns aus dem Backup des Stammbaumes. Unter dem Menü "Stammbaum" existiert ein Untermenü "Datensicherung" 

Dort wählen wir eine aktuelle Sicherung aus. 

Nach dem Aufruf erhalten wir einen Link zur Datensicherung auf einem Server aus dem AMAZON-Cloud-Dienst AWS. Er enthält neben dem Download-Link einen einmalig zu verwendenden Code zu Autorisierung des Downloads.

​Der Download-Link bietet nun auch im Paket alle Fotos an. Leider weisen die wiederum zwei Nachteile auf:

  • die Dateinamen haben sich erneut geändert und haben nun nichts mehr mit denen in MyHeritage und den mit Family Tree Builder lokal gespeicherten gemeinsam
  • in der GEDCOM-Datei verweisen die Referenzen auf den Speicherort auf dem Cloud-Server von Amazon - zu allem Überfluss in verschiedenen Unterverzeichnissen.
2 FILE http://mhbackups.s3.amazonaws.com/site12345678/7gki27snumirphy0/files/...
...D/501481_1993339cxb2e461cmo9j04.jpg 

​Uns bleibt also nicht anderes übrig, als die AWS-Refrenzen zu entfernen, so dass der nackte Dateiname übrig bleibt.

Datenmanipulation in der GEDCOM-Datei

Um es vorweg zu nehmen - eine zeilenweise Bearbeitung der GEDCOM scheidet aus, da eine einzige Unachtsamkeit ausreicht, die Struktur und damit Konsistenz der GEDCOM-Datei zu zerstören - mal vom Aufwand ganz zu schweigen. 

Mittels Scripting findet der versierte Programmierer schnell eine Lösung - aber wer ist das schon...

Uns bleibt nur ein Umweg unter Zuhilfenahme des "Schweizer Taschenmessers" für Genealogen -  der Excel-basierten "GedTool"-Lösung von Peter Schulz. 

Update: Inzwischen hat Peter Schulz die nachstehend beschriebene Datenaufbereitung nativ in seine GedTools integriert, so dass sich diese Prozedur deutlich vereinfacht.

Vorgehen:
1. GEDCOM einlesen
2. Flache Liste /Quelldatei  aus GEDCOM erstellen (hier Ausgabe „Source" wählen)
3. Quelldatei in flache Liste umsetzen (hier Mapping-Datei einlesen)
4. GEDCOM aus flacher Liste erstellen (hier den Haken „FAM-ID aus Personen-IDs bilden" entfernen. Wird der Haken nicht entfernt, dann werden neue FAM-IDs erzeugt, was aber nicht schädlich ist.)
5. GEDCOM ausgeben

Die nachstehenden Schritte beschreiben das ursprüngliche, nun nicht mehr erforderliche Vorgehen. Zu Dokumentationszwecken lösche ich den Rest des Artikels aber nicht.

GEDCOM importieren

Zunächst muss die GedTool-Datei geöffnet werden und der Import mittels "GEDCOM-Datei einlesen" gestartet werden 

Fotos identifizieren 

Dazu wechselt man in den TAB "1 INDI" und scrollt das Tabellenbaltt soweit nach rechts, bis man auf eine Spalte mit der Bezeichnung "OBJE" im Tabellenkopf in Zeile 1, "FILE" in Zeile 3 und in Zeilen 2 sowie 4 fortlaufende Nummern findet. Ab Zeile 8 findet man dann die AWS-Referenz-Links.

Zeilen einblenden

Einige Zeilen des Tabellenkopfes sind ausgeblendet und müssen eingeblendet werden. Dazu markiert man die Zeilen 1 bis 8 und nutzt das Kontext-Menü "Einblenden" 

Bearbeitung mit Hilfstabelle

Nun muss der Inhalt der komplette Spalte in eine Hilfstabelle kopiert werden, in der man vom Pfad alles abschneidet, was nicht reiner Dateiname ist. 

Dazu den Inhalt der Spalte kopieren und in der Hilfstabelle einfügen. 

Diese Hilfstabelle enthält nur zwei Spalten

Spalte A: mit dem eingefügten Spateninhalt aus der GedTool-Tabelle 

Spalte B: mit den Rechenoperationen. 

Die Tabelle habe ich im Downlaodbereich zur Verfügung gestellt: "AWS-Links entfernen.xlsx"


Der Inhalt der Spalte B wird wieder in die Original-Spalte in GedTools kopiert, sodass das Objekt nur noch mit dem reinen Datenamen identifiziert ist.

Diese Operationen werden mehrfach für jede OBJE-Spalte wiederholt, solange noch welche mit AWS-Links zu finden sind. Hierzu kann man die Suchfunktion von Excel bemühen.

Zum Schluss wird die Gedcom-Datei wieder aus GedTool exportiert und steht nun für den Import in webtrees oder anderen Plattformen zur Verfügung. 

Die Fotos werden vorab in ein Media-Verzeichnis unter webtrees mittels FTP bereitgestellt. Beim Import der GEDCOM-Detei in webtrees findet das System die Fotos anhand der Dateinamen und referenziert sie korrekt zu den jeweiligen Datensätzen.

Ein naheliegender Schönheitsfehler springt einen nun prominent ins Auge - wenn in MyHertiage keine dezidierte Bezeichnung des Fotos vergeben wurde (und bspw. nur der von der Kamera oder dem Scanner vergebene Dateiname  zu sehen war) wird natürlich auch unter webtrees der nichtssagende Dateiname anstelle einer sinnvollen Bildbezeichnung angezeigt. Aber das lässt sich ja leicht korrigieren...

Bewerte diesen Beitrag:
4
Schreiber-Stammbaum
//Anleitung// Verfassen eines Beitrages

Ähnliche Beiträge

 

Kommentare (0)

Rated 0 out of 5 based on 0 votes
Bisher wurden hier noch keine Kommentare veröffentlicht

Einen Kommentar verfassen

Posting comment as a guest.
0 Characters
Anhänge (0 / 3)
Deinen Standort teilen
Gib den Text aus dem Bild ein. Nicht zu erkennen?
Zum Seitenanfang