2013. november 1., péntek

MS Excelbe tárolt családfaadatok konvertálása más formátumokba


Sok családfakutató eredményeit MS Excelbe tárolja. Ennek a tárolási módnak vannak úgy előnyei, mint hátrányai is. Egyik nagy hátránya a korlátozott hordozhatóság (portability): nehezen tudjuk az így tárolt adatokat továbbadni. Ha mással meg akarjuk osztani az adatainkat, akkor nem biztos, hogy a fogadó fél az Excelbe kapott adatokat kellőképpen tudja felhasználni. Ilyen esetekben egy egységes szabványnak megfelelő formába kell az adatokat átalakítani, más szóval konvertálni. Ezt a célt szolgálja a GEDCOM szabvány. A GEDCOM szabvány szerint formázott szöveges fájlok családfaadatokat képesek tárolni. Ezeket az adatokat a családfaprogramok el tudják olvasni és meg tudják jeleníteni. A GEDCOM szabvány biztosítja a családfaadatok hordozhatóságát. Természetesen a családkutatónak, a mostanáig elmondottakon kívül, semmi mást nem kell tudnia a GEDCOM szabványról, illetve formátumról. Akit egy kicsit közelebbről érdekel a téma, meglátogathatja a szabvány hivatalos honlapját[1]. Távolról sem kimerítve a témát, a családkutatók számára a MATRIKULA legelső számában, egy rövid írásomban[2] bemutattam a GEDCOM állomány felépítését.
A fentiekből meggyőződhetünk, hogy legalább az Excelből GEDCOM formátumra való konvertálásban érdekelt minden családfakutató. Még jobb lenne egy olyan egyszerű megoldás, amellyel, ugyanazzal a fáradsággal, akár több formátumba is konvertálni tudjuk az Excelbe tárolt családfaadatainkat. Egy ilyen megoldás ismertetése a jelenlegi írás célja.

A konvertáló program


Az konvertáló program egyben egy családfaprogram is, mely képes Excel adatokat beolvasni, megjeleníteni, majd különböző formátumba, köztük GEDCOM formátumba is, elmenteni. Az Ahnenblatt programot Dirk Böttcher német fejlesztő írta és honlapjáról[3] ingyen letölthető. Látogassuk meg a program honlapját és a Download linkre kattintva töltsük le programtelepítőt a gépünkre, egy tetszőleges helyre. Kattintsunk kétszer a telepítőre és telepítsük a programot a gépünkre. A telepítő program varázslója egyszerű: elegendő az összes javasolt paramétert elfogadni. Telepítés után a telepítőt törölhetjük a gépünkről. A program aktuális verziója 2.74 (2012.11.15). Újabb verziók megjelenésekor a program automatikusan felkínálja a frissítést.
Indítsuk el a programot és a Language vagy Sprache (utolsóelőtti) menüponttal állítsuk be a kezelőfelületet magyar nyelvre, ha ez automatikusan nem történt meg. Pillanatnyilag nincs szükségünk a programra, ezért zárjuk be.

Az Excel állomány előkészítése


Mielőtt bármit is csinálnánk az értékes adatainkat tartalmazó Excellel, készítsünk egy biztonsági másolatot. Legjobb, ha ezt a biztonsági másolatot egy külön mappába tároljuk, és ezzel dolgozunk tovább.
Az adatainkat tartalmazó Excelt elő kell készítenünk úgy, hogy a program tudja, mi hova van írva, mit honnan olvasson. Ezt a fejléc egy bizonyos szabály szerint való címkézésével érjük el. Ha az Excelünk nem tartalmaz egy fejlécet, ami kevésbé valószínű, akkor adjunk hozzá legfelül egy új sort és oda írjuk be a fejléccímeket. Ha az Excelünk már tartalmaz egy fejlécet, akkor ezen nevezzük át fejléccímeket a lejjebb leírt szabály szerint. A szabályt az Ahnenblatt program súgója is tartalmazza, sajnos csak németül. A következőkben leírom, milyen címeket kell tartalmaznia a fejlécnek és melyik oszlop, milyen címet kap.
  • REFN – egy egyértelmű referenciát rendez minden egyes személyhez. A személyreferencia bármilyen alfanumerikus (betűk és számok) érték lehet. A legegyszerűbb, ha a személyreferenciák pozitív egészszánok. A számok bármilyen sorrendben lehetnek. Nagyon fontos, hogy a referenciák egyértelműek legyenek: minden személynek van egy referenciája és minden referencia csak egy személyhez van hozzárendelve. A program szerzője szerint ez az oszlop nem feltétlenül szükséges, ha a következő NAME oszlop jelen van. Javaslom, hogy mindenesetben használjuk a REFN oszlopot, mert nagy Excel állományok esetében, lényegesen meggyorsítja a konvertálást.
  • NAME – tartalmazza a személy teljes nevét „Utónév Vezetéknév” formában. Több utónév és előnév is szerepelhet az Utónév részben, szóközzel elválasztva. A Vezetéknév részben csak egy szó szerepelhet. A program mindig csak a cellában szereplő utolsó szót értelmezi vezetéknévként, a többit utónévként értelmezi. Ez az oszlop fölösleges, ha a következő SURN és GIVN oszlopok jelen vannak. Javaslom, hogy ezt az oszlopot ne használjuk.
  • SURN – a személy vezetékneve. Itt használható az „előnév Vezetéknév” alak is.
  • GIVN – a személy utónevei szóközzel elválasztva.
  • FATH.NAME – a személy apjának a neve. Nem feltétlenül szükséges, ha a FATH.REFN oszlop jelen van.
  • FATH.REFN – a személy apjának a referenciája.
  • MOTH.NAME – a személy anyjának a neve. Nem feltétlenül szükséges, ha a MOTH.REFN oszlop jelen van.
  • MOTH.REFN – a személy anyjának referenciája.
  • SEX – a személy neme: M vagy m – hímnemű, W, w, F vagy f – nőnemű.
  • OCCU – a személy foglalkozása.
  • BIRT.DATE – a személy születési dátuma.
  • BIRT.PLAC – a személy születési helye.
  • RELI – a személy felekezete.
  • CHR.DATE – a személy keresztelésének, névadásának dátuma.
  • CHR.ADDR - a személy keresztelésének, névadásának egyházi helye (templom, imaház, zsinagóga, stb.).
  • CHR.PLAC - .a személy keresztelésének, névadásának helye.
  • GODP – a személy keresztszüleinek és hasonlóknak neve (vesszővel elválasztva).
  • CONF.DATE - a személy egyházi nagykorúságának (első áldozás, konfirmáció, stb.) dátuma.
  • CONF.ADDR - a személy egyházi nagykorúságának egyházi helye.
  • CONF.PLAC - a személy egyházi nagykorúságának helye.
  • DEAT.DATE – a személy halálának dátuma.
  • DEAT.PLAC – a személy halálának helye.
  • BURI.DATE – a személy temetésének dátuma.
  • BURI.PLAC – a személy temetésének helye.
  • NOTE – megjegyzés (sortörés nélkül).
  • SOUR – források (sortörés nélkül).
  • MARR.DATE.1 – a személy első házasságának dátuma.
  • MARR.PLAC.1 – a személy első házasságának helye.
  • MARR.SPOU.NAME.1 – a személy első házastársának neve. Nem feltétlenül szükséges, ha a MARR.SPOU.REFN.1 oszlop jelen van.
  • MARR.SPOU.REFN.1 – a személy az első házastársának referenciája.
További házasságok esetén az utolsó négy oszlopot meg kell ismételni a házasság sorszámának megadásával, pld. MARR.DATE.2, stb.
Az oszlopok tetszőleges sorrendben lehetnek az Excelben. Az Excelben más oszlopok is jelen lehetnek, melyek a fentiektől eltérő fejléccímekkel vannak ellátva. Ezek nem zavarják a konvertálást, egyszerűen nem játszanak semmilyen szerepet. A fejléccímeket kis-, nagybetűkkel vagy vegyesen írhatjuk. Fontos a pontos fejléccím. A fejléccímeknek feltétlenül az Excel első sorában kell lenniük: ne használjunk többsoros fejlécet! Aki ismeri a GEDCOM állományok felépítését, az bizonyára felismerte a fenti fejléccímekben a GEDCOM szabvány kifejezéseit.

Egy példa


Nézzünk meg egy egyszerű Excelt, ami már elő van készítve a konvertálásra:

Mint látható, a „családfa” tíz személyt tartalmaz. A könnyebb áttekintés céljából, a generációkat színes háttérrel jelöltem meg. A személyek referenciája természetes számok (azaz pozitív egészszámok) 1-től 10-ig.
A második és harmadik nemzedéknél a FATH.REFN és a MOTH.REFN oszlopok a szülőket definiálják. Ebből kiderül, hogy
·         Kovács János, Sándor és Mária apja Kovács István,
·         Kovács János és Sándor anyja Szabó Mária,
·         Kovács Mária anyja Varró Magdolna,
·         Kocsis Béla apja Kocsis János és anyja Kerekes Anna,
·         Kocsis Imre apja Kocsis Béla és anyja Kovács Mária


A MARR.SPOU.REFN.1 és MARR.SPOU.REFN.2 oszlopok a házasságokat definiálják. Könnyen megállapítjuk, hogy
·         Kovács Istvánnak két felesége volt: Szabó Mária és Varró Magdolna,
·         Kocsis János és Kerekes Anna, valamint Kovács Mária és Kocsis Béla egy-egy házaspár
A többi oszlop értelmezése nem okoz nehézséget és nem igényel magyarázatot.
Ügyelnünk kell a dátumok formázásánál. Bármilyen megengedett formázást használhatunk (ld. a Fájl->Tulajdonságok... menüponttal előhívott ablakon a Dátum formázása fület és lejjebb a következő képet), de feltétlenül egységesen ugyanazt használjuk az egész Excelben. Csonka dátumokat is használhatunk (pld. EEEE.HH vagy EEEE).

Az előkészített Excel elmentése CSV formátumba


Az Ahnenblatt program a megadott szabály szerint előkészített Excel állományt csak akkor tudja beolvasni, ha CSV formátumba van elmentve. Miután előkészítettük az Excel állományt, mentsük el.
A CSV (comma separated values) formátumú állomány egy szöveges állomány, mely tárolni tudja egy Excel munkalapon levő adatokat (értékeket), az Excel-specifikus információ (makrók, színek, karaktersajátosságok, stb.) nélkül. Eredetileg, az egy sorban levő Excel értékek (cellatartalmak) vesszővel voltak egymástól elválasztva. Későbbi változatokban, az értékek pontosvesszővel vagy tabulátorral is elválaszthatók, a fájl elnevezése és kiterjesztése azonban megmaradt csv-nek.
Az MS Excel programmal elmentetjük az munkalap adatait CSV formátumú fájlba. Ezt a következőképpen hajtjuk végre:
·         A főmenüből válasszuk ki a Mentés másként… menüpontot.
·         A felkínált lehetőségekből válasszuk ki a Más formátumok menüpontot (régebbi Excel verziókban ez a lépés nem létezik).
·         A megjelenő párbeszédablakban válasszuk ki a Fájltípus címszónál a legördülő listából az Unicode szöveg (*.txt) bejegyzést.
·         A Fájlnév címszónál megjelenik az Excel állomány neve txt kiterjesztéssel, például Munka1.txt. Változtassuk meg a kiterjesztést csv-re: Munka1.csv
·         Kattintunk a Mentés gombra.
·         A program, verziótól függően, egyszer vagy kétszer figyelmeztet, hogy a mentés ebben a formátumba, bizonyos Excel-sajátosságok elvesztésével jár. Minkét esetben nyomjuk meg az OK vagy Igen gombot.
Ezennel elmentettük a munkalapot CSV formátumba. Zárjuk be az Excel programot. A program megkérdezi, hogy CSV formátumba kívánjuk menteni az állományt? Fontos: kattintsunk a Nem gombra, hogy az állományt eredeti formátumban hagyjuk.
Az elmentett CSV fájlt megnézhetjük egy szöveges állomány megjelenítővel, mint például a Jegyzettömb (Notpad) program. Ne nyissuk ki a CSV-fájlt az MS Word programmal, mert esetleg elronthatjuk!

A konvertálás


Nyissuk ki az Ahnenblatt programot. Mielőtt beolvasnánk az elmentett CSV fájlunkat, készítsük el a programot a dátumok fogadására:
·         Kattintsunk a Fájl menüre és válasszuk ki a Tulajdonságok… menüpontot.
·    A megjelenő párbeszédablakban válasszuk ki a Dátum formátuma fület és állítsuk be a használt dátumformátumot:


Most beolvashatjuk az elmentett CSV fájlunkat. Kattintsunk a Megnyitás menüpontra. A megjelenő párbeszédablakban, a fájltípusnál, válasszuk ki a CSV-File (*.csv) bejegyzést, majd lapozzunk az elmentett CSV fájlunkhoz és válasszuk ki. A program jeleni, hogy hány személyt töltött be. Kattintsunk az OK gombra. A program egy családfában megjeleníti a beolvasott adatokat:


Ennek a cikknek nem célja, hogy az Ahnenblatt program kezelését elmagyarázza. A program kezelése nagyon logikus es egyszerű, egy rövid kísértetezés után, mindenki rájön, a legfontosabb funkciókra. Miután megjelenítettük az adatainkat, kattintunk az Ellenőrzés menüpontra. Ha mindent helyesen csináltunk, a program jelenti, hogy nem talált hibát. Különben fellistázza a talált hibákat.
Most már csak a konvertálás GEDCOM formátumba maradt hátra. A Fájl menüből válasszuk ki a Mentés másként…, majd a GEDCOM-fájl menüpontot:


A megjelenő ablakon kattintsunk a Mentés gombra. Ezzel elmentettük az adatainkat GEDCOM formátumba. A GEDCOM állomány a ged kiterjesztést kapja. Megtekintésére csak szöveges állomány megjelenítőt használjuk. Az állomány eleje a következőképpen néz ki. Ezt az állományt bármelyik családfaprogram be tudja olvasni és az adatokat meg tudja jeleníteni.

A Mentés másként… menü más konvertálást is lehetővé tesz (lásd az utolsóelőtti képet). Érdemes mindegyiket kipróbálni.









Nincsenek megjegyzések:

Megjegyzés küldése