In juni 2017 is aan alle projectpartners van de Personenportal WO2 de demonstrator getoond, die laat zien hoe de persoonsdata uit verschillende collecties gekoppeld is.
12. Personenportal – na de pilot
Projectplan Fase 2:
Uitwerken en afsluiten Verwerkingsovereenkomst voor data
Implementatie veilige techniek voor Verwerken persoonsdata
Afstemmen welke collectie/data geleverd kan worden onder welke Gebruiks- en
Verwerkingsvoorwaarden
Interface en workflow personenportal uitwerken
Bouwen en testen personenportal
Inventarisatie missende gegevens – Personenportal v 2.0
Editor's Notes
Personen met de meeste beschrijvingen in bronnen bovenaan. Timeline per persoon: het grootste deel van de timeline is gereserveerd voor de periode 1940-1945.
Gedateerde gebeurtenissen in een leven hebben een bolletje.
Als een gebeurtenis (bijvoorbeeld verblijf in een kamp) een bekende begin- en einddatum hebben dan wordt het tussenliggende vlak oranje.
Als een persoon op onbekende datum van een kamp naar een ander kamp is gegaan dan wordt dit aangegeven met oranje verloop.
Per persoon worden beschrijvingen weergegeven, monumenten en beeldmateriaal getoond.
De tijdbalk is uitgewerkt voor zovel bekend vanuit de bronnen.
Per persoon een kaart van de plekken waar een persoon is geweest.
Gebeurtenissen zonder begin en einddatum worden benoemd.
Alle databronnen worden getoond. Je kunt vanuit hier direct naar de databron gaan (als deze online beschikbaar is)
Er is nu een schuifje ingebouwd waarmee je kunt melden dat een databron niet juist is/niet aan de juiste persoon is gekoppeld). Dit is optioneel.
Tot slot volgt een lijst van personen/namen waarvan de computer denkt dat het NIET dezelfde personen zijn.
Hier zijn ook schuifjes geplaatst: je kunt een persoon alsnog koppelen aan een naam.
Iedereen zit in de Personenportal, maar soms is er te weinig info om mensen te matchen of om gebeurtenissen te dateren.
We tonen alles, maar deze gegevens blijven los/ongekoppeld. Waarschijnlijk betreft het wel dezelfde persoon maar matches gebeuren beargumenteerd.
Met beargumenteerd bedoelen we dat we altijd een achternaam (inclusief voorvoegsels) en dateringen (geboorte- en sterfdatum, gevangenneming en lokatie) nodig hebben.
De personenportal bestaat uit een aantal zoek- en match strategiën: met behulp van google en google achtige zoekstrategiën brengen we bronnen samen.
We halen eerst brongegevens op. Dit kan als XML, excel, csv, JSON etc bestand.
De brongegevens halen we door de zoekstrategiën heen. De resultaten van de zoekstrategiën slaan we op als indexen.
Het hele proces duurt enkele minuten en daarna kunnen de bronbestanden in principe verwijderd worden waardoor we een beheersbare hoeveelheid data overhouden (belangrijk voor opslag en milieu).
We kunnen periodiek nieuwe bronbestanden ophalen en opnieuw indexeren. Zo houden we de data actueel.
We matchen de drie grote collecties (OGS, NDVS en NIOD) en vervolgens matchen we de kleinere collecties met deze grote match. Dit is een heel efficiente manier van matchen.
De resultaten van het matchen kunnen per collectie/organisatie ook als excel beschikbaar gezteld worden.