Toolbasierte	
  Datendokumenta2on	
  
                 in	
  der	
  
           Psychologie	
  
               Ina Dehnhard, Peter Weiland


Leibniz-Zentrum für Psychologische Information und
         Dokumentation – Universität Trier


       12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
PsychData	
  –	
  Forschungsdatenzentrum	
  für	
  die	
  Psychologie	
  


           §  langfris+ge	
  Sicherung	
  und	
  Bewahrung	
  psychologischer	
  
             Forschungsdaten	
  

           §  Bereitstellung	
  	
  für	
  die	
  WissenschaCsgemeinschaC	
  

           §  Unterstützung	
  bei	
  retrospek+ver	
  und	
  forschungsbegleitender	
  
             Datendokumenta+on	
  	
  	
  



	
  	
  



                        12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Übersicht	
  

     1.  Einleitung:	
  Trends	
  im	
  Data	
  Sharing	
  	
  
     2.  DatenauNereitung	
  als	
  Voraussetzung	
  zum	
  Data	
  
          Sharing	
  
     3.  Dokumenta+onsstandards	
  im	
  PsychData-­‐Archiv	
  
     4.  Ein	
  Werkzeug	
  zur	
  Datendokumenta+on	
  
     5.  Ausblick	
  	
  
     	
  




                12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Data	
  Sharing	
  –	
  Ein	
  allgemeiner	
  Trend	
  


      §  	
  Open	
  data	
  –	
  open	
  access	
  	
  

      §  	
  RatSWD	
  

      §  	
  DataCite	
  




                         12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Data	
  Sharing	
  in	
  der	
  Psychologie	
  



                •  Psychologisches	
  Datenarchiv	
  PsychData	
  

 J             •  Bereitstellung	
  psychologischer	
  Studien	
  (z.B.	
  IQSS,	
  …)	
  
                •  Paneluntersuchungen	
  wie	
  pairfam,	
  NEPS	
  oder	
  SOEP	
  mit	
  
                       psychologischer	
  Beteiligung	
  
                	
  
                	
   Wicherts	
  et	
  al.	
  (2006):	
  The	
  poor	
  availability	
  of	
  psychological	
  
                • 
                	
  
 L                    research	
  data	
  for	
  reanalysis	
  
                à	
  Zurückhaltung	
  bei	
  der	
  Bereitstellung	
  von	
  Daten	
  
                	
  
                	
  
                	
  
                	
  
                	
  
                	
         12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Gründe	
  für	
  geringe	
  BereitschaD	
  zum	
  Data	
  Sharing	
  


      §  Zeit‑	
  und	
  Geld-­‐Aufwand	
  für	
  die	
  DatenauNereitung	
  

      §  fehlende	
  Anerkennung	
  

      §  mögliche	
  Nachteile	
  im	
  wissenschaClichen	
  Weabewerb	
  

      §  rechtliche	
  Probleme	
  

      §  Aufdeckung	
  methodischer	
  Unzulänglichkeiten	
  

      §  Selbstverständnis	
  der	
  Forschenden	
  	
  
         (WissenschaCler	
  ≠	
  Datenverwalter)	
  




                       12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
DatenauEereitung	
  als	
  Voraussetzung	
  zum	
  Data	
  Sharing	
  


•  technische	
  AuNereitung	
  	
  	
  
       à	
  langfris+ge	
  Verfügbarkeit	
  

•  umfassende	
  Dokumenta+on	
  
       à	
  langfris+ge	
  Interpre+erbarkeit	
  

	
  
	
  


                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Datendokumenta2on	
  im	
  Forschungsprozess	
  



     Projekt-­‐             Daten-­‐                         Daten-­‐                    Forschungs-­‐                    Archivierung/	
  
     beginn	
              erhebung	
                        analyse	
                    ergebnis	
                      Nachnutzung	
  



 Daten-­‐              Dokumenta+on:	
                 Dokumenta+on:	
                 Abschluss	
  der	
             Langfris+ge	
  
 verwaltungsplan	
     Metadaten	
                     Abgeleitete	
                   Dokumenta+on	
                 Datensicherung	
  
 	
                    Kodebuch	
                      Variablen	
                     	
                             	
  
 	
                    	
                              	
                              	
                             Regelung	
  der	
  
 	
                    Datenintegrität	
               Datensicherung	
                	
                             Datenweitergabe	
  
                       Datenkontrolle	
                	
                                                             	
  
                       	
                                                                                             	
  
                       Datensicherung	
  
                       	
  
                       	
  
                       	
  
 Datendokumenta+on	
  und	
  –archivierung	
  sind	
  keine	
  
 selbstverständlich	
  integrierten	
  Bestandteile	
  im	
  Forschungsprozess.	
  

                       12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onsstandards	
  im	
  Datenarchiv	
  PsychData	
  


     §  Metadaten	
  im	
  engeren	
  Sinn:	
  Beschreibung	
  der	
  Variablen	
  
        (Kodebuch)	
  	
  

     §  Metadaten	
  im	
  weiteren	
  Sinn:	
  Bibliografische	
  
        Informa+onen,	
  Beschreibung	
  des	
  Erhebungskontext	
  
        	
  
     §  kompa2bel	
  mit	
  Dublin	
  Core,	
  DDI	
  2.0	
  




                    12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Studienbeschreibung	
  in	
  PsychData	
  




 hap://goo.gl/UIaSo	
  	
  

                        12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
PsychData	
  Kodebuchschema	
  


1.  Variablenname	
  

2.  Inhaltliche	
  Variablenbeschreibung	
  	
  

3.  Itemtext	
  (z.B.	
  die	
  gestellte	
  Frage	
  oder	
  
    Instruk+onsanweisung)	
  

4.  Wertebereich	
  der	
  gül+gen	
  Werte	
  

5.  Wertebereich	
  der	
  fehlenden	
  Werte	
  

6.  Bedeutung	
  der	
  gül+gen	
  Werte	
  	
  

7.  Bedeutung	
  der	
  fehlenden	
  Werte	
  	
  


                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
PsychData	
  Dokumenta2onstool	
  



Frei	
  verfügbar	
  unter	
  hap://pde.zpid.de	
  	
  




                          12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Erfassung	
  von	
  Metadaten	
  I	
  




                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Erfassung	
  von	
  Metadaten	
  II	
  




                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Kodebuch	
  hochladen	
  




                   12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Neue	
  Variable	
  zum	
  Kodebuch	
  hinzufügen	
  




                    12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Neue	
  Variable	
  zum	
  Kodebuch	
  hinzufügen	
  




                    12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Kodebuch	
  anzeigen	
  




                   12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Eingabe	
  von	
  Daten	
  




                                                                                                                            Validierung	
  der	
  
                                                                                                                            Daten	
  während	
  
                                                                                                                            der	
  Eingabe	
  




                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Häufigkeitsverteilung	
  




                   12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Dokumenta2onstool	
  –	
  Datensätze	
  für	
  andere	
  Nutzer	
  freigeben	
  




                     12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Ausblick	
  

•  Vorteile:	
  
      –  Standardisierte	
  forschungsbegleitende	
  Dokumenta+on	
  
      –  Automa+sche	
  Fehlererkennung	
  
      –  Data-­‐Sharing-­‐Plalorm	
  (z.B.	
  Forschungsgruppen)	
  
      	
  
•  Erweiterung	
  der	
  Funk+onalitäten:	
  
      –  Ein-­‐/Auslesen	
  aus	
  Sta+s+kprogrammformaten	
  
      –  Eingabehilfen	
  bei	
  den	
  Metadaten	
  zum	
  
         Erhebungshintergrund	
  
      –  Ausgabe	
  der	
  Metadaten	
  in	
  DDI	
  




                   12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  
Vielen	
  Dank	
  	
  
für	
  Ihre	
  Aufmerksamkeit!	
  
                      hap://www.psychdata.de	
  	
  




                                                                          Das	
  Forschungsdatenzentrum	
  PsychData	
  gehört	
  zu	
  der	
  	
  
                                                                          vom	
  Rat	
  für	
  Sozial-­‐	
  und	
  WirtschaCsdaten	
  (RatSWD)	
  	
  
                                                                          empfohlenen	
  und	
  zer+fizierten	
  Dateninfrastruktur	
  in	
  den	
  	
  
                                                                          Sozial-­‐,	
  Verhaltens-­‐	
  und	
  WirtschaCswissenschaCen.	
  

                                                                         Die	
  Entwicklung	
  von	
  PsychData	
  wurde	
  durch	
  die	
  	
  
                                                                         Deutsche	
  ForschungsgemeinschaC	
  (DFG)	
  gefördert.	
  



   12th	
  Interna+onal	
  Symposium	
  of	
  	
  Informa+on	
  Science	
  	
  (ISI	
  2011),	
  Hildesheim	
  

Toolbasierte Datendokumentation in der Psychologie

  • 1.
    Toolbasierte  Datendokumenta2on   in  der   Psychologie   Ina Dehnhard, Peter Weiland Leibniz-Zentrum für Psychologische Information und Dokumentation – Universität Trier 12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 2.
    PsychData  –  Forschungsdatenzentrum  für  die  Psychologie   §  langfris+ge  Sicherung  und  Bewahrung  psychologischer   Forschungsdaten   §  Bereitstellung    für  die  WissenschaCsgemeinschaC   §  Unterstützung  bei  retrospek+ver  und  forschungsbegleitender   Datendokumenta+on           12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 3.
    Übersicht   1.  Einleitung:  Trends  im  Data  Sharing     2.  DatenauNereitung  als  Voraussetzung  zum  Data   Sharing   3.  Dokumenta+onsstandards  im  PsychData-­‐Archiv   4.  Ein  Werkzeug  zur  Datendokumenta+on   5.  Ausblick       12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 4.
    Data  Sharing  –  Ein  allgemeiner  Trend   §   Open  data  –  open  access     §   RatSWD   §   DataCite   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 5.
    Data  Sharing  in  der  Psychologie   •  Psychologisches  Datenarchiv  PsychData   J •  Bereitstellung  psychologischer  Studien  (z.B.  IQSS,  …)   •  Paneluntersuchungen  wie  pairfam,  NEPS  oder  SOEP  mit   psychologischer  Beteiligung       Wicherts  et  al.  (2006):  The  poor  availability  of  psychological   •    L research  data  for  reanalysis   à  Zurückhaltung  bei  der  Bereitstellung  von  Daten               12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 6.
    Gründe  für  geringe  BereitschaD  zum  Data  Sharing   §  Zeit‑  und  Geld-­‐Aufwand  für  die  DatenauNereitung   §  fehlende  Anerkennung   §  mögliche  Nachteile  im  wissenschaClichen  Weabewerb   §  rechtliche  Probleme   §  Aufdeckung  methodischer  Unzulänglichkeiten   §  Selbstverständnis  der  Forschenden     (WissenschaCler  ≠  Datenverwalter)   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 7.
    DatenauEereitung  als  Voraussetzung  zum  Data  Sharing   •  technische  AuNereitung       à  langfris+ge  Verfügbarkeit   •  umfassende  Dokumenta+on   à  langfris+ge  Interpre+erbarkeit       12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 8.
    Datendokumenta2on  im  Forschungsprozess   Projekt-­‐ Daten-­‐ Daten-­‐ Forschungs-­‐ Archivierung/   beginn   erhebung   analyse   ergebnis   Nachnutzung   Daten-­‐ Dokumenta+on:   Dokumenta+on:   Abschluss  der   Langfris+ge   verwaltungsplan   Metadaten   Abgeleitete   Dokumenta+on   Datensicherung     Kodebuch   Variablen               Regelung  der     Datenintegrität   Datensicherung     Datenweitergabe   Datenkontrolle           Datensicherung         Datendokumenta+on  und  –archivierung  sind  keine   selbstverständlich  integrierten  Bestandteile  im  Forschungsprozess.   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 9.
    Dokumenta2onsstandards  im  Datenarchiv  PsychData   §  Metadaten  im  engeren  Sinn:  Beschreibung  der  Variablen   (Kodebuch)     §  Metadaten  im  weiteren  Sinn:  Bibliografische   Informa+onen,  Beschreibung  des  Erhebungskontext     §  kompa2bel  mit  Dublin  Core,  DDI  2.0   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 10.
    Studienbeschreibung  in  PsychData   hap://goo.gl/UIaSo     12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 11.
    PsychData  Kodebuchschema   1. Variablenname   2.  Inhaltliche  Variablenbeschreibung     3.  Itemtext  (z.B.  die  gestellte  Frage  oder   Instruk+onsanweisung)   4.  Wertebereich  der  gül+gen  Werte   5.  Wertebereich  der  fehlenden  Werte   6.  Bedeutung  der  gül+gen  Werte     7.  Bedeutung  der  fehlenden  Werte     12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 12.
    PsychData  Dokumenta2onstool   Frei  verfügbar  unter  hap://pde.zpid.de     12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 13.
    Dokumenta2onstool  –  Erfassung  von  Metadaten  I   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 14.
    Dokumenta2onstool  –  Erfassung  von  Metadaten  II   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 15.
    Dokumenta2onstool  –  Kodebuch  hochladen   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 16.
    Dokumenta2onstool  –  Neue  Variable  zum  Kodebuch  hinzufügen   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 17.
    Dokumenta2onstool  –  Neue  Variable  zum  Kodebuch  hinzufügen   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 18.
    Dokumenta2onstool  –  Kodebuch  anzeigen   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 19.
    Dokumenta2onstool  –  Eingabe  von  Daten   Validierung  der   Daten  während   der  Eingabe   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 20.
    Dokumenta2onstool  –  Häufigkeitsverteilung   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 21.
    Dokumenta2onstool  –  Datensätze  für  andere  Nutzer  freigeben   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 22.
    Ausblick   •  Vorteile:   –  Standardisierte  forschungsbegleitende  Dokumenta+on   –  Automa+sche  Fehlererkennung   –  Data-­‐Sharing-­‐Plalorm  (z.B.  Forschungsgruppen)     •  Erweiterung  der  Funk+onalitäten:   –  Ein-­‐/Auslesen  aus  Sta+s+kprogrammformaten   –  Eingabehilfen  bei  den  Metadaten  zum   Erhebungshintergrund   –  Ausgabe  der  Metadaten  in  DDI   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim  
  • 23.
    Vielen  Dank     für  Ihre  Aufmerksamkeit!   hap://www.psychdata.de     Das  Forschungsdatenzentrum  PsychData  gehört  zu  der     vom  Rat  für  Sozial-­‐  und  WirtschaCsdaten  (RatSWD)     empfohlenen  und  zer+fizierten  Dateninfrastruktur  in  den     Sozial-­‐,  Verhaltens-­‐  und  WirtschaCswissenschaCen.   Die  Entwicklung  von  PsychData  wurde  durch  die     Deutsche  ForschungsgemeinschaC  (DFG)  gefördert.   12th  Interna+onal  Symposium  of    Informa+on  Science    (ISI  2011),  Hildesheim