Forschungsdaten organisieren

Forschungsdaten organisieren

5S-Regel

Die 5S-Methode zur Arbeitsgestaltung wurde ursprünglich in den 2000er Jahren für Produktionssysteme entworfen und später auf den Kontext von Forschungsdaten angepasst. Sie besteht aus den Bestandteilen: Sort, Set in Order, Shine, Standardize und Sustain.

 

Bestandteil 1: Sort (deutsch: Aussortieren)

Ziel: Zeitgewinnung bei der Suche & Gewinnung von mehr Datenspeicher​
​Umsetzung: Unnötige Dateien/ Ordner löschen (oder für geplante Löschung markieren) und temporären Dateien frei halten

 

Bestandteil 2: Set in Order (deutsch: Aufräumen)

Ziel: Ein System aufbauen um Arbeitsvorgänge zu vereinfachen​
Umsetzung: Sinnvolle Ordnerstrukturen, Namenskonventionen und Strukturen und Ausnahmen dokumentieren

 

Bestandteil 3: Shine (deutsch: Arbeitsplatzsauberkeit)

Ziel: Qualität erhalten und ggf. anpassen​ und dokumentieren und verständlich halten
Umsetzung: Vorgänge kontrollieren und selber durchsetzen sowie regelmäßige Routinen entwickeln.​

Bestandteil 4: Standardize (deutsch: Anordnung zur Regel machen)

Ziel: Prozesse und Termine etablieren und Zusammenarbeit ermöglichen
Umsetzung: Best-Practices, Leitlinien und Regeln dokumentieren; ​ Standard Operating Procedure (SOP) festlegen; Diskussionen mit Kolleg:innen und Verantwortlichkeiten klären

Bestandteil 5: Sustain (deutsch: Alle Punkte einhalten und verbessern)

Ziel: Mit Selbstdisziplin und durch Gewohnheit entwickeltes System erhalten, Automatisierung und Templates anstreben
​Umsetzung: Workshops, Übungseinheiten​; Einweisung neuer Mitarbeiter:innen sowie neue Methoden/ Technologien anwenden

 

Quelle: Lang, K., Roman Gerlach, Jessica Rex, Annett Schröter, & Nadine Neute.(2025, April 30). Coffee Lecture Slides: 5S Data. Zenodo. doi:10.5281/zenodo.15310362

Bitte beachten Sie: Sobald Sie sich das Video ansehen, werden Informationen darüber an Youtube/Google übermittelt. Weitere Informationen dazu finden Sie unter Google Privacy.

Quelle Video: 5S Data: Setz dich auf deine 5 Buchstaben und organisiere deine Daten! (Coffee Lecture), Forschungsdatenmanagement Thüringen (TKFDM), 2021

 

 

 

Ordnerstrukturen und Dateibenennung

Der effektive und sichere Umgang mit Daten erfordert die Erstellung und Nutzung klarer Strukturen für die Organisation Ihrer Daten. Zu einer effektiven Datenorganisation gehören systematische Ordnerstrukturen, die einen einheitlichen Aufbau der Ordner- und Dateinamen festlegen und geeignete Speicherorte auswählen.

Aussagekräftige Namenskomponenten sind z. B.:

  • Titel, mit Aussage zum Inhalt
  • Kürzel des/der Bearbeiters/Bearbeiterin
  • Datum im Format JJMMTT
  • Versionsnummer (z. B. „v02“)

Beispiel für einen Dateinamen: <JJMMTT_TitelMessreihe_Bearbeiter_Version>

 

Weitere Hinweise zu Benennungen und Ordnerstrukturen:

  • Leerzeichen vermeiden, stattdessen „-“ oder „_“
  • Sonderzeichen vermeiden, z.B. & * % €? !
  • Umlaute vermeiden
  • Generische Namen vermeiden, z.B. „Datensatz“, „Text“
  • Lange Namen vermeiden
  • Zu viele Ebenen und parallele Ordner vermeiden

 

 

 

Versionierung

Konsequente Versionierung von Forschungsdaten inklusive ihrer Dokumentation ist essenziell für das Nachvollziehen und Unterscheiden von verschiedenen Stadien der Bearbeitung. Sie hilft dabei insbesondere an Meilensteinen von Daten und Dokumenten die Änderungen nachzuvollziehen.

Möglichkeiten der Versionierung:

  • im Dateinamen, z.B. durch Anfügen von „v01“ oder „final“ an das Ende des Dateinamens
  • in der jeweiligen Datei, z.B. durch Einfügen einer Änderungshistorie am Anfang des Textdokuments. Nicht alle Dateiformate ermöglichen das Hinzufügen eines solchen Textbereichs.
  • im gesonderten Versionierungsdokument, d.h. ein separates Dokument, welches die Informationen sowie Änderungen und ggf. Bearbeitende und Datum der letzten Änderung u.ä. aufführt. Ein solches Dokument kann beispielsweise auch als Ergänzung zur Versionierung im Dateinamen dienen, um Informationen darüber zu dokumentieren, welche Änderungen zwischen zwei Versionen durchgeführt wurden.
  • Software zur Versionskontrolle z.B. mit Git. Git kommt ursprünglich aus der Softwareentwicklung und ist besonders für die Verwaltung von textbasierten Dateien geeignet. Weitere Informationen finden sich beim Gitlab-Service der Universität Rostock.
  • kollaborative Dokumenten und Speicherorte steht Versionierung und Änderungsverfolgung zur Verfügung, z.B. im Sharepoint kann eine Versionierung von Dokumenten aktiviert werden.

 

 

 

Nachhaltige Dateiformate

Die Nachnutzung von Forschungsdaten erfordert die Verarbeitbarkeit des entsprechenden Dateiformats. Insbesondere proprietäre, d.h. herstellerspezifische nicht veröffentlichte, Dateiformate sorgen ggf. für Herausforderungen in der Nachnutzung nach vielen Jahren, da entweder die häufig kostenintensive Software gekauft werden muss oder im schlimmsten Fall das Format reverse-engineered werden muss, um die Forschungsdaten nachnutzen zu können. Daher ist es empfehlenswert idealerweise ein offenes langfristig nutzbares Dateiformat zu wählen. Mitunter kann man in der jeweiligen Software einen Export oder eine Konvertierung in ein offenes Format durchführen, wobei zu prüfen ist, ob Informationen dabei verloren gehen. Sofern dies nicht verlustfrei ist, empfiehlt sich dennoch die zusätzliche Ablage als offenes Format mit einer Dokumentation welche Einschränkungen damit verbunden sind, um flexibel in der Nachnutzung zu sein. Die nachfolgende Tabelle enthält Empfehlungen für gängige Datenarten:

Datenart Empfehlung Vermeiden
Tabellen CSV, TSV, SPSS portable, ODS, XLSX​ XLS, SPSS, NUMBERS​
Texte TXT, HTML, RFT, PDF/A, DOCX, ODT​ DOC, PDF, PAGES
Multimedia Container: MP4, MKV, Codec: Theora, Dirac, FLAC, MPEG4​ QuickTime, Flash​
Bilder TIFF, JPEG2000, PNG, JPG​ GIF, RAW, NEF, PSD, VSD​

 

 

 

Backup-Strategien

3-2-1 Regel ​ ​

Von den Daten sollten 3 Kopien angelegt werden, auf 2 unterschiedlichen Medien, dazu eine Kopie dezentral sichern.

Beispiel: Originaldaten: Auf deinem Laptop​ sicher; Erstes Backup: Eine Kopie auf einer externen Festplatte​; Zweites Backup: Eine zusätzliche Kopie in der Cloud.​

 

Vorteile:

  • Datensicherheit und Minimierung von Datenverlust

  • Schutz vor physischen Gefahren

  • Einfachheit und Flexibilität

 

Hinweise für ein sicheres Backup:

  • Datenträger für Backups sollten von der genutzten Infrastruktur abgekoppelt sein​

  • Empfehlung: mind. 1-mal täglich sichern + wöchentliches Gesamtbackup ​

  • Datenwiederherstellung zu Projektbeginn und in regelmäßigen Abständen überprüft werden ​

Formulierungshilfen für Forschungsanträge

Textbausteine für die Beschreiung der technischen Infrastruktur finden Sie auf der Seite Hinweise für DFG-Anträge.