Forschungsdaten organisieren
5S-Regel
Die 5S-Methode zur Arbeitsgestaltung wurde ursprünglich in den 2000er Jahren für Produktionssysteme entworfen und später auf den Kontext von Forschungsdaten angepasst. Sie besteht aus den Bestandteilen: Sort, Set in Order, Shine, Standardize und Sustain.
Bestandteil 1: Sort (deutsch: Aussortieren)
Ziel: Zeitgewinnung bei der Suche & Gewinnung von mehr Datenspeicher
Umsetzung: Unnötige Dateien/ Ordner löschen (oder für geplante Löschung markieren) und temporären Dateien frei halten
Bestandteil 2: Set in Order (deutsch: Aufräumen)
Ziel: Ein System aufbauen um Arbeitsvorgänge zu vereinfachen
Umsetzung: Sinnvolle Ordnerstrukturen, Namenskonventionen und Strukturen und Ausnahmen dokumentieren
Bestandteil 3: Shine (deutsch: Arbeitsplatzsauberkeit)
Ziel: Qualität erhalten und ggf. anpassen und dokumentieren und verständlich halten
Umsetzung: Vorgänge kontrollieren und selber durchsetzen sowie regelmäßige Routinen entwickeln.
Bestandteil 4: Standardize (deutsch: Anordnung zur Regel machen)
Ziel: Prozesse und Termine etablieren und Zusammenarbeit ermöglichen
Umsetzung: Best-Practices, Leitlinien und Regeln dokumentieren; Standard Operating Procedure (SOP) festlegen; Diskussionen mit Kolleg:innen und Verantwortlichkeiten klären
Bestandteil 5: Sustain (deutsch: Alle Punkte einhalten und verbessern)
Ziel: Mit Selbstdisziplin und durch Gewohnheit entwickeltes System erhalten, Automatisierung und Templates anstreben
Umsetzung: Workshops, Übungseinheiten; Einweisung neuer Mitarbeiter:innen sowie neue Methoden/ Technologien anwenden
Quelle: Lang, K., Roman Gerlach, Jessica Rex, Annett Schröter, & Nadine Neute.(2025, April 30). Coffee Lecture Slides: 5S Data. Zenodo. doi:10.5281/zenodo.15310362
Bitte beachten Sie: Sobald Sie sich das Video ansehen, werden Informationen darüber an Youtube/Google übermittelt. Weitere Informationen dazu finden Sie unter Google Privacy.
Quelle Video: 5S Data: Setz dich auf deine 5 Buchstaben und organisiere deine Daten! (Coffee Lecture), Forschungsdatenmanagement Thüringen (TKFDM), 2021
Ordnerstrukturen und Dateibenennung
Der effektive und sichere Umgang mit Daten erfordert die Erstellung und Nutzung klarer Strukturen für die Organisation Ihrer Daten. Zu einer effektiven Datenorganisation gehören systematische Ordnerstrukturen, die einen einheitlichen Aufbau der Ordner- und Dateinamen festlegen und geeignete Speicherorte auswählen.
Aussagekräftige Namenskomponenten sind z. B.:
- Titel, mit Aussage zum Inhalt
- Kürzel des/der Bearbeiters/Bearbeiterin
- Datum im Format JJMMTT
- Versionsnummer (z. B. „v02“)
Beispiel für einen Dateinamen: <JJMMTT_TitelMessreihe_Bearbeiter_Version>
Weitere Hinweise zu Benennungen und Ordnerstrukturen:
- Leerzeichen vermeiden, stattdessen „-“ oder „_“
- Sonderzeichen vermeiden, z.B. & * % €? !
- Umlaute vermeiden
- Generische Namen vermeiden, z.B. „Datensatz“, „Text“
- Lange Namen vermeiden
- Zu viele Ebenen und parallele Ordner vermeiden
Weiterführende Links
Versionierung
Konsequente Versionierung von Forschungsdaten inklusive ihrer Dokumentation ist essenziell für das Nachvollziehen und Unterscheiden von verschiedenen Stadien der Bearbeitung. Sie hilft dabei insbesondere an Meilensteinen von Daten und Dokumenten die Änderungen nachzuvollziehen.
Möglichkeiten der Versionierung:
- im Dateinamen, z.B. durch Anfügen von „v01“ oder „final“ an das Ende des Dateinamens
- in der jeweiligen Datei, z.B. durch Einfügen einer Änderungshistorie am Anfang des Textdokuments. Nicht alle Dateiformate ermöglichen das Hinzufügen eines solchen Textbereichs.
- im gesonderten Versionierungsdokument, d.h. ein separates Dokument, welches die Informationen sowie Änderungen und ggf. Bearbeitende und Datum der letzten Änderung u.ä. aufführt. Ein solches Dokument kann beispielsweise auch als Ergänzung zur Versionierung im Dateinamen dienen, um Informationen darüber zu dokumentieren, welche Änderungen zwischen zwei Versionen durchgeführt wurden.
- Software zur Versionskontrolle z.B. mit Git. Git kommt ursprünglich aus der Softwareentwicklung und ist besonders für die Verwaltung von textbasierten Dateien geeignet. Weitere Informationen finden sich beim Gitlab-Service der Universität Rostock.
- kollaborative Dokumenten und Speicherorte steht Versionierung und Änderungsverfolgung zur Verfügung, z.B. im Sharepoint kann eine Versionierung von Dokumenten aktiviert werden.
Nachhaltige Dateiformate
Die Nachnutzung von Forschungsdaten erfordert die Verarbeitbarkeit des entsprechenden Dateiformats. Insbesondere proprietäre, d.h. herstellerspezifische nicht veröffentlichte, Dateiformate sorgen ggf. für Herausforderungen in der Nachnutzung nach vielen Jahren, da entweder die häufig kostenintensive Software gekauft werden muss oder im schlimmsten Fall das Format reverse-engineered werden muss, um die Forschungsdaten nachnutzen zu können. Daher ist es empfehlenswert idealerweise ein offenes langfristig nutzbares Dateiformat zu wählen. Mitunter kann man in der jeweiligen Software einen Export oder eine Konvertierung in ein offenes Format durchführen, wobei zu prüfen ist, ob Informationen dabei verloren gehen. Sofern dies nicht verlustfrei ist, empfiehlt sich dennoch die zusätzliche Ablage als offenes Format mit einer Dokumentation welche Einschränkungen damit verbunden sind, um flexibel in der Nachnutzung zu sein. Die nachfolgende Tabelle enthält Empfehlungen für gängige Datenarten:
| Datenart | Empfehlung | Vermeiden |
|---|---|---|
| Tabellen | CSV, TSV, SPSS portable, ODS, XLSX | XLS, SPSS, NUMBERS |
| Texte | TXT, HTML, RFT, PDF/A, DOCX, ODT | DOC, PDF, PAGES |
| Multimedia | Container: MP4, MKV, Codec: Theora, Dirac, FLAC, MPEG4 | QuickTime, Flash |
| Bilder | TIFF, JPEG2000, PNG, JPG | GIF, RAW, NEF, PSD, VSD |
Backup-Strategien
3-2-1 Regel
Von den Daten sollten 3 Kopien angelegt werden, auf 2 unterschiedlichen Medien, dazu eine Kopie dezentral sichern.
Beispiel: Originaldaten: Auf deinem Laptop sicher; Erstes Backup: Eine Kopie auf einer externen Festplatte; Zweites Backup: Eine zusätzliche Kopie in der Cloud.
Vorteile:
Datensicherheit und Minimierung von Datenverlust
Schutz vor physischen Gefahren
Einfachheit und Flexibilität
Hinweise für ein sicheres Backup:
Datenträger für Backups sollten von der genutzten Infrastruktur abgekoppelt sein
Empfehlung: mind. 1-mal täglich sichern + wöchentliches Gesamtbackup
Datenwiederherstellung zu Projektbeginn und in regelmäßigen Abständen überprüft werden

