Deletion of data sources and the CaosDB Crawler

assigned to @henrik

User Comment:

Einen echten Synchronisations-Ansatz a la Dropbox ist für Forschungsdaten denke ich zu gefährlich. Wenn aus Versehen der Crawler auf einem leeren Ordner ausgeführt wird, kann unter Umständen alles gelöscht werden, im schlimmsten Fall unbemerkt. Bei Dropbox & Co ist das mehr oder weniger ok, da es sehr einfach ist alles wieder herzustellen, aber auch nur wenn der Nutzer das bemerkt.

Für die Nextcloud am unserem Institut habe ich versucht eine Art on-demand Synchronisation zu verwenden (https://manpages.debian.org/testing/nextcloud-desktop-cmd/nextcloudcmd.1.en.html), aber es ist damit unheimlich schwer vorherzusagen, was genau in bestimmten Situationen passieren wird (Ordner leer, Dateien umbenannt, Konflikt zwischen Server und lokalem Ordner, ...)

Für den CaosDB-Crawler könnte ich mir vorstellen, dass das Modifizieren und Löschen von Dateien ähnlich wie in Git funktionieren könnte. Also der User sieht im "git status", dass Dateien gelöscht/verschoben wurden, und kann durch eine explizite Aktion (staging/commit) dann durchführen.

TL;DR Datenveränderung sollte immer explizit sein, nicht unbemerkt. Löschen sollte möglich sein.

Deletion of data sources and the CaosDB Crawler

Designs

Child items ...

Activity