105 - Wofür ist der Institutional Cloud Storage (Projektspeicher) gut und weniger gut geeignet?

Während der Institutional Cloud Storage ganz vorzüglich zur Ablage von Dokumenten und für die Nutzung durch Arbeitsgruppen geeignet ist, passt er nicht zu jedem Einsatzbereich. Dieser Artikel nennt die wichtigsten Kriterien für sinnvolle, nicht empfohlene und falsche Einsatzmöglichkeiten:

Sinnvolle Einsatzmöglichkeiten des Cloud Storage

Ersatz von lokalen Dateiservern für Dokumente

Kleine Arbeitsgruppen mit 10-100 Mitarbeitern haben oft eigene Fileserver mit einigen Terabyte Speicherplatz. Diese können ohne weiteres auf den Institutional Cloud Storage (Projektspeicher) migriert werden. Die lokalen Fileserver können dann aufgelöst werden.

Lehrstuhl-, Fakultäts- und Uni-übergreifende Projekte

Wenn in einem Projekt Mitarbeiter aus unterschiedlichen Bereichen einer Universität zusammenarbeiten sollen, kann eines der beteiligten Institute einen Teil des eigenen Speicherbereiches für das Projekt freigeben und allen Projektmitarbeitern Zugriffsrechte gewähren.

MWN-weiter Dateizugriff

Innerhalb des gesamten MWN haben Sie Zugriff auf Ihre Daten. Das LRZ stellt sicher, dass auch lokale Firewalls innerhalb des Münchner Wissenschaftsnetzes den Datenverkehr zu den Dateidiensten auf den LRZ Cloud Storage durchlassen. Das ist mit eigenen Fileservern nicht leicht umzusetzen, da die CIFS-typischen Ports oft blockiert werden. Sollten lokale Firewalls am Lehrstuhl (oder/und dem eigenen Rechner) den Zugriff sperren müssen die zuständigen Administratoren gebeten werden den Zugang für die CIFS-Ports und IP-Adressen freizuschalten.

Remote Access - Zugriff aus der Ferne

Der Zugriff auf die Dateidienste ist über das LRZ-VPN weltweit möglich. Da die Dateidienste SMB 2.x und 3.x unterstützen ist die Performance über WAN-Leitungen recht gut. Steht kein VPN zur Verfügung, kann mit einem Web-Browser über die Webdisk (https://webdisk.ads.mwn.de) auf die Daten zugegriffen werden.

Speicherplatz für CIP-Pools

Zentrale Rechnerräume können für die Dateidienste konfiguriert werden. Damit können die Benutzer sehr einfach von jedem Rechner im CIP-Pool auf ihre Dateien zugreifen.

Nicht empfohlene Nutzung des Cloud Storage

Serverbetrieb auf den Dateidiensten

Wenn Applikationen mit intensiver I/O mit einzelnen Dateien (Messdatenanalyse, Übersetzen von Programmen etc.) auf dem LRZ Cloud Storage betrieben werden und der bearbeitende Rechner lokal steht, ist mit Leistungseinbußen zu rechnen. Testen Sie, ob die Leistung für Sie akzeptabel ist. Sollte die Last auf den Speichersysemen zu stark steigen behält sich das LRZ vor den entsprechenden Speicherbereich bezüglich IOPs und/oder Datendurchsatz zu drosseln. Alternativ sollten Sie darüber nachdenken, Server und Daten entweder lokal zu halten oder beides auf eine, vom LRZ gehosteten Umgebung umzuziehen.

Speicherplatz für große Medien und Sensordaten

Die Dateidienste sind für umfangreiche Medien- und Sensordaten sowie als Speicher für GPU/GPGPU-Systeme (z.B. KI-Appllikationen, etc. ) weniger gut geeignet, da die Speichersysteme für diesen Zweck nicht konzipiert wurden. Wenn Sie sich für die Beibehaltung oder Anschaffung eines lokalen Fileservers entscheiden, empfehlen wir, den Fileserver in das zentrale Active Directory einzugliedern. Das Backup sollte mit Hilfe der Angebote des LRZ durchgeführt werden.

Wenn es darum geht, Daten für längere Zeit zu archivieren (gute wissenschaftliche Praxis), empfehlen wir den Archivierungsdienst des LRZ oder den ISAR Cloud Storage zu nutzen.

Image-basierte Verschlüsselung

Es wird nicht empfohlen, im größeren Umfang eine Image-basierte Verschlüsselung auf den Dateidiensten einzusetzen (z.B. Truecrypt mit sehr großen Verzeichnissen). Durch die Arbeitsweise dieser Verschlüsselungsverfahren entsteht aus dem ganzen Verzeichnisbaum nur eine einzige, große Datei, die durch den Fileserver nur als Ganzes behandelt werden kann. Eine Wiederherstellung einzelner Dateien des Originalverzeichnisses durch Snapshots ist daher nur mit Umwegen möglich. Zudem können mehrere Personen nicht mehr gleichzeitig auf den verschlüsselten Bereich zugreifen.

Falls Sie eine Verschlüsselung für nötig halten, empfehlen wir den Einsatz dateibasierter Verschlüsselungsverfahren (z.B. PGP). Bei jeder Verschlüsselung muss auf die langfristige Verwaltung der Schlüssel geachtet werden. Ein Schlüsselverlust bedeutet den unwiederbringlichen Verlust der Daten.

Falscher Einsatz des Cloud Storage

Es gibt einige Anwendungsfälle, bei denen wir von der Nutzung des zentralen Speichers explizit abraten.

Datenbankserver auf Projektspeicher

Es wird nicht empfohlen, Multiuser-Datenbanken oder andere Applikationen mit einem parallelen Zugriff durch mehrere Nutzer/Instanzen auf dem LRZ Cloud Storage zu betreiben. Die technische Konfiguration (aktivierte Oplocks) ist für den normalen Dateibetrieb optimiert und kann zu Problemen bis hin zum Datenverlust im Fall von Verbindungsunterbrechungen führen.

Gegen die Ablage z.B. einfacher Access-Datenbanken, die im Single-User-Modus betreiben werden, bestehen jedoch keine Einwände.

Backup

Der Projektspeicher soll nicht zur Ablage von Backups genutzt werden. Dafür bietet das LRZ spezifische Lösungen an, die nicht nur eine längere Aufbewahrungsdauer (mind. 6 Monate statt 4 Wochen) bieten, sondern für diesen Einsatzzweck auch optimiert sind.

Home-Verzeichnisse für Linux/Unix

Native Home-Verzeichnisse für Linux/Unix-Server sind derzeit nicht möglich, da kein NFS angeboten wird und die CIFS-Clients einige Unix-Spezialitäten (Softlinks) nicht unterstützen. Es ist aber ohne weiteres möglich, Projektspeicher oder den persönlichen Speicher als Unterverzeichnis im Home-Verzeichnis bereitzustellen. Die CIFS-Semantik bereitet dann auch keine Probleme bei der gemeinsamen Nutzung von z.B. Office-Dokumenten.

Offline Folder

Offline Folder führen im täglichen Betrieb immer wieder zu Probleme, da teilweise die Synchronisation zum Speichersystem aussetzt bzw. nicht mehr ordnungsgemäß funktioniert. Dies kann dazu führen, dass Dateien nicht bzw. nur ältere Versionen einer Datei auf dem Speichersystem gespeichert wurden. Aus diesem Grund wird die Verwendung von Offline Folder NICHT empfohlen!