Trends in der Datenspeicherung

Ein Beitrag von Rainer Zielonka, Leiter des Arbeitskreises 6.3 „Digitale Archivierung”

Die aktuelle Technologie zur Speicherung und Archivierung von Daten durchläuft momentan eine tiefgreifende Veränderungsphase, vergleichbar mit der Einführung der Festplattentechnologie Mitte der Fünfzigerjahre. Die Speicherinfrastruktur wird dabei auf ein All-Flash-KI-gesteuertes, softwaredefiniertes und automatisiertes Modell weiterentwickelt, welches insbesondere stark gestiegene Anforderungen an zukünftiges Datenwachstum, die Einführung von Künstlicher Intelligenz (KI) und neue Herausforderungen an Datensicherheit unterstützen wird.

Der AWV-Arbeitskreis 6.3 "Digitale Archivierung" hat zukunftsorientiert die Aufgabe übernommen, zu informieren und die fachgerechte Beurteilung von neuen Trends zu unterstützen. KI wird mehr und mehr Mainstream werden.

Um die Vorteile der Big-Data-Analyse optimal zu nutzen, werden KI-Lösungen mit der klaren Absicht zum Einsatz kommen, Datenvorgänge radikal zu vereinfachen und komplexe manuelle Aufgaben zu automatisieren. KI ist die Zukunft nicht nur für die Speicherung, sondern generell für alle verfügbaren, aktuellen und angewandten Technologien in Rechenzentren.

Aktuelle Speicher und Speicher­infrastrukturen
Flash-Speicher, wie z. B. NVM-Arrays (nichtflüchtiger Speicher) und SSDs (Solid State Disks), sind der neue Standard, und es ist zu erwarten, dass rotierende Laufwerke im hoch performanten Bereich in Kürze überwiegend großflächig durch SSDs ersetzt werden. Der offensichtliche Grund: SSDs bieten eine höhere Leistung, Energieeinsparung, Raumeffizienz und einen geringeren Overhead.

Software Defined Storage (SDS) ist ein heute bereits weit verbreitetes Konzept bei dem Speichersoftware verwendet wird, um richtlinienbasierte Bereitstellung und Verwaltung der Speichergeräte wesentlich effizienter nutzen zu können. SDS bietet dabei sozusagen eine Form der Speicher-Virtualisierung, da der Speicher unabhängig von der zugrunde liegenden Hardware zu sein scheint. Dieser Umstand erlaubt eine erhebliche Flexibilitätssteigerung und deutliche Benutzerfreundlichkeit sowohl beim Definieren als auch generell beim Verwalten von Speichersystemen.

Die Hyperconverged Infrastructure (HCI) ist dabei als integrierte Lösung anzusehen, die sowohl Storage, Computing, Netzwerk als auch Virtualisierung in jeweils einer Hardware oder Anwendung vereinigt und damit eine erhebliche Leistungssteigerung und Komprimierung bietet. Mit HCI können auch weitere zusätzliche Funktionalitäten wie Replikation, Cloud Archivierung und Encryp­tion zu einer kompletten Lösung für Backup, File Services Analytics und anderen Speicherlösungen abgebildet werden.

Bei einer mehrstufigen Speicherhierarchie (Tiered Storage) werden jeweils verschiedene Arten von Speicherlösungen unterschiedlichen Klassifizierungen von Daten zugewiesen. Damit können Gesamtspeicherkosten reduziert und dennoch Anforderungen an vereinbarte Servicelevel verlässlich erfüllt werden.

Die Cloud ist in diesem Zusammenhang eine neu entwickelte Speicherlösung, die SSD, HDDs und Tape in einer eigenen, gestuften Hierarchie nach jeweiligen Erfordernissen kombinieren kann.

Einer der Schlüsselparameter für Tiered Storage ist das jeweilige Datenalterungsprofil, welches für die meisten verwendeten Datentypen gilt. Die Wahrscheinlichkeit, auf die Daten zuzugreifen, nimmt mit zunehmender Alterung seit ihrem Erstellungsdatum ab, und die Daten bewegen sich im Laufe der Zeit in Richtung Archivstatus. Tiered Storage ist damit ein Grundprinzip für geordnetes Data Lifecycle Management. Eine abgestufte Speicherstrategie kann dabei zwei, drei oder vier Ebenen verwenden; vier Ebenen bieten dabei die optimale Kombination von Kosten und Leistung. Die Grundlagen für das gestufte Speichern liegen über 30 Jahren zurück, als Festplatten, automatisierte Bandbibliotheken und fortschrittliche richtlinienbasierte Datenverwaltungssoftware (jetzt als HSM bekannt) kombiniert wurden, um weniger aktive Daten effektiv auf kostengünstigere Speichergeräte zu migrieren. Mit Deep Archive ist in diesem Zusammenhang ein Speicherort für Daten gemeint, auf den mit großer Wahrscheinlichkeit nicht mehr zugegriffen werden wird, der jedoch im Falle eines Compliance-Audits oder aus anderen geschäftlichen Gründen zwingend aufbewahrt werden muss.

Grundsätzlich entscheidend ist bei diesem Modell die Frage, ob die Daten auf physischen Speichermedien oder in der Cloud abgelegt werden – beide Lösungen bringen Vor- und Nachteile mit sich. Werden digitalisierte Dokumente beispielsweise in der Cloud gespeichert, können Anwender jeweils flexibel und ortsunabhängig auf ihre Daten zugreifen. Zudem lassen sich die gespeicherten Daten auch auf unterschiedlichen Endgeräten jederzeit abrufen. Es entfallen Bereitstellung und Betreuung von Speichersystemen sowie die Installation von Software, Wartungen, Backups oder Updates der IT-Infrastruktur bei der Nutzung von Cloud-Diensten. Einen weiteren positiven Aspekt stellt die jederzeit mögliche flexible und kurzfristige Erweiterung des Speicherbedarfs dar. Sicherheit, ein wichtiges Thema beim Einsatz von Cloud-Lösungen in Unternehmen, ist jederzeit gewährleistet. Vor allem bei der Speicherung hochsensibler Daten, wie sie etwa im Gesundheits- oder Bankenwesen anfallen, sollte aus Sicherheitsgründen ein besonderes Augenmerk auf eine Ende-zu-Ende-Datenverschlüsselung gelegt werden. Auch darf man Abhängigkeiten wie Bandbreite, Verfügbarkeit und laufende Kosten keinesfalls unterschätzen.

Storage-as-Service (StaaS) basiert auf dem Cloud Computing Service Modell Infrastructure-as-a-Service (IaaS). Dem Anwender wird in diesem Fall Speicherplatz über ein Netzwerk zur Verfügung gestellt, welcher individuell für Online Backups, Datenarchivierung oder zur Bereitstellung von Dokumenten verwendet werden kann. Immer mehr Unternehmen setzen zudem auf sogenannte Hybrid-Lösungen aus Cloud und lokalem Speichermedium. Im laufenden Geschäftsbetrieb erfolgt das Backup jeweils lokal. Erst nachts werden dann Daten in die Cloud transferiert, um im laufenden Betrieb bei großen Datenmengen keine Einschränkungen bei der Bandbreite hervorzurufen. Dieses Modell kann auch insofern lukrativ und effizient sein, als Firmen, welche die Vorteile einer Cloud nutzen, sehr sensible Daten zusätzlich nach wie vor auf physischen Speichern ablegen und verwalten können.

Die Aufbewahrungspflichten für geschäftsrelevante Dokumente stellen Unternehmen vor weitere Herausforderungen im Rahmen der Datenspeicherung. Je nach Branche existieren unterschiedlich lange Vorgaben in Bezug auf die Langzeitarchivierung. Damit elektronische Daten auch nach über 30 Jahren noch lesbar sind, müssen jedoch ganz spezifische Vorkehrungen getroffen werden. Eine entscheidende Rolle spielen im Zuge dessen das Archivierungsmedium und das Dateiformat. Dabei dominieren drei Speichermedien: externe und interne Festplatten sowie Tapes.

Müssen Daten jeweils über längere Zeiträume aufbewahrt werden, sollte neben dem passenden Archivierungsmedium auch auf die entsprechenden Schreib- und Lesesysteme geachtet werden. Die Hauptproblematik liegt dabei in der Haltbarkeit von Speichermedien wie Magnetbändern, Festplatten, Flash-Speichern oder DVDs. Bei optischen Speichermedien gilt eine Lebensdauer von zehn bis 30 Jahren als realistisch, bei Festplatten sind es etwa fünf Jahre, Magnetbänder können indes 30 Jahre oder mehr überstehen.

Archiving-as-a-Service (AraaS) bietet leistungsstarke Lösungen für die Dokumentenarchivierung in der Cloud. Es ist dabei möglich, wichtige Daten und Dokumente, die aufbewahrt werden sollen, einfach und sicher in der Cloud zu speichern. Auf diese kann dann jederzeit und von überall zugegriffen werden.

Wie geht es nun weiter?
Niemand kann in die Zukunft sehen. Den ständig steigenden Datenzuwachs, die noch weiterwachsende Komplexität in Kombination mit zunehmenden Sicherheitsproblemen gilt es zu bewältigen. Technologien wie Hybrid Memory Cube (HMC), Phase-Change Memory (PCM), Quanten Computing und DNA als Langzeitspeichermedium werden uns dabei helfen, diese Ziele zu erreichen. In Zukunft werden viele heute noch übliche technologische Details der Datenspeicherung zunehmend an Bedeutung verlieren, während die Diskussionen um den betrieblichen Geschäftswert zunehmen werden. Speicherentscheidungen werden zunehmend basierend darauf getroffen werden, was Unternehmen grundsätzlich und offensichtlich benötigen, um ihr Geschäft auszubauen und Gewinne zu erzielen, weniger darauf, wo und wie die Daten gespeichert werden.

Wir wollen als Arbeitskreis der AWV die dringendsten Herausforderungen und Chancen des Speichers in Bezug auf die Zukunft besser verstehen, diese fachkundig bewerten und Unterstützung in der Vorbereitung auf zukünftige Technologien bieten.

Zurück zu Seite 1 | Zurück zu Seite 2 | Seite 3

Bild: AdobeStock, Pavel Ignatov