top of page

Advertorial

Storage für KI: Eine ganz besondere Herausforderung

Dass KI viel Rechenleistung benötigt, ist den meisten Unternehmen bewusst, doch dass auch die Anforderungen an die Storage-Infrastrukturen deutlich ansteigen, wird häufig übersehen. Dabei haben Unternehmen schon heute Schwierigkeiten, ihre schnell wachsenden Datenmengen effizient zu verwalten.

Storage für KI: Eine ganz besondere Herausforderung

Christian Winterfeldt, Senior Director, Data Center Sales, DACH bei Dell Technologies in Deutschland (Quelle: Dell Technologies)

Bevor Unternehmen mit der Entwicklung und dem Training von KI-Modellen beginnen, sollten sie ihre IT-Infrastrukturen auf den Prüfstand stellen und gegebenenfalls modernisieren. Das betrifft nicht nur die Server, die äußerst rechenintensive Arbeitslasten bewältigen müssen und auf spezialisierte Komponenten wie leistungsstarke GPUs angewiesen sind, sondern auch die Storage-Systeme. Diese sind schon jetzt oft kaum in der Lage, die schnell wachsenden Datenmengen der Unternehmen effizient zu verwalten, und mit KI wird sich dieses Problem nur noch weiter verschärfen. Schließlich stellt KI ganz besonders hohe Anforderungen an die Leistung, Kapazität, Skalierbarkeit und Datensicherheit der Systeme.


Das liegt vor allen daran, dass der KI-Einsatz mit enormen Datenmengen einhergeht. Die KI-Modelle haben nicht nur einen riesigen Informationshunger und liefern bessere Ergebnisse, wenn sie mit mehr relevanten Daten trainiert werden. Sie generieren darüber hinaus auch selbst viele Daten, die zuverlässig aufgefangen werden müssen. Unternehmen benötigen daher skalierbare Speicherlösungen, die sich leicht erweitern lassen, wenn die Kapazitäten knapp werden – zumal erste erfolgreiche KI-Projekte in der Regel schnell weitere Projekte nach sich ziehen und Unternehmen rasch neue Datenquellen erschließen, um weitere Prozesse und Entscheidungen zu verbessern. Im Grunde führt KI eigentlich fast immer dazu, mehr und mehr Daten anzusammeln und in neuen Anwendungsfällen zu nutzen.


Schnelle und energieeffiziente Datenbereitstellung


Um das Training oder Fine-Tuning der Modelle nicht auszubremsen beziehungsweise wichtige KI-Entscheidungen nicht zu verzögern, müssen die Speichersysteme zudem äußerst leistungsstark sein und Daten zügig bereitstellen. Dafür setzen sie meist auf NVMe-SSDs, die hohe Kapazitäten mit hohen Datenübertragungsraten vereinen und deutlich mehr IOPS pro Watt als Festplatten liefern. Damit ermöglichen sie eine energieeffiziente Datenbereitstellung, wobei auch optimierte Systemdesigns mit hohen Speicherdichten und effizienten Kühlkonzepten zu niedrigen Betriebskosten beitragen. Gleiches gilt für die integrierten Mechanismen zur Datenreduktion, die helfen, den wertvollen Speicherplatz optimal auszunutzen und unnötige Kosten durch redundante Daten zu vermeiden.


Neben der Komprimierung kommt es dabei vor allem auf die Deduplizierung an, von deren Leistungsfähigkeit sich Unternehmen am besten in PoCs oder in den Demo-Centern der Anbieter überzeugen sollten, da die Unterschiede zwischen den verschiedenen Lösungen teilweise erheblich sind. Überhaupt ist es sinnvoll, vor der Anschaffung neuer Storage-Systeme den Austausch mit Anbietern oder deren Partnern zu suchen, da diese mit ihrer Erfahrung und smarten Sizing-Tools den aktuellen und künftigen Bedarf an Speicherkapazitäten gut prognostizieren können.


Einbindung von Cloud und Edge


Moderne Storage-Systeme basieren auf offenen Plattformen, die eine einheitliche Datenverwaltung vom Rechenzentrum über die Cloud bis an den Edge sowie reibungslose Datenmigrationen zwischen diesen Speicherorten ermöglichen. Die Cloud-Anbindung ist wichtig, um Daten mithilfe spezialisierter KI-Lösungen zu verarbeiten, ältere Daten kosteneffizient auszulagern oder wertvolle Informationen außer Haus zu sichern. Die Einbindung des Edge wiederum ist für Analysen und Entscheidungen in Echtzeit erforderlich, da viele Anwendungsfälle nach kurzen Antwortzeiten verlangen, etwa die Steuerung von Maschinen in der Fertigung, die Betrugserkennung im Finanzsektor oder die Interaktion mit Kunden im Einzelhandel. In all diesen Fällen muss die KI die Daten möglichst nah am Ort ihrer Entstehung verarbeiten – das vorherige Training der KI-Modelle kann allerdings durchaus im Rechenzentrum stattfinden, da sich die benötigten Rechenressourcen dort besser und kostengünstiger bereitstellen lassen als am Edge.


KI-Optimierung der Storage-Infrastruktur


In den Storage-Plattformen selbst steckt inzwischen ebenfalls KI – die intelligente Überwachung und Optimierung der Systeme kann den IT-Teams viel Arbeit abnehmen und mögliche Probleme frühzeitig verhindern. KI-basierte Funktionen erkennen beispielsweise Nutzungsmuster und verlagern die gespeicherten Informationen dementsprechend auf Storage-Tiers, die häufig genutzte Daten schnell bereitstellen und selten genutzte Daten kostengünstig speichern. Zudem helfen sie bei der Storage-Planung, indem sie frühzeitig vor drohenden Kapazitäts- und Leistungsengpässen warnen. Auch Systemfehler und Defekte sagen sie zuverlässig vorher, bevor diese eintreten, sodass Unternehmen gezielt Wartungen ansetzen und ungeplante Ausfallzeiten verhindern können.

Darüber hinaus spielt KI beim Schutz der Daten eine entscheidende Rolle, denn diese sind ein attraktives Ziel für Cyberkriminelle, die unternehmenskritische Informationen nicht nur stehlen oder verschlüsseln, sondern immer häufiger manipulieren. Letzteres stellt im KI-Zeitalter ein hohes Risiko dar, da sich Veränderungen am Trainingsmaterial nur schwer erkennen lässt und dazu führt, dass KI-Tools ungenaue Prognosen liefern und nicht-optimale Entscheidungen fällen. Fortschrittliche Security-Lösungen nutzen daher KI, um ungewöhnliche Aktivitäten innerhalb der Infrastruktur aufzuspüren, die auf eine Bedrohung hindeuten können, etwa Zugriffe zu ungewohnten Zeiten, von unüblichen Orten oder die plötzliche Veränderung vieler Bestandsdaten.


Davon abgesehen helfen Konzepte wie Zero Trust, das Risiko von Angriffen zu minimieren. Hier schränken die Vergabe möglichst geringer Berechtigungen und eine konsequente Verifizierung aller Zugriffe den Handlungsspielraum von Cyberkriminellen erheblich ein. Selbst mit gestohlenen Passwörtern können sie sich nicht länger nahezu ungehindert innerhalb der Infrastruktur bewegen. Dennoch bleibt natürlich eine leistungsfähige Data Protection Pflicht, um Daten unabhängig von ihrem Speicherort zu sichern und auch nach schwerwiegenden Cyberattacken oder weitreichenden Systemausfällen wiederherstellen zu können. Geht es darum, Storage-Infrastrukturen für KI fit zu machen, dürfen die Investitionen somit nicht nur in die Systeme selbst fließen, sondern müssen auch den Schutz der darauf gespeicherten Daten abdecken.


Artikel von Christian Winterfeldt, Senior Director, Data Center Sales, DACH bei Dell Technologies

bottom of page