KI-Inferenz an der Edge: Cloudian und AWS kooperieren

Objektspeicher-Anbieter Cloudian bringt zusammen mit AWS eine KI-Plattform auf den Markt, die Unternehmen Echtzeit-Datenverarbeitung an dezentralen Standorten ermöglichen soll – ohne eigene Rechenzentren.

Der Objektspeicher-Spezialist Cloudian hat eine KI-Datenplattform für AWS Local Zones vorgestellt. Die Lösung kombiniert S3-kompatiblen Speicher mit GPU-beschleunigter Infrastruktur und zielt auf KI-Anwendungen ab, die eine geringe Latenz erfordern.

AWS Local Zones stellen Rechen- und Speicherkapazitäten in der Nähe von Ballungszentren und Industrieregionen bereit. Die neue Plattform nutzt dieses Konzept, um KI-Workloads näher an den Datenquellen zu betreiben. Laut Cloudian sollen Latenzzeiten unter 10 Millisekunden möglich sein.

RAG-Anwendungen im Fokus

Der erste Anwendungsfall konzentriert sich auf Enterprise Document RAG (Retrieval Augmented Generation). Dabei greifen KI-Systeme auf unternehmensinternes Wissen zu – etwa Dokumente, Handbücher oder Berichte – und stellen diese über eine Chat-Oberfläche bereit.

„Unternehmen müssen sich nicht länger zwischen Performance, Datensouveränität und Wirtschaftlichkeit entscheiden“, erklärt Neil Stobart, CTO bei Cloudian. Die lokale Datenverarbeitung soll Datenschutzanforderungen gerecht werden, während das Pay-as-you-go-Modell von AWS Vorabinvestitionen vermeidet.

Technische Ausstattung

Die Plattform nutzt GPU-Server mit bis zu acht NVIDIA Hopper GPUs und 640 GB GPU-Speicher sowie AMD-EPYC-Prozessoren der dritten Generation. Die Netzwerkbandbreite erreicht bis zu 3.200 Gbit/s über Elastic Fabric Adapter. Eine integrierte Vektordatenbank indexiert multimodale Inhalte automatisch.

Justin Boitano, Vice President Enterprise AI Products bei NVIDIA, sieht in der Kombination aus Compute- und Speicherleistung am Edge einen Vorteil für RAG-Anwendungen.

Cloudian verspricht eine Bereitstellung innerhalb von Stunden statt Monaten, wie sie bei traditionellen Edge-Implementierungen üblich sei. Die Plattform ist ab sofort verfügbar.

Foto: Neil Stobart, CTO bei Cloudian (Quelle: Cloudian)

More from author

Ähnliche Beiträge

Latest posts

Wiedereinstieg von Tchibo ins Reisesegment

Über die neu gestaltete Plattform tchibo-travel.de können Kunden ab sofort eine Vielzahl an Urlaubsangeboten buchen, die mit besonderen Vorteilen verbunden sind.

KI macht uns alle gleich – außer die, die wirklich wollen

Was früher wenigen vorbehalten war, ist nun für alle verfügbar. Doch während Technologie allen Möglichkeiten eröffnet, nutzen nur wenige sie wirklich.

Von der KI-Vision zur Praxis: Warum Europa beim produktiven Einsatz nachziehen muss

Beim Executive Dinner in München diskutierten Führungskräfte, wie aus ambitionierten KI-Projekten echte Wertschöpfung wird.