KI-Inferenz an der Edge: Cloudian und AWS kooperieren

Objektspeicher-Anbieter Cloudian bringt zusammen mit AWS eine KI-Plattform auf den Markt, die Unternehmen Echtzeit-Datenverarbeitung an dezentralen Standorten ermöglichen soll – ohne eigene Rechenzentren.

Der Objektspeicher-Spezialist Cloudian hat eine KI-Datenplattform für AWS Local Zones vorgestellt. Die Lösung kombiniert S3-kompatiblen Speicher mit GPU-beschleunigter Infrastruktur und zielt auf KI-Anwendungen ab, die eine geringe Latenz erfordern.

AWS Local Zones stellen Rechen- und Speicherkapazitäten in der Nähe von Ballungszentren und Industrieregionen bereit. Die neue Plattform nutzt dieses Konzept, um KI-Workloads näher an den Datenquellen zu betreiben. Laut Cloudian sollen Latenzzeiten unter 10 Millisekunden möglich sein.

RAG-Anwendungen im Fokus

Der erste Anwendungsfall konzentriert sich auf Enterprise Document RAG (Retrieval Augmented Generation). Dabei greifen KI-Systeme auf unternehmensinternes Wissen zu – etwa Dokumente, Handbücher oder Berichte – und stellen diese über eine Chat-Oberfläche bereit.

„Unternehmen müssen sich nicht länger zwischen Performance, Datensouveränität und Wirtschaftlichkeit entscheiden“, erklärt Neil Stobart, CTO bei Cloudian. Die lokale Datenverarbeitung soll Datenschutzanforderungen gerecht werden, während das Pay-as-you-go-Modell von AWS Vorabinvestitionen vermeidet.

Technische Ausstattung

Die Plattform nutzt GPU-Server mit bis zu acht NVIDIA Hopper GPUs und 640 GB GPU-Speicher sowie AMD-EPYC-Prozessoren der dritten Generation. Die Netzwerkbandbreite erreicht bis zu 3.200 Gbit/s über Elastic Fabric Adapter. Eine integrierte Vektordatenbank indexiert multimodale Inhalte automatisch.

Justin Boitano, Vice President Enterprise AI Products bei NVIDIA, sieht in der Kombination aus Compute- und Speicherleistung am Edge einen Vorteil für RAG-Anwendungen.

Cloudian verspricht eine Bereitstellung innerhalb von Stunden statt Monaten, wie sie bei traditionellen Edge-Implementierungen üblich sei. Die Plattform ist ab sofort verfügbar.

Foto: Neil Stobart, CTO bei Cloudian (Quelle: Cloudian)

More from author

Ähnliche Beiträge

Latest posts

Neues Förderprogramm für Elektromobilität 2026: Staatliche Zuschüsse bis 6.000 Euro für E-Autos

Die Bundesregierung führt ab Januar 2026 ein neues Förderprogramm für Elektromobilität ein. Das Programm unterstützt private Käuferinnen und Käufer beim Umstieg auf elektrifizierte Fahrzeuge durch staatliche Zuschüsse von bis zu 6.000 Euro.

Die 10 größten Call Center Dienstleister in Deutschland 2026

Der deutsche Markt für Call Center und Customer Experience (CX) Dienstleistungen wächst weiter. Trotz Konsolidierung und technologischem Wandel durch KI-Integration verzeichnet die Branche steigende Umsätze.

Münchner Industriedenkmal wird zum Loft der Zukunft: Rock Capital Group baut HEAVEN THREE

Auf dem Gelände eines früheren Kunstdruckverlages in der Lothstraße entsteht bis Mitte 2028 das HEAVEN THREE.