KI-Inferenz an der Edge: Cloudian und AWS kooperieren

Objektspeicher-Anbieter Cloudian bringt zusammen mit AWS eine KI-Plattform auf den Markt, die Unternehmen Echtzeit-Datenverarbeitung an dezentralen Standorten ermöglichen soll – ohne eigene Rechenzentren.

Der Objektspeicher-Spezialist Cloudian hat eine KI-Datenplattform für AWS Local Zones vorgestellt. Die Lösung kombiniert S3-kompatiblen Speicher mit GPU-beschleunigter Infrastruktur und zielt auf KI-Anwendungen ab, die eine geringe Latenz erfordern.

AWS Local Zones stellen Rechen- und Speicherkapazitäten in der Nähe von Ballungszentren und Industrieregionen bereit. Die neue Plattform nutzt dieses Konzept, um KI-Workloads näher an den Datenquellen zu betreiben. Laut Cloudian sollen Latenzzeiten unter 10 Millisekunden möglich sein.

RAG-Anwendungen im Fokus

Der erste Anwendungsfall konzentriert sich auf Enterprise Document RAG (Retrieval Augmented Generation). Dabei greifen KI-Systeme auf unternehmensinternes Wissen zu – etwa Dokumente, Handbücher oder Berichte – und stellen diese über eine Chat-Oberfläche bereit.

„Unternehmen müssen sich nicht länger zwischen Performance, Datensouveränität und Wirtschaftlichkeit entscheiden“, erklärt Neil Stobart, CTO bei Cloudian. Die lokale Datenverarbeitung soll Datenschutzanforderungen gerecht werden, während das Pay-as-you-go-Modell von AWS Vorabinvestitionen vermeidet.

Technische Ausstattung

Die Plattform nutzt GPU-Server mit bis zu acht NVIDIA Hopper GPUs und 640 GB GPU-Speicher sowie AMD-EPYC-Prozessoren der dritten Generation. Die Netzwerkbandbreite erreicht bis zu 3.200 Gbit/s über Elastic Fabric Adapter. Eine integrierte Vektordatenbank indexiert multimodale Inhalte automatisch.

Justin Boitano, Vice President Enterprise AI Products bei NVIDIA, sieht in der Kombination aus Compute- und Speicherleistung am Edge einen Vorteil für RAG-Anwendungen.

Cloudian verspricht eine Bereitstellung innerhalb von Stunden statt Monaten, wie sie bei traditionellen Edge-Implementierungen üblich sei. Die Plattform ist ab sofort verfügbar.

Foto: Neil Stobart, CTO bei Cloudian (Quelle: Cloudian)

More from author

Ähnliche Beiträge

Latest posts

Geschützt: Warum Holz bei Terrassenüberdachungen das Comeback des Jahrzehnts feiert

In der Baubranche wird seit Jahren ein intensiver Zweikampf zwischen Aluminium und Holz geführt. Während Aluminium oft mit dem Versprechen der absoluten Wartungsfreiheit wirbt, punktet Holz massiv bei den initialen Investitionskosten und der unschlagbaren ökologischen Bilanz.

Neuer PEUGEOT 408 kann ab jetzt bestellt werden

Der französische Automobilhersteller PEUGEOT hat die Bestellsysteme für sein neuestes Modell, den PEUGEOT 408, geöffnet.

Botox unter 30: Warum die Generation Z zur Spritze greift

Aktuelle Branchenzahlen zeigen, dass der Anteil der unter 30-Jährigen bei Botox-Behandlungen in Deutschland 2025 auf 8,8 Prozent gestiegen ist.