Red Hat AI bringt Entwicklungs- und Betriebsteams von KI-Agenten zusammen

13. Mai 2026

Red Hat AI bringt Entwicklungs- und Betriebsteams von KI-Agenten zusammen

Red Hat AI liefert einen vollständigen „Metal to Agent“-Stack für KI und bietet mit neuen Funktionen eine Basis für die Skalierung von Modellen und autonomen Agenten in der Hybrid Cloud

ATLANTA – RED HAT SUMMIT, 13. Mai 2026 – Red Hat, der weltweit führende Anbieter von Open-Source-Lösungen, hat umfassende Verbesserungen für Red Hat AI angekündigt, die Unternehmen dabei unterstützen, KI vom Experimentierstadium in den produktiven Betrieb zu überführen. Die Plattform liefert einen einheitlichen und vollständigen „Metal to Agent“-Stack für KI, der mit Version 3.4 die Entwicklung und Bereitstellung agentenbasierter Workflows vereinfacht, sodass Unternehmen über ihre gesamte Infrastruktur hinweg von Piloten zu skalierbarer KI übergehen können.

Mit Red Hat AI bietet Red Hat ein konsistentes Framework für Entwicklungs- und Betriebsteams, das eine Basis für die Skalierung autonomer Systeme schafft und dabei die Kontrolle, Sicherheitsfunktionen und Hardware-Effizienz liefert, die moderne Unternehmen benötigen.

Was ist Red Hat AI 3.4?

Red Hat AI 3.4 ist eine umfassende Plattform, die die architektonische Basis und die betrieblichen Werkzeuge bereitstellt, die für die Skalierung von Modellen und agentenbasierten Workflows in der Hybrid Cloud benötigt werden. Im Mittelpunkt der neuen Version steht „Model-as-a-Service“ (MaaS), das Entwicklern eine einheitliche, kontrollierte Schnittstelle für den Zugriff auf kuratierte Modelle zur Verfügung stellt und es Administratoren erlaubt, deren Nutzung zu tracken und Richtlinien durchzusetzen. Unternehmen erhalten eine Grundlage für hochperformante, verteilte Inferenz, die auf vLLM und llm-d basiert, sodass sie Modelle optimiert und effizient in einer Vielzahl von Umgebungen bereitstellen können.

Agenten treiben die Nachfrage nach Inferenz exponentiell voran. Red Hat bietet Unternehmen die Möglichkeit, Agenten im großen Stil bereitzustellen und zu verwalten, unabhängig vom jeweiligen Agenten-Framework. Neu eingeführte AgentOps-Tools managen die Agenten von der Entwicklung bis zum Produktiveinsatz – inklusive integrierten Funktionen für Tracing, Observability, die Verwaltung von kryptografischen Identitäten und das Lifecycle-Management.

Um Unternehmensdaten leichter mit Modellen und Agenten zu verbinden, führt Red Hat AI 3.4 ein Prompt-Management ein, bei dem Prompts wie Daten-Assets erster Klasse behandelt werden. Darüber hinaus gibt es einen neuen Evaluation Hub zur Beurteilung der Genauigkeit, Qualität und Sicherheit von Modellen und Agenten. Die Funktionen basieren auf MLFlow, das sich auch um das Tracking von Experimenten und das Management von Artefakten kümmert – sowohl für generative als auch prädiktive KI. Die Plattform erlaubt es Nutzern, Modelle und Agenten mit Hilfe von automatisierten Sicherheitstest und Red Teaming sicher zu evaluieren. Dabei kommen Technologien von Chatterbox Labs und dem Garak-Projekt zum Einsatz, die einen sicheren Weg von experimentellen Piloten zu produktionsreifen Unternehmensanwendungen bereiten.

Warum ist Red Hat AI 3.4 wichtig?

Der Übergang von experimentellen Chatbots zu produktionsreifen autonomen Systemen erfordert einen grundlegenden Wandel in der Zusammenarbeit von IT-Teams. Viele Unternehmen erkennen inzwischen die Notwendigkeit, sich von reinen „Token-Verbrauchern“ zu „Token-Providern“ weiterzuentwickeln, um Kosten besser verwalten und private, souveräne KI-Anwendungsfälle umsetzen zu können. Eine Hürde stellen dabei weiterhin die unterschiedlichen Interessen von Entwicklern und Infrastrukturadministratoren dar. Ohne einen einheitlichen Ansatz, der diese beiden Rollen zusammenbringt, bremsen Zugangsbarrieren zur Infrastruktur die Innovationen aus, während Schatten-KI zu unkontrollierten Risiken und unvorhersehbaren Kosten führt.

Red Hat AI 3.4 hilft, dieses Spannungsfeld aufzulösen, indem es eine solide Enterprise-Basis für die skalierbare Bereitstellung von Inferenz und Agenten bietet und dabei genau die Transparenz und Kontrolle liefert, die für die Einhaltung strenger Risiko- und Governance-Standards erforderlich sind. Da Agenten mit einem gewissen Maß an Unabhängigkeit agieren, stellt ein Mangel an Sichtbarkeit in ihre Entscheidungsfindung ein kritisches Sicherheitsrisiko dar. Red Hat AI adressiert dieses Risiko und stellt eine Infrastruktur für das Nachvollziehen von Aktionen, Reasoning-Schritten und Tool-Aufrufen bereit, sodass geprüft werden kann, wie Agenten zu ihren Ergebnissen gekommen sind. Durch ein Management kryptografischer Identitäten verbindet die Plattform alle Aktionen mit einer verifizierten Identität, sodass sich erkennen lässt, welche Instanz eine Aufgabe ausgeführt hat. Im Zusammenspiel ermöglichen es diese Funktionen, KI über Pilotprojekte hinaus als skalierbares, vorhersehbares und verantwortungsvolles Werkzeug im Unternehmen einzusetzen.

Was Red Hat und seine Partner sagen

„Das Zeitalter der Agenten stellt auch eine Weiterentwicklung unserer Plattform dar – weg von der Ausführung traditioneller Anwendungen hin zur Unterstützung intelligenter, autonomer Systeme“, erklärt Joe Fernandes, Vice President und General Manager, AI Business Unit bei Red Hat. „Wir definieren einen offenen Standard, wie Unternehmen KI ausführen können. Durch die Bereitstellung einer gehärteten ‚Metal to Agent‘-Basis für KI-Inferenz, MaaS und AgentOps bietet Red Hat die betriebliche Sicherheit, die Unternehmen benötigen, um Innovationen schneller voranzutreiben und dabei strenge Kontrollen für die KI aufrechtzuerhalten.“

„Die Zusammenarbeit von CoreWeave mit Red Hat basiert auf dem gemeinsamen Bekenntnis zu Offenheit und der Bereitstellung einer Plattform für hochperformante Inferenz, die es Unternehmen erlaubt, auch ihre komplexesten KI-Workloads zu skalieren“, betont Urvashi Chowdhary, Vice President of Product Management – AI Services bei CoreWeave. „Gemeinsam liefern wir einen Blueprint für die Bereitstellung von Red Hat AI Inference auf dem CoreWeave Kubernetes Service, sodass derselbe Inferenz-Stack on-premises und in der Cloud genutzt werden kann – mit Kubernetes-nativer Kontrolle und produktionsreifer Performance. Die KI-Teams von Unternehmen in regulierten Branchen können sich somit auf das konzentrieren, was wichtig ist: das Erstellen und Skalieren von KI und nicht das Re-Tooling ihres Stacks für jede neue Umgebung.“

„Autonome, lang laufende Agenten erfordern ein ganz neues Level von Kontrolle und Sicherheit auf Infrastrukturebene, um einen vertrauenswürdigen Betrieb zu gewährleisten“, sagt John Fanelli, Vice President, Enterprise Software bei NVIDIA. „Red Hat AI Factory with NVIDIA bietet eine einheitliche, auf Open Source basierende Grundlage dafür – mit Governance und Sicherheit, sodass Entwicklungs- und Betriebsteams eine agentenbasierte Zukunft vorantreiben können.“

Das Wichtigste auf einen Blick

Skalierbare und leistungsstarke Inferenz trifft kontrollierten Modellzugriff: Hocheffiziente Inferenz ist nach wie vor der Kern von produktionsreifer KI. Durch die Kombination aus dem Inferenz-Server vLLM und der verteilten Inferenz-Engine llm-d mit Model-as-a-Service bietet Red Hat AI 3.4 eine zuverlässige und leistungsfähige Basis für Modellinferenz und vereinfacht zugleich den kontrollierten Zugriff auf Modelle für Benutzer und Agenten.
Schlanke AgentOps-Funktionen für den automatisierten Anwendungslebenszyklus: Red Hat AI 3.4 führt umfangreiche AgentOps-Funktionen ein, die Unternehmen dabei helfen, den KI-Einsatz zu operationalisieren. Hierzu zählen integrierte Funktionen für Tracing, Observability und Evaluierungen, ebenso wie ein Management für die Identitäten und Lebenszyklen von Agenten, um diese von der Entwicklung in den Produktivbetrieb zu bringen.
Verbindung von Daten mit Modellen und Agenten: Unternehmensdaten sind der Treibstoff für Modelle und Agenten. Red Hat AI 3.4 ergänzt ein Prompt-Management, das Prompts wie Daten-Assets erster Klasse behandelt, und einen Evaluation Hub für die Evaluierung von Qualität, Genauigkeit, Sicherheit und Risiken. Die Funktionen basieren auf MLFlow, das auch das Tracking von Experimenten und das Artefakte-Management für GenAI- und prädiktive KI/ML-Anwendungsfälle übernimmt.
Integrierte Sicherheit für Modelle und Agenten: Um den gesamten KI-Stack zu schützen, bietet Red Hat AI eine mehrschichtige Sicherheitsarchitektur vom Betriebssystem bis zur Agentenlogik. Automatisierte Sicherheitstests und Red Teaming helfen Unternehmen, einen datengetriebenen Ansatz für die Auswahl und Konfiguration von Modellen und Guardrails zu verfolgen und KI-Workloads besser vor sich verändernden Bedrohungen zu schützen.

Weitere Details

Fortschrittliche Inferenz und Modelloptimierung: Red Hat AI Inference erweitert seine verteilten Inferenz-Funktionen um eine Priorisierung von Anfragen, sodass sich interaktiver und Background-Traffic denselben Endpunkt teilen können. Latenzempfindliche Anfragen werden dabei unter Last vorranging bearbeitet. Zudem geht Red Hat AI Inference über Red Hat OpenShift hinaus und umfasst nun auch Kubernetes-Services wie CoreWeave und Azure, sodass Unternehmen einen einheitlichen Inferenz-Stack über alle Umgebungen hinweg erhalten. Die Unterstützung für spekulative Dekodierung ist nun allgemein verfügbar und verbessert die Antwortgeschwindigkeiten um das Zwei- bis Dreifache – bei nur minimalen Auswirkungen auf die Qualität und niedrigere Kosten pro Interaktion.
Model-as-a-Service (MaaS) mit Governance: MaaS erlaubt es Platform Engineers, kuratierte und validierte Modelle über sicherheitsoptimierte API-Endpunkte unter Verwendung von standardisierten, OpenAI-kompatiblen Interfaces bereitzustellen. Dadurch wird eine einheitliche Governance für interne Modelle und externe APIs sichergestellt, integriert mit einer IdP-basierten (Identity Provider) Authentifizierung.
Integriertes Prompt-Management: Die Plattform stellt einheitliche Tools für die Erstellung und Verwaltung von Prompts als „first class“ Data Assets bereit. Das Speichern von Inputs, die Modelle und Agenten steuern, in einer zentralen Registry sorgt für eine Single Source of Truth sowohl für Entwickler als auch Administratoren.
Automatisierte Evaluierung von Modellen und Agenten: Red Hat AI 3.4 führt einen Evaluation Hub ein – eine einheitliche, Framework-agnostische Kontrollschicht für die Evaluierung von Large Language Models (LLMs), KI-Anwendungen und Agenten. Damit werden fragmentierte Testmethoden durch einen einheitlichen Ansatz ersetzt, der hilft, Qualität, Genauigkeit und Risiken zu beurteilen.
Mehrschichtige Sicherheit: Automatisierte Sicherheitsscans sind direkt in den Entwicklungslebenszyklus integriert. Red Hat AI nutzt Technologie von Chatterbox Labs und Garak, um Modelle und agentenbasierte Systeme auf Risiken wie Jailbreaks, Prompt Injections und Bias zu überprüfen, während NVIDIA NeMo Guardrails für Sicherheit zur Laufzeit sorgen.
Observability für den Produktiveinsatz: Die Integration von MLFlow liefert Sichtbarkeit bei der Ausführung von Agenten, sodass Unternehmen LLM-Aufrufe, Reasoning-Schritte, die Ausführung von Tools, die Antworten des Modells und die Token-Nutzung via OpenTelemetry von Ende zu Ende nachvollziehen können. Es entsteht ein transparenter Audit Trail über den gesamten Lebenszyklus von Prompts, Embeddings und RAG-Konfigurationen hinweg, der beim Debugging und Auditieren unterstützt. MLFlow bietet darüber hinaus ein integriertes Tracking für Experimente und ein Artefakte-Management für GenAI- und prädiktive KI-Anwendungsfälle.
Identitätsbasierte Governance: Mit einem kryptografischen Identity-Management (SPIFFE/SPIRE) versetzt Red Hat AI Unternehmen in die Lage, statische, hart-kodierte Schlüssel durch kurzlebige Token zu ersetzen. Das erleichtert die Umsetzung von Least-Privilege-Prinzipien für autonome Agenten im gesamten Stack und hilft dabei sicherzustellen, dass Aktionen von Agenten an eine verifizierte Identität gebunden sind.
Automatisierte Abläufe: Tools wie AutoRAG und AutoML automatisieren komplexe KI-Aufgaben von der Auswahl der effektivsten Strategie für den Abruf bestimmter Datensätze bis hin zum Erstellen und Optimieren klassischer prädiktiver Modelle.
Hardware-Flexibilität und gemanagte Clouds: Red Hat AI 3.4 bietet Day-Zero-Unterstützung für Blackwell-GPUs von NVIDIA und MI325X-Architekturen von AMD. Darüber hinaus unterstützt die einheitliche Plattformarchitektur nun auch den nativen Betrieb in Clouds, die von Drittanbietern verwaltet werden, was operative Konsistenz über eine breite Palette von Hardware- und Cloud-Anbietern hinweg garantiert. Unter anderem läuft das neue Red Hat AI Inference in der IBM Cloud.

Verfügbarkeit

Red Hat AI 3.4 wird voraussichtlich im Laufe des Monats verfügbar sein.

Red Hat Summit

Verfolgen Sie die Keynotes des Red Hat Summit live auf YouTube und erfahren Sie Aktuelles von Führungskräften, Kunden und Partnern von Red Hat:

The next platform is choice — Dienstag, 12. Mai 2026, 14:30-16:00 Uhr MEZ
The AI-ready enterprise is here — Mittwoch, 13. Mai 2026, 15:00-16:00 Uhr MEZ

Weiterführende Informationen

Blog-Beitrag zu Red Hat AI 3.4
weitere Ressourcen
Überblick über den Red Hat Summit
Alle Ankündigungen im Red Hat Summit Newsroom
Aktuelle Updates bei X unter @RedHatSummit or #RHSummit

Weitere Informationen zu Red Hat

Erfahren Sie mehr über Red Hat
Lesen Sie Neuigkeiten und Presseinformationen im Red Hat Newsroom oder im Red Hat Blog
Folgen Sie Red Hat auf X, Facebook, YouTube und LinkedIn

Über Red Hat, Inc.

Red Hat ist der führende Anbieter von Open-Hybrid-Cloud-Technologien und bietet damit eine vertrauenswürdige, konsistente und umfassende Grundlage für transformative IT-Innovationen und KI-Anwendungen. Das Portfolio an Cloud-, Entwickler-, KI-, Linux-, Automatisierungs- und Applikationsplattform-Technologien ermöglicht den Einsatz jeder Anwendung an jedem Ort – vom Rechenzentrum bis zum Edge. Als weltweit führender Anbieter von Enterprise-Open-Source-Softwarelösungen investiert Red Hat in offene Ökosysteme und Communities, um die IT-Herausforderungen von morgen zu bewältigen. In Zusammenarbeit mit Partnern und Kunden unterstützt Red Hat beim Aufbau, der Vernetzung, der Automatisierung, der Sicherung und der Verwaltung von IT-Umgebungen, unterstützt durch Consulting-Services und preisgekrönte Trainings- und Zertifizierungsangebote.

Forward-Looking Statements

Except for the historical information and discussions contained herein, statements contained in this press release may constitute forward-looking statements within the meaning of the Private Securities Litigation Reform Act of 1995. Forward-looking statements are based on the company’s current assumptions regarding future business and financial performance. These statements involve a number of risks, uncertainties and other factors that could cause actual results to differ materially. Any forward-looking statement in this press release speaks only as of the date on which it is made. Except as required by law, the company assumes no obligation to update or revise any forward-looking statements.

###

Red Hat, Red Hat Enterprise Linux, OpenShift and the Red Hat logo are trademarks or registered trademarks of Red Hat, LLC, or its subsidiaries in the U.S. and other countries. Linux® is the registered trademark of Linus Torvalds in the U.S. and other countries.

Pressekontakt

PR-COM GmbH
Melissa Gemmrich
Sendlinger-Tor-Platz 6
D-80336 München
melissa.gemmrich@pr-com.de