Amazon hat mit der Vorstellung von Nova Act einen wichtigen Schritt in Richtung agentischer KI gemacht – ein intelligenter Software-Agent, der Webseiten selbstständig bedienen, Formulare ausfüllen und einfache Aufgaben im Netz erledigen kann. Was sich zunächst nach technischer Spielerei anhört, könnte sich schnell zu einem der einflussreichsten Werkzeuge im KI-Wettrennen der Tech-Giganten entwickeln. Nova Act ist nicht nur ein Experiment aus Amazons neuer AGI-Forschungseinheit in San Francisco, sondern auch ein Vorbote der kommenden Alexa+-Generation – einer überarbeiteten, KI-gestützten Version des Sprachassistenten.
Im Unterschied zu bisherigen Chatbots agiert Nova Act nicht mehr nur reaktiv auf Texteingaben, sondern interagiert aktiv mit grafischen Benutzeroberflächen im Web. In der Praxis bedeutet das: Die KI kann eigenständig einen Salat bei Sweetgreen bestellen, eine Kalenderbuchung vornehmen oder ein Online-Formular ausfüllen – ohne dass der Nutzer jeden Schritt einzeln anweisen muss. Damit nähert sich Amazon der Vision einer KI an, die den Computer wie ein Mensch bedienen kann – eine Kernidee des Konzepts der Artificial General Intelligence.
Auch wenn Nova Act zunächst nur als Research Preview verfügbar ist, liefert Amazon bereits ein komplettes SDK mit, über das Entwickler eigene Agenten-Prototypen bauen können. Auf nova.amazon.com werden nicht nur die zugrunde liegenden Foundation Models präsentiert, sondern auch ein Toolkit, mit dem Agenten zuverlässig und sicher gesteuert werden können. Besonders wichtig laut Amazon: Entwickler können exakt festlegen, wann der Agent eine Aufgabe eigenständig ausführen darf – und wann der Mensch übernehmen muss.
Leistungsdaten will Amazon ebenfalls nicht schuldig bleiben. In internen Benchmarks – etwa dem ScreenSpot Web Text-Test – erreichte Nova Act beeindruckende 94 Prozent und übertraf damit sowohl OpenAIs CUA (88 Prozent) als auch Anthropics Claude 3.7 Sonnet (90 Prozent). Allerdings vermied Amazon gängige Agenten-Benchmarks wie WebVoyager, was Fragen zur Vergleichbarkeit aufwirft.
Hinter Nova Act steht Amazons neu gegründetes AGI-Lab, das von zwei prominenten Namen geleitet wird: David Luan, ehemals bei OpenAI und Gründer von Adept, sowie Pieter Abbeel, Mitgründer des Robotikunternehmens Covariant. Beide gelten als führende Köpfe im Bereich maschinellen Lernens und autonomen Handelns. Für Luan ist Nova Act nicht bloß ein praktisches Tool, sondern ein strategischer Schritt in Richtung echter maschineller Intelligenz. Seine Definition von AGI ist pragmatisch: ein System, das dir bei allem helfen kann, was du am Computer tust.
Obwohl Nova Act zunächst auf einfache Tasks fokussiert ist, steckt viel Potenzial in der Architektur. Während aktuelle Agenten von OpenAI, Google und Anthropic noch mit Stabilität, Geschwindigkeit und Autonomie kämpfen, will Amazon gezielt auf Verlässlichkeit setzen – mit klaren Eingriffspunkten für den Menschen, aber auch mit mehr Autonomie als bisher üblich. Denn ein Agent, der in 90 Prozent der Fälle funktioniert, aber im entscheidenden Moment scheitert, ist kaum alltagstauglich.
Gerade mit Blick auf Alexa+, das noch dieses Jahr erscheinen soll, dürfte Nova Act zum Herzstück eines neuen Amazon-Ökosystems werden. Ein Ökosystem, das nicht nur zuhört – sondern handelt. Für Amazon steht dabei viel auf dem Spiel: Die nächste Alexa-Generation könnte zur Bewährungsprobe für die gesamte KI-Strategie des Unternehmens werden.
Ob Nova Act tatsächlich den Unterschied macht, wird sich in den kommenden Wochen zeigen. Klar ist: Amazon betritt ein überfülltes Feld – aber mit einem klaren Fokus, einem starken Entwicklerangebot und der vielleicht bislang besten Schnittstelle zwischen generativer KI und praktischer Anwendung. Wenn es gelingt, Agenten zu entwickeln, die wirklich nützlich, schnell und zuverlässig sind, könnte Nova Act der Durchbruch gelingen, auf den der Markt gewartet hat.
Beitragsbild: Amazon