Agentenbasierte Prozessautomatisierung #1

Veröffentlicht am 21. August 2024 um 11:10

Von Ralf Keuper 

Das größte Potenzial von KI-Agenten liegt, zumindest was die Steigerung der Produktivität anbelangt, laut Andrew Ng, CEO und Gründer von LandingAI, in der Prozessautomatisierung. Die Fortschritte im Bereich der agentenbasierten Prozessautomatisierung seien inzwischen beachtlicher als bei den Foundation Models; ja - die agentenbasierte Prozessautomatisierung ist bis zu einem beachtlichen Grad unabhängig von der Weiterentwicklung der Foundation Models. Verantwortlich dafür ist die Einbindung iterativer Agenten-Workflows. 

In einem Vortrag erläutert Ng den Unterschied zwischen Non-agentic Workflows (Zero-shot) und agentic-Workflows am Beispiel des Schreibens eines wissenschaftlichen Essays. 

Beim Non-agentic Workflow lautet die Anweisung/der Prompt: 

Bitte schreibe einen Aufsatz zum Thema x von Anfang bis Ende in einem Rutsch, ohne die Rücktaste zu benutzen.

Beim Agentic-Workflow lautet der Prompt: 

  • Schreibe einen Aufsatz zum Thema x 
  • Benötigst du eine Web-Recherche?
  • Schreibe einen ersten Entwurf 
  • Überlege, welche Teile überarbeitet oder weiter recherchiert werden müssen
  • Überarbeite deinen ersten Entwurf

Der Agentic Workflow liefert dadurch, dass er mehrere Iterationen durchläuft und die Entwürfe einer Revision unterzieht, deutlich bessere Ergebnisse als dies mit non-agentic-Workflows möglich ist. 

Ng und sein Team haben haben die Ergebnisse einer Reihe von Forschungsteams analysiert und sich dabei auf die Fähigkeit eines Algorithmus konzentriert, bei dem weit verbreiteten Coding Benchmark HumanEval gut abzuschneiden (siehe Beitragsbild): 

GPT-3.5 (Zero Shot) war zu 48,1 % richtig. GPT-4 (Zero Shot) schneidet mit 67,0 % besser ab. Die Verbesserung von GPT-3.5 zu GPT-4 wird jedoch durch die Einbindung eines iterativen Agenten-Workflows in den Schatten gestellt. In einer Agentenschleife erreicht GPT-3.5 sogar bis zu 95,1 %.

Quellen:

The Batch 

Andrew Ng On AI Agentic Workflows And Their Potential For Driving AI Progress

 

Kommentar hinzufügen

Kommentare

Es gibt noch keine Kommentare.