Obecnie agenci sztucznej inteligencji (AI) zawodzą w przypadku oszałamiających 63% złożonych zadań. Stanowi to główną przeszkodę dla firm chcących wdrożyć systemy autonomiczne. Teraz Patronus AI, start-up wspierany kapitałem wysokiego ryzyka o wartości 20 milionów dolarów, ogłasza rozwiązanie: dynamicznie generowane, adaptacyjne środowiska edukacyjne, które symulują rzeczywiste problemy w czasie rzeczywistym.
Problem z tradycyjnymi testami porównawczymi AI
Przez lata branża sztucznej inteligencji do pomiaru postępu opierała się na statycznych wzorcach. Jednak te ustandaryzowane testy nie uwzględniają nieprzewidywalności zadań w świecie rzeczywistym. Tradycyjne testy porównawcze mierzą izolowane umiejętności, ignorując przerwy, zmiany kontekstu i wielopoziomowe podejmowanie decyzji. W rezultacie agenci sztucznej inteligencji często działają słabo poza kontrolowanymi warunkami laboratoryjnymi.
Dyrektor generalny Patronus AI, Anand Kannappan, wyjaśnia: „Tradycyjne testy porównawcze mierzą izolowane możliwości, ale pomijają przerwy, zmiany kontekstu i wielowarstwowe podejmowanie decyzji, które wpływają na rzeczywistą wydajność”. Oznacza to, że agent o nawet niskim poziomie błędów może szybko stać się zawodny w skomplikowanych scenariuszach. Na przykład 1% poziom błędu na każdym kroku powoduje, że w setnym kroku wskaźnik awaryjności wynosi 63%.
Symulatory generatywne: sztuczna inteligencja, która uczy się jak ludzie
Podejście Patronus AI, zwane symulatorami generatywnymi, tworzy środowiska edukacyjne, które stale ewoluują. Symulatory te generują nowe zadania, dynamicznie dostosowują reguły i oceniają wydajność agentów w czasie rzeczywistym. Naśladuje to sposób, w jaki uczą się ludzie: poprzez dynamiczne doświadczenia i ciągłą informację zwrotną.
Dyrektor ds. technologii firmy, Rebecca Qian, zauważa, że granica między szkoleniem a oceną zaciera się. „W ciągu ostatniego roku zaobserwowaliśmy odejście od tradycyjnych statycznych testów porównawczych w kierunku bardziej interaktywnych przestrzeni do nauki” – mówi. „Benchmarki stały się środowiskami”.
Jak działa uczenie się adaptacyjne: „złoty środek”
Kluczem do skutecznego szkolenia sztucznej inteligencji jest znalezienie „najlepszego punktu” – poziomu trudności, który nie jest ani zbyt łatwy, ani zbyt trudny. System Patronus AI wykorzystuje „zarządcę programu nauczania” do analizy zachowań agentów i dynamicznej zmiany scenariuszy szkoleń.
To adaptacyjne podejście zapobiega „hackowaniu za nagrody”, w ramach którego systemy sztucznej inteligencji wykorzystują luki zamiast rozwiązywać problemy. W środowiskach statycznych łatwo jest oszukiwać; zmieniające się środowiska zmuszają agentów do pełnego przystosowania się.
Efekt biznesowy: wzrost przychodów i popyt rynkowy
Patronus AI odnotował 15-krotny wzrost przychodów wynikający z dużego popytu na platformy RL. Z platformy firmy korzystają już firmy z listy Fortune 500 i wiodące laboratoria AI. Świadczy to o wyraźnym zapotrzebowaniu rynku na skuteczniejsze rozwiązania szkoleniowe w zakresie sztucznej inteligencji.
Dlaczego duże firmy technologiczne nie mogą zrobić tego samodzielnie
Podczas gdy OpenAI, Anthropic i Google inwestują we własną infrastrukturę szkoleniową, Patronus AI argumentuje, że różnorodność rzeczywistych aplikacji tworzy niszę dla wyspecjalizowanych zewnętrznych dostawców.
„Chcą ulepszyć agentów w różnych obszarach… Rozwiązanie wszystkich tych różnych problemów operacyjnych jest bardzo trudne dla jednej firmy” – mówi Kannappan.
Przyszłość uczenia się AI: środowiska jako nowa ropa naftowa
Patronus AI przewiduje przyszłość, w której wszystkie procesy pracy człowieka zostaną przekształcone w ustrukturyzowane środowiska uczenia się. Firma wierzy, że kontrola nad tymi środowiskami zadecyduje o możliwościach przyszłych systemów AI.
„Uważamy, że wszystko powinno być środowiskiem — żartujemy wewnętrznie, że środowisko to nowa ropa”. — Dyrektor generalny Patronus AI Anand Kannappan
Ta odważna wizja pozycjonuje Patronus AI jako kluczowego gracza w kształtowaniu nowej generacji sztucznej inteligencji. Podejście firmy jest ważnym krokiem w kierunku stworzenia agentów AI, którzy mogą niezawodnie wykonywać złożone zadania w świecie rzeczywistym.














































