Zorientowana na cel orkiestracja zadań agenta. Zasadniczo agenci AI będą się ze sobą komunikować, aby wykonać Twoje zadanie.
Przykład: „wybierz najlepszy dzień w przyszłym miesiącu na półmaraton na 20 km”. Sztuczna inteligencja rozpocznie współpracę: agent pogody pobiera prognozy, agent wyszukiwania internetowego identyfikuje optymalne warunki pracy, a agent Wolfram oblicza „najlepszy dzień”. To sztuka połączonej sztucznej inteligencji, upraszczająca złożone zadania w wyrafinowany sposób.
LLM jako centralny komputer mainframe dla agentów autonomicznych to intrygująca koncepcja. Demonstracje takie jak AutoGPT, GPT-Engineer i BabyAGI służą jako proste ilustracje tego pomysłu. Potencjał LLM wykracza poza generowanie lub uzupełnianie dobrze napisanych kopii, opowiadań, esejów i programów; można ich postrzegać jako potężnych specjalistów do rozwiązywania zadań ogólnych i właśnie to zamierzamy osiągnąć budując orkiestrację zorientowaną na cel grupy zadaniowej agentów (GOAT.AI)
Aby zorientowana na cel orkiestracja systemu grupy zadaniowej agentów LLM istniała i działała prawidłowo, trzy główne podstawowe elementy systemu muszą działać prawidłowo
- Przegląd
1) Planowanie
- Cel cząstkowy i dekompozycja: agent dzieli duże zadania na mniejsze, łatwe do zarządzania cele cząstkowe, co ułatwia efektywną realizację złożonych zadań.
- Refleksja i udoskonalanie: Agent angażuje się w samokrytykę i autorefleksję na temat przeszłych działań, uczy się na błędach i ulepsza podejście do przyszłych kroków, poprawiając w ten sposób ogólną jakość wyników.
2) Pamięć
- Pamięć krótkotrwała: odnosi się do ilości tekstu, który model może przetworzyć przed udzieleniem odpowiedzi, bez pogorszenia jakości. W obecnym stanie LLM mogą udzielać odpowiedzi bez utraty jakości dla około 128 tys. tokenów.
- Pamięć długoterminowa: umożliwia agentowi przechowywanie i przywoływanie nieograniczonej ilości informacji związanych z kontekstem przez długi czas. Często osiąga się to poprzez użycie zewnętrznego magazynu wektorów dla wydajnych systemów RAG.
3) Pole Akcji
- Agent zyskuje możliwość wywoływania zewnętrznych API w celu uzyskania dodatkowych informacji, które nie są dostępne w wagach modeli (które często są trudne do modyfikacji po wstępnym szkoleniu). Obejmuje to dostęp do bieżących informacji, wykonywanie kodu, dostęp do zastrzeżonych źródeł informacji i, co najważniejsze: wywoływanie innych agentów w celu odzyskania informacji.
- Przestrzeń działania obejmuje także działania, które nie mają na celu odzyskania czegoś, ale raczej polegają na wykonaniu określonych działań i uzyskaniu wynikającego z nich rezultatu. Przykłady takich działań obejmują wysyłanie e-maili, uruchamianie aplikacji, otwieranie drzwi wejściowych i inne. Działania te są zazwyczaj wykonywane za pośrednictwem różnych interfejsów API. Ponadto należy pamiętać, że agenci mogą również wywoływać innych agentów w przypadku zdarzeń, do których mają dostęp.
Ostatnia aktualizacja
8 kwi 2024