Cieľovo orientovaná orchestrácia úloh agentov. Agenti AI budú v podstate navzájom komunikovať, aby vykonali vašu úlohu.
Príklad: „vyberte si najlepší deň budúceho mesiaca na 20 km dlhý polmaratón“. Umelá inteligencia začne spolupracovať: agent počasia získa predpovede, webový vyhľadávací agent identifikuje optimálne prevádzkové podmienky a agent Wolfram vypočíta „najlepší deň“. Je to umenie prepojenej AI, ktoré sofistikovane zjednodušuje zložité úlohy.
LLM ako centrálny mainframe pre autonómnych agentov je zaujímavý koncept. Ukážky ako AutoGPT, GPT-Engineer a BabyAGI slúžia ako jednoduché ilustrácie tejto myšlienky. Potenciál LLM presahuje vytváranie alebo dokončovanie dobre napísaných kópií, príbehov, esejí a programov; môžu byť zarámované ako výkonní všeobecní riešitelia úloh a to je to, čo sa snažíme dosiahnuť pri budovaní cieľovo orientovanej orchestácie agentov (GOAT.AI)
Aby cielene orientovaná orchestrácia systému úloh agentov LLM existovala a správne fungovala, musia správne fungovať tri hlavné komponenty systému.
- Prehľad
1) Plánovanie
- Podcieľ a dekompozícia: Agent rozdeľuje veľké úlohy na menšie, zvládnuteľné podciele, čo uľahčuje efektívne zvládnutie zložitých úloh.
- Reflexia a zdokonaľovanie: Agent sa zapája do sebakritiky a sebareflexie minulých činov, učí sa z chýb a zlepšuje prístupy k budúcim krokom, čím zvyšuje celkovú kvalitu výsledkov.
2) Pamäť
- Krátkodobá pamäť: Vzťahuje sa na množstvo textu, ktoré môže model spracovať pred odpoveďou bez akéhokoľvek zníženia kvality. V súčasnom stave môžu LLM poskytovať odpovede bez zníženia kvality za približne 128 000 tokenov.
- Dlhodobá pamäť: Umožňuje agentovi ukladať a vyvolávať neobmedzené množstvo informácií pre daný kontext počas dlhých období. Často sa to dosahuje použitím externého vektorového úložiska pre efektívne systémy RAG.
3) Akčný priestor
- Agent získava schopnosť volať externé API, aby získal ďalšie informácie, ktoré nie sú dostupné v modelových váhach (ktoré sa často ťažko upravujú po predtrénovaní). To zahŕňa prístup k aktuálnym informáciám, spustenie kódu, prístup k proprietárnym zdrojom informácií a čo je najdôležitejšie: privolanie iných agentov na získanie informácií.
- Akčný priestor tiež zahŕňa akcie, ktoré nie sú zamerané na získanie niečoho, ale zahŕňajú vykonávanie konkrétnych akcií a dosiahnutie výsledného výsledku. Príklady takýchto akcií zahŕňajú odosielanie e-mailov, spúšťanie aplikácií, otváranie vchodových dverí a ďalšie. Tieto akcie sa zvyčajne vykonávajú prostredníctvom rôznych rozhraní API. Okrem toho je dôležité poznamenať, že agenti môžu tiež vyvolať iných agentov pre akcie, ku ktorým majú prístup.