Agendiülesannete eesmärgipõhine orkestreerimine. Põhimõtteliselt suhtlevad AI agendid teie ülesande täitmiseks üksteisega.
Näide: "vali järgmisel kuul parim päev 20 km poolmaratoniks". AI alustab koostööd: ilmaagent hangib prognoosid, veebiotsingu agent tuvastab optimaalsed töötingimused ja Wolframi agent arvutab välja "parima päeva". See on ühendatud AI kunst, mis lihtsustab keerulisi ülesandeid rafineeritult.
LLM-id kui autonoomsete agentide keskne suurarvuti on intrigeeriv kontseptsioon. Demonstratsioonid, nagu AutoGPT, GPT-Engineer ja BabyAGI, on selle idee lihtsad illustratsioonid. LLM-ide potentsiaal ulatub kaugemale hästi kirjutatud koopiate, lugude, esseede ja programmide loomisest või lõpetamisest; neid saab kujundada võimsate üldiste ülesannete lahendajatena ja see on see, mida me püüame saavutada agentide töörühma eesmärgipõhise orkestratsiooni (GOAT.AI) loomisel.
Selleks, et LLM-agendi töörühma süsteemi eesmärgipärane orkestreerimine eksisteeriks ja korralikult toimiks, peavad süsteemi kolm peamist põhikomponenti korralikult toimima.
- Ülevaade
1) Planeerimine
- Alaeesmärk ja dekomponeerimine: agent jaotab suured ülesanded väiksemateks hallatavateks alaeesmärkideks, muutes keerukate ülesannete tõhusa haldamise lihtsamaks.
- Refleksioon ja viimistlemine: agent tegeleb enesekriitikaga ja eneserefleksiooniga mineviku tegude üle, õpib vigadest ja täiustab lähenemisviise tulevaste sammude jaoks, parandades seeläbi tulemuste üldist kvaliteeti.
2) Mälu
- Lühiajaline mälu: see viitab tekstihulgale, mida mudel suudab enne vastamist töödelda ilma kvaliteedi halvenemiseta. Praeguses olekus saavad LLM-id anda vastuseid ilma kvaliteedi languseta ligikaudu 128 000 märgi puhul.
- Pikaajaline mälu: see võimaldab agendil pika aja jooksul salvestada ja meelde tuletada piiramatul hulgal konteksti teavet. Sageli saavutatakse see tõhusate RAG-süsteemide välise vektormälu abil.
3) Tegevusruum
- Agent omandab võimaluse kutsuda väliseid API-sid, et saada lisateavet, mis pole mudelikaaludes saadaval (mida on pärast eelkoolitust sageli raske muuta). See hõlmab juurdepääsu praegusele teabele, koodi käivitamist, juurdepääsu omandiõigusega teabeallikatele ja mis kõige tähtsam: teabe hankimiseks teiste agentide väljakutsumist.
- Tegevusruum hõlmab ka tegevusi, mis ei ole suunatud millegi kättesaamisele, vaid pigem hõlmavad konkreetsete toimingute sooritamist ja sellest tuleneva tulemuse saamist. Selliste toimingute näideteks on meilide saatmine, rakenduste käivitamine, välisuste avamine ja palju muud. Neid toiminguid tehakse tavaliselt erinevate API-de kaudu. Lisaks on oluline märkida, et agendid võivad kutsuda ka teisi agente tegevuste jaoks, millele neil on juurdepääs.