Målrettet orkestrering av agentoppgaver. I utgangspunktet vil AI-agenter kommunisere med hverandre for å utføre oppgaven din.
Eksempel: "velg den beste dagen neste måned for et 20 km semi-maraton". AI vil begynne å samarbeide: Weather-agenten henter prognoser, nettsøkeagenten identifiserer optimale kjøreforhold, og Wolfram-agenten beregner den "beste dagen." Det er kunsten å koble AI, som forenkler komplekse oppgaver med raffinement.
LLM-er som den sentrale hovedramme for autonome agenter er et spennende konsept. Demonstrasjoner som AutoGPT, GPT-Engineer og BabyAGI fungerer som enkle illustrasjoner av denne ideen. Potensialet til LLM-er strekker seg utover å generere eller fullføre velskrevne kopier, historier, essays og programmer; de kan innrammes som kraftige General Task Solvers, og det er det vi har som mål å oppnå med å bygge den målorienterte orkestreringen av Agent Taskforce (GOAT.AI)
For at en målrettet orkestrering av et LLM-agenttask force-system skal eksistere og fungere ordentlig, må tre hovedkjernekomponenter i systemet fungere ordentlig
- Oversikt
1) Planlegging
- Delmål og dekomponering: Agenten bryter ned store oppgaver i mindre, håndterbare delmål, noe som gjør det enklere å håndtere komplekse oppdrag effektivt.
- Refleksjon og foredling: Agenten engasjerer seg i selvkritikk og selvrefleksjon over tidligere handlinger, lærer av feil og forbedrer tilnærminger for fremtidige skritt, og forbedrer derved den generelle kvaliteten på resultatene.
2) Minne
- Korttidsminne: Det refererer til mengden tekst modellen kan behandle før den svarer uten forringelse av kvaliteten. I den nåværende tilstanden kan LLM-ene gi svar uten reduksjon i kvalitet for omtrent 128 000 tokens.
- Langtidsminne: Dette gjør at agenten kan lagre og hente frem en ubegrenset mengde informasjon for konteksten over lange perioder. Det oppnås ofte ved å bruke et eksternt vektorlager for effektive RAG-systemer.
3) Action Space
- Agenten får muligheten til å kalle eksterne APIer for å få tilleggsinformasjon som ikke er tilgjengelig i modellvektene (som ofte er vanskelige å modifisere etter forhåndsopplæring). Dette inkluderer tilgang til gjeldende informasjon, utføring av kode, tilgang til proprietære informasjonskilder, og viktigst av alt: å påkalle andre agenter for informasjonshenting.
– Handlingsrommet omfatter også handlinger som ikke er rettet mot å hente frem noe, men heller innebærer å utføre spesifikke handlinger og oppnå det resulterende resultatet. Eksempler på slike handlinger inkluderer å sende e-poster, starte apper, åpne inngangsdører og mer. Disse handlingene utføres vanligvis gjennom ulike APIer. I tillegg er det viktig å merke seg at agenter også kan påkalle andre agenter for handlingsbare hendelser som de har tilgang til.