Ciljno usmerjena orkestracija agentskih nalog. V bistvu bodo agenti AI komunicirali med seboj, da bodo izvedli vašo nalogo.
Primer: "naslednji mesec izberite najboljši dan za 20 km polmaraton". Umetna inteligenca bo začela sodelovati: vremenski agent pridobi napovedi, spletni iskalnik identificira optimalne pogoje za delovanje, agent Wolfram pa izračuna "najboljši dan". To je umetnost povezane umetne inteligence, ki poenostavlja zapletene naloge s sofisticiranostjo.
LLM kot osrednji glavni računalnik za avtonomne agente je zanimiv koncept. Predstavitve, kot so AutoGPT, GPT-Engineer in BabyAGI, služijo kot preproste ilustracije te ideje. Potencial študija LLM presega ustvarjanje ali dokončanje dobro napisanih izvodov, zgodb, esejev in programov; jih je mogoče oblikovati kot zmogljive splošne reševalce nalog, in to je tisto, kar želimo doseči pri izgradnji ciljno usmerjene orkestracije delovne skupine agentov (GOAT.AI).
Da ciljno usmerjena orkestracija sistema delovne skupine agenta LLM obstaja in deluje pravilno, morajo pravilno delovati tri glavne komponente sistema
- Pregled
1) Načrtovanje
- Podcilj in dekompozicija: Agent razdeli velike naloge na manjše, obvladljive podcilje, kar olajša učinkovito obravnavo zapletenih nalog.
- Razmislek in izpopolnjevanje: agent se ukvarja s samokritiko in samorefleksijo preteklih dejanj, se uči iz napak in izboljšuje pristope za prihodnje korake, s čimer izboljša splošno kakovost rezultatov.
2) Spomin
- Kratkoročni spomin: Nanaša se na količino besedila, ki ga lahko model obdela pred odgovorom brez poslabšanja kakovosti. V trenutnem stanju lahko LLM-ji zagotovijo odgovore brez kakršnega koli zmanjšanja kakovosti za približno 128k žetonov.
- Dolgoročni spomin: To agentu omogoča shranjevanje in priklic neomejene količine informacij za kontekst v daljših obdobjih. To se pogosto doseže z uporabo zunanjega vektorskega pomnilnika za učinkovite sisteme RAG.
3) Akcijski prostor
- Agent pridobi možnost klica zunanjih API-jev za pridobitev dodatnih informacij, ki niso na voljo v uteži modela (ki jih je po predhodnem usposabljanju pogosto težko spremeniti). To vključuje dostop do trenutnih informacij, izvajanje kode, dostop do lastniških virov informacij in kar je najpomembnejše: priklic drugih agentov za iskanje informacij.
- Akcijski prostor zajema tudi dejanja, ki niso namenjena pridobivanju nečesa, temveč vključujejo izvajanje določenih dejanj in doseganje končnega rezultata. Primeri takih dejanj vključujejo pošiljanje e-pošte, zagon aplikacij, odpiranje vhodnih vrat in drugo. Ta dejanja se običajno izvajajo prek različnih API-jev. Poleg tega je pomembno upoštevati, da lahko agenti prikličejo tudi druge agente za dejanja, do katerih imajo dostop.
Posodobljeno dne
8. apr. 2024