Orquestración orientada a obxectivos de tarefas de axente. Basicamente, os axentes de IA comunicaranse entre eles para executar a súa tarefa.
Exemplo: "escolla o mellor día do mes que vén para unha semimaratón de 20 km". A IA comezará a colaborar: o axente meteorolóxico recupera as previsións, o axente de busca web identifica as condicións óptimas de execución e o axente Wolfram calcula o "mellor día". É a arte da IA conectada, que simplifica tarefas complexas con sofisticación.
Os LLM como mainframe central para axentes autónomos é un concepto intrigante. Demostracións como AutoGPT, GPT-Engineer e BabyAGI serven como ilustracións sinxelas desta idea. O potencial dos LLM vai máis aló de xerar ou completar copias, historias, ensaios e programas ben escritos; pódense enmarcar como poderosos solucionadores de tarefas xerais, e iso é o que pretendemos conseguir na construción da Orquestración Orientada a Obxectivos de Axente Taskforce (GOAT.AI)
Para que exista e funcione correctamente unha orquestración orientada a obxectivos dun sistema de grupo de traballo de axentes de LLM, tres compoñentes principais do sistema teñen que funcionar correctamente.
- Visión xeral
1) Planificación
- Subobxectivo e descomposición: o axente divide as tarefas grandes en subobxectivos máis pequenos e manexables, o que facilita a xestión de tarefas complexas de forma eficiente.
- Reflexión e refinamento: o axente participa na autocrítica e autorreflexión sobre as accións pasadas, aprende dos erros e mellora os enfoques para os pasos futuros, mellorando así a calidade xeral dos resultados.
2) Memoria
- Memoria a curto prazo: refírese á cantidade de texto que o modelo pode procesar antes de contestar sen que se produza ningunha degradación da calidade. No estado actual, os LLM poden proporcionar respostas sen ningunha diminución da calidade para aproximadamente 128k tokens.
- Memoria a longo prazo: isto permite ao axente almacenar e recordar unha cantidade ilimitada de información para o contexto durante longos períodos. A miúdo conséguese usando un almacén de vectores externo para sistemas RAG eficientes.
3) Espazo de acción
- O axente adquire a capacidade de chamar a API externas para obter información adicional que non está dispoñible nos pesos do modelo (que moitas veces son difíciles de modificar despois do adestramento previo). Isto inclúe o acceso á información actual, a execución de código, o acceso a fontes de información propietarias e, o máis importante: invocar outros axentes para a recuperación de información.
- O espazo de acción tamén engloba accións que non teñen como obxectivo recuperar algo, senón que implican realizar accións concretas e obter o resultado resultante. Exemplos deste tipo de accións inclúen o envío de correos electrónicos, o lanzamento de aplicacións, a apertura de portas de entrada e moito máis. Estas accións adoitan realizarse a través de varias API. Ademais, é importante ter en conta que os axentes tamén poden invocar outros axentes para eventos accionables aos que teñen acceso.
Última actualización
8 de abr. de 2024