Orquestación orientada a objetivos de tareas de agentes. Básicamente, los agentes de IA se comunicarán entre sí para ejecutar su tarea.
Ejemplo: "elige el mejor día del mes que viene para una semimaratón de 20 km". La IA comenzará a colaborar: el agente meteorológico recupera pronósticos, el agente de búsqueda web identifica las condiciones óptimas de funcionamiento y el agente Wolfram calcula el "mejor día". Es el arte de la IA conectada, que simplifica tareas complejas con sofisticación.
Los LLM como sistema central para agentes autónomos son un concepto intrigante. Demostraciones como AutoGPT, GPT-Engineer y BabyAGI sirven como ilustraciones simples de esta idea. El potencial de los LLM se extiende más allá de generar o completar copias, historias, ensayos y programas bien escritos; se pueden enmarcar como poderosos solucionadores de tareas generales, y eso es lo que pretendemos lograr al construir la Orquestación Orientada a Objetivos del Grupo de Trabajo de Agentes (GOAT.AI).
Para que exista y funcione correctamente una orquestación orientada a objetivos de un sistema de grupo de trabajo de agentes de LLM, tres componentes centrales principales del sistema deben funcionar correctamente.
- Descripción general
1) Planificación
- Subobjetivo y descomposición: el agente divide las tareas grandes en subobjetivos más pequeños y manejables, lo que facilita el manejo eficiente de tareas complejas.
- Reflexión y refinamiento: el agente realiza autocrítica y autorreflexión sobre acciones pasadas, aprende de los errores y mejora los enfoques para pasos futuros, mejorando así la calidad general de los resultados.
2) Memoria
- Memoria a corto plazo: Se refiere a la cantidad de texto que el modelo puede procesar antes de responder sin que se degrade la calidad. En el estado actual, los LLM pueden proporcionar respuestas sin ninguna disminución en la calidad por aproximadamente 128.000 tokens.
- Memoria a largo plazo: permite al agente almacenar y recordar una cantidad ilimitada de información del contexto durante largos períodos. A menudo, esto se logra mediante el uso de un almacén de vectores externo para sistemas RAG eficientes.
3) Espacio de acción
- El agente adquiere la capacidad de llamar a API externas para obtener información adicional que no está disponible en los pesos del modelo (que muchas veces son difíciles de modificar después del entrenamiento previo). Esto incluye acceder a información actual, ejecutar código, acceder a fuentes de información patentadas y, lo más importante, invocar a otros agentes para la recuperación de información.
- El espacio de acción también engloba acciones que no tienen como objetivo recuperar algo, sino que implican realizar acciones específicas y obtener el resultado resultante. Ejemplos de tales acciones incluyen enviar correos electrónicos, iniciar aplicaciones, abrir puertas de entrada y más. Estas acciones normalmente se realizan a través de varias API. Además, es importante tener en cuenta que los agentes también pueden invocar a otros agentes para eventos procesables a los que tengan acceso.
Última actualización
8 abr 2024