Orkestrasi Tugas Agen yang berorientasi pada tujuan. Pada dasarnya, Agen AI akan berkomunikasi satu sama lain untuk menjalankan tugas Anda.
Contoh: "pilih hari terbaik bulan depan untuk semi-maraton 20 km". AI akan mulai berkolaborasi: agen Cuaca mengambil perkiraan, agen pencarian Web mengidentifikasi kondisi berjalan yang optimal, dan agen Wolfram menghitung "hari terbaik". Ini adalah seni AI yang terhubung, menyederhanakan tugas-tugas kompleks dengan kecanggihan.
LLM sebagai kerangka utama bagi agen otonom adalah sebuah konsep yang menarik. Demonstrasi seperti AutoGPT, GPT-Engineer, dan BabyAGI berfungsi sebagai ilustrasi sederhana dari ide ini. Potensi LLM lebih dari sekadar menghasilkan atau menyelesaikan salinan, cerita, esai, dan program yang ditulis dengan baik; mereka dapat dibingkai sebagai Pemecah Tugas Umum yang kuat, dan itulah yang ingin kami capai dalam membangun Orkestrasi Agen Tugas yang Berorientasi Tujuan (GOAT.AI)
Agar orkestrasi sistem gugus tugas agen LLM yang berorientasi pada tujuan ada dan berfungsi dengan baik, tiga komponen inti utama sistem harus berfungsi dengan baik
- Ringkasan
1) Perencanaan
- Subtujuan dan dekomposisi: Agen memecah tugas besar menjadi subtujuan yang lebih kecil dan dapat dikelola, sehingga lebih mudah menangani tugas kompleks secara efisien.
- Refleksi dan penyempurnaan: Agen melakukan kritik diri dan refleksi diri atas tindakan masa lalu, belajar dari kesalahan, dan meningkatkan pendekatan untuk langkah masa depan, sehingga meningkatkan kualitas hasil secara keseluruhan.
2) Memori
- Memori jangka pendek: Mengacu pada jumlah teks yang dapat diproses model sebelum dijawab tanpa penurunan kualitas. Dalam kondisi saat ini, LLM dapat memberikan jawaban tanpa penurunan kualitas untuk sekitar 128 ribu token.
- Memori jangka panjang: Hal ini memungkinkan agen untuk menyimpan dan mengingat informasi dalam jumlah tak terbatas untuk konteksnya dalam jangka waktu lama. Hal ini sering dicapai dengan menggunakan penyimpanan vektor eksternal untuk sistem RAG yang efisien.
3) Ruang Aksi
- Agen memperoleh kemampuan untuk memanggil API eksternal untuk mendapatkan informasi tambahan yang tidak tersedia dalam bobot model (yang seringkali sulit diubah setelah pra-pelatihan). Hal ini termasuk mengakses informasi terkini, mengeksekusi kode, mengakses sumber informasi kepemilikan, dan yang paling penting: meminta agen lain untuk mengambil informasi.
- Ruang tindakan juga mencakup tindakan yang tidak bertujuan untuk mengambil sesuatu, melainkan melibatkan melakukan tindakan tertentu dan memperoleh hasil yang dihasilkan. Contoh tindakan tersebut termasuk mengirim email, meluncurkan aplikasi, membuka pintu depan, dan banyak lagi. Tindakan ini biasanya dilakukan melalui berbagai API. Selain itu, penting untuk dicatat bahwa agen juga dapat memanggil agen lain untuk peristiwa yang dapat ditindaklanjuti yang dapat mereka akses.