La aplicación demuestra la capacidad de ejecutar Modelos Visuales de Lenguaje (VLM) en Android usando llama.cpp, libmtmd y SmolVLM2 de HuggingFace. Esta aplicación se ampliará con el tiempo para admitir todos los VLM en formato GGUF, pero en la versión inicial solo admite SmolVLM2-256M-Instruct.