IA PRIVADA, LOCAL E SEN CONEXIÓN. SEN ANUNCIOS SEN SUBSCRICIÓN
TokForge executa modelos de linguaxe grandes directamente no teu dispositivo Android rapidamente. Sen nube, sen subscrición e sen datos que saian do teu peto.
Tanto se necesitas un asistente de IA local para a produtividade como un amigo de IA falante sen conexión, TokForge ofrece inferencia de alto rendemento sen conexión a internet.
QUE PODE FACER? CARACTERÍSTICAS DE TOKFORGE:
Chatea con personaxes de IA
💬 A túa experiencia de chat de IA sen conexión acaba de ser actualizada. Importa tarxetas de personaxes de TavernAI V2 (PNG/JSON), personaliza personalidades e mantén conversas reais coa xeración de transmisión. TokForge é o amigo de IA sen conexión definitivo, con libros de tradicións, saúdos alternativos e información do mundo. Os modelos de razoamento incluso inclúen bloques de pensamento plegables para unha lóxica profunda.
Adxuntar documentos e facer preguntas
📄 Converte TokForge nunha potente ferramenta de investigación de IA local. Introduce un ficheiro PDF, DOCX, EPUB ou de texto e pregúntame calquera cousa ao estilo da aplicación sen conexión. Usando a indexación de árbores RAPTOR e as incrustacións BGE-small, a aplicación atopa pasaxes relevantes ao instante. As preguntas de seguimento mantéñense rápidas grazas á preservación da caché delta KV.
Escoitar respostas en voz alta
🔊 Un verdadeiro asistente de voz para Android sen conexión. Con Kokoro TTS no dispositivo con 11 voces e dous niveis de calidade, o teu asistente sen conexión pode lerche as respostas sen latencia e sen uso de datos.
2 veces máis rápido con descodificación especulativa
⚡ Experimenta o rendemento LLM máis rápido en móbiles. Un pequeno modelo de borrador predí con antelación mentres o modelo principal verifica por lotes. Cun indicador de tok/s en directo e enrutamento intelixente do backend, é a solución de IA no dispositivo máis eficiente dispoñible.
Tres backends, cinco rutas de GPU
· MNN con GPU OpenCL e Vulkan: núcleos axustados para Mali e Adreno. TQ4 TurboQuant alcanza 46–57 tok/s en modelos pequenos.
· GGUF a través de llama.cpp: ARM i8mm, matriz cooperativa Vulkan, atención flash e rango completo de cuantización.
· API remota: transmisión compatible con OpenAI a servidores Ollama, vLLM ou llama.cpp.
· Enrutamento automático compatible con SoC: este asistente local de IA escolle automaticamente a ruta máis rápida para o teu chipset específico.
FUNCCIÓNS AVANZADAS DE CHAT SEN LIÑA DE IA:
• A túa IA lémbrate: memoria persistente por carácter con extracción en segundo plano. Os gráficos de coñecemento rastrexan as relacións entre entidades mediante palabras clave híbridas e busca semántica.
• Axusta o teu dispositivo: ForgeLab realiza unha comparación de cada modelo de IA e combinación de backend no teu hardware. AutoForge revisa todas as configuracións para escoller as opcións máis rápidas para a túa aplicación de IA sen conexión.
• API para desenvolvedores: Máis de 120 puntos finais para un control local completo sobre HTTP. Carga modelos, xestiona a memoria e envía mensaxes mediante programación.
PROBADO EN HARDWARE REAL
- RedMagic 11 Pro: 21,0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13,58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra: 11,88 tok/s — Qwen3-8B
- Xiaomi Pad 7 Pro: 11,81 tok/s — Qwen3-4B
POR QUE TOKFORGE?
►Esta é a aplicación de IA todo en un para usuarios que se negan a comprometer a velocidade ou a seguridade.
►Cero análises, cero telemetría, cero dependencia da nube.
►Chatbot de IA gratuíto sen conexión: toda a inferencia ocorre no dispositivo; o modo avión funciona perfectamente.
►Sen contas, sen rexistro.
►17 modelos seleccionados (0.6B–14B): Escolle entre Qwen3, DeepSeek-R1, Llama 3, Phi-4 e moitos máis.
O teu teléfono intelixente é máis intelixente e potente do que pensas. E ao trasladar o cerebro da IA directamente ao teu silicio, eliminamos o atraso, os custos e os ollos curiosos da nube.
☑️Descarga hoxe mesmo esta potencia de IA sen conexión gratuíta e toma o control dos teus datos.Última actualización
6 de abr. de 2026