TokForge Local AI Offline Chat

Clasificación de contido
Todos
100+
Descargas
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla
Imaxe de captura de pantalla

Acerca desta aplicación

IA PRIVADA, LOCAL E SEN CONEXIÓN. SEN ANUNCIOS SEN SUBSCRICIÓN


TokForge executa modelos de linguaxe grandes directamente no teu dispositivo Android rapidamente. Sen nube, sen subscrición e sen datos que saian do teu peto.

Tanto se necesitas un asistente de IA local para a produtividade como un amigo de IA falante sen conexión, TokForge ofrece inferencia de alto rendemento sen conexión a internet.

QUE PODE FACER? CARACTERÍSTICAS DE TOKFORGE:



Chatea con personaxes de IA


💬 A túa experiencia de chat de IA sen conexión acaba de ser actualizada. Importa tarxetas de personaxes de TavernAI V2 (PNG/JSON), personaliza personalidades e mantén conversas reais coa xeración de transmisión. TokForge é o amigo de IA sen conexión definitivo, con libros de tradicións, saúdos alternativos e información do mundo. Os modelos de razoamento incluso inclúen bloques de pensamento plegables para unha lóxica profunda.

Adxuntar documentos e facer preguntas


📄 Converte TokForge nunha potente ferramenta de investigación de IA local. Introduce un ficheiro PDF, DOCX, EPUB ou de texto e pregúntame calquera cousa ao estilo da aplicación sen conexión. Usando a indexación de árbores RAPTOR e as incrustacións BGE-small, a aplicación atopa pasaxes relevantes ao instante. As preguntas de seguimento mantéñense rápidas grazas á preservación da caché delta KV.

Escoitar respostas en voz alta


🔊 Un verdadeiro asistente de voz para Android sen conexión. Con Kokoro TTS no dispositivo con 11 voces e dous niveis de calidade, o teu asistente sen conexión pode lerche as respostas sen latencia e sen uso de datos.

2 veces máis rápido con descodificación especulativa


⚡ Experimenta o rendemento LLM máis rápido en móbiles. Un pequeno modelo de borrador predí con antelación mentres o modelo principal verifica por lotes. Cun indicador de tok/s en directo e enrutamento intelixente do backend, é a solución de IA no dispositivo máis eficiente dispoñible.

Tres backends, cinco rutas de GPU


· MNN con GPU OpenCL e Vulkan: núcleos axustados para Mali e Adreno. TQ4 TurboQuant alcanza 46–57 tok/s en modelos pequenos.
· GGUF a través de llama.cpp: ARM i8mm, matriz cooperativa Vulkan, atención flash e rango completo de cuantización.
· API remota: transmisión compatible con OpenAI a servidores Ollama, vLLM ou llama.cpp.
· Enrutamento automático compatible con SoC: este asistente local de IA escolle automaticamente a ruta máis rápida para o teu chipset específico.

FUNCCIÓNS AVANZADAS DE CHAT SEN LIÑA DE IA:

A túa IA lémbrate: memoria persistente por carácter con extracción en segundo plano. Os gráficos de coñecemento rastrexan as relacións entre entidades mediante palabras clave híbridas e busca semántica.

Axusta o teu dispositivo: ForgeLab realiza unha comparación de cada modelo de IA e combinación de backend no teu hardware. AutoForge revisa todas as configuracións para escoller as opcións máis rápidas para a túa aplicación de IA sen conexión.

API para desenvolvedores: Máis de 120 puntos finais para un control local completo sobre HTTP. Carga modelos, xestiona a memoria e envía mensaxes mediante programación.

PROBADO EN HARDWARE REAL

- RedMagic 11 Pro: 21,0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13,58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra: 11,88 tok/s — Qwen3-8B
- Xiaomi Pad 7 Pro: 11,81 tok/s — Qwen3-4B

POR QUE TOKFORGE?


►Esta é a aplicación de IA todo en un para usuarios que se negan a comprometer a velocidade ou a seguridade.
►Cero análises, cero telemetría, cero dependencia da nube.
►Chatbot de IA gratuíto sen conexión: toda a inferencia ocorre no dispositivo; o modo avión funciona perfectamente.
►Sen contas, sen rexistro.
►17 modelos seleccionados (0.6B–14B): Escolle entre Qwen3, DeepSeek-R1, Llama 3, Phi-4 e moitos máis.

O teu teléfono intelixente é máis intelixente e potente do que pensas. E ao trasladar o cerebro da IA ​​directamente ao teu silicio, eliminamos o atraso, os custos e os ollos curiosos da nube.

☑️Descarga hoxe mesmo esta potencia de IA sen conexión gratuíta e toma o control dos teus datos.
Última actualización
6 de abr. de 2026

Seguranza dos datos

A seguranza pasa por entender como recompilan e comparten os teus datos os programadores. As prácticas relacionadas coa seguranza e a privacidade dos datos utilizadas poden variar en función do uso, a rexión e a idade. O programador facilitou esta información e pode modificala co paso do tempo.
Non se comparten datos con terceiros
Máis información sobre como fan os programadores declaracións acerca dos datos que comparten
Non se recompila ningún dato
Máis información sobre como fan os programadores declaracións acerca da recompilación de datos

Novidades

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback

Servizo de asistencia da aplicación