IA PRIVADA, LOCAL E OFFLINE. SEM ANÚNCIOS E SEM ASSINATURA
O TokForge executa grandes modelos de linguagem diretamente no seu dispositivo Android com rapidez. Sem nuvem, sem assinatura e sem consumir dados.
Seja para ter um assistente de IA local para aumentar a produtividade ou um amigo de IA para conversar offline, o TokForge oferece inferência de alto desempenho sem conexão com a internet.
O QUE ELE FAZ? RECURSOS DO TOKFORGE:
Bate-papo com personagens de IA
💬 Sua experiência de bate-papo com IA offline acaba de ser aprimorada. Importe cartões de personagens do TavernAI V2 (PNG/JSON), personalize personalidades e tenha conversas reais com geração em tempo real. O TokForge é o melhor amigo de IA offline, com livros de conhecimento, saudações alternativas e informações sobre o mundo. Os modelos de raciocínio incluem até mesmo blocos de pensamento expansíveis para lógica avançada.
Anexe Documentos e Faça Perguntas
📄 Transforme o TokForge em uma poderosa ferramenta local de pesquisa com IA. Basta adicionar um arquivo PDF, DOCX, EPUB ou de texto e perguntar qualquer coisa, no estilo do aplicativo offline. Usando indexação em árvore RAPTOR e embeddings BGE-small, o aplicativo encontra trechos relevantes instantaneamente. As perguntas de acompanhamento permanecem rápidas graças à preservação do cache delta KV.
Ouça as Respostas Lidas em Voz Alta
🔊 Um verdadeiro assistente de voz para Android offline. Com o recurso Kokoro TTS integrado, com 11 vozes e dois níveis de qualidade, seu assistente offline pode ler as respostas para você sem latência e com consumo zero de dados.
2x Mais Rápido com Decodificação Especulativa
⚡ Experimente o desempenho LLM mais rápido em dispositivos móveis. Um pequeno modelo de rascunho faz previsões enquanto o modelo principal verifica em lote. Com um indicador de tok/s em tempo real e roteamento inteligente de backend, é a solução de IA em dispositivo mais eficiente disponível.
Três Backends, Cinco Caminhos de GPU
· MNN com GPU OpenCL e Vulkan: Kernels otimizados para Mali e Adreno. O TQ4 TurboQuant atinge 46–57 tok/s em modelos pequenos.
· GGUF via llama.cpp: ARM i8mm, matriz cooperativa Vulkan, atenção flash e faixa de quantização completa.
· API Remota: Streaming compatível com OpenAI para servidores Ollama, vLLM ou llama.cpp.
· Roteamento Automático com Reconhecimento de SoC: Este assistente local de IA escolhe automaticamente o caminho mais rápido para o seu chipset específico.
RECURSOS AVANÇADOS DE CHAT OFFLINE COM IA:
• Sua IA se lembra de você: Memória persistente por caractere com extração em segundo plano. Gráficos de conhecimento rastreiam relacionamentos entre entidades usando busca híbrida por palavras-chave e semântica.
• Otimize seu dispositivo: O ForgeLab testa o desempenho de cada combinação de modelo de IA e backend em seu hardware. O AutoForge analisa todas as configurações para escolher as configurações mais rápidas para seu aplicativo de IA offline.
• API do desenvolvedor: Mais de 120 endpoints para controle local completo via HTTP. Carregue modelos, gerencie memória e envie mensagens programaticamente.
TESTADO EM HARDWARE REAL
- RedMagic 11 Pro: 21,0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13,58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra: 11,88 tok/s — Qwen3-8B
- Xiaomi Pad 7 Pro: 11,81 tok/s — Qwen3-4B
POR QUE O TOKFORGE?
►Este é o aplicativo de IA completo para usuários que não abrem mão de velocidade ou segurança.
►Zero análises, zero telemetria, zero dependência da nuvem.
►Chatbot de IA gratuito offline: Toda a inferência acontece no dispositivo — o modo avião funciona perfeitamente.
►Sem contas, sem cadastro.
►17 modelos selecionados (0,6B–14B): Escolha entre Qwen3, DeepSeek-R1, Llama 3, Phi-4 e muito mais.
Seu smartphone é mais inteligente e poderoso do que você imagina. E ao transferir o cérebro da IA diretamente para o seu chip, eliminamos a latência, os custos e a vigilância da nuvem.
☑️Baixe hoje mesmo esta poderosa ferramenta de IA offline gratuita e assuma o controle dos seus dados.Atualizado em
6 de abr. de 2026