TokForge Local AI Offline Chat

Classificação do conteúdo
Todos
100+
downloads
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela
Imagem da captura de tela

Sobre este app

IA PRIVADA, LOCAL E OFFLINE. SEM ANÚNCIOS E SEM ASSINATURA


O TokForge executa grandes modelos de linguagem diretamente no seu dispositivo Android com rapidez. Sem nuvem, sem assinatura e sem consumir dados.

Seja para ter um assistente de IA local para aumentar a produtividade ou um amigo de IA para conversar offline, o TokForge oferece inferência de alto desempenho sem conexão com a internet.

O QUE ELE FAZ? RECURSOS DO TOKFORGE:



Bate-papo com personagens de IA


💬 Sua experiência de bate-papo com IA offline acaba de ser aprimorada. Importe cartões de personagens do TavernAI V2 (PNG/JSON), personalize personalidades e tenha conversas reais com geração em tempo real. O TokForge é o melhor amigo de IA offline, com livros de conhecimento, saudações alternativas e informações sobre o mundo. Os modelos de raciocínio incluem até mesmo blocos de pensamento expansíveis para lógica avançada.

Anexe Documentos e Faça Perguntas


📄 Transforme o TokForge em uma poderosa ferramenta local de pesquisa com IA. Basta adicionar um arquivo PDF, DOCX, EPUB ou de texto e perguntar qualquer coisa, no estilo do aplicativo offline. Usando indexação em árvore RAPTOR e embeddings BGE-small, o aplicativo encontra trechos relevantes instantaneamente. As perguntas de acompanhamento permanecem rápidas graças à preservação do cache delta KV.

Ouça as Respostas Lidas em Voz Alta


🔊 Um verdadeiro assistente de voz para Android offline. Com o recurso Kokoro TTS integrado, com 11 vozes e dois níveis de qualidade, seu assistente offline pode ler as respostas para você sem latência e com consumo zero de dados.

2x Mais Rápido com Decodificação Especulativa


⚡ Experimente o desempenho LLM mais rápido em dispositivos móveis. Um pequeno modelo de rascunho faz previsões enquanto o modelo principal verifica em lote. Com um indicador de tok/s em tempo real e roteamento inteligente de backend, é a solução de IA em dispositivo mais eficiente disponível.

Três Backends, Cinco Caminhos de GPU


· MNN com GPU OpenCL e Vulkan: Kernels otimizados para Mali e Adreno. O TQ4 TurboQuant atinge 46–57 tok/s em modelos pequenos.

· GGUF via llama.cpp: ARM i8mm, matriz cooperativa Vulkan, atenção flash e faixa de quantização completa.

· API Remota: Streaming compatível com OpenAI para servidores Ollama, vLLM ou llama.cpp.

· Roteamento Automático com Reconhecimento de SoC: Este assistente local de IA escolhe automaticamente o caminho mais rápido para o seu chipset específico.

RECURSOS AVANÇADOS DE CHAT OFFLINE COM IA:

Sua IA se lembra de você: Memória persistente por caractere com extração em segundo plano. Gráficos de conhecimento rastreiam relacionamentos entre entidades usando busca híbrida por palavras-chave e semântica.

Otimize seu dispositivo: O ForgeLab testa o desempenho de cada combinação de modelo de IA e backend em seu hardware. O AutoForge analisa todas as configurações para escolher as configurações mais rápidas para seu aplicativo de IA offline.

API do desenvolvedor: Mais de 120 endpoints para controle local completo via HTTP. Carregue modelos, gerencie memória e envie mensagens programaticamente.

TESTADO EM HARDWARE REAL

- RedMagic 11 Pro: 21,0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13,58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra: 11,88 tok/s — Qwen3-8B
- Xiaomi Pad 7 Pro: 11,81 tok/s — Qwen3-4B

POR QUE O TOKFORGE?


►Este é o aplicativo de IA completo para usuários que não abrem mão de velocidade ou segurança.

►Zero análises, zero telemetria, zero dependência da nuvem.

►Chatbot de IA gratuito offline: Toda a inferência acontece no dispositivo — o modo avião funciona perfeitamente.

►Sem contas, sem cadastro.

►17 modelos selecionados (0,6B–14B): Escolha entre Qwen3, DeepSeek-R1, Llama 3, Phi-4 e muito mais.

Seu smartphone é mais inteligente e poderoso do que você imagina. E ao transferir o cérebro da IA ​​diretamente para o seu chip, eliminamos a latência, os custos e a vigilância da nuvem.

☑️Baixe hoje mesmo esta poderosa ferramenta de IA offline gratuita e assuma o controle dos seus dados.
Atualizado em
6 de abr. de 2026

Segurança dos dados

Sua segurança começa quando você entende como os desenvolvedores coletam e compartilham seus dados. As práticas de segurança e privacidade de dados podem variar de acordo com o uso, a região e a idade. O desenvolvedor forneceu as informações a seguir, que podem ser atualizadas ao longo do tempo.
Os dados não são compartilhados com terceiros
Saiba mais sobre como os desenvolvedores declaram o compartilhamento
Nenhum dado foi coletado
Saiba mais sobre como os desenvolvedores declaram a coleta

O que há de novo

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback

Suporte do app

Sobre o desenvolvedor
Isaac Maple
isaac.maple@defcon-one.io
United States