TokForge Local AI Offline Chat

Classification du contenu
Tout public
100+
Téléchargements
Classification du contenu
Tout public
En savoir plus
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran
Capture d'écran

À propos de l'application

IA PRIVÉE, LOCALE ET HORS LIGNE. SANS PUBLICITÉ NI ABONNEMENT



TokForge exécute rapidement de grands modèles de langage directement sur votre appareil Android. Sans cloud, sans abonnement et sans consommer de données.

Que vous ayez besoin d'un assistant IA local pour la productivité ou d'un ami IA avec qui discuter hors ligne, TokForge offre une inférence haute performance sans connexion Internet.

QUE PEUT-IL FAIRE ? FONCTIONNALITÉS DE TOKFORGE :



Discutez avec des personnages IA


💬 Votre expérience de chat IA hors ligne passe à la vitesse supérieure. Importez les fiches de personnages TavernAI V2 (PNG/JSON), personnalisez les personnalités et engagez de véritables conversations grâce à la génération en continu. TokForge est l'ami IA hors ligne par excellence, avec des livres de connaissances, des salutations alternatives et des informations sur le monde. Les modèles de raisonnement incluent même des blocs de pensée pliables pour une logique complexe.

Joindre des documents et poser des questions


📄 Transformez TokForge en un puissant outil de recherche en IA local. Importez un fichier PDF, DOCX, EPUB ou texte et posez-moi toutes vos questions, même hors ligne. Grâce à l'indexation arborescente RAPTOR et aux embeddings BGE-small, l'application trouve instantanément les passages pertinents. Les questions de suivi restent rapides grâce à la préservation du cache delta KV.

Écouter les réponses lues à voix haute


🔊 Un véritable assistant vocal pour Android, même hors ligne. Grâce à la synthèse vocale Kokoro intégrée, avec 11 voix et deux niveaux de qualité, votre assistant hors ligne peut vous lire les réponses sans latence et sans consommer de données.

Deux fois plus rapide avec le décodage spéculatif


⚡ Profitez des performances LLM les plus rapides sur mobile. Un petit modèle préliminaire effectue des prédictions pendant que le modèle principal effectue les vérifications par lots. Avec un indicateur de tok/s en temps réel et un routage intelligent du backend, c'est la solution d'IA embarquée la plus efficace du marché.

Trois backends, cinq chemins GPU



• MNN avec GPU OpenCL et Vulkan : Noyaux optimisés pour Mali et Adreno. TQ4 TurboQuant atteint 46 à 57 tok/s sur les petits modèles.

• GGUF via llama.cpp : ARM i8mm, matrice coopérative Vulkan, gestion de l'attention flash et plage de quantification complète.

• API distante : Streaming compatible OpenAI vers les serveurs Ollama, vLLM ou llama.cpp.

• Routage automatique adapté au SoC : Cet assistant IA local sélectionne automatiquement le chemin le plus rapide pour votre chipset.

FONCTIONNALITÉS AVANCÉES DE CHAT HORS LIGNE :


Votre IA se souvient de vous : Mémoire persistante par caractère avec extraction en arrière-plan. Les graphes de connaissances suivent les relations entre les entités grâce à une recherche hybride par mots-clés et sémantique.

Optimisation de votre appareil : ForgeLab évalue les performances de chaque combinaison de modèle d'IA et de backend sur votre matériel. AutoForge analyse toutes les configurations pour sélectionner les paramètres les plus rapides pour votre application d'IA hors ligne.

API développeur : Plus de 120 points de terminaison pour un contrôle local complet via HTTP. Chargez des modèles, gérez la mémoire et envoyez des messages par programmation.

TESTÉ SUR DU MATÉRIEL RÉEL


- RedMagic 11 Pro : 21,0 tok/s — Qwen3-8B

- Galaxy S24 Ultra : 13,58 tok/s — Qwen3-4B

- OnePlus Ace 5 Ultra : 11,88 tok/s — Qwen3-8B

- Xiaomi Pad 7 Pro : 11,81 tok/s — Qwen3-4B

POURQUOI TOKFORGE ?



► Une application IA tout-en-un pour les utilisateurs exigeants qui refusent tout compromis sur la vitesse et la sécurité.

► Aucune analyse, aucune télémétrie, aucune dépendance au cloud.

► Chatbot IA gratuit et utilisable hors ligne : toutes les inférences sont effectuées sur l’appareil ; le mode avion fonctionne parfaitement.

► Aucun compte, aucune inscription. ►17 modèles sélectionnés (0,6 à 14 milliards de Mbps) : Choisissez parmi Qwen3, DeepSeek-R1, Llama 3, Phi-4 et bien d’autres.

Votre smartphone est plus intelligent et plus puissant que vous ne le pensez. En intégrant l’intelligence artificielle directement dans votre processeur, nous avons éliminé la latence, les coûts et les risques liés au cloud.

☑️Téléchargez gratuitement cette puissante application d’IA hors ligne dès aujourd’hui et prenez le contrôle de vos données.
Date de mise à jour
6 avr. 2026

Sécurité des données

La sécurité, c'est d'abord comprendre comment les développeurs collectent et partagent vos données. Les pratiques concernant leur confidentialité et leur protection peuvent varier selon votre utilisation, votre région et votre âge. Le développeur a fourni ces informations et peut les modifier ultérieurement.
Aucune donnée partagée avec des tiers
En savoir plus sur la manière dont les développeurs déclarent le partage
Aucune donnée collectée
En savoir plus sur la manière dont les développeurs déclarent la collecte

Nouveautés

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback
Classification du contenu
Tout public
En savoir plus

Assistance de l'appli

À propos du développeur
Isaac Maple
isaac.maple@defcon-one.io
United States