TokForge

Name: TokForge
Availability: InStock
Author: Defcon-One

Defcon-One

50+

Mga Download

Lahat

Tungkol sa app na ito

Mas matalino ang iyong telepono kaysa sa inaakala mo.

Direktang nagpapatakbo ang TokForge ng malalaking modelo ng wika sa iyong Android device — walang cloud, walang subscription, walang data na umaalis sa iyong bulsa. Makipag-chat sa mga AI character, maglakip ng mga dokumento, makinig sa mga tugon na binibigkas nang malakas, at awtomatikong i-tune ang lahat sa iyong hardware.

ANO ANG MAGAGAMIT NITO?

Makipag-chat sa mga AI Character
Mag-import ng mga TavernAI V2 character card (PNG/JSON), i-customize ang mga personalidad gamit ang mga setting bawat karakter, at magkaroon ng mga totoong pag-uusap gamit ang streaming generation. Ang mga reasoning model ay nakakakuha ng mga maaaring i-collapse na thinking block. Mga Lorebook, alternatibong pagbati, impormasyon sa mundo — ang buong detalye.

Maglakip ng mga Dokumento at Magtanong
Maglagay ng PDF, DOCX, EPUB, o text file at magtanong batay sa dokumentong iyon. Ang RAPTOR tree indexing at BGE-small embeddings ay nakakahanap ng mga kaugnay na sipi. Ang mga follow-up na tanong ay nananatiling mabilis salamat sa delta KV cache preservation.

Pakinggan ang mga Tugon na Binabasa nang Malakas
On-device na Kokoro TTS — 11 boses, naaayos na bilis, dalawang antas ng kalidad. Ganap na offline. Hindi kailangan ng internet.

2x Mas Mabilis Gamit ang Speculative Decoding
Isang maliit na draft model ang humuhula nang maaga, ang pangunahing modelo ay nagve-verify nang batch. Live tok/s indicator sa chat toolbar. Awtomatikong nade-detect na mga pairing gamit ang smart per-mode backend routing.

TATLONG BACKEND, LIMANG LANDAS NG GPU
• MNN na may OpenCL at Vulkan GPU — naka-tune na MNN Vulkan GEMV kernels para sa Mali, OpenCL para sa Adreno. Ang TQ4 TurboQuant ay umaabot sa 46–57 tok/s sa maliliit na modelo.
• GGUF sa pamamagitan ng llama.cpp — ARM i8mm, Vulkan cooperative matrix, flash attention, DRY sampler, Mirostat, full quantization range
• Remote API — OpenAI-compatible streaming sa Ollama, vLLM, o llama.cpp server
• Pinipili ng SoC-aware auto-routing ang pinakamabilis na landas para sa iyong chipset

INAALALA KA NG IYONG AI
Per-character persistent memory na may background extraction — walang manual tagging. Sinusubaybayan ng mga knowledge graph ang mga relasyon ng entity. Hybrid keyword + semantic search. Mananatili ang mga attachment ng dokumento sa iba't ibang session.

I-TUNE ANG IYONG DEVICE
Bina-benchmark ng ForgeLab ang bawat modelo/backend combo sa iyong hardware. Sinusuri ng AutoForge ang lahat ng config at pinipili ang pinakamabilis. I-save ng mga pinangalanang inference profile ang mga setting ng iyong sampler. Maibabahaging PNG report card.

DEVELOPER API — 120+ ENDPOINTS
Kumpletong local control plane sa HTTP. Mag-load ng mga modelo, magpatakbo ng mga benchmark, mamahala ng memory, mag-pin ng mga dokumento, magpadala ng mga mensahe — lahat ay programmatic. Bearer-token auth, hindi pinagana bilang default.

NASUBUKAN SA TUNAY NA HARDWARE
• RedMagic 11 Pro (SM8850): 21.0 tok/s — Qwen3-8B, OpenCL
• Galaxy S24 Ultra (SM8650): 13.58 tok/s — Qwen3-4B, OpenCL
• OnePlus Ace 5 Ultra (D9400): 11.88 tok/s — Qwen3-8B, MNN Vulkan
• Xiaomi Pad 7 Pro (SM8635): 11.81 tok/s — Qwen3-4B, CPU

PRIVACY ANG PUNTO
• Walang analytics, walang telemetry, walang cloud dependency
• Lahat ng inference sa device — gumagana nang maayos ang airplane mode
• Walang account, walang sign-up

17 napiling modelo (0.6B–14B): Qwen3, DeepSeek-R1, Llama 3, Phi-4 at marami pang iba. I-download ang in-app o maghanap sa HuggingFace.

Na-update noong

Abr 6, 2026

Kaligtasan ng data

Nagsisimula ang kaligtasan sa pag-unawa kung paano kinokolekta at ibinabahagi ng mga developer ang iyong data. Posibleng mag-iba ang mga kagawian sa privacy at seguridad ng data batay sa iyong paggamit, rehiyon, at edad. Ang developer ang nagbigay ng impormasyong ito at posibleng i-update niya ito sa paglipas ng panahon.

Walang data na ibinabahagi sa mga third party

Matuto pa tungkol sa kung paano inihahayag ng mga developer ang pagbabahagi

Walang nakolektang data

Matuto pa tungkol sa kung paano inihahayag ng mga developer ang pagkolekta

Ano'ng bago

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback

I-flag bilang hindi naaangkop

Suporta sa app

Website

Email ng suporta

tokforge@defcon-one.io

Patakaran sa Privacy

Tungkol sa developer

Isaac Maple

isaac.maple@defcon-one.io

United States

I-flag bilang hindi naaangkop