TokForge Local AI Offline Chat

Mức phân loại nội dung
Tất cả mọi người
100+
Lượt tải xuống
Mức phân loại nội dung
Tất cả mọi người
Tìm hiểu thêm
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình
Ảnh chụp màn hình

Thông tin về ứng dụng này

TRÍ TUỆ NHÂN TẠO RIÊNG TƯ, CỤC BỘ & NGOẠI TUYẾN. KHÔNG QUẢNG CÁO VÀ KHÔNG CẦN ĐĂNG KÝ


TokForge chạy các mô hình ngôn ngữ lớn trực tiếp trên thiết bị Android của bạn một cách nhanh chóng. Không cần đám mây, không cần đăng ký và không mất dữ liệu.

Cho dù bạn cần một trợ lý AI cục bộ để tăng năng suất hay một người bạn AI biết nói ngoại tuyến, TokForge đều cung cấp khả năng suy luận hiệu suất cao mà không cần kết nối internet.

NÓ CÓ THỂ LÀM GÌ? CÁC TÍNH NĂNG CỦA TOKFORGE:



Trò chuyện với các nhân vật AI


💬 Trải nghiệm trò chuyện AI ngoại tuyến của bạn vừa được nâng cấp. Nhập thẻ nhân vật TavernAI V2 (PNG/JSON), tùy chỉnh tính cách và có những cuộc trò chuyện thực sự với khả năng tạo nội dung trực tuyến. TokForge là người bạn AI ngoại tuyến tuyệt vời nhất, với các cuốn sách truyền thuyết, lời chào thay thế và thông tin về thế giới. Các mô hình suy luận thậm chí còn bao gồm các khối suy nghĩ có thể thu gọn để tạo ra logic sâu sắc.

Đính kèm tài liệu & Đặt câu hỏi


📄 Biến TokForge thành công cụ nghiên cứu AI cục bộ mạnh mẽ. Chỉ cần kéo thả tệp PDF, DOCX, EPUB hoặc tệp văn bản và sử dụng ứng dụng "Hỏi tôi bất cứ điều gì" ngoại tuyến. Sử dụng chỉ mục cây RAPTOR và nhúng BGE-small, ứng dụng sẽ tìm thấy các đoạn văn liên quan ngay lập tức. Các câu hỏi tiếp theo vẫn được trả lời nhanh chóng nhờ khả năng bảo toàn bộ nhớ cache delta KV.

Nghe câu trả lời được đọc to


🔊 Trợ lý giọng nói thực sự dành cho Android ngoại tuyến. Với Kokoro TTS trên thiết bị với 11 giọng nói và hai cấp độ chất lượng, trợ lý ngoại tuyến của bạn có thể đọc lại câu trả lời cho bạn mà không có độ trễ và không tốn dữ liệu.

Nhanh hơn gấp 2 lần với Giải mã suy đoán


⚡ Trải nghiệm hiệu suất LLM nhanh nhất trên thiết bị di động. Một mô hình dự thảo nhỏ dự đoán trước trong khi mô hình chính xác minh theo lô. Với chỉ báo tok/giây trực tiếp và định tuyến máy chủ thông minh, đây là giải pháp AI trên thiết bị hiệu quả nhất hiện có.

Ba máy chủ, năm đường dẫn GPU


• MNN với OpenCL và GPU Vulkan: Nhân được tinh chỉnh cho Mali và Adreno. TQ4 TurboQuant đạt 46–57 tok/giây trên các mô hình nhỏ.

• GGUF thông qua llama.cpp: ARM i8mm, ma trận hợp tác Vulkan, cơ chế chú ý flash và phạm vi lượng tử hóa đầy đủ.

• API từ xa: Truyền phát tương thích OpenAI đến máy chủ Ollama, vLLM hoặc llama.cpp.

• Tự động định tuyến nhận biết SoC: Trợ lý AI cục bộ này tự động chọn đường dẫn nhanh nhất cho chipset cụ thể của bạn.

TÍNH NĂNG TRÒ CHUYỆN NGOẠI TUYẾN AI NÂNG CAO:

AI của bạn ghi nhớ bạn: Bộ nhớ bền vững theo từng ký tự với khả năng trích xuất nền. Đồ thị tri thức theo dõi mối quan hệ giữa các thực thể bằng cách sử dụng tìm kiếm kết hợp từ khóa và ngữ nghĩa.

Tinh chỉnh thiết bị của bạn: ForgeLab đánh giá hiệu năng của mọi mô hình AI và sự kết hợp máy chủ phụ trợ trên phần cứng của bạn. AutoForge sẽ quét tất cả các cấu hình để chọn cài đặt nhanh nhất cho ứng dụng AI ngoại tuyến của bạn.

API dành cho nhà phát triển: Hơn 120 điểm cuối cho phép kiểm soát cục bộ hoàn toàn qua HTTP. Tải mô hình, quản lý bộ nhớ và gửi tin nhắn theo chương trình.

ĐÃ KIỂM TRA TRÊN PHẦN CỨNG THỰC TẾ

- RedMagic 11 Pro: 21.0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13.58 tok/s — Qwen3-4B

- OnePlus Ace 5 Ultra: 11.88 tok/s — Qwen3-8B

- Xiaomi Pad 7 Pro: 11.81 tok/s — Qwen3-4B

TẠI SAO CHỌN TOKFORGE?



►Đây là ứng dụng AI tất cả trong một dành cho người dùng không muốn thỏa hiệp về tốc độ hoặc bảo mật.

►Không phân tích, không thu thập dữ liệu từ xa, không phụ thuộc vào đám mây.

►Chatbot AI miễn phí ngoại tuyến: Tất cả suy luận diễn ra trên thiết bị — chế độ máy bay hoạt động hoàn hảo.

►Không cần tài khoản, không cần đăng ký.
►17 mô hình được tuyển chọn (0,6 tỷ–14 tỷ): Chọn từ Qwen3, DeepSeek-R1, Llama 3, Phi-4, và nhiều hơn nữa.

Điện thoại thông minh của bạn thông minh và mạnh mẽ hơn bạn nghĩ. Và bằng cách chuyển bộ não của AI trực tiếp lên chip của bạn, chúng tôi đã loại bỏ độ trễ, chi phí và sự dòm ngó của đám mây.

☑️Tải xuống ứng dụng AI mạnh mẽ ngoại tuyến miễn phí này ngay hôm nay và kiểm soát dữ liệu của bạn.
Lần cập nhật gần đây nhất
6 thg 4, 2026

An toàn dữ liệu

Sự an toàn bắt đầu từ việc nắm được cách nhà phát triển thu thập và chia sẻ dữ liệu của bạn. Các biện pháp bảo vệ quyền riêng tư và bảo mật dữ liệu có thể thay đổi tuỳ theo cách sử dụng, khu vực và độ tuổi. Nhà phát triển đã cung cấp thông tin này và có thể sẽ cập nhật theo thời gian.
Không chia sẻ dữ liệu với bên thứ ba
Tìm hiểu thêm về cách nhà phát triển khai báo thông tin về hoạt động chia sẻ dữ liệu
Không thu thập dữ liệu nào
Tìm hiểu thêm về cách nhà phát triển khai báo thông tin về hoạt động thu thập dữ liệu

Tính năng mới

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback
Mức phân loại nội dung
Tất cả mọi người
Tìm hiểu thêm

Thông tin hỗ trợ về ứng dụng

Giới thiệu về nhà phát triển
Isaac Maple
isaac.maple@defcon-one.io
United States