TokForge Local AI Offline Chat

콘텐츠 등급
전체이용가
100+
다운로드
콘텐츠 등급
전체이용가
자세히 알아보기
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지
스크린샷 이미지

앱 정보

개인 정보 보호, 로컬 및 오프라인 AI. 광고 없음, 구독료 없음


TokForge는 대규모 언어 모델을 Android 기기에서 직접 빠르게 실행합니다. 클라우드도, 구독료도, 데이터도 주머니 밖으로 나가지 않습니다.

생산성을 위한 로컬 AI 비서가 필요하든, 오프라인에서 대화할 AI 친구가 필요하든, TokForge는 인터넷 연결 없이 고성능 추론을 제공합니다.

TokForge의 주요 기능:



AI 캐릭터와 채팅


💬 오프라인 AI 채팅 경험이 한 단계 업그레이드되었습니다. TavernAI V2 캐릭터 카드(PNG/JSON)를 가져와 개성을 맞춤 설정하고, 실시간 생성 기능을 통해 실제 대화를 나눠보세요. TokForge는 세계관 정보, 대체 인사말, 세계관 정보 등을 제공하는 최고의 오프라인 AI 친구입니다. 추론 모델에는 심층적인 논리를 위한 접이식 사고 블록도 포함되어 있습니다.

문서 첨부 및 질문하기


📄 TokForge를 강력한 로컬 AI 연구 도구로 활용하세요. PDF, DOCX, EPUB 또는 텍스트 파일을 첨부하고 오프라인에서 무엇이든 질문하세요. RAPTOR 트리 인덱싱과 BGE-small 임베딩을 사용하여 관련 구절을 즉시 찾아줍니다. 델타 KV 캐시 보존 덕분에 후속 질문에도 빠른 응답 속도를 유지합니다.

답변 음성 듣기


🔊 안드로이드 오프라인용 진정한 음성 비서입니다. 11가지 음성과 두 가지 음질 등급을 제공하는 온디바이스 Kokoro TTS를 통해 오프라인 비서가 지연이나 데이터 사용량 없이 답변을 읽어줍니다.

추측 디코딩으로 2배 빠른 속도


⚡ 모바일에서 가장 빠른 LLM 성능을 경험하세요. 작은 초안 모델이 미리 예측하는 동안 메인 모델은 일괄적으로 검증합니다. 실시간 tok/s 표시기와 스마트 백엔드 라우팅을 통해 가장 효율적인 온디바이스 AI 솔루션을 제공합니다.

세 가지 백엔드, 다섯 가지 GPU 경로


· OpenCL 및 Vulkan GPU를 사용하는 MNN: Mali 및 Adreno에 최적화된 커널. TQ4 TurboQuant는 작은 모델에서 46~57 tok/s의 속도를 달성합니다.

· llama.cpp를 통한 GGUF: ARM i8mm, Vulkan 협력 행렬, 플래시 어텐션, 전체 양자화 범위 지원.

· 원격 API: OpenAI 호환 Ollama, vLLM 또는 llama.cpp 서버로 스트리밍 가능.

· SoC 인식 자동 라우팅: 이 AI 로컬 어시스턴트는 사용자의 칩셋에 맞춰 가장 빠른 경로를 자동으로 선택합니다.

고급 AI 오프라인 채팅 기능:

AI가 사용자를 기억합니다: 문자별 영구 메모리 및 백그라운드 추출 기능. 지식 그래프는 하이브리드 키워드 및 시맨틱 검색을 사용하여 엔티티 간의 관계를 추적합니다.

기기 최적화: ForgeLab은 모든 AI 모델과 백엔드 조합을 하드웨어에서 벤치마킹합니다. AutoForge는 모든 구성을 검토하여 오프라인 AI 앱에 가장 빠른 설정을 찾아줍니다.

개발자 API: 120개 이상의 엔드포인트를 통해 HTTP를 사용하여 로컬에서 완벽하게 제어할 수 있습니다. 모델 로드, 메모리 관리, 메시지 전송 등을 프로그래밍 방식으로 수행할 수 있습니다.

실제 하드웨어에서 테스트 완료

- RedMagic 11 Pro: 21.0 tok/s — Qwen3-8B
- Galaxy S24 Ultra: 13.58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra: 11.88 tok/s — Qwen3-8B
- Xiaomi iPad 7 Pro: 11.81 tok/s — Qwen3-4B

TOKFORGE를 선택해야 하는 이유


►속도와 보안을 타협하지 않는 사용자를 위한 AI 올인원 앱입니다.

►분석, 원격 측정, 클라우드 의존성이 전혀 없습니다.

►무료 AI 챗봇 오프라인 사용: 모든 추론은 기기 내에서 이루어지며, 비행기 모드에서도 완벽하게 작동합니다.

►계정이나 가입이 필요 없습니다.

►엄선된 17개 모델(0.6B~14B): Qwen3, DeepSeek-R1, Llama 3, Phi-4 등 다양한 모델 중에서 선택하세요.

스마트폰은 생각보다 훨씬 더 똑똑하고 강력합니다. AI의 핵심 기능을 스마트폰에 직접 탑재함으로써 클라우드의 지연, 비용, 그리고 개인 정보 유출 위험을 없앴습니다.

☑️지금 바로 이 무료 오프라인 AI 강자 앱을 다운로드하고 데이터를 완벽하게 관리하세요.
업데이트 날짜
2026. 4. 6.

데이터 보안

보안은 개발자가 데이터를 수집 및 공유하는 방식을 파악하는 것에서 시작됩니다. 데이터 개인 정보 보호 및 보안 관행은 사용자의 앱 사용, 지역, 연령에 따라 다를 수 있습니다. 다음은 개발자가 제공한 정보이며 추후 업데이트될 수 있습니다.
제3자와 공유되는 데이터 없음
개발자가 어떻게 공유를 선언하는지 자세히 알아보세요.
수집된 데이터가 없습니다.
개발자가 어떻게 수집을 선언하는지 자세히 알아보세요.

새로운 기능

Lot's of changes vs last upload. TurboQuant added under advanced settings, Cache clearing, RAG + Attachment support (Very Beta), Metrics/API work, UI/UX cleaning and improvements from beta tester feedback
콘텐츠 등급
전체이용가
자세히 알아보기

앱 지원

개발자 소개
Isaac Maple
isaac.maple@defcon-one.io
United States