TOM,ChatGPT API 最完整的客戶端
ChatGPT 的 OpenAI API 現已公開,透過 TOM,您可以在行動裝置上釋放 GPT-4 Turbo 和 GPT-4 Vision 的強大功能。
直接與 GPT 4 交談、發起討論或拍照並提出相關問題。你可以用任何語言說話,TOM 都能聽懂。
透過點擊系統提示來更改 TOM 的行為方式。讓它扮演任何你想要的角色。
透過 OpenAI 的 Whisper 享受最準確的語音識別,透過 OpenAI 的 TTS 享受完美的人類語音。或者,將它們停用並使用 Google 的服務,以降低延遲和成本,並提供更快的使用者體驗。
您還可以使用 GPT 3.5 Turbo 來加快回應速度並最大限度地降低成本。
TOM 是免費的,並且將永遠是。但要使用 AI,您需要 AI 所有者 OpenAI 提供的 API 金鑰。
GPT API 客戶端
您無需每月訂閱即可享受 GPT 4 Turbo 或 GPT 4 Vision:只需一個 API 金鑰。好消息是 OpenAI 網站上的 API 金鑰是免費的。以下是如何開始:
1. 在 https://platform.openai.com/api-keys 上建立您的 API 金鑰
2. 使用 TOM 中的 API 金鑰釋放 THE BEAST
如果您隨時需要更新或變更正在使用的 API 金鑰,請點擊「金鑰」按鈕。
控制項
使用頂部的選擇器在 GPT-3.5 Turbo 和 GPT-4 Turbo 之間切換,以管理您的成本或獲得更快的回應。每當您拍照時,都會自動選擇 GPT-4 Vision。
點擊湯姆的描述來設定您自己的系統提示。它將指導 GPT 如何與您互動。
點選 SPEAK 按鈕與 GPT 對話。
點擊“相機”按鈕拍照並詢問任何相關資訊。
之後您可以點擊「發言」繼續討論該照片。
然而,你的上下文將會增長。
上下文是什麼?
上下文包括您當前對話中所說的所有內容,包括拍攝的照片。每次都會將其發送到 API,因為 GPT 就是這樣記住它的。
它隨著每一個新句子,尤其是每張新圖片而增長。發送到 API 的上下文越大,回應時間越長。重要的是,OpenAI 根據您的環境規模進行收費。
為了找到正確的平衡,TOM 提供了在上下文變得特別繁重時清除上下文的能力,儘管 GPT 會忘記之前的所有互動。為此,請使用 BIN 按鈕。
影像尺寸
TOM 為發送到 GPT 的圖片提供了三種設定:快速、中等和品質。
「快速」是預設值,提供較小的圖像以更快地與 GPT 互動。它適用於文字和大多數類型的圖像。
「中」提供更多細節,但會產生稍大的影像。
使用“品質”以獲得最準確的結果。這些圖像是 OpenAI API 中最重且成本最高的。
耳語和 TTS
Whisper 是一個 OpenAI 神經網絡,其語音辨識的穩健性和準確性接近人類水準。如果啟用,您將享受 TOM 發送到 GPT 的語音識別的更高準確性,但需要額外費用。
TTS(文字轉語音)是一個 OpenAI 系統,可將文字轉換為逼真的語音。它還會產生額外費用。
預設啟用這兩個選項以獲得更好的使用者體驗。但可以停用這兩種功能,以便在網路速度較慢的情況下獲得更快的回應,或降低成本。然而,同時啟用這兩個功能,體驗確實很棒。