TOM, najkompletnejší klient pre rozhranie ChatGPT API
OpenAI API pre ChatGPT je teraz verejné a s TOM môžete na svojom mobilnom zariadení uvoľniť silu GPT-4 Turbo a GPT-4 Vision.
Porozprávajte sa priamo s GPT 4, začnite diskusiu alebo fotografujte a pýtajte sa na ne. Môžete hovoriť v akomkoľvek jazyku, TOM im všetkým rozumie.
Zmeňte spôsob, akým sa TOM správa, klepnutím na systémovú výzvu. Nechajte to hrať akúkoľvek rolu, ktorú chcete.
Vychutnajte si najpresnejšie rozpoznávanie hlasu s OpenAI Whisper a dokonale ľudskú reč s OpenAI TTS. Prípadne ich ponechajte deaktivované a používajte služby Google, aby ste dosiahli nižšiu latenciu, náklady a rýchlejšie používateľské prostredie.
Môžete tiež použiť GPT 3.5 Turbo pre rýchlejšie reakcie a minimalizáciu nákladov.
TOM je zadarmo a vždy bude. Ale aby ste mohli používať AI, budete potrebovať API kľúč od vlastníka AI, OpenAI.
Klient GPT API
Na to, aby ste si užili GPT 4 Turbo alebo GPT 4 Vision, nepotrebujete mesačné predplatné: iba kľúč API. A dobrou správou je, že API kľúče sú na stránke OpenAI zadarmo. Tu je návod, ako začať:
1. Vytvorte si kľúč API na https://platform.openai.com/api-keys
2. Použite svoj kľúč API v TOM na rozpútanie THE BEAST
Ak kedykoľvek potrebujete aktualizovať alebo zmeniť kľúč API, ktorý používate, klepnite na tlačidlo KĽÚČ.
Ovládacie prvky
Pomocou voliča v hornej časti môžete prepínať medzi GPT-3.5 Turbo a GPT-4 Turbo, aby ste mohli spravovať svoje náklady alebo rýchlejšie reagovať. GPT-4 Vision sa automaticky vyberie pri každom fotografovaní.
Klepnutím na Tomov popis nastavíte vlastnú systémovú výzvu. Povedie GPT, ako s vami komunikovať.
Klepnutím na tlačidlo SPEAK môžete hovoriť s GPT.
Klepnutím na tlačidlo FOTOAPARÁT odfotíte obrázok a opýtate sa ho na čokoľvek.
Potom môžete pokračovať v diskusii o tejto fotografii klepnutím na „HOVORIŤ“.
Váš KONTEXT však porastie.
Aký je kontext?
Kontext zahŕňa všetko, čo sa hovorí vo vašej aktuálnej konverzácii, vrátane nasnímaných obrázkov. Zakaždým sa odošle do rozhrania API, pretože si to GPT pamätá.
Rastie s každou novou vetou a najmä s každým novým obrázkom. Čím väčší je kontext odoslaný do API, tým dlhší je čas odozvy. A čo je dôležité, OpenAI účtuje na základe veľkosti vášho kontextu.
Na nájdenie správnej rovnováhy poskytuje TOM možnosť vyčistiť kontext vždy, keď bude obzvlášť ťažký, hoci GPT potom zabudne na všetky predchádzajúce interakcie. Na tento účel použite tlačidlo BIN.
Veľkosti obrázkov
TOM ponúka tri nastavenia pre obrázky odosielané do GPT: rýchle, stredné a kvalitné.
Predvolená je možnosť „Rýchla“, ktorá poskytuje menšie obrázky pre rýchlejšiu interakciu so značkami GPT. Funguje dobre s textami a väčšinou typov obrázkov.
„Stredné“ ponúka viac detailov, ale výsledkom sú o niečo väčšie obrázky.
Pre maximálnu presnosť použite „kvalitu“. Tieto obrázky sú najťažšie a najdrahšie v OpenAI API.
Šepot a TTS
Whisper je neurónová sieť OpenAI, ktorá sa približuje k robustnosti a presnosti v rozpoznávaní reči na ľudskej úrovni. Ak je táto možnosť povolená, budete mať vyššiu presnosť pri rozpoznávaní hlasu, ktoré TOM odosiela do GPT, no za príplatok.
TTS (Text-to-Speech) je systém OpenAI, ktorý mení text na realistický hovorený zvuk. Spôsobuje to aj dodatočné náklady.
Obe možnosti sú v predvolenom nastavení povolené pre lepšiu používateľskú skúsenosť. Obe však možno deaktivovať, aby ste získali rýchlejšie reakcie v prípade pomalých sietí alebo znížili svoje náklady. Ak sú však obe povolené, zážitok je skutočne úžasný.Aktualizované
19. 12. 2023