TOM, den mest komplette klienten for ChatGPTs API
OpenAI API for ChatGPT er nå offentlig, og med TOM kan du slippe løs kraften til GPT-4 Turbo og GPT-4 Vision på mobilenheten din.
Snakk direkte til GPT 4, start en diskusjon eller ta bilder og still spørsmål om dem. Du kan snakke på alle språk, TOM forstår dem alle.
Endre måten TOM oppfører seg på ved å trykke på systemmeldingen. Få den til å spille hvilken som helst rolle du vil.
Nyt den mest nøyaktige stemmegjenkjenningen med OpenAIs Whisper, og perfekt menneskelig tale med OpenAIs TTS. Alternativt kan du holde dem deaktivert og bruke Googles tjenester for lavere ventetid og kostnader, og en raskere brukeropplevelse.
Du kan også bruke GPT 3.5 Turbo for raskere svar og for å minimere kostnadene.
TOM er gratis og vil alltid være det. Men for å bruke AI trenger du en API-nøkkel fra AI-eieren, OpenAI.
En GPT API-klient
Du trenger ikke et månedlig abonnement for å nyte GPT 4 Turbo eller GPT 4 Vision: bare en API-nøkkel. Og den gode nyheten er at API-nøkler er gratis på OpenAIs nettsted. Slik kommer du i gang:
1. Opprett API-nøkkelen din på https://platform.openai.com/api-keys
2. Bruk API-nøkkelen din i TOM for å slippe løs THE BEAST
Hvis du på noe tidspunkt trenger å oppdatere eller endre API-nøkkelen du bruker, trykker du på NØKKEL-knappen.
Kontroller
Bruk velgeren på toppen for å bytte mellom GPT-3.5 Turbo og GPT-4 Turbo for å administrere kostnadene dine eller for en raskere respons. GPT-4 Vision velges automatisk hver gang du tar et bilde.
Trykk på Toms beskrivelse for å angi din egen systemmelding. Den vil veilede GPT om hvordan du kan samhandle med deg.
Trykk på SPEAK-knappen for å snakke med GPT.
Trykk på KAMERA-knappen for å ta et bilde og spørre om det.
Du kan fortsette å diskutere det bildet ved å trykke på "SPEAK" etterpå.
KONTEKSTEN din vil imidlertid vokse.
Hva er konteksten?
Konteksten inkluderer alt som er sagt i din nåværende samtale, inkludert bilder tatt. Det sendes til API hver gang, da det er slik GPT husker det.
Det vokser med hver ny setning og spesielt med hvert nytt bilde. Jo større kontekst som sendes til API, desto lengre er responstiden. Og viktigere, OpenAI tar betalt basert på størrelsen på konteksten din.
For å finne den rette balansen gir TOM muligheten til å tømme konteksten når den blir spesielt tung, selv om GPT da vil glemme alle tidligere interaksjoner. Bruk BIN-knappen til dette formålet.
Bildestørrelser
TOM tilbyr tre innstillinger for bilder sendt til GPT: rask, middels og kvalitet.
"Rask" er standard, og gir mindre bilder for raskere interaksjon med GPT. Det fungerer godt med tekster og de fleste typer bilder.
'Medium' gir flere detaljer, men resulterer i litt større bilder.
Bruk 'kvalitet' for mest mulig nøyaktighet. Disse bildene er de tyngste og mest kostbare i OpenAI API.
Hvisking og TTS
Whisper er et OpenAI nevralt nett som nærmer seg robusthet og nøyaktighet på menneskelig nivå i talegjenkjenning. Hvis aktivert, vil du nyte ekstra nøyaktighet i stemmegjenkjenning som TOM sender til GPT, men mot en ekstra kostnad.
TTS (Text-to-Speech) er et OpenAI-system som gjør tekst til naturtro talelyd. Det medfører også ekstra kostnader.
Begge alternativene er aktivert som standard for en bedre brukeropplevelse. Men begge kan deaktiveres for å få raskere svar i tilfelle trege nettverk, eller for å redusere kostnadene. Men med begge aktivert, er opplevelsen virkelig fantastisk.