TOM, o cliente máis completo para a API de ChatGPT
A API de OpenAI para ChatGPT agora é pública e, con TOM, podes liberar o poder de GPT-4 Turbo e GPT-4 Vision no teu dispositivo móbil.
Fala directamente con GPT 4, inicia unha discusión ou fai fotos e fai preguntas sobre elas. Podes falar en calquera idioma, TOM enténdeos todos.
Cambia o comportamento de TOM tocando o indicador do sistema. Faino xogar o papel que queiras.
Goza do recoñecemento de voz máis preciso con Whisper de OpenAI e dunha fala perfectamente humana co TTS de OpenAI. Alternativamente, manténos desactivados e utiliza os servizos de Google para reducir a latencia e os custos e unha experiencia de usuario máis rápida.
Tamén podes usar GPT 3.5 Turbo para respostas máis rápidas e para minimizar os custos.
TOM é gratuíto e sempre o será. Pero para facer uso da IA necesitarás unha clave API do propietario da IA, OpenAI.
Un cliente da API de GPT
Non necesitas unha subscrición mensual para gozar de GPT 4 Turbo ou GPT 4 Vision: só unha clave API. E a boa noticia é que as claves API son gratuítas no sitio de OpenAI. Aquí tes como comezar:
1. Crea a túa clave API en https://platform.openai.com/api-keys
2. Usa a túa clave API en TOM para liberar THE BEAST
Se nalgún momento precisa actualizar ou cambiar a clave API que está a usar, toque o botón CLAVE.
Controis
Usa o selector da parte superior para cambiar entre GPT-3.5 Turbo e GPT-4 Turbo para xestionar os teus custos ou para unha resposta máis rápida. GPT-4 Vision selecciónase automaticamente sempre que fas unha fotografía.
Toca a descrición de Tom para configurar o teu propio aviso do sistema. Orientará a GPT sobre como interactuar contigo.
Toca o botón FALAR para falar con GPT.
Toca o botón CÁMARA para sacar unha foto e preguntar calquera cousa ao respecto.
Podes seguir comentando esa foto tocando "FALAR" despois.
Non obstante, o teu CONTEXTO crecerá.
Cal é o contexto?
O contexto inclúe todo o que se dixo na túa conversa actual, incluídas as imaxes tomadas. Envíase á API cada vez, xa que así o lembra GPT.
Crece con cada nova frase e especialmente con cada nova imaxe. Canto maior sexa o contexto enviado á API, maior será o tempo de resposta. E o que é importante, OpenAI cobra en función do tamaño do teu contexto.
Para atopar o equilibrio adecuado, TOM ofrece a posibilidade de limpar o contexto sempre que se faga particularmente pesado, aínda que GPT esquecerá todas as interaccións anteriores. Use o botón BIN para este fin.
Tamaños da imaxe
TOM ofrece tres opcións para as imaxes enviadas a GPT: rápido, medio e de calidade.
"Rápido" é o predeterminado, que proporciona imaxes máis pequenas para unha interacción máis rápida con GPT. Funciona ben con textos e coa maioría dos tipos de imaxes.
"Medio" ofrece máis detalles pero dá como resultado imaxes un pouco máis grandes.
Use "calidade" para obter a maior precisión. Estas imaxes son as máis pesadas e caras da API de OpenAI.
Susurro e TTS
Whisper é unha rede neuronal OpenAI que se achega á robustez e precisión a nivel humano no recoñecemento de voz. Se está activado, gozarás dunha maior precisión no recoñecemento de voz que TOM envía a GPT, pero cun custo adicional.
TTS (Text-to-Speech) é un sistema OpenAI que converte o texto en audio falado realista. Tamén supón custos adicionais.
Ambas opcións están habilitadas por defecto para unha mellor experiencia de usuario. Pero ambos poden desactivarse para obter respostas máis rápidas en caso de redes lentas ou para reducir os custos. Non obstante, con ambos activados, a experiencia é realmente incrible.Última actualización
19 de dec. de 2023