TOM, le client le plus complet pour l'API de ChatGPT
L'API OpenAI pour ChatGPT est désormais publique et avec TOM, vous pouvez libérer la puissance de GPT-4 Turbo et GPT-4 Vision sur votre appareil mobile.
Parlez directement à GPT 4, démarrez une discussion ou prenez des photos et posez des questions à leur sujet. Vous pouvez parler dans n'importe quelle langue, TOM les comprend toutes.
Modifiez la façon dont TOM se comporte en appuyant sur l'invite du système. Faites-lui jouer le rôle que vous voulez.
Profitez de la reconnaissance vocale la plus précise avec Whisper d'OpenAI et d'une parole parfaitement humaine avec le TTS d'OpenAI. Vous pouvez également les laisser désactivés et utiliser les services de Google pour réduire la latence et les coûts, ainsi qu'une expérience utilisateur plus rapide.
Vous pouvez également utiliser GPT 3.5 Turbo pour des réponses plus rapides et minimiser les coûts.
TOM est gratuit et le sera toujours. Mais pour utiliser l'IA, vous aurez besoin d'une clé API du propriétaire de l'IA, OpenAI.
Un client API GPT
Vous n'avez pas besoin d'un abonnement mensuel pour profiter de GPT 4 Turbo ou GPT 4 Vision : juste une clé API. Et la bonne nouvelle est que les clés API sont gratuites sur le site d'OpenAI. Voici comment commencer :
1. Créez votre clé API sur https://platform.openai.com/api-keys
2. Utilisez votre clé API dans TOM pour libérer THE BEAST
Si à tout moment vous devez mettre à jour ou modifier la clé API que vous utilisez, appuyez sur le bouton CLÉ.
Contrôles
Utilisez le sélecteur en haut pour basculer entre GPT-3.5 Turbo et GPT-4 Turbo afin de gérer vos coûts ou pour une réponse plus rapide. GPT-4 Vision est automatiquement sélectionné chaque fois que vous prenez une photo.
Appuyez sur la description de Tom pour définir votre propre invite système. Il guidera GPT sur la manière d'interagir avec vous.
Appuyez sur le bouton PARLER pour parler à GPT.
Appuyez sur le bouton APPAREIL PHOTO pour prendre une photo et poser des questions à ce sujet.
Vous pouvez continuer à discuter de cette photo en appuyant ensuite sur « PARLER ».
Cependant, votre CONTEXTE grandira.
Quel est le contexte ?
Le contexte inclut tout ce qui a été dit dans votre conversation en cours, y compris les photos prises. Il est envoyé à l'API à chaque fois, car c'est ainsi que GPT s'en souvient.
Il grandit à chaque nouvelle phrase et surtout à chaque nouvelle image. Plus le contexte envoyé à l'API est important, plus le temps de réponse est long. Et surtout, OpenAI facture en fonction de la taille de votre contexte.
Pour trouver le bon équilibre, TOM offre la possibilité d'effacer le contexte chaque fois qu'il devient particulièrement lourd, même si GPT oubliera alors toutes les interactions précédentes. Utilisez à cet effet le bouton BIN.
Tailles des images
TOM propose trois paramètres pour les images envoyées vers GPT : rapide, moyen et qualité.
"Rapide" est la valeur par défaut, fournissant des images plus petites pour une interaction plus rapide avec GPT. Cela fonctionne bien avec les textes et la plupart des types d’images.
« Moyen » offre plus de détails mais donne des images légèrement plus grandes.
Utilisez « qualité » pour une précision maximale. Ces images sont les plus lourdes et les plus coûteuses de l'API OpenAI.
Chuchotement et TTS
Whisper est un réseau neuronal OpenAI qui se rapproche de la robustesse et de la précision du niveau humain en matière de reconnaissance vocale. Si cette option est activée, vous bénéficierez d'une précision supplémentaire dans la reconnaissance vocale que TOM envoie à GPT, mais à un coût supplémentaire.
TTS (Text-to-Speech) est un système OpenAI qui transforme le texte en audio parlé réaliste. Cela entraîne également des frais supplémentaires.
Les deux options sont activées par défaut pour une meilleure expérience utilisateur. Mais les deux peuvent être désactivés pour obtenir des réponses plus rapides en cas de réseaux lents ou pour réduire vos coûts. Cependant, une fois les deux activés, l’expérience est vraiment géniale.Date de mise à jour
19 déc. 2023