Third Eye は、Gemini AI のパワーを活用して視覚障害者を支援するように設計された革新的な Android アプリケーションです。このアプリは、ユーザーが音声コマンドと視覚入力を通じて対話できるようにすることでアクセシビリティと独立性を強化し、自信を持って簡単に日常業務を実行できるようにします。
質問する場合も、目の前にあるものを理解する場合も、画像からテキストを抽出する場合も、周囲の状況を説明する場合も、Third Eye は旅の知的な相棒です。すべての機能は、シンプルさ、明瞭さ、リアルタイムの応答性を考慮して最適化されています。
🔍 主な機能:
🧠 1. カスタムプロンプト
音声またはテキストを使用して質問したり、Gemini AI に指示を与えたりできます。
リクエストをアプリに直接話すか入力します。
お客様のニーズに合わせたインテリジェントで役立つ応答を受け取ります。
一般的な支援、情報、サポートに最適です。
🖼️ 2. 画像付きのカスタムプロンプト
視覚的な入力とカスタム クエリを組み合わせて、より正確でコンテキストを認識した応答を実現します。
画像をアップロードまたはキャプチャします。
質問するか、画像のコンテキストを説明してください。
Gemini AI に両方の入力を分析させ、それに応じて応答させます。
👁️ 3. 画像の説明
画像の内容を明確かつ簡潔に説明します。
アプリのカメラ機能を使用して写真を撮影またはアップロードします。
アプリはAIを用いて画像の内容を記述します。
周囲の状況や視覚的な文書を理解するのに最適です。
📝 4. 画像からテキストへ (OCR)
リアルタイム処理を使用して画像からテキストを抽出します。
印刷または手書きのテキストを含む写真をアップロードまたは撮影します。
即座に読みやすいテキストに変換します。
標識、ラベル、印刷物の読み取りに便利です。