**私は現在開発者として働いていません。ただし、このアプリはAIを活用してさらに開発を進めることができます。詳細はこちらをご覧ください: https://github.com/Android-PowerUser/ScreenOperator **
このアプリは現在、Android 15以降でのみ動作します。
Screen Operatorにタスクを記述すると、画面をタップしてタスクを完了する動作をシミュレートします。それに応じて、ビジョン言語モデルが画面とスマートフォンを操作するためのコマンドを含むシステムメッセージを受信します。Screen Operatorはスクリーンショットを作成し、Geminiに送信します。Geminiはコマンドを返信し、Screen Operatorはアクセシビリティサービスの権限を使用してこれらのコマンドを実行します。
利用可能なモデルは、
Gemini 2.0 Flash Lite、
Gemini 2.0 Flash、
Gemini 2.5 Flash Lite、
Gemini 2.5 Flash、
Gemini 2.5 Flash Live(Google が API を変更したため、動作しなくなりました)、
Gemini 2.5 Pro(Google が無料 API の使用を変更したため、動作しなくなりました)、
Gemma 3n E4B it(クラウド)、
Gemma 3 27B it です。
Google アカウントで 18 歳未満と確認された場合、Google が(不当に)API キーの発行を拒否しているため、大人用アカウントが必要です。
https://github.com/Android-PowerUser/ScreenOperator