iPhoneでAIエージェントを一足先に味わえる「PhoneAgent」って?

ライフハッカー[日本版]6/16(月)20:47

iPhoneでAIエージェントを一足先に味わえる「PhoneAgent」って?

ライフハッカー[日本版]

エージェント型AI(またはエージェンティックAI)は、AIにとって次の大きな一歩と見られています。

これが実現すれば、不正確なことも多いガイダンスや説明を返してくるだけでなく、人間に代わってボットに実際の行動を担ってもらうことが可能になるのです。

イメージしてみてください。

ChatGPTが、ホテルの宿泊料金を調べて休暇旅行の予約をとってくれたり、ユーザーが必要としている食料品をGeminiがウェブ上で注文したりする未来を。

いつ実現するの?

このテクノロジーは、今はまだごく初期の段階ですが、最近のAIツールの進歩はかなり目覚ましいものがあります。

たとえば、すでにプレビュー版が登場しているように、ユーザーの代わりにウェブを閲覧してくれるブラウザや、新しいアパートの部屋やルームメイトを探してくれるボットの構想も明らかになっています。

こうしたエージェントは、もう間もなく利用できるようになるでしょう。

一方で、これだけの技術の進歩を受け、いくつかの重要な疑問が湧いてきます。たとえば、以下のような疑問です。

  • AIに自分のスケジュールやクレジットカード情報へのアクセス権を与えたいと思いますか?
  • 街で一番のレストランを選ぶときに、お気に入りのボットを信頼して選択を任せられますか?

AIに任せれば、こうしたタスクにかかる時間を節約できると謳われていますが、実際には、AIはミスをするものですし、今のところは、どんなことであれ大事な用事を頼めるほど信頼できるとは言えません

そんな中、iPhone向けのAIエージェントのプロトタイプが公開されました。

プログラマーのRounak Jain氏が開発したものです(この情報は9to5Googleで報じられました)。アプリとしてまだ提供されていませんが、多少の設定作業とOpenAIクレジットへの追加出費をいとわないのであれば、今すぐ試すことができます。

「スマホがエージェントになる」未来を見せるPhoneAgent

「PhoneAgent」」というこのアシスタントは当初、OpenAIが主催したハッカソンの中で作成されました。

まだ改善の余地を多く残しており、作成したJain氏自身も「これは実験的なソフトウェアであり、間違えることもある」と述べています。

それでも、AppleやGoogle、OpenAIなどの企業がまもなく実現する未来を一足先に見せてくれることは間違いありません。

このツールは、OpenAIのモデルに接続するので、ChatGPTを使って得られるのと同種のリソースを活用しつつ、iPhoneでタスクの実行が可能になります。

手短かなプロンプトでテキストを生成してくれるので、メールやメッセージ、ドキュメントの文面を作成する際にはとりわけ便利です。

Jain氏が自身のデモンストレーションでPhoneAgentに実行させたのは、写真を撮って、それを友人のRonとシェアし、写真を送るときのメッセージに俳句風の文章を添えるという一連のタスクです。

別のデモでは、PhoneAgentがフライトの詳細情報をRon(ここでも出てきた!)にメッセージで送り、さらに飛行機の便名をもとに、デルタ航空ターミナルからの交通手段が必要と判断し、出発先の空港ターミナルまでのUberを予約しました。

PhoneAgentでは、システムレベルの操作も可能で、iPhoneのコントロールセンターを開いてフラッシュライトをオンにすることもできます。

コマンドは、音声あるいは文字入力で作成可能です。

それぞれのタスクが完了すると、通知が表示されます。さらに、この通知に対するリプライの形で、追加のコマンドを入力することもできます。

筆者が実際に試してみた

私が試した限りでは、PhoneAgentは時々うまく動作しないことがあり、動作は常にかなりもっさりしていた印象です。ただし、こうした初期段階のソフトウェアを試す場合には、今回のような使用感も想定範囲内でしょう。

全体的に見ると、PhoneAgentは私のコマンドをこちらの意図通りに実行してくれました

たとえば、友人のBethに「会えるのを楽しみにしている」というメッセージを送れましたし、1つのコマンドによって、カメラアプリで写真を撮り、それを写真アプリの編集インターフェースで開く、という一連の操作をこなせました。

PhoneAgentの画面
AIに頼んで、友人のBethに、会えるのを楽しみにしていると伝えてもらった時の画面です。
Image: Lifehacker

無理もない話ですが、このソフトのサポートは手厚いとは言えません。

また、たとえば「SpotifyでSelf Esteem(イギリスのインディ系アーティスト)の最新アルバムを再生させる「写真を撮って自動でメモに添付する」といったタスクについては、このエージェントではうまく実行できませんでした。

楽しみではあるが……

AIデバイスの「rabbit r1」などが示したように、サードパーティーの参加が成否を分ける要素となるでしょう。とはいえ、アプリの開発者がAIボットにどこまでデータへのアクセス権を与えるかは、予断を許しません。

一方で、今回のような出来事が今後のSiriやGeminiの進化で見せられる姿だとすると、かなりの差別化要因になるだろうというのはわかります。

コマンド1つで、次のミーティングの場所を確認して、そこまでの道案内をしてくれるとか、何か別の用事で忙しいときに、AIに配車サービスの予約をまかせられるといった状況をイメージしてみてください。

ただし、克服すべきハードルは、まだかなりたくさんあります。

この点については、ジョナサン・アイブとサム・アルトマンの両氏にも、ぜひ留意しておいてもらいたいところです(彼らは先日、新しいAIデバイス開発に向けてパートナーシップを強化しました)。

PhoneAgentの設定方法

PhoneAgentを使うために設定する手順は、それほど難しいわけではありません(多少込み入ってはいますが)。

しかも、OpenAIのモデルにアクセスするためのクレジットにかかる費用を抜かせば、無料で使えます。私は数十件のコマンドをこのソフト経由で実行しましたが、そのために使ったクレジットの利用料は1ドルほど(約140円)で済みました。

まず、「Xcode」(リンクでは、macOSのApp Storeが開きます)と「GitHub Desktop」を、Macにインストールする必要があります。さらに、まだ作成していない場合は、GitHubの無料アカウントをつくりましょう。

次に、GitHub Desktopから、PhoneAgentのリポジトリのクローンを作成します。

アプリを立ち上げると表示される画面から、「Clone a Repository from the Internet(インターネットからリポジトリのクローンを作成する)」を選ぶか、「File」メニューを開いて、「Clone Repository」を選びましょう。

ここまで済んだら、URLタブに切り替えて、URLフィールドに「https://github.com/rounak/PhoneAgent.git」と入力し、Mac上の保存先のフォルダを選んで、「Clone」をクリックします。

PhoneAgentのインストール
PhoneAgentを使うには、まずはMacのXcode内でインストールする必要があります。
Image: Lifehacker

これで、お使いのMac上にPhoneAgentのコードが保存されました。

Finder上でコードを保存したフォルダを表示し、「PhoneAgent.xcodeproj」というファイルをダブルクリックします。すると、Xcodeで開かれるはずです。

ここまで準備が済めば、このコードをiPhoneに転送して試すことができます。

ケーブルを使って、お使いのiPhoneをMacにつなぎ、iPhoneのロックを解除し、「このコンピュータを信頼しますか?」という警告が表示された場合は「信頼」をタップします。

次に、iOSの「設定」アプリから、「プライバシーとセキュリティ」メニューを選び、「デベロッパモード」を有効にしましょう。

iPhoneを再起動したのち、macOS上のXcode画面の上部にあるドロップダウンメニュー(「PhoneAgent」の右側に表示)をクリックして、表示されるリストから自分のiPhoneを選びます。

今度は、左側にあるナビゲーションウィンドウの上部にある「PhoneAgent」を選び、「Signing & Capabilities(署名と機能)」タブに切り替えて「Add Account(アカウント追加)」を使い、自分のApple認証情報を入力しましょう。

この作業が終わったら、「Signing & Capabilities」タブの下にある「Team」というドロップダウンリストから自分の名前を選びます。加えて、固有の「Bundle identifier」(バンドルID)への変更が必要です。

続いて、左側のウィンドウから「PhoneAgentUITests.swift」を選び、PhoneAgentのコードから「func testLoop」というエントリーを検索してください(画面を少し下にスクロールした先にあるはず)。

そのすぐ左にあるコードの行のラベルにマウスポインタを載せると、再生ボタンに変わります。これをクリックすると、接続しているiPhone上で、PhoneAgentが実行されるはずです。

PhoneAgentの実行先としてiPhoneを選択
PhoneAgentの実行先としてiPhoneを選びます。
Image: Lifehacker

最初に表示される画面では、OpenAIのAPIキーを入力するよう促されるでしょう。

まずは、ウェブブラウザからOpenAIアカウントにサインアップして、こちらのページに向かってください。決済情報の詳細を追加して、OpenAIサービスを使うのに必要なクレジットを購入します。最低購入額は5ドル(約722円)です。

購入手続きが済んだら、「API keys」ページに移動し、「Create new secret key」をクリックして、PhoneAgentに入力するキーを手に入れます(それと同時に、このキーのコピーをどこか安全な場所に保存するのも忘れないようにしましょう)。

これで準備は完了です。

あとは、マイクボタンをタップするか、画面の下にある入力欄にテキストをタイプして、PhoneAgentにやってもらいたいことを伝えましょう。

【WWDC 2025速報】誰も語らなかったiOS 26の「隠れ機能」36選。本当にすごいのはこっちかも? | ライフハッカー・ジャパン https://www.lifehacker.jp/article/2506_all-the-ios-26-features-apple-barely-mentioned-at-wwdc-2025/

【徹底比較】Google AIモード vs ChatGPT、結局「何に向いている」のか調べてみた | ライフハッカー・ジャパン https://www.lifehacker.jp/article/2506-google-ai-mode-vs-chatgpt-web-search/

【WWDC 2025まとめ】Apple速報!iPhone、iPad、Macの体験はこう変わる #WWDC2025 | ライフハッカー・ジャパン https://www.lifehacker.jp/article/2505apple-wwdc-2025-live-blog/

Source: GitHub(1, 2), 9to5Mac, OpenAI, Mac App Store

関連記事

おすすめ情報

ライフハッカー[日本版]の他の記事も見る

主要なニュース

6/23(月) 7:58更新

トレンドの主要なニュースをもっと見る