今週、iOS 18.2 の導入により、Apple インテリジェンスが完全に私たちの目の前に現れ、大きな飛躍を遂げています。 iPhone の世界全体 (少なくとも Apple の人工知能ブランドをサポートできるもの) では、何百万もの人が iPhone を漫画のようなキャラクターに変身させたり、Image Playground を通じて素晴らしいマッシュアップや奇妙なシナリオを作成したりする機能を体験しています。
私もこの魅力に無縁ではありません。私は Image Playground を使用して、私を魔法使いに変身させました。妻は「私の人生にはこれは必要ない」と言いましたが、妻は感銘を受けませんでした。その後、メッセージ絵文字として使用できる小さなウィザード Genmoji Lance を作成しました。おそらく彼女はその方が気に入るでしょう。
Apple インテリジェンスへの取り組みに対する Apple の取り組みは、ほとんど暫定的であるように見えることがあります。たとえば、Genmoji ベータ版を見つけます。このアイコンは、メッセージ内の最初の絵文字の下に隠されており、次にそのアイコンのさらに小さいバージョンで、[絵文字の説明]フィールドの横に小さな「+」が表示されます。これは楽しいツールです。なぜその光をブッシェルの下に隠すのでしょうか?
Image Playground や Genmoijis で多くの時間を過ごした後、私は Siri に注意を向けましたが、何も感動しませんでした。
Apple の Generative AI 分野への参入が遅れたことは、Apple がこの分野に本当に役立つものを持ち込むというプレッシャーがさらに高まっていることを意味しており、正直に言うと、Genmoji と Image Playground はそうではありません。それらは楽しいものですが、Apple が WWDC 2024 で初めて Apple Intelligence を導入したときに私が最も興奮したのは、iPhone (および Mac や iPad) がどのように自己認識を高めるかということでした。
Apple Intelligence に関するリリースの中で、Apple は Siri が「Apple およびサードパーティのアプリ内およびそのアプリ間で何百もの新しいアクションを実行できる」と約束しました。 Apple は、私が Siri に「土曜日のバーベキューの写真をマリアに送ってください」と依頼できると主張しました。そうすれば、Siri が処理してくれるでしょう。
公平を期すために言うと、Apple は、Apple Intelligence が 2024 年末から 2025 年にかけて展開される予定であると述べています。競合他社や OpenAI のようなパートナーがほぼ毎日大規模なアップデートをリリースしている分野では、これは信じられないほど遅いスケジュールです (OpenAI の 12 日間を参照)。
その一方で、現在のバージョンの Siri で何が有効になっているのかが明確でないのはイライラさせられます。現在の Siri は見た目がまったく違っていて素敵ですが、基本的な骨の構造は基本的に同じで、ほとんどがフェイスリフトに相当します。
Siri は依然として会話を続けるのに苦労しており、私が写真リクエストを再現して、最近のホリデー パーティーの写真を妻に送ってほしいと頼もうとしたところ、Siri は単に「ここからはスクリーンショットしか送信できない」と言いました。これは、システムを認識して真に役立つものになるには程遠いです。少なくとも、Siri なら私が最近どの写真について話しているのかを推測してくれると期待しています。
写真では、再設計された写真でそのアルバムを見つけるのに苦労しているため、Siri に「スクリーンショットを開いて」と依頼すると、Siri はページのスクリーンショットを撮りました。 Siri、別のスクリーンショットをありがとう、後で見つけるのに苦労するよ。
Siri がこのシステムでできることはたくさんあります。 Siriに頼むだけでダークモードに切り替えることができます。デジタル アシスタントのほうが、私のつぶやきをうまくナビゲートできます。 Siri を通じてホームを開くことはできますが、Siri はホーム ネットワークを調べてホーム システムに含まれていない他のスマート デバイスがあるかどうかを確認するなど、ホームの問題を解決するのには役立ちません。
Siriは相変わらず賢いですね。今日は何をしているのかと尋ねると、「永遠のことを考えている、永遠に時間がかかる」と言いました。しかし、それが何を意味するのか尋ねると、Siri は何も答えませんでした。会話は依然として Siri の得意分野ではありません。
同様に、サードパーティ アプリの統合や画面上のアクションの認識もまだ現実のものではありません。たとえば、Siri はスレッドを開くことができますが、新しい投稿を作成するように指示すると、Siri は「誰に?」という質問に行き詰まってしまいました。ループ。 Threads は公開ソーシャル メディア プラットフォームなので、答えは「全員に」ということになりますが、このリクエストでは何も得られませんでした。
Apple の最も強力な AI トリックの一部は、Apple 独自のものではありません。 iOS 18.2 では、カメラ コントロール (iPhone の側面にある新しい「ボタン」) に Visual Intelligence アップデートが導入されました。カメラ コントロールを強く押すと、特別な画像キャプチャ ウィンドウが起動します。シャッターボタンを押すと、「質問」または「検索」の 2 つのオプションが表示されます。
「Ask」を選択すると、クエリは OpenAI の ChatGPT に送信され、「Search」を選択すると、はい、Google に送信されます。どちらもうまく機能しますが、この図のどこに Apple Intelligence があるのでしょうか?シリはどこですか? Apple は、他人の AI 作品を自社のものとして主張することはできませんよね?
Apple Intelligence が開発中であることは理解していますが、生成 AI プラットフォームにとって最も輝くオブジェクトは依然としてチャットボットです。 Gemini や ChatGPT などのプラットフォームの音声アシスタントは、長時間の会話を続け、見ているものを確認し、コンテキストを理解し、アクションを実行できます。
iOS 18.2 アップデート後でも、Siri はそこから遠く離れています。 Apple がこれらのことにどれほど慎重であるかはわかりますが、アクセルを踏み込む前にエンジンのチェックを続ければ、残りの AI レースカーは大きく遅れをとってしまうでしょう。レースが終わって勝ったときは勝つことはできません。