面白いことに、同社が開始したほぼすべてのサードパーティ統合 (DoorDash、Uber、Midjourney など) は廃止されつつあるため、これらの機能はまったく機能しません。 (以前は実際に動作していたわけではありません。) スクロール ホイールの動作が不安定になり、インターフェイスの改善は歓迎されています。たとえば、プッシュ トゥ トーク ボタンを押したまま、上下にスクロールして音量を変更できるようになりました。
この 1 年間、R1 には数多くのアップデートが行われてきましたが、特に目立っているのは Beta Rabbit、LAM Playground、Teach Mode の 3 つです。
Beta Rabbit は、R1 に何か質問するときに、より会話的なエクスペリエンスを実現するために、強化された大規模言語モデルを使用します。 GPT-4o や Gemini Live のような会話的な内容とは思えませんでした。私はそれに、宇宙の初期についてどのようにして何かを知っているのかと尋ねると、それは抜粋を読み始めました。ある時点で「宇宙マイクロ波背景放射」について言及していたので、私はそれを中断し、それがどのように検出されるのか尋ねました。その後、R1 は「宇宙マイクロ波背景放射を探します」「これを探します」「あれを探します」という攻撃を開始しました。これらが 5 つ続いた後、ついに CMB に関する答えを読み上げ始めました。
LAM Playground は、Rabbit の Web ポータルからアクセスできる興味深い機能です。これらの「大規模なアクション モデル」は、対話可能な仮想ブラウザ上で実行され、主に、Rabbit がユーザーに代わってタスクをどのように実行できるかを示すことを目的としています。 (ご存知のように、起動時にはそれができませんでした!) プロンプトを入力すると、Rabbit のボットがそれを実行します。たとえば、商品を検索して Amazon のカートに追加するように依頼できますが、この仮想ブラウザ経由で Amazon にログインする必要があり、プライバシー リスクが大きくなるように思えます。
Google で「最高のオフィスチェア」を検索して、その小売店の Web ページに移動するように依頼しました。これを行うのに時間がかかりすぎて、「2023 年のベストオフィスチェアレビュー」と入力されました。 (R1 は別のタイムラインにあるのでしょうか?) しかし、それでも最初の結果 (これは私自身のオフィスチェアのガイドです。ありがとうございます) に進み、次の製品ページに移動しました。 ブランチのエルゴノミクスチェア プロ、私の一番のおすすめです。
LAM プレイグラウンドではこれらすべてがどのように機能するかを確認できますが、ティーチ モードではそれを実際に実行できます。まだベータ版です (R1 もまだベータ版だと思います)。何度か試した後も、エラーが発生し続けて機能が使用できなくなりました。結局、別の日に動作しました。レッスンを作成し、仮想ブラウザ内でステップを実行しました。R1 はクリックごとにログを記録します。次に、R1 デバイスにアクションを実行するように指示すると、R1 デバイスは私のアクションを模倣しました。