NEWS 每日早報

Aside AI Browser 發布:主打 SOTA Browser Agent 與本地工作流

Aside 是一款剛發布的 AI browser,官方主打 browser agent 能力,並宣稱在 Online-Mind2Web、BU-Bench-V1、Odysseys 三個 benchmark 排名第一。我實際試用後,最直接的感受是 UI 精緻,登入 ChatGPT 後使用似乎是吃 Codex 額度,而不是一般 ChatGPT 對話額度。

前言

今天看到一個剛發布的新 AI browser:Aside

它不是單純把聊天框塞進瀏覽器側邊欄,而是直接把 browser agent 當成核心賣點。官方頁面給的定位很明確:Aside 是「The SOTA browser agent」,可以在已登入的網站、分頁、訊息、文件和本機檔案之間工作。

我自己初步用下來,第一個感受是 UI 做得很精緻。它不是那種工程 demo 感很重的 agent browser,整體更像是已經準備拿來日常使用的瀏覽器產品。另外一點比較特別:我這邊登入 ChatGPT 後,使用起來的體感是走 Codex 額度,不是一般 ChatGPT 對話那邊的額度。這點後續還需要觀察,但如果它真的把 browser agent 跟 Codex 額度綁得比較深,定位會跟一般 AI browser 很不一樣。


官方主打:SOTA Browser Agent

Aside 官方最醒目的宣稱是 browser agent benchmark。

官方頁面寫到,Aside 在三個 browser agent benchmark 上排名第一:

  • Online-Mind2Web
  • BU-Bench-V1
  • Odysseys

官方也直接把比較對象列出來,包含 OpenAI、Anthropic、Browser Use。以 Online-Mind2Web 來看,Aside 頁面顯示的結果是:

Agent / ModelOnline-Mind2Web
Aside99.0%
Browser Use97.7%
GPT-5.492.8%
Claude Opus 4.884.0%
ChatGPT Atlas70.0%

公開的 benchmark repo 裡,也可以看到 Aside 在 Online-Mind2Web 的紀錄:300 個任務中通過 297 個,官方計算 pass rate 是 99.0%。其中 1 個任務被標為 impossible,排除 impossible 後是 297/299,也就是 99.3%。

這裡我會先把它視為「Aside 官方與公開 repo 的 benchmark 結果」,而不是完全等同於日常使用一定碾壓所有 browser agent。Browser agent benchmark 很吃網站當下狀態、登入流程、反 bot 機制、任務是否仍然可完成,這些都會影響結果。不過 99.0% 這個數字確實很有衝擊力。


它和一般 AI Browser 差在哪

現在 AI browser 已經不少,問題通常不是「能不能問問題」,而是「能不能真的把事情做完」。

Aside 的方向比較接近把瀏覽器重做成 agent 的工作台。官方說它可以處理:

  • 已登入網站
  • email、dashboard、內部工具
  • comments、replies、follow-ups
  • docs、spreadsheets
  • 本機檔案

這些剛好都是 browser agent 最容易卡住的地方。很多 agent demo 看起來很強,但一遇到登入、切分頁、表單、檔案、付款、發訊息,就會停下來要求使用者接手。Aside 的賣點就是想把這些真實工作流納進來。

官方也提到 sensitive actions 會等待使用者確認,例如付款、發文、發訊息。這點很重要,因為 browser agent 一旦能操作已登入網站,權限就比一般聊天機器人大很多。如果沒有明確確認機制,風險會很高。


UI 體感:完成度比預期高

我自己最有感的是 UI。

Aside 的介面不是很粗糙的自動化工具,而是有認真把瀏覽器、agent task、context 和操作流程整合在一起。整體視覺非常精美,狀態呈現也比較像一個完整產品,而不是臨時包一層殼。

這對 AI browser 很重要。因為 browser agent 的核心不是只跑一次 benchmark,而是你願不願意把它留在日常工作裡。UI 如果卡、亂、難理解,使用者很快就會回到 Chrome 或 Arc。Aside 至少在第一印象上,比很多 agent browser 更像能長期使用的產品。


ChatGPT 登入與 Codex 額度體感

我這邊測的另一個重點是登入 ChatGPT 後的使用感。

Aside 官方頁面有提到可以 bring your own subscription,使用 ChatGPT、Claude 訂閱或自己的 API key。我的體感是,登入 ChatGPT 後它比較像使用 Codex 額度,不是一般 ChatGPT 聊天額度。

這點我先保守寫成「我目前測到的體感」,因為額度計算最後仍要看官方帳戶頁與後續使用紀錄。但如果這個方向成立,Aside 的定位會更偏向 agent 工作工具,而不是聊天瀏覽器。

換句話說,它比較像是把 Codex / browser-use / AI browser 這幾條線拉在一起:不是叫 AI 回答你網頁內容,而是讓 AI 直接操作瀏覽器完成任務。


我目前的判斷

Aside 值得關注,但我會分兩層看。

第一層是產品體驗。UI 很漂亮,agent 介面完成度高,官方也明確把登入網站、本機檔案、敏感操作確認這些真實問題放進設計裡。這比只做一個 sidebar chatbot 更實際。

第二層是 benchmark 宣稱。Aside 在官方頁和公開 repo 上給出很強的 browser agent 成績,尤其 Online-Mind2Web 99.0% 很亮眼。但 browser agent benchmark 本來就會受到網站狀態和評測設定影響,所以我會把它當成強訊號,不會直接當成所有日常任務都能穩定完成的保證。

我接下來比較想測的是幾種實際工作:

  • 幫我在已登入網站裡整理資料
  • 跨多個分頁做 research
  • 讀本機檔案後去網頁操作
  • 處理表單與 follow-up
  • 遇到敏感操作時是否真的會停下來確認

如果這些都能穩,Aside 就不只是好看的 AI browser,而是真的可能成為 browser agent 這條線的新標竿。

資訊來源