不久前,字節(jié)跳動豆包團(tuán)隊發(fā)布豆包手機(jī)助手技術(shù)預(yù)覽版,引發(fā)廣泛關(guān)注。這款與中興通訊合作、搭載于努比亞M153工程樣機(jī)的AI助手,能夠跨應(yīng)用完成訂票、購物比價、批量投遞簡歷等復(fù)雜任務(wù),試圖將手機(jī)助手從“輔助工具"升級為"智能管家"。它到底如何“接管”手機(jī),每一個環(huán)節(jié)是如何操作,用戶與AI的分工和邊界在哪里?
實測:AI操作需指令并彈窗授權(quán)
測試結(jié)果顯示,豆包手機(jī)助手的操作能力已超過傳統(tǒng)語音助手,在用戶明確指令下,AI可完成大部分操作。在實測中,首先嘗試了基礎(chǔ)的手機(jī)操作指令。當(dāng)說出“在B站搜索并播放‘影視颶風(fēng)’的最新視頻”的語音指令后,手機(jī)屏幕上方的靈動島位即顯示B站圖標(biāo),提示正在執(zhí)行操作,全程用戶可觀看。系統(tǒng)成功搜索到"影視颶風(fēng)"頻道并自動播放其最新視頻,整個過程無需手動操作。
測試者用更近一步的復(fù)雜的場景,再次測試助手的協(xié)同能力。當(dāng)發(fā)出"下周三上午從成都前往杭州,在某旅行App查找四川航空最便宜的機(jī)票"的指令時,豆包手機(jī)助手在要求下打開該旅行App,填入出發(fā)地“成都”、目的地“杭州”,將日期選擇為“下周三”,并篩選出四川航空的航班列表,最終將最便宜的航班結(jié)果彈出展示給用戶。

涉及到支付等信息,在用戶確認(rèn)后,系統(tǒng)可協(xié)助完成預(yù)訂流程。這種從“信息檢索”到“事務(wù)處理”的能力,實現(xiàn)了“指令助手”的定位。
不過實測也存在部分局限性。在嘗試讓助手在某主流購物 App 上完成商品比價下單時,操作在登錄環(huán)節(jié)受阻,后續(xù)的搜索、比價流程無法繼續(xù)。
獨(dú)立開關(guān)及三重機(jī)制明確用戶授權(quán)
據(jù)介紹,針對AI操作手機(jī)可能引發(fā)的授權(quán)和安全擔(dān)憂,豆包手機(jī)助手建立了"事前-事中-事后"三層授權(quán)體系。
事前授權(quán)階段,用戶首次打開應(yīng)用時將彈窗提示操作及權(quán)限使用場景。每次執(zhí)行具體功能前,系統(tǒng)會在對話框詢問用戶,并提供"單次允許""始終允許""拒絕"三種選項。鎖屏狀態(tài)下喚醒助手則需通過人臉、聲紋或密碼鑒權(quán),防止未經(jīng)授權(quán)的訪問。此外各個App均有單獨(dú)開關(guān),可獨(dú)立控制是否使用AI操作手機(jī)。

事中的管理機(jī)制更為細(xì)致。AI執(zhí)行任務(wù)時,狀態(tài)欄會通過"靈動島"圖標(biāo)實時展示操作進(jìn)度,用戶單擊即可進(jìn)入虛擬屏查看具體操作步驟。系統(tǒng)支持三種干預(yù)方式:雙擊虛擬屏手動接管、點擊"停止"按鈕終止任務(wù)、通過"補(bǔ)充"按鈕修改需求。特別是在識別到涉及支付密碼、隱私信息修改等高風(fēng)險操作時,系統(tǒng)會主動提示用戶接管,必須經(jīng)用戶確認(rèn)才能繼續(xù)執(zhí)行。
事后管理環(huán)節(jié),任務(wù)完成后系統(tǒng)會主動呈現(xiàn)操作結(jié)果,用戶可隨時撤回操作權(quán)限、調(diào)整可操作應(yīng)用范圍或清除聊天數(shù)據(jù)。
同時,豆包手機(jī)助手官網(wǎng)通過發(fā)布隱私與數(shù)據(jù)使用白皮書,對數(shù)據(jù)使用授權(quán)流程及隱私保護(hù)相關(guān)細(xì)節(jié)進(jìn)行了清晰、完整的說明,保障用戶充分知情。
用戶始終擁有操作最終決策權(quán)
實測表明,豆包手機(jī)助手的技術(shù)預(yù)覽版在語音交互上十分創(chuàng)新。它一定程度上節(jié)省了用戶在應(yīng)用間反復(fù)切換、填寫信息的繁瑣操作。其分級授權(quán)與實時控制機(jī)制,也為AI深度融入系統(tǒng)級操作提供了基礎(chǔ)保障,這也為AI手機(jī)的創(chuàng)新發(fā)展提供了基礎(chǔ)。
當(dāng)然,AI助手幫助用戶在各類App間跳轉(zhuǎn)操作,意味著傳統(tǒng)的行業(yè)邏輯可能會發(fā)生調(diào)整和適配。部分平臺對AI助手登錄的限制,正是這種生態(tài)博弈的早期信號。但長期來看,這是一條必經(jīng)之路。手機(jī)AI助手領(lǐng)域"手機(jī)廠商+大模型廠商"的深度合作已成趨勢。谷歌Gemini與三星的跨界協(xié)同已為行業(yè)提供參考樣本,豆包也明確表示無自研手機(jī)計劃,將通過"生態(tài)合作"形式與多家手機(jī)廠商和第三方App洽談合作方案。
此前,北京大學(xué)武漢人工智能研究院副院長呂鵬在接受采訪時表示,技術(shù)發(fā)展需堅守“人的主體性”,確保用戶始終擁有操作的最終決策權(quán)。在發(fā)展AI手機(jī)助手的過程中,需要監(jiān)管方、生產(chǎn)商、App技術(shù)方協(xié)同構(gòu)建通用智能體的交互協(xié)議,實現(xiàn)跨App的安全聯(lián)動。
豆包手機(jī)助手在發(fā)布時也曾表示,將嚴(yán)格保護(hù)用戶隱私,產(chǎn)品仍將持續(xù)迭代優(yōu)化。正如測試中所見,AI手機(jī)助手的"壓力測試"才剛剛開始,技術(shù)成熟度、安全邊界、生態(tài)協(xié)同等問題仍需時間解答。