當(dāng)AI手機“自作主張”,帶來驚喜還是驚嚇?

2025-01-21 05:00:00 21世紀(jì)經(jīng)濟報道 王俊,實習(xí)生崔嘉豪

一天清晨,你臨出門時突然收到銀行短信:“您的賬戶已成功支付1999元。”一頭霧水的你打開手機發(fā)現(xiàn),AI手機助手幫你購買了一款你已經(jīng)在購物平臺瀏覽過多次的智能音箱,它提示“根據(jù)您的消費記錄與偏好,已為您搶購商品,確保最佳購物體驗”。

在另一個頭昏腦脹的下午,開車回家時你突然想起沒有提交工作總結(jié),于是你喊了聲AI手機助手,讓TA幫忙寫一份總結(jié)并發(fā)給老板。等到家后才發(fā)現(xiàn),對你過于了解的AI助手,把吐槽也裝進了總結(jié),并一鍵發(fā)到了工作群。

……

上述看似無厘頭的場景,可能會逐漸變成現(xiàn)實。

從2024年開始,手機廠商最賣力吆喝的噱頭就是:只要你輕輕一句話,不用動一根手指,手機便能根據(jù)你的習(xí)慣和喜好幫你點咖啡、訂餐廳。

“一句話”便能響應(yīng)用戶訴求的背后,是內(nèi)化在手機中的AI智能體,TA是升級版、更絲滑的siri,掌握你的喜好、行為,并幫你作判斷、決策。

“像人一樣操作”是否可靠?1月20日起,全國各地陸續(xù)實施手機等數(shù)碼產(chǎn)品購新補貼,手機每件最高補500元,AI手機是否值得入手?

近日,21世紀(jì)經(jīng)濟報道記者實測了OPPO Find X8、vivo X200、榮耀Magic7、小米14等多款A(yù)I手機,發(fā)現(xiàn)為了更懂你,Ta們會收集包括位置、用戶習(xí)慣、健康情況等大量個人信息,在一些功能中可以自動獲取家庭和公司位置等信息;并且在執(zhí)行操作時可繞過第三方App授權(quán),直接操作App內(nèi)部功能。

這些是否可控?

手機廠商的大賣點 是否可靠?

這兩年間,最熱鬧的人工智能大模型從虛無縹緲的概念變成了觸手可及的應(yīng)用,尤其是AI手機,成為廠商刺激消費的抓手。研究機構(gòu)Techinsights數(shù)據(jù)顯示,2023年中國消費者換機周期已超過40個月,全球更長達51個月。

AI手機都有哪些功能?實測多款A(yù)I手機后發(fā)現(xiàn),TA們最基礎(chǔ)的AI功能包括AI修圖,拍照更方便,一鍵便能AI去反光、去路人——比如長按OPPO手機底部進行一鍵識屏,AI就能快速修圖手指劃圈的區(qū)域;實時的會議紀(jì)要、同傳翻譯也是較為基礎(chǔ)的AI功能——比如vivo可以邊通話邊做紀(jì)要,多人之間的對話也可以總結(jié)摘要,并識別出不同角色。

手機廠商最賣力宣傳的賣點,還是“一句話點外賣”“一句話訂餐廳”。在榮耀的發(fā)布會上,原CEO趙明用榮耀Magic7演示點咖啡,趙明對著榮耀Magic7說了一句“我有些困了,幫我點杯喝的”,收到這個指令后,YOYO智能體便根據(jù)以往記錄判斷趙明喜歡喝什么,自動打開外賣軟件或小程序下單。

上述多數(shù)功能的實現(xiàn)是基于AI智能體,比如YOYO、小布、藍心小v,是藏在手機里沒有肉身的管家。

智能體完成任務(wù)的核心思路是“讓AI像人類一樣”,理解指令的語義,“理解”屏幕,“點擊”或“調(diào)用”各種應(yīng)用功能,從而完成復(fù)雜任務(wù)。

但是如何確保模擬人的操作是用戶真正想要的,而不是TA的自作主張?以及用戶真的明白,智能體是如何運作的嗎?

我的數(shù)據(jù)被用在哪兒?

在測試了多款A(yù)I手機后,最直觀的感受就是,必須吃下大量的“個人數(shù)據(jù)”,智能體才能理解用戶,精準(zhǔn)執(zhí)行任務(wù)。

從基本的功能來看,智能體首先需要理解人類的意圖,不管是語音命令還是文字命令,必須“聽得懂”,精準(zhǔn)明白用戶訴求,這一點就立基于數(shù)據(jù)之上。

比如vivo的語義理解是與百度合作,會收集“該產(chǎn)品所產(chǎn)生的指令、會話等信息、當(dāng)前地理位置、獲知當(dāng)前前臺應(yīng)用以及運行狀態(tài)等信息(例如前臺是音樂應(yīng)用,以及音樂的播放狀態(tài)”)。

在理解用戶指令后,如何執(zhí)行任務(wù)?目前行業(yè)中有兩大主流方案:(一)屏幕識別+模擬點擊;(二)屏幕識別+意圖框架執(zhí)行官方接口(或類API)調(diào)用。

其中,“屏幕識別+模擬點擊”是更為通用的方案。簡而言之就是時刻讀取顯示在屏幕上的一切信息,并且模擬人的手指操作。

以榮耀magic7測評中所展示的點咖啡為例,全程無需自己動手,AI智能體YOYO會根據(jù)你的語音、識別當(dāng)前屏幕信息,模擬人手打開美團進行點單,并根據(jù)手機時間、定位等信息填充配送地址。

要完成上述操作,伴隨大量的數(shù)據(jù)搜集行為。小v助手的隱私政策中提及,模擬點擊需要收集:“界面控件、文本,圖像的位置、媒體影音數(shù)據(jù)、聯(lián)系人信息(包含姓名、電話等)”。

吞下這些數(shù)據(jù)后,智能體或許只能稱得上合格滿足基本要求,而智能體理想的形態(tài)如同《鋼鐵俠》中的賈維斯,聰明俏皮,清楚主人最合身的尺寸,了解他的風(fēng)格秉性,能給出判斷、執(zhí)行任務(wù)。

更進一步了解用戶、深探用戶心智,才是智能體的野心,也是手機廠商想要俘獲用戶的抓手。在此輪手機廠商的大戰(zhàn)中,趙明認(rèn)為YOYO優(yōu)于其他手機智能體的原因便是,其能對用戶意圖進行分析理解。比如說自己困了,YOYO能理解你意圖背后的這些信息和邏輯,并且知道這種情況下,你的習(xí)慣是喝咖啡,再來進行操作?!斑@個短時間內(nèi)還沒人能追上榮耀?!壁w明稱。

其實除了榮耀,所有廠商都在做這件事。眼花繚亂的意圖感知、智能增強、識屏改善、個人記憶……這些功能的目標(biāo)無一例外:洞察用戶行為和偏好,打造反應(yīng)更快、更懂你的智能體。

OPPO小布的意圖感知服務(wù),會收集設(shè)備信息、WiFi、藍牙、位置信息、開關(guān)機信息、運動健康信息(步數(shù)、睡眠)、應(yīng)用名稱等,并基于自身的算法自動學(xué)習(xí)。

YOYO助理也會基于與用戶對話中獲取到的卡證信息、日程信息、交易信息、重要人物/地點、紀(jì)念日信息提供個人記憶相關(guān)的對話和服務(wù),這些信息可能還會被用于云端模型推理。

但是,作為手機主人的用戶,是否真的了解這些帶有強烈個人色彩的數(shù)據(jù)會被作何用途?用戶授權(quán)的到底指向哪個功能?這些功能是否會在未來某一天的操作中,繞過用戶的個體意志?

針對意圖感知服務(wù),OPPO回應(yīng)21世紀(jì)經(jīng)濟報道稱,“我們致力于在隱私合規(guī)的前提下為用戶提供個性化的服務(wù);所有的用戶授權(quán)信息只會用于設(shè)備端側(cè)范圍內(nèi),用戶首次使用前會有完整的隱私授權(quán)協(xié)議,明確告知用戶會讀取哪些信息?!?/p>

此外,在整個實測過程中,21世紀(jì)經(jīng)濟報道記者發(fā)現(xiàn)幾個問題,包括:

一、隱私政策過多。對于個人信息的搜集以及各項功能,散見于不同的隱私政策,每個AI手機的隱私政策保底5個起步。這與其豐富的AI功能有關(guān),每個AI功能基本都有對應(yīng)的隱私政策。

二、手機廠商并未清晰說明數(shù)據(jù)用于何處。用戶授權(quán)是廠商收集個人信息的合法性基礎(chǔ),但并非是手機廠商逃避責(zé)任的理由。大量的隱私政策以及復(fù)雜的授權(quán)機制,并不能讓用戶了解自己的信息到底用于支持何種功能。

比如,vivo的語音識別服務(wù),會收集通訊錄中的聯(lián)系人姓名、本地已安裝的應(yīng)用名稱、地理信息;場景識別服務(wù)則會自動獲取用戶的家庭和公司位置信息,根據(jù)通勤信息生成通勤卡片……這些是否會明示告知用戶?有授權(quán)的情況下,是否充分告知授權(quán)的用途?據(jù)此,21世紀(jì)經(jīng)濟報道記者詢問了vivo,未獲回應(yīng)。

三、用戶隱私及行為習(xí)慣等數(shù)據(jù)分散,比如YOYO的個人記憶功能,提及用戶個人信息可能會被用于云端模型推理;還有的會提到優(yōu)先在端側(cè)處理您的位置信息,但是有些內(nèi)容結(jié)果的返回,可能涉及第三方服務(wù)商。

AI手機仿佛又創(chuàng)建了一個黑箱,數(shù)據(jù)的鏈路、流動路徑模糊不清。

更多的未知數(shù)

手機智能體與第三方App之間也存在一片未知領(lǐng)域。

正如上述提及,在AI手機的“讀屏+模擬點擊”模式中,智能體可繞過第三方App授權(quán),直接操作App內(nèi)部功能。趙明在接受采訪時明確表示,榮耀智能體可以實現(xiàn)跨第三方應(yīng)用的AI智能體操作,實現(xiàn)In App的操作。

絲滑的點咖啡,模擬人來使用外賣平臺點外賣,也意味著調(diào)用App的權(quán)限握在了智能體手中。Ta幫我們提供“最佳選擇”,但這個最佳選擇會是用戶所想嗎?

在實測中,記者向OPPO的小布、vivo的藍心小v要求點一杯咖啡,由于手機尚未安裝App,OPPO會跳轉(zhuǎn)到美團的下載界面,vivo則提示需要下載美團或大眾點評。這對于餓了么用戶是不是損傷呢?

對此,記者詢問了OPPO、vivo,vivo并未給出回應(yīng),OPPO回應(yīng)表示,目前智能體對后端內(nèi)容和服務(wù)的調(diào)用還處在相對初級的發(fā)展階段,APP開放的接口和能力并不多,我們會基于對后端模型的效果評測以及用戶的使用反饋來調(diào)整服務(wù)的調(diào)用,致力于為用戶提供最好的體驗。

在AI手機光明的未來中,AI智能體會成為用戶與手機新的交互口,這有望為手機廠商帶來新的商機。智研咨詢指出,端側(cè)AI將帶來新的盈利模式,手機、PC等終端廠商及其應(yīng)用生態(tài)合作伙伴有望通過提供除硬件之外的AI服務(wù)和解決方案獲得更多價值增量。

但是,掌握流量分配大權(quán)的AI智能體,是否真的能實現(xiàn)以用戶需求為導(dǎo)向?是否會在無形中強化對用戶行為的控制,甚至引發(fā)新的隱私和公平競爭問題?

21財經(jīng)客戶端下載