更新时间:2026-03-09 22:48 来源:牛马见闻
Galaxy S26搭载谷歌Gemini AI亮相端侧AI的iPhone时刻不远GUI在理解用户意图
本文来源:时代周[报 作者):赵一川
两会期间,人工智能毫无疑问再次成为热议话题之一。从顶层设计到产业端再到应用落地,这一轮的科技浪潮日益升温。
今年政府工作报告指出,要推动重点行业领域人工智能商业化规模化应用,培育智能原生新业态新模式。这是“智能原生”首次进入两会视野,而打造智能经济新形态的提法,或意味着人工智能已升维到经济形态的新定位。
在此背景下,新一代智能终端和智能体的进展备受瞩目。工信部部长李乐成在“部长通道”采访中提及,将推进新一代人工智能产品的攻关和迭代更新,包括AI手机、AI电脑等智能终端。外界普遍认为,相关产业迎来重大利好。
去年12月,豆包手机助手面世在业界引发热议,成为端侧AI的标志性进展之一。通过获得操作系统层面的授权,借由GUI (图形界面识别)技术实现对手机APP的操作。这一创新性应用引发巨头跟进,今年2月份,三星 Galaxy S26搭载谷歌Gemini AI亮相,该手机具备跨应用操作能力。与豆包手机一样,也采用了GUI路线。
围绕智能体的技术路线,当前有所谓GUI和API之争,API由苹果等手机厂商所主导。处在智能体爆发前夜,路线与路线之间也正经历创造性颠覆、融合与共存。目标只有一个,那就是诞生更好的智能体产品,带给用户真正的AI时代福利。
而作为最高频使用的智能终端,AI手机很可能是最快触及的那个。
产业需要创新刺激
从近年情况看,不得不说,手机产业已很久没产生爆炸式的变革。一时间,整个行业似乎进入创新瓶颈。
中信证券研报称,单纯手机硬件参数的提升,对手机换机拉动力持续削弱。根据相关统计,2024年全球智能手机换机率跌至23.7%,此前高点则是30%-60%。与此同时,尽管AI手机助手、AI修图以及智能语音助手等功能出现,尚未带来消费体验的突破性改善。
这种局面下,搭载智能体的AI手机,成为整个业界期待的下一个重大变革。
所谓智能体,是能够感知环境、执行任务并根据用户反馈持续优化服务的人工智能系统。回顾过往,从PC互联网到移动互联网时代,本质上都是“注意力经济”。从产品设计思路到商业变现路径,基本也是围绕这一逻辑进行。但进入AI时代,事情正在发生变化。
从此前体验看,豆包手机助手可根据用户指令,在多款应用间自动跳转,帮助用户一站式完成多项任务。由于可以跨越不同手机应用执行任务,该产品一亮相便收获巨大关注。
对整个手机产业而言,这可能是里程碑的一刻。AI手机大大拓展了端侧应用的想象空间,以往圈地为战的流量池打法或迎来重塑。打法改变,整个生态边界也会跟着变。虽然仍处于很早期阶段,但考虑到全新的用户交互体验,这或将成为手机厂商迭代新机的主要发力点。
诚然,这个过程可能会伴随业界的各种讨论——尤其在早期阶段。硬件厂商与各应用,乃至与用户之间,围绕系统安全、信息隐私和生态主导权将展开磨合。但生态关系的重构,未必是一场零和博弈,所谓智能原生新业态,或许就是在类似的探索磨合中获得成长。
在中国政法大学知识产权创新与竞争法研究中心主任陶乾看来,智能体的相关行为系在用户知情同意的前提下,由用户主动发起并通过技术手段实现,这是用户意志的技术实现机制。
这一底层逻辑,有助于消解用户隐私安全带来的相关顾虑。在个人信息安全如此得以强调的当下,罔顾这一点对任何厂商而言都不明智。也正因如此,在合法合规的前提下进行突破性创新,对促进产业发展和提升用户体验便尤为重要。
其实不止是豆包手机助手和三星新机,目前全球范围内正掀起OpenClaw风暴,这款开源应用试图打破API依赖,让智能体助手跨平台、跨系统执行任务。它描绘了一个具象且诱人的技术前景,而ClawPhone的现身,也展示了AI手机现阶段能触及的智能化水准。
面对可能改变商业模式、价值链以及生态格局的变化,对巨头们而言,可能需要尽早躬身入局。
端侧AI的iPhone时刻不远?
按照顶层设定的发展路线图,到2027年,国内新一代智能终端、智能体等应用普及率超70%。到2030年,这个数字将是90%。
从今年政府工作报告看,鼓励开放式创新是显著的信号,报告提出支持人工智能开源社区建设,促进开源生态繁荣。分析认为这有助于降低技术门槛,进一步促进产业研究和商业应用提速。
AI手机赛道的竞合,可能将更加激烈。
从目前发展情况看,GUI与API并非相对立的技术选择,只是两条不同技术路径,面向不同场景的不同问题。
北京航空航天大学人工智能研究院教授沙磊认为,GUI在理解用户意图、解决海量长尾场景问题上具备显著的突破性,通过读取屏幕信息、借助智能体能力拆解用户需求,在用户明确授权下完成各类任务。
“整个过程会直观向用户展现智能体从意图理解、任务分解、执行校验到最终完成需求的全流程能力,让用户真正感受到AI带来的实际便利。”他如此表示。
相比之下,传统的API对接则需要应用方的接口开放权限。香港科技大学计算机科学及工程学系副教授王帅认为,大量中小应用、长尾服务缺乏标准化API,也没动力去做。GUI 路线对服务端的要求低很多,理论上只要有可交互的界面,就存在被感知和操作的可能,不用等生态里各方慢慢谈合作、定标准。这也有助于缓解“生态孤岛”问题。
在业内人士看来,GUI路线有助于绕开API对接的商业壁垒,尤其对中小开发者较为友好。某种程度上,这对重新构建AI时代的流量分配规则、鼓励开放式创新,以及形成智能原生生态均有裨益。
针对用户权利保障这一焦点,似不应与某一条技术路线所绑定,而应看机制本身是否足够有效。“智能体有能力构建充分的用户权利保障机制,事前明确告知权限和隐私政策;操作过程实时可见,碰到敏感节点将控制权主动交还给用户;事后完整的操作日志摆在那里,随时可查。”王帅认为,成熟的方案基本已跑通了这条链路。
因此,在用户授权下的前提下运行,严格保护用户数据,AI手机在加快技术普惠方面或将发挥重要作用。
从这一轮人工智能技术进化看,其迭代速度、与场景结合的程度均在显著加快。大模型之争,已从最开始训练需求下的参数堆砌和算力囤积,迅速转变为推理应用能力的角逐。而与此同时,智能体的技术和商业较量也正在拉开帷幕,玩家们纷纷抢占下一阶段的智能高地。潮流对旧有格局的冲击不可避免,但也正是开放式创新的魅力所在。
从这个意义上讲,端侧AI的iPhone时刻,也许不会太遥远。
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901