最主流的 AI 应用智能体将爆发
作者/ IT 时报记者 孙妍
编辑/ 孙妍
今年年初,Open AI 文生视频大模型 Sora 横空出世,这一 " 王炸 " 点燃了整个人工智能界,一些大模型企业趁热打铁,一些则捶胸顿足,但是百度却没有跟进。
这一年,百度到底在布局什么方向?李彦宏在百度世界 2024 大会上透露了百度大模型过去一年的重点是解决图像生成幻觉问题,而确定的方向是智能体和产业应用," 智能体是 AI 应用的最主流形态,即将迎来爆发点。"
李彦宏认为百度要做的是搭建一个平台,让每一个想法都能迅速、低成本地变为现实能力,也就是让每个看不懂代码的人变成 " 程序员 ",迎来一个只靠想法就能赚钱的时代。
大模型的爆发点在哪?
最主流的智能体将爆发
"智能体是 AI 应用的最主流形态,将迎来它的引爆点。" 从李彦宏的定调来看,百度已将智能体作为最重要的战略方向。
智能体的门槛已经降低到人人都能上手的程度,在文心智能体平台上,甚至有 11 岁的小学生在创造智能体。同时,智能体是一个天花板很高的方向,可以解决复杂问题,目前文心智能体平台已经吸引 15 万家企业和 80 万名开发者参与。在百度展示的 TOP100 智能体中,既有农民院士智能体等角色类,还有工具、行业、职场、情感、娱乐等多种类型。
那么,智能体主流应用会是什么场景?"公司官方智能体很可能替代官网,成为最直接面向消费者的界面。" 李彦宏认为。
传统的 PC 官网只能静态展示公司介绍、产品参数,客服人员也没办法针对个性化问题及时给出满意回答,只能记录后电话回访,而智能体却能代替客服在一秒钟内给出答案。李彦宏展示了比亚迪官方智能体,它可以根据顾客需求推荐车型,也可以预约试驾等。比亚迪官方智能体上线后,销售转化率提升 119%,联想 AI PC 智能体的 9 月互动率提升 89%。
百度不止想用智能体革了官网的命,还想创造更多 AI 分析师、AI 律师来解决实际问题。百度文库和百度网盘联合打造了工具类智能体 " 自由画布 ",这是一块由大模型加持的万能白板。
以前的研报只停留在图文、图表阶段,但在 " 自由画布 " 上,新型研报可以加入发布会视频、电话会录音等富媒体内容。有了自由画板,每个孩子都能成为故事主角,和孙悟空一起游览花果山,生成自己的话本;有了自由画板,每个人都能成为漫画家、短视频导演。
此外,法律智能体 " 法行宝 ",已回答用户 1660 万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。
"就像 PC 时代的网站,移动时代的自媒体账号,智能体将是 AI 时代的内容、服务和信息的新载体。" 在李彦宏看来,不同的是,智能体更像人,更像销售、客服、助理。
普通人的机会在哪?
迎来一个只靠想法就能赚钱的时代
既然智能体已经打开大门欢迎普通人,那么普通人如何才能抓住大模型的机会?
当天,李彦宏带来了 One More Thing ——无代码工具 " 秒哒 ",一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它能帮助更多普通人、企业打造出应用。
演讲现场,李彦宏以开一场萝卜快跑的技术发布会为例,展示了如何用 " 秒哒 " 完成活动报名系统的搭建。只要在 " 秒哒 " 上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥小组长、策划、小编、程序员和质检员五个智能体协作,协同完成策划、内容和开发等各种工作,还能自动识别 bug、调用各种工具,完成报名系统的开发。
当然," 秒哒 " 还能完成更为复杂的任务,可以为企业省去项目经理、设计人员、开发人员、测试人员,也让一行代码都看不懂的普通人具备程序员能力,会说话、有想法就能做出应用来。
李彦宏透露," 秒哒 " 将在明年**季度正式发布。目前,秒哒已正式开启企业测试申请,发布后不到一天时间,已有 300 余家企业申请秒哒测试。
"这是迄今为止人类历史上最复杂的多智能体协作工具。只要你有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。" 李彦宏强调。
过去 24 个月 AI 最大变化是什么?
大模型基本消除幻觉
"过去 24 个月,AI 行业的最大变化是大模型基本消除了幻觉,不再一本正经地胡说八道。" 李彦宏认为,让大模型这一概率模型变得可用、可被信赖的技术,就是 RAG(Retrieval-augmented Generation),即检索增强技术。
百度做搜索起家,自然要选择检索增强这条路,但是事实上,检索增强不是百度特色,而已成为行业共识。目前,在文生文层面,RAG 已能很好地消除幻觉,但与多模态内容的结合还不够,绝大多数大模型生成的图片常常 " 一眼假 "" 机器味儿 ",比如开源模型生成的北京天坛图片是四层,实际上只有三层。
在百度世界 2024 大会上,百度发布了一大突破——检索增强的文生图技术 iRAG(image based RAG),将百度搜索亿级图片资源与文心基础大模型相结合,可以生成超真实的图片。
文心大模型生成的大众揽巡汽车飞跃长城的图片,从车型车标到长城,均未出现错误或变形的幻觉问题。另一组 " 爱因斯坦环游世界 " 的演示图片中,爱因斯坦与每个背景的结合,与真实世界高度相似,质感接近照片。
幻觉问题正是大模型广泛应用的最大 " 绊脚石 ",iRAG 极大提高了 AI 生成图片的可用性。以前拍一组品牌宣传海报动辄花费几十万,但现在的创作成本接近于 0。目前,iRAG 已经不是一个 " 期货 " 产品,最大的优势是没成本、立等可取、无幻觉、超真实,可以大幅降低影视作品、漫画作品、连续画本、海报制作等应用场景。
大模型是技术革命还是泡沫?
不做一个超级应用
要做数百万 " 超级有用 "
过去 24 个月,全球性的大模型狂热,让行业不禁思考:这究竟是一场新的技术革命,还是新一轮泡沫?
今年 5 月,李彦宏与百度高管讨论大模型的未来:" 怎么才算做成了?" 彼时,李彦宏认为,一年内涨 10 倍,日均调用量从 2 亿涨到 20 亿,才证明这个大模型是大家真正需要的。
截至 2024 年 11 月初,百度文心大模型的日均调用量已经超过 15 亿,相较一年前首次披露的 5000 万次,增长约 30 倍。离那次高管对话半年之后,文心大模型的成绩单已经接近于李彦宏制定的目标。这条陡峭增长的曲线,一定程度上代表着过去两年中国大模型应用的爆发。
然而,仍有人质疑:到目前为止,大模型还是没有产生一个杀手级应用。
李彦宏的回答一直没变,"不要等待一个超级应用,而是要打造数百万个‘超级有用’的应用。"
在百度世界 2024 大会上,百度秀了一把肌肉,亮出了大模型 100 大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。
在人类信息技术变革的不同历史时期,应用出现的样貌也不一样:在 PC 时期,它是一个个的软件和网站;在移动时期,它是一个个的 APP 和可被关注的账号;在 AI 时代,应用主要的形态就是智能体。随着大模型技术和能力的指数级跃迁,自然语言成为了这个时代最重要的编程语言。我们每一个人都能动手创造一个属于自己、也属于他人的 AI 应用,或者智能体。AI 之所以能成为产业革命级的机会,就是因为它给社会经济带来了生产力的无限扩张。
" 我是软件工程师出身,国外有一种说法叫‘软件吞噬世界’。但我认为,这个世界不应该被吞噬,而应该被创造。AI 时代,应用创造世界。基础模型能力就绪,我们即将迎来 AI 应用的群星闪耀时刻。" 李彦宏振奋人心地说道。
排版/ 季嘉颖
图片/ 百度
来源/《IT 时报》公众号 vittimes
E N D
在北京的 IT 时报好友们看过来 ~
领取方法:
点击下方 " 我要购票 "
点击右上角 " 兑换码 "
输入 "IT 时报 " 即可领取