各家媒体都在预测Agent是下一个爆款级AI应用,各种Agent层出不穷,AI领域Agent这个词有点泛滥了。
在电商领域,AI Agent能够根据用户的购物历史、浏览行为和偏好提供个性化的产品推荐,这不仅能提高用户满意度,还能增加销售额和客户忠诚度。
在客服领域,AI Agent还可以作为智能客服,通过自然语言处理和机器学习技术自动回答用户咨询,处理订单问题和退货请求,从而提高客户服务效率。
在教育领域,AI Agent可以根据学生的学习进度、兴趣和能力提供个性化的学习资源和辅导。
金融领域,AI Agent可以帮助用户管理个人财务,甚至预测股票走势,提供投资建议。
在交通领域,AI Agent可以通过分析交通数据和实时路况提供最佳的路线规划和交通建议。
在医疗领域,AI Agent可以帮助医生进行疾病诊断和治疗方案的制定。
在社会交互方面,AI Agent的一个重要场景是虚拟陪伴,中国已经进入老龄化社会,面向老年人的AI Agent虚拟陪伴将具有较高的社会价值。
确实,很多AI公司不卷大模型,开始卷应用了,其中Agent就是主要方向,很多创业公司也在开发AI Agent,并能得到投资者的青睐。
微盟集团10月30日在上海举办首届“技术开放日暨AI产品发布会”,微盟将“All in AI”,希望未来微盟有上万个Agent数字员工提高整体的效率,同时积极探索AI Agent 在To B和To C两个维度的全新业务布局,并从“AI+SaaS(助力SaaS商家智慧经营)、AI+营销(AI驱动智慧营销降本增效)、To B(提供个性化AI定制解决方案)、To C(为小微企业和设计师提供AI电商设计工具)”四个方向,探索AI Agent全新布局。
根据科创板今日日报,专注银行领域的AI Agent平台Interface.ai宣布完成3000万美元首次融资,由Avataar Venture Partners领投。根据Interface.ai公布的数据,平均使用Sphere产品的金融机构每年可节省400-600万美元的运营成本;节省时间在4400小时左右;可自动化的业务数量在650个左右。
那么什么是Agent?为什么要引入Agent概念?它真的那么神秘吗****?它与大模型是什么关系?
要说Agent历史,可以追溯到很久远,暂且不论Agent,先说大模型。我们前面研究神经网络和大模型已经知道,大模型本身就是仿照人脑进行设计的,你可以把大模型当成一个会思考的大脑。但是你只有大脑肯定什么也干不了,“知行合一”,只“知”而不“行”是没有任何实际产出的。所以第一个轰动的ChatGPT其实就是一个Agent,它接受你的提问,大模型“思考”后给出回复,你好像在和一个人在说话,但它不是真人,而是一个Agent(所谓的代理人)。
所有的Agent,你就可以看成是一个“真人”在后面,但是真人不存在,是一个代理人,这个代理人和你聊天,给你提供学习建议,给你提供投资建议,给你提供诊断建议,甚至给你提供营销和管理建议等等。
或者你更简单一些,就把这些五花八门的Agent看成是“智能机器人”,只不过这些机器人可能是实体的,比如人形机器人,也可能是软件形式的,比如app或者网页等。
Agent和大模型的关系也很清晰,大模型是大脑,它的智力水平决定了Agent的智力水平,它的边界决定了Agent的边界。Agent是眼鼻耳口和手脚,接受信息并执行动作的。所以Agent是大模型的具体应用,想象空间是非常巨大的。
现在我们回过头来看看Agent的定义,市场上很多人给出了Agent定义。其中传统的定义是这样的:人工智能体(Agent)是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体。
相对于人类来说,个人认为Agent当前缺乏两个基本的东西,一个是情感能力,另一个是自主意识。
但是并不代表它不能进化,人类的情感能力也是通过环境进化过来的,比如“爱”的能力,脸红心跳都是可以设计出来的,照料和呵护的能力本身是基础的,而且可能比人都做得好,因为Agent不知疲倦,非常听话。Agent也能提供大量的情绪价值,比如聊天,幽默感,诗词歌赋等其实已经超越普通的人类水平了。但是你与Agent接吻、或者做爱能不能达到与真人的感觉,那可能见仁见智了,毕竟仿真学越来越发达。
相对于触发式行动,自主意识就很难了。比如监测到陪护的老人出现了口渴的生物征兆,触发机器人去端茶倒水;根据营销的目标,自主进行客群选择,主动发起各类渠道的营销,应该也不是难事。但是,树立一个目标,去攻克哥德巴赫猜想,然后一步一步去实现;牵头研发一款创新药;突然奇想,统治地球,消灭人类之间的战争,实现公平正义。这些应该还比较遥远,机器人有自我意识,能够自我觉醒,不知道21世纪能否实现。
有点扯远了,还是回到当前的Agent,我们再细致的分析分析。我下面引用中科院物理所的一篇科普文章,说说Agent的结构和一个智能家居的具体案例。
AI Agent的架构是其智能行为的基础,它通常包括感知、规划、记忆、工具使用和行动等关键组件,这些组件协同工作以实现高效的智能行为。
假设我们有一个名为“小兴”的智能家居管理AI Agent,它通过以下方式协同工作。
个人认为,目前Agent的发展水平相当于人类的原始社会,原始人的大脑和工具,但是AI的发展不会像人类发展那么缓慢,速度会非常快,从石器时代、青铜器时代、蒸汽机时代迅速到互联网时代,可能只要100年。那时候就不是“安能辨我是雌雄”,而是安能辨我是真假,真人、数字装备的真人、纯智能机器人已经没有区别了。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
保证100%免费
】