定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638
《2024智能体(AI Agent)应用场景、未来展望及潜在标的分析报告(31页).pdf》由会员分享,可在线阅读,更多相关《2024智能体(AI Agent)应用场景、未来展望及潜在标的分析报告(31页).pdf(31页珍藏版)》请在薪酬报告网上搜索。
1、 2024 年深度行业分析研究报告目目录录1.原理解析:思维链铸就智能体,多体交互拓展应用.61.1Agent 模式架构解析.61.2单智能体 vs 多智能体.71.3 Prompt 提示词的艺术.82.应用场景:赋能两类实体领域,成本与效益的博弈.82.1自动化类:微软智能体 AutoGen.92.2 情感需求类:陪伴型智能体.112.3 效能讨论:成本与价值间的博弈.123.未来展望:人工智能发展迅猛,智能体商业化落地.133.1 海内外政策推动人工智能发展加速.133.2 算力规模高增,企业对 AIGC 的投入意愿强.153.3 多模态智能体有望实现大规模商业化.173.4 全球智能体市
2、场增速加快.184.潜在标的:Agent 企业千帆竞发,垂类应用引人期待.194.1 LeewayHertz:提供多领域解决方案.194.2 Markovate:提供多模态智能体解决方案.214.3 Replika:情感类智能体热度不减.24.4 CharacterAl:自研大模型,打造智能体社区.234.5 星火智能体:布局智能体平台,发布垂类智能体.244.6 SkyAgents:自研模型降低成本自研模型降低成本.254.7 商汤:联合清华、上海人工智能实验室打造GITM.264.8 字节跳动:豆包聊天助手.274.9 腾腾 讯讯:AppAgent.285.投资建议.316.风险提示.32
3、图目录图目录图1人类与 AI 的交互模式.6图2AI Agent 智能体工作原理.7图3单智能体强化学习原理图.7图4多智能体强化学习原理图.7图5CrewAI 整体框架.8图6AutoGen 运作模式图解.9图7Agent 交流模式展示.10图8AutoGen 实验数据对比.11图9林间聊愈室产品介绍.12图 10OpenAI 不同模型 tokens 消耗价目表.12图 1 1单次运行 Agent 对 Tokens 的消耗.13图 1 2单次运行 Agent的实际成本.13图1 3 中国人工智能市场规模预测.14图1 4全球人工智能市场规模预测.14图1 5美国增强型人工智能研发投资2015
4、-2030.15图1 6 美国及其 AI盟 友.15图1 7中国智能算力规模及预测.16图 1 8企业 AIAgent 使用情况.16图1 9专注于横向应用的 AI 代理初创企业率先获得融资.17图2 0 多模态大模型发展.18图 2 1全球自主人工智能和智能体市场规模.18图2 2中国前五大人工智能市场应用.19图 2 3LeewayHertz 公司发展历程与合作公司.19图 2 4LeewayHertz 的智能体产品架构.20图 2 5LeewayHertz 为私募股权提供的 AI Agent解决方案.20图 2 6Character.ai 智能体架构.21图 2 7ShopSpot 用户
5、界面展示.21图 2 8ShopSpot 库存管理系统.21图 2 9ShopSpot 多模态智能体图片识别功能展示.22图 3 0Replika 付费模式.22图 3 1截止2024年8月Replika 各年龄段用户占比.23图 3 2截止2024年8月Replika 用户全球分布.23图 3 3Character.AI 用户界面.23图 3 4Character.ai 2024年7月每日访问量.24图 3 5Character.AI 各年龄段用户占比.24图 3 6Character.AI用户全球分布.24图 3 7科大讯飞星火智能体介绍.25图 3 8部分星火AI 智能体展示.25图 3
6、 9天工大模型能力展示.26图 4 0天工Agent计费模式.26图 4 1RL架构对比GITM 创新架构.27图 4 2解锁科技树的成功率(蓝色是GITM).27图 4 3各模型完成任务成功率对比.27图 4 4豆包智能体的对话界面.28图 4 5腾 讯AppAgent展示软件操作.29图 4 6AppAgent 的 App 探索学习阶段.30图 4 7AppAgent 的实际部署阶段.31表目录表目录表1AI Agent 类型盘点以及具体应用.9表2国内政策推动人工智能发展.13表3海外政策推动人工智能发展.151.1.原理解析:思维链铸就智能体,多体交互拓展应用原理解析:思维链铸就智能体
7、,多体交互拓展应用早在上世纪50年代,阿兰图灵把“高度智能有机体”扩展到了人工智能。如今随着大模型的快速发展,这个概念又被重新拾起。大模型成为了智能体目前最完美的载体,有望完成从概念到实际应用的蜕变。用户在Agent(智能体)模式中给Al 设置目标和身份,并提供 Prompt(提示词)。AI自主拆分任务、使用工具、完成工作,用户仅负责设立目标、提供工具资源和监督结果。OpenAI 定义的智能体具有长期和短期记忆、自主规划、工具使用和自动执行任务的能力,能提高工作效率和用户体验。另外,智能体也分为单智能体和多智能体。单智能体通过试错学习在单一环境中行动,追求最大奖励,多用于简易任务。多智能体在博
8、弈环境中行动,追求长期累积奖励,多用于复杂测试。1.1Agent1.1Agent模式架构解析模式架构解析Agent有效减少人类工作总量,人与AI协作才是最终形态。人类与AI交互可大致分为三种模式。Embedding模式中大模型可以填补一些信息缺失,完成少量子任务,例如总结信息等等。用户最终会整合挑选AI提供的信息,并自主完成任务。Copilot 模式则更加智能化,Al 可根据用户设定的流程去执行任务。例如让AI根据写一段稿件或者根据需求编程,但其对Prompt 的要求也更高。在AI完成流程后,用户需要对内容结果进行调整并自主结束工作。Agent 智能体模式的AI参与度更高,但也不是完全由AI代
9、理。用户需要给AI设计一个目标和身份,以及需要使用的工具。配上更为复杂的Prompt,AI能自主进行任务拆分,使用工具并结束任务。用户只负责设立目标、提供资源、监督结果。图图1 1 人类与人类与AIAI的交互模式的交互模式Agents模式AI人类完成绝大部分工作人类设立任务目标其中某(几)个流程Al完成初稿其中某(几)个任务AI提供信息或建议人类修改调整确认人类自主结束工作资料来源:腾讯研究院,海通证券研究所任务拆分工具选择进度控制A自主结束工Embedding模式人类自主结束工作Copilot模式设立目标提供资源监督结果AI完成绝大部分工作人类设立任务目标入类和AI协作工作Al全权代理人类人
10、类AIAI以 LLMLLM 为核心,四模块铸造AI Agent。从 OpenAl 的定义来看,智能体以大语言模型为核心,其拥有长期和短期记忆、自主规划能力、能自动化执行复杂任务、能够使用工具等四个特点。1)记忆模块:智能体像人类一样,能留存学到的知识以及交互习惯等,这样的机制能让智能体在处理重复工作时调用以前的经验,从而避免用户进行大量重复交互。短期记忆适用于所有上下文的学习,类似平常我们与ChatGPT沟通的模式;长期记忆则保留知识和交互回忆,例如智能体在特定行业积累的大量数据和经验,则能提供更专业、更具深度和个性化的回答,提升用户体验。2)规划模块:将复杂任务分解成子目标并逐一解决,完成任
11、务后进行反思总结。例如反思自己大量输出重复内容或在单一子目标耗时过长等问题,将经验存入长期记忆以规避类似错误。3)工具模块:智能体可利用工具来弥补自身短板,通过调用外部API来实现功能拓展。例如调用连接互联网的API去搜索实时信息。4)行动模块:智能体会形成完整的计划流程。例如先读取以前工作的经验和记忆,之后规划子目标并使用相应工具去处理问题,最后输出给用户并完成反思。图图2 2 AIAI AgentAgent智能体工作原理智能体工作原理日 历()计算器()代码解释器()搜 索()更 多.短期记忆工具智能体长期记忆记忆智能体规划行动交互协作智能体反射自我反思思维链子目标拆解资料来源:腾讯研究院
12、,海通证券研究所1 1.2 2单智能体单智能体 vsvs多多 智智 能能 体体单智能体与多智能体各具优势,适配于不同垂直领域。单智能体的强化学习原理是基于马尔可夫决策来完成的,简单来说可以分为状态集S、行动集A、奖 励R,下一 时刻的状态和奖励只与上一时刻的行动有关,与更早之前的状态无关。其模型原理就是让智能体用试错的方式来学习,若某个策略能得到奖赏,则智能体产生该行为的策略就会加强。其目的就是在单一环境中行动,尽可能得到最大的奖励。应用领域目前也较为广泛,例如赛车游戏中连续动作的训练:控制方向盘、油门、刹车等动作,可由DDPG、A3C、PPO 算法来决策。一些离散动作的训练例如围棋智能体 A
13、lphaGo,可通过Q-Learning 等算法决策。多智能体的决策不仅与自身行动相关,还与系统内其他智能体的行动所关联。一个多智能体系统中会有两个以上的智能体,他们一般存在着合作或竞争关系。这样模型称为马尔科夫博弈,其状态转换符合马尔可夫决策,关系符合博弈。在多智能体模型中每个智能体的目标是找到最优策略来使它在任意状态下获得最大的长期累积奖励。由于其模型更为复杂,干扰因素较多等原因,目前多智能体模型商业化产品较少。图图 3 3 单单 智智 能能 体体 强强 化化 学学 习习 原原 理理 图图Agent智能体行动A环境状态s奖励R资料来源:CSDN,海通证券研究所图图 4 4 多多 智智 能能
14、 体体 强强 化化 学学 习习 原原 理理 图图环境状态8料劝Agent 1状态 s奖励 R2状态s奖励RAgent2Agent n奖励 R1行动An资料来源:CSDN,海通证券研究所CrewAI 是世界领先的多智能体框架之一,在多智能体领域用于协调角色扮演型自主AI智能体。通过促进协作智能,CrewAI使智能体能够无缝协作并处理复杂任务。在编写程序时,用户需要赋予每一位 Agent 角色、任务、以及背景故事。图图5 5 CrewAI整体框架整体框架CrewProcesses definehow-How tasks will be assigned to Agents.How agents i
15、nteract with each other.-Howagentsperformtheirtasks.ProcessTasks can override agentthat should be used an资料来源:CrewAI,CSDN,海通证券研究所Agents have the inertabitityof reachout toanothertodelegateaskguestns.alsothaeasepc0ificagents will work together:AgentAgentAgentTaskTask1.3Prompt提示词的艺术提示词的艺术Prompt 是一种基于自
16、然语言处理的交互方式,它通过机器对自然语言的解析,实现用户与机器之间的沟通。可以理解为是一段给定的文本或语句,用于启动和引导机器学习模型生成类型、主题或格式的输出。在自然语言处理领域中,Prompt 通常由一个问题或任务描述组成,例如“帮我写一篇有关人工智能的文章”,“帮我编写一段可以整理数据的程序”等等。一个优秀的 Prompt 应该包含1)明确目标:能够定义任务,以及想要达到的效果;2)具体指导:给予模型明确的指导和约束,举一些例子或明确回复边界;3)简洁明了:使用简练、清晰的语言表达Prompt;4)迭代优化:一次 Prompt 输出可能达不到想要的结果,用户需要根据智能体的回答来改变提
17、示词,持续调整优化。2.2.应用场景:赋能两类实体领域,成本与效益的博弈应用场景:赋能两类实体领域,成本与效益的博弈AI Agent目前的应用大多都在概念层面,但随着大模型竞争加快、政策鼓励研发投入、更多企业参与AI研究等因素,应用层面的AI Agent推进速度加快。智能体大致可以分为六类,根据他们被设计出的特点,可以作用在不同的应用领域上。不同类别的智能体给予应用层面上更多研发方向,像目前关注度较高的自动驾驶技术、智能电网控制、能源管理等都能被垂类智能体覆盖。结合多模态大模型,自动化和情感需求类智能体已落地。但商业化智能体仍需考虑成本问题,由于智能体之间的交互过程可能出现错误循环且输出结果不
18、一定符合需求,tokens 成本远高于普通LLMs。表表1 1 AIAI AgentAgent类型盘点以及具体应用类型盘点以及具体应用AlAl AgentAgent类型类型具体描述具体描述应用领域应用领域基于效能的Agent基于目标的Agent基于模型的Agent分层Agent机器人Agent多Agent系统基于效用的Agent在具有多种潜在结果的复杂决策环境中表现出色-比如平衡不同风险以做出投资决策,或者 金融交易、价格追踪系统、智权衡价格与成本。基于目标的Agent会评估和规划行动,以实现它们的目标。与其他类型的智能Agent不同的是,它们能够将前瞻性和战略规划结合起来,朝着特定的结果前进
19、。能电网控制扫地机器人、项目管理软件、电子游戏适用于并非总是可见或可预测的信息时。这个模型会根据环境中传入的数据不断更新,因此人工智能Agent可以对环境中未见的部分进行推断,并预测未来的状况。自动驾驶技术、自动灌溉、智能家居分层Agent类似于复杂的组织结构,具有不同的决策层次。系统中的不同Agent拥有不同的专业领域,这使它们在处理复杂的多步骤任务时更加高效。空中交通管制系统、自主仓储机器人增加了性能元素,这些人工智能Agent的实体通常配备有摄像头或触摸传感器等传感器。这种Agent在危险或重复性很高的任务中尤其有用-让人工智能Agent来完成这些任务可能更有效率,也更符合成本效益。生产
20、线机器人、手术机器人、农业机器人、服务机器人每个Agent都是半自主运行的,但其设计目的是与其他Agent互动,形成一个动态的生态系统,从个体行为中产交通管理系统、用于能源管理生集体行为。对于这种Agent程序来说,协作是关键。的智能电网、供应链与物流2.12.1自动化类:微软智能体自动化类:微软智能体 AutoGenAutoGen微软研发的AutoGen是一种多智能体沟通的模型,这些智能体通过对话完成任务。实验发现这种多智能体沟通模式可以有效提高AI 解决问题的准确性以及成果的完整性。使用AutoGen,开发者可以灵活定义智能体交互行为。微软的研究证明了该框架在包括解决数学、编码、问题解答、
21、运筹学、在线决策、娱乐等问题上的有效性。AutoGen需要两个以上的智能体形成交流模式,其中智能体可以由大语言模型LLMs、人类、工具来扮演。当一个需求被提出,智能体会开始灵活交流,他可以是多个智能体向需求人汇报的模式(HierarchicalChat)或者是像研讨会一样随意讨论(JointChat)。在官方给出的示例中,智能体之间的沟通确实减少了人工交互,其有能力自己修复出现的问题并给出满意的答案。图图6A u t o G e n运运 作作 模模 式式 图图 解解ConversableagentsMonthMulti-AgentConversationsGot it!Here is theO
22、utput:%JointchatHierarchicalchatSorry!Pleasefirstpip install yfinanceand then executethe codeError packageyfinanceishotinstalledPlotachartofMETAandTESLAstock price changeYTD.Execute thefollowing code.No,please plot%revised code.Installingchange!Output:MonthAgentCustomizationFlexible Conversation Pat
23、ternsExampleAgent Chat资料来源:Enabling Next-GenLLMApplicationsvia Multi-AgentConversation,CSDN,海通证券研究所资料来源:botpress,海通证券研究所在AutoGen智能体程序中,人类充当需求发起者,智能体通过不断使用工具并在相互交流中解决陆续出现的问题从而得到最终答案。在智能体交流过程中,人类可随时介入其中,若用户对最终结果不满意,可以重新提出需求,智能体就会继续优化答案。图图 7 7A A g g e e n n t t 交交 流流 模模 式式 展展 示示TheResulting Automated
24、Agent Chat:Conversation-DrlvenPlot a chart of META andTESLA stock price change YTD.receivegenerate_replygenerate_replyBthon工 具sendConversation-CentricComputationError:package yfinance is notinstalledAoent自己解决问题,0人工介入Sorry!PleasefirstpipinstallyfinanceandthenexecuteExecutethefollowingcode.generate_re
25、plyreceive人县供需Control Flowend资料来源:Enabling Next-GenLLM Applications via Multi-Agent Conversation,CSDN,海通证券研究所AutoGen在四项实战应用的表现测试中均胜过单一大语言模型,实验发现智能体能增加AI完成任务的成功率以及模型的稳定性。1)数学计算:分别测试了AI在完成整个数学题库和随机120 道题目的表现,AutoGen 的成功率远超各类语言模型。2)数据库检索问答:先建立一个RAG数据库,然后对智能体进行问答测试,看其能否追踪到正确的答案。其F1-scoreF1-score越高,说明模型更
26、稳定;RecallRecall体现了分类模型对样本的识别能 力。Recall越高,说明模型对样本的识别能力越强。从数据看出纯 AutoGen 模型的表现略高于其他组合。3)ALFWorld(AdaptiveLearningFrameworkWorld)研究:ALFWorld是专门用于研究和开发智能体的仿真环境,在其虚拟世界中,包含了各种场景、任务和智能体需要完成的挑战。ALFWorldALFWorld 实验发现3个智能体的成功率高于2个智能体,说明随着交互的智能体变多,智能体间互相纠错的能力有所提升。但对于AutoGen 的实验也提到多智能体可能会导致错误循环(智能体之间反馈错误但一直无法解决
27、),这也是降低成功率的因素之一。一。4)4)OptiGuide:是专门设计来通过自然语言处理,解读和指导复杂供应链优化决策。在用不同语言模型运行OptiGuide的时,发现多智能体协作模式的成绩显著高于单智能体。其中多GPTGPT4 4智能体协作运行 OptiGuide时,F1-score 和 Recall 分别能达到96%96%和 9 8%。ProgramExecutionuserid:93117,docid:175129,date:2024-09-20,1图图8A u t o G e n实实 验验 数数 据据 对对 比比MethodsMetrics(b)A2:Q&Atasks(w/GPT-
28、3.5).Metrics(c)A3:Performance on ALFWorld.(d)A4:Performance on OptiGuide.资料来源:Enabling Next-Gen LLM Applications via Multi-Agent Conversation,海通证券研究所2.22.2情感需求类:陪伴型智能体情感需求类:陪伴型智能体智能体另一大应用领域就是提供拟人情感陪伴类服务。陪伴类的智能体拥有长期记忆,让用户与其聊天中产生熟悉且亲切的感觉。随着大模型不断迭代,陪伴类智能体更加立体,能提供更高的情绪价值。目前国内情绪消费类市场潜力较大,在如今紧凑的生活节奏之下,国民孤
29、独感增加,而陪伴类智能体或受益于这样的大环境。根据GIA(GlobalIndustry Analysts)的研究,Denny Yin提出该行业规模预计到2024年增长到1000亿美元,到2026年增长到2000亿美元。情感沟通类智能体上线,收获大量用户好评。在大模型出现之前,一些利用心理学CBT 沟通技术的产品已经在市面上广泛存在,例如Weobot、wysa 等。随着大模型的发展和迭代,智能体已经能被打造成心理咨询师或塔罗师的角色。用户通过倾诉生活中的烦恼,并在与智能体沟通中寻求情绪宣泄。目前一款治愈系的软件“林间聊愈室”上线后获得了大量好评,App Store评分4.7,多数用户给出了五星好
30、评。其中产品使用小动物的角色设定降低了用户的戒备心,加上治愈的画风和场景设计,打造独特的用户体验。(a)A1:PerformanceonMATH(w/GPT-4).Methods图图9 9林间聊愈室产品介绍林间聊愈室产品介绍资料来源:App Store,海通证券研究所2.32.3效能讨论:成本与价值间的博弈效能讨论:成本与价值间的博弈打造智能体并不是0成本,大语言模型的token 消耗就是最直观的成本展示。由于智能体的运行机制内包含反思和深度学习,这使得其在token 消耗方面比传统大语言模型高。相比于单智能体,多智能体又多了一层交互端的消耗,当多个智能体讨论且进入错误循环中,无效成本将会显著
31、提升。所以在效能方面,对智能体进行成本讨论以及优化策略十分重要。在商用智能体中,更先进的大语言模型代表更好的用户体验,但随之而来的是极速上升的成本。目前GPT4的价格是GPT3.5turbo的十倍,而且由于智能体之间交互的特性,在输出过程中往往伴随着更高的token 消耗。若最终输出的长度超出模型token限制,则不得不调用更高版本的模型例如GPT4-32K,成本又是GPT4的两倍。图图1010 OpenAI 不同模型不同模型tokens消耗价目表消耗价目表Modelgpt-4oModelgpt-3.5-turbo-0125资料来源:OpenAl,海通证券研究所PricingUS$0.0050
32、/1K input tokensUS$0.0150/1Koutput tokensPricingUS$0.00050/1KinputtokensUS$0.00150/1Koutputtokens在实际测试中,使用搭载GPT4 的智能体模型查找新闻并进行总结梳理。这部分的单次消耗是42000个 tokens,成本是1.5美元。在实际应用中,假设一天需要统计的股票新闻大约有120家公司,则成本为35.8美元,按照汇率1:7.14折合人民币255.5元。而且智能体并不是完美的,在运行过程中出现幻觉或错误循环也是常事。例如智能体在找不到合适新闻的时候会进行大量重复的内容输出,人工介入纠错又会增加一定成
33、本。图图1111单次运行单次运行AgentAgent 对对 TokensTokens 的消耗的消耗图图1212单次运行单次运行Agent 的实际成本的实际成本Tokens60K16Jul ContexttokensGeneratedtokens0-01Ju41,59941,599 tokens33,591 tokens8,008tokens31JulGPT-4$216 JulDefaultProjectS07Jul13Jui$1.4919Jul$1.4925JuiJul资料来源:OpenAI,海通证券研究所资料来源:OpenAI,海通证券研究所商业化智能体在成本和最终产品中会有一定博弈,若将智
34、能体运用到股票交易等对精准度需求极高的行业中,产品或引入更多智能体进行协作以提高模型的稳定性,则成本上升。如果运行成本高于其创造的价值时,该智能体模型就失去了商业化的能力。目前多数智能体应用仅停留在测试阶段,市场中的用户需要更理性的看待智能体商业发中能带来的效益。3 3.未未来来展展望望:人人工工智智能能发发展展迅迅猛猛,智智能能体体商商业业化化落落地地未来多方面推动人工智能发展,应用级别智能体有望快速落地。国内各地相继出台关于人工智能的发展政策,推动其为重要的研究方向。预计2026年国内人工智能市场规模超过260亿美元,全球人工智能市场规模2025年超6万亿美元。海外以美国为例,相关政策出台
35、时间较早,人工智能领域发展更加成熟,许多智能体应用已在服务各类企业。并且美国有意与人工智能强国组成战略伙伴,共同发展AI科技。多模态大模型利用异构数据提升应用效率,促进AI Agent发展。将智能体赋能于图片+语音的多模态大模型中,可以减少使用工具和交互的过程,使智能体完成更多复杂任务,解决跨行业、跨领域的问题。智能体发展能推动政府、金融、制造、能源、医疗、零售等行业的智能化应用向多模态和跨模态转变。3.13.1 海内外政策推动人工智能发展加速海内外政策推动人工智能发展加速多地陆续出台关于人工智能发展的指导文件,2024年政府与企业的投入资金有望迎来大幅增长。国务院在2024政府工作报告中提出
36、,要开展“人工智能+”行动,实施数字化转型。智能体作为人工智能应用领域的重要研究方向,相信众多企业和研究部门会开展更多研究工作。另外,像上海、杭州、广东、北京等省市也出台了相关政策,其中杭州市推出“算力券”约2.5亿用于支持本地的算力发展。广东省也将算力作为重点发展方向,预测2025年的人工智能核心产业规模超过3000亿元。表表2 2国内政策推动人工智能发展国内政策推动人工智能发展政府机构政府机构上海市经济和信息化委员会、上海市发展和改革委员会等五部门国务院文件名称文件名称发布时间发布时间具具体内容体内容实施大模型创新扶持计划。支持引进高水平创新企业,支持本市创新主体打造具有国际竞争力的大模型
37、,鼓励形成数据飞轮,加速模型迭代,对取得重大成果的予以专项奖励。实施大模型示范应用推进计划。重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际2024政府工作报告2024年3月竞争力的数字产业集群。实施制造业数字化转型行动,加快工业互联网规模化应用,推进服务业数字化,建设智慧城市、数字乡村上海市推动人工智能大模型创新发展若干措施(2023-2025年)2023年10月$0.530K杭州市人民政府广东省人民政府办公厅关于支持人
38、工智能全产业链高质量发展的补充意见(征求意见稿)广东省关于人工智能赋能千行百业的若干措施2024年5月2024年6月1)支持算力技术攻关。鼓励企业开展算力关键技术研发攻关,市级科技研发计划给予专项支持。鼓励企业承担国家、省重点研发任务,加速形成重大科研成果,对符合政策规定的项目按国家、省实际到账资助经费的25%给予资助,资助金额最高不超过500万元。2)加大融资贴息支持。对纳入政府统一布局的算力基础设施建设项目(总投资规模不低于5000万元)3)扩容算力券发放。每年设立“算力券”总额提升至2.5亿元,新增算力券支持企业购买符合杭州市规划布局的智算中心以及纳入算力撮合的合作伙伴所供给的智能算力。
39、到2025年,全省算力规模超过40EFLOPS,人工智能核心产业规模超过3000亿元。到2027年,全省人工智能产业底座进一步夯实,算力规模超过60EFLOPS,全国领先的算法体系和算力网络体系基本形成;智能终端产品供给丰富,在手机、计算机、家居、机器人等8大门类,打造100款以上大规模使用的智能终端产品,人工智能核心产业规模超过4400亿元;聚焦制造、教育、养老等领域,打造500个以上应用场景,各行各业劳动生产率显著提升。资料来源:上海市经济和信息化委员会,国务院,杭州市人民政府,广东省人民政府,中国政府网,新华社,海通证券研究所中国人工智能市场份额稳定增长,未来AI 实体项目增多利好智能体
40、发展。根据IDC预测,国内人工智能市场规模预计在2026年达到264.4亿美元,2021年到2026年期间的CAGR 超20%。根据增长率计算,从2022年开始,每年市场规模会保持20%左右的稳定增长态势。根据澎湃新闻援引德勤统计,未来2025年世界人工智能市场规模将超过6万亿美元,2017年-2025年期间复合增长率将超30%。AI高速发展中或利好更多实体企业,专门提供智能体产品服务的厂商规模也将快速扩张。图图1313中国人工智能市场规模预测中国人工智能市场规模预测300264.42 2.1%p0.6%20%180.115%122.410%100500202120222023E市场份额(左亿
41、美元)资料来源:IDC,海通证券研究所图图1414全球人工智能市场规模预测全球人工智能市场规模预测6.45.7364.483.53.042.431.91.180.6910201720182019E2020E2021E2022E2023E2024E市场规模(左万亿美元)一yoy(右资料来源:德勤,澎湃新闻,海通证券研究所美国相关政策落地较早,人工智能发展已成规模。在2021年3月,大模型还未进入公众视野时,美国人工智能国家安全委员会已经发布了对该领域未来发展的规划。文件中写到了美国坚定在人工智能领域的投入,且规定了研发投入资金的比重。另外,在2023年5月,美国白宫发布国家人工智能研发战略计划,
42、对之前提出的8项重点战略目标进行了优化和完善,同时强调了人工智能领域国际交流的重要性。另外,文件还80%70%60%50%40%30%20%10%0%250200150一yoy(右%)5%0%54322025E2024E20.5%21.7%2025E2026E17.9%219.2103.8147.525%75对比了2020年发布计划中的各项指标与实际指标差距,并针对细分领域加强研发投入。表表3 3海外政策推动人工智能发展海外政策推动人工智能发展政府机构政府机构美国人工智能国家安全委员会美国白宫文件名称文件名称NSCAI最终报告国家人工智能研发战略计发布时间发布时间2021年3月2023年5月具
43、体内容具体内容美国国家人工智能安全委员会(NSCAI)的任务是向总统和国会提出建议,以“推进人工智能、机器学习发展以全面解决美国国家安全和国防需求的相关技术。”在设立本委员会时,2019财年约翰 S 麦凯恩国防授权法案第1051节指示NSCAI从国家竞争力的角度审视人工智能及其维持技术优势的手段、国际合作和竞争力的趋势、促进基础和先进研究投资的方式、劳动力和培训、军事使用的潜在风险、伦理问题、建立数据标准和激励数据共享,以及人工智能的未来发展等方方面面。该计划是对2016、2019年版国家人工智能研发战略计划的再次更新,重申了之前的8项战略目标并对各战略的具体优先事项进行了调整和完善,同时增加
44、了新的第9项战略以强调国际合作。此外,该报告还提出要评估联邦机构对2020年国家人工智能倡议法案(NAlIA)和国家人工智能研发战略计划的实施情况。资料来源:清华大学人工智能国际治理研究院,安全内参,海通证券研究所美国增强型人工智能投资研发保持高增速,AI 战略联盟强大。2024年美国在该方面的投入预计为15亿美元,NSCAI 希望在2025年把这一数字提高到80亿美元,增幅高达433%。且在2025年之后,保持每年投入增长80亿美元的趋势。最高预计在2030年投入高达350亿美元。美国强调了AI 盟友的概念,与澳大利亚、加拿大、英国、日本等国家构建人工智能战略伙伴关系,未来将会吸引更多AI强
45、国加入联盟当中。图图1515美国增强型人工智能研发投资美国增强型人工智能研发投资2015-20302015-2030SohenedAIRAD50170资料来源:清华大学人工智能国际治理研究院,海通证券研究所tment.FY2015-2030图图 1 1 6 6 美美 国国 及及 其其 A A I I 盟盟 友友资料来源:清华大学人工智能国际治理研究院,海通证券研究所3.23.2算力规模高增,企业对算力规模高增,企业对 AIGC的投入意愿强的投入意愿强2021年中国的智能算力规模为155.2 EFLOPS(每秒百亿亿次浮点运算)。据IDC预测,规模将在2026年达到ZFLOPS 级别(每秒十万亿
46、亿次浮点计算)。预计在2021-2026年期间,智能算力增长的CAGR 为52.3%。随着算力规模的大幅增长,将会带动AI技术快速发展。根据中国信通院的测算,每在算力中投入1元,将带动3-4元的经济产出。在智能体发展中,更强的算力能支持更复杂的模型计算并且给予其更快的响应速度。当大模型能快速迭代,AI Agent将会有更强力的基座,相同运行模式下或能显著提升F1-score和 Recall水平。图图1717中国智能算力规模及预测中国智能算力规模及预测140012001000800600400200031.72019752020427268155.2202120222023EFLOPS(左 百
47、亿 亿 次/秒)922.8640.720242025yoy(右%)1271.42026160.0%140.0%120.0%100.0%80.0%60.0%40.0%20.0%0.0%资 料 来 源:新 华 网、经 济 日报、国 家 自 然 科 学 基金 委 员 会,IDC 与 浪潮 信 息 2 0 2 2-2 0 2 3 中 国人 工 智 能 计 算 力 发展评 估报告 ,海通 证 券 研究 所根据IDC 统计,2023年已有34%的企业在 AI 中的投入已见成效,AI 能力正在稳步发展。AIAgent目前多为企业自研,仅有少部分企业将Agent 融入真正工作中,若AI Agent能在未来用低
48、成本撬动高效益,则会引起越来越多的企业重视。定制化AIAI AgentAgent或成为一片蓝海市场,拥有成熟技术和一揽子解决方案的企业能占据大量市场份额。图图1 8企企 业业A IA g e n t使使 用用 情情 况况图 1 3 企 业AIAgent的 应 用 情 况实 现 了AIAgent常 态 化,AIAgent已经参与到企业招聘、销售、人事等各项业务流程中AIAgent已经成熟运用于某 一 具体业务流程 已经在某项工作中进行了AIAgent试 点正在制定AIAgent应 用 计 划不了解或尚未考虑来源:IDC,2023资 料 来 源:IDC与钉钉2024 AIGC应 用 层 十 大 趋
49、 势 白 皮 书 ,海 通 证 券 研 究 所风险投资青睐的智能体初创企业聚焦于横向应用领域,广泛涉及销售、客户支持及企业级与常规生产力工作流程优化。当前市场上专注于垂直行业特定应用的初创公司仍属少数,大部分代理技术开发的新兴企业主要面向企业客户,而非个人消费者。这些Agent 初创公司希望用技术取代SDR、软件工程师、合规分析专家、客户服务专员等多个职位的职能。这一趋势的影响力将极为广泛且深远,不仅限于日常工作中对公司员工的增加或取代,更会改变公司面向外界客户的交互形象,或使企业的运营方式与客户体验发生改变。图图1919专注于横向应用的专注于横向应用的 AI代理初创企业率先获得融资代理初创企
50、业率先获得融资Al agent startups focusing on horizontal applications takefunding leadDlsclosed equlty funding&deals since2022(asof 7/29/2024)$1,548MHorizontal70 deok$220MVertical9dealNote fcudes OpnAL ncudes tondng to companies dnvtloping sgents withvaying degees af atonomyCBINSIGHTS资料来源:点滴科技资讯公众号,海通证券研究所3
51、3.3.3多模态智能体有望实现大规模商业化多模态智能体有望实现大规模商业化多模态大模型能利用大量异构的数据资源提升应用的效率和能力上限,同时也利好AIAgent发展。多模态的概念或能提高智能体的工作效率,例如将其赋能于一个能形成图片+语音的多模态大模型中,单个智能体能完成更多复杂的任务,有效的减少智能体数量和任务中的交互次数。多模态智能体有望解决跨行业、跨领域的复杂问题和各类长尾场景。目前,研究开发的核心领域已经包括多模态信息识别与理解技术以及群体智能技术,这些将有望加速人工智能从感知向认知的转变。这些技术成果还能够解决其他单项技术领域(如自然语言处理和计算机视觉)所面临的瓶颈问题,例如视觉领
52、域的盲区和遮挡问题。此外,自动驾驶的激光点云、时空感知与测绘信息等更多类型的模态数据也将被整合到大模型中。未来,政府、金融、制造、能源、医疗、零售等多个行业的智能化应用将逐步转向多模态和跨模态的形式。图图 2 2 0 0 多多 模模 态态 大大 模模 型型 发发 展展金融金融政府政府制造制造能源能源医疗医疗零售零售风险评估和信贷审查:通风险评估和信贷审查:通 公共服务自动化:为公共服务自动化:为公生产流程生产流程优化:分析优化:分析能源消费预测:预测末能源消费预测:预测末诊断辅助:分析医疗图诊断辅助:分析医疗图库存管理和预测:预库存管理和预测:预测过分析文本和数值数据来 众提供信息查询、办事众
53、提供信息查询、办事工厂数据以优化生产来的能源需求和消费模像和患者数据以协助医像和患者数据以协助医产品的销售趋势和库存产品的销售趋势和库存预测客户的信用风险预测客户的信用风险指南等服务指南等服务效率式生诊断需求需求自动化客服:自动化客服:为用户提供 政策模拟与预测:预测政策模拟与预测:预测产品设计辅助:基于设备维护预测:预测能药物研发:预测新药物个性化推荐:基于用户即时的财务咨询和支持即时的财务咨询和支持政策实施后的社会和经政策实施后的社会和经市场和用户反馈生成源设备何时需要维护或的效果和副作用的购买历史和喜好为其济影响济影响新的产品设计建议更换推荐产品投资策略优化投资策略优化:分析大量 数据分
54、析和可视化:自数据分析和可视化:自供应链管理:预测供能源存储和分发优化:治疗建议生成:基于患客户服务自动化:为客数据,为投资者生成投资动生成关于公共问题的应链中的潜在问题或基于数据分析来优化能者的历史和病情生成治户提供自动化的购物咨户提供自动化的购物咨建议或预测市场走势建议或预测市场走势报告和可视化内容延迟源的存储和分发疗建议询和支持欺诈检测:通过分析交易 舆情分析:分析公众对模式和行为来识别可疑的 政府政策和行动的态度交易交易和反应设备维护预测:预测设备何时需要维护或更换可再生能源管理:预测和优化太阳能和风能的产出患者监控和预警:实时分析患者的生理数据以预警其健康状况市场趋势预测:分析市场数
55、据以预测未来的零售趋势报告自动生成:为管理层报告自动生成:为管理层 智能监控和安全:通过智能监控和安全:通过质量控制自动化:通环境监测:通过分析视医疗文献自动生成和分虚拟试衣和产品展示:或监管机构自动生成财务或监管机构自动生成财务 分析视频和音频数据来过分析图片和视频数频、图片和传感器数据析:自动生成或分析医使用AR和VR技术为用户和业务报告和业务报告提高公共场所的安全提高公共场所的安全据自动检测产品缺陷来监测环境和设备状况学研究报告和文献提供虚拟的产品体验模态:文本图片语音视频数值数据资料来源:IDC 与钉钉2024 AIGC 应用层十大趋势白皮书,海通证券研究所3 3.4 4 全全 球球
56、智智 能能 体体 市市 场场 增增 速速 加加 快快根据marketsandmarkets 的数据显示,2019年全球自主智能体(AutonomousAgent)市场份额为3.45亿美元,预计2024年将达到29.92亿美元,期间CAGR为54%。机构预测2023年全球自主人工智能和自主智能体的市场规模在2028年能达到285亿美元,期间 CAGR为43%。智能体的需求增长迅速,企业希望用到最先进的Al 科技来实现快速创收,未来智能体软件公司有很高发展潜力。图图2121 全球自主人工智能和智能体市场规模全球自主人工智能和智能体市场规模AUTONOMOUSAIANDAUTONOMOUSAGENT
57、SMARKEIGLOBALFORECASTT2028(USDBILLION)28.5CAGR OF43.0%TheglobalAutonomousAandAutonomousAgentsMarketisexpectedtobeworthUSD 28.5billionby2028,growing at a CAGR of43.0%duringtheforecastperod资料来源:marketsandmarkets,s,海通证券研究所202220232026Noth Anerico WEuope Asa PacifeMode East嘉AMico Latin Ameico4.83.29各行业用
58、户正积极探索生成式 Al 的应用场景,开发数字化产品和服务,挖掘数据要素的潜在价值,并尝试智能化商业模式。根据 IDC的数据,软件和信息服务、银行以及通讯行业在人工智能方面的投资最为突出,预计到2027年,这三大行业的投资占比分别为23.8%、9.7%和9.4%。IDC 的调查显示,近一半(43%)的受访组织正在研究生成式Al 的潜在应用,其中2023年有55%的金融机构和电信公司投资了生成式AI技术。这些技术正在帮助金融和电信行业提升反犯罪和监控能力,提供个性化的投资建议,并减少人工成本。图图2222中国前五大人工智能市场应用中国前五大人工智能市场应用中国前五大人工智能市场应用场景占比预测,
59、中国前五大人工智能市场应用场景占比预测,20202424智能基础设施调配智能基础设施调配增强的智能客服增强的智能客服销售流程推荐和增强销售流程推荐和增强智能业务创新和自动化增强的公共安全和应急响应 其他资料来源:IDC,海通证券研究所4.4.潜在标的:潜在标的:Agent 企业千帆竞发,垂类应用引人期待企业千帆竞发,垂类应用引人期待4.1 LeewayHertz:提供多领域解决方案提供多领域解决方案LeewayHertz 公司在人工智能Agent开发方面取得了长足进步,以创建定制化人工智能解决方案的专长而闻名。目前已在医疗保健、金融和物流等多个领域成功实施了人工智能智能体应用。他们致力于提供量
60、身定制的人工智能解决方案,这使LeewayHertz站在了智能体应用的最前沿。其中公司持续与各类行业的头部企业达成协作,提供各类数字解决方案,商业模式较为成熟。图图2 3L e e w a y H e r t z公公 司司 发发 展展 历历 程程 与与 合合 作作 公公 司司Alexaoce占batONHAWAllRearsonSIEMENSMINASCAR80+Digit2019PaG*NorthShore45+Digitions20232024TRACERX85F3MHERSHEYS2008-2018NanoWallKxiNESS202020222021100+150+125+90+9HT
61、资料来源:LeewayHertz 官网,海通证券研究所行 业 研20其公司的智能体业务旨在通过自动化任务和简化流程来提高运营效率,从而扩大业务成果。公司使用 AutoGen Studio、Vertex AI Agent生成器和 crewAI 等一流工具,根据业务需求量身打造以任务为中心、高性能且可靠的 AI Agent。利 用 LLM 的高级功能和全面的技能库,LeewayHertz的人工智能Agent 在研究、分析、代码生成、审查、审计、在线搜索和细分等各种任务中表现出色。图图2424 LeewayHertzLeewayHertz的智能体产品架构的智能体产品架构资料来源:LeewayHert
62、z 公司官网AI Agent产品界面,海通证券研究所公司提供了一系列AI Agent产品解决方案,例如私募股权智能体。这些智能体是能够分析和解释复杂数据的智能助手,帮助私募股权公司:1)获得洞见:AI 智能体可以在大型数据集中发现隐藏的模式和趋势,帮助私募股权公司识别有前途的投资机会或潜在风险。2)做出更好的决策:AI 智能体生成的洞见使得投资决策更加知情和数据驱动。3)提高效率:通过自动化重复性任务,AI 智能体让人类分析师可以专注于更高价值的活动,如建立关系和战略规划。智能体通过战略决策进行推理并行动,提升私募股权公司的投资成果和运营效率。公司为私募股权打造智能体的架构分为三个层面。首先智
63、能体捕获和处理与私募股权相关的各种输入,包括财务数据、市场趋势、投资者情绪和监管更新。它可以处理文本、数字和图形格式的输入,以便为战略决策和行动提供信息。其次,认知功能(大脑)内又包含了:a)角色定义:确定 Agent 在私募股权操作中的角色,使任务与投资策略和客户目标保持一致。b)记忆:存储和检索过去的投资决策、市场行为和客户互动,促进自适应学习和知情决策。c)知识:存储私募股权操作中关键的领域特定信息,如财务分析、风险评估模型和监管框架。d)规划:根据当前市场状况、投资组合目标和监管要求制定投资策略和运营计划。最后执行层面中,智能体使用预测分析、投资组合管理软件和合规自动化工具来执行计划策
64、略。这确保了投资策略的精确实施、投资组合表现的优化以及私募股权操作中对监管标准的遵守。图图2525 LeewayHertz 为私募股权提供的为私募股权提供的AIAgent解决方案解决方案TextAudioImageUTInfoAIAgentforPrivateEquityoryBRAKnowledgeingnfoSeaACTION(Agent plckstools basedon资 料 来 源:LeewayHertz公 司 官 网Insight界 面,海 通 证 券 研 究 所4.24.2 Markovate:Markovate:提供多模态智能体解决方案提供多模态智能体解决方案Markovat
65、e公司为企业开发人工智能Agent,以提高业务流程、决策和运营效率。这些智能体是先进的数字助理,可自动执行任务、分析数据和提供见解,并与企业系统无缝集成。Markovate使用 AutoGenStudio、Vertex AI 和 GPT-4o 等工具定制智能体,以满足特定的业务需求。图图2626 Character.aiCharacter.ai 智能体架构智能体架构CmorAIVrtoxA资料来源:Markovate公司官网,海通证券研究所Markovate打造了一款由智能体集成驱动的虚拟助理零售库存管理解决方案ShopSpot。结 合AI 智能体提供了彻底改变零售业的库存管理的方案,通过整合
66、先进的机器学习和神经网络,它可以提供精确的需求预测和库存水平优化,有效地应对现代零售业的挑战。在整个解决方案中包含了几个重要模块:1)聊天机器人和智能体:使用大量的客户互动数据对这些智能体模型进行训练,确保智能体能够提供准确和有用的回复,从而提高用户参与度和效率,开发能够理解和响应各种库存相关查询的人工智能模型。2)动态数据可视化:结合了先进的图形工具,设计了动态数据可视化功能,用户能通过热图和散点图等可视化工具来直观地探索和理解复杂的库存数据。3)聚类分析:设计聚类分析功能涉及创建算法,根据购买模式和行为的相似性对产品或客户进行分组,为不同的细分市场量身定制库存策略。图图2828 ShopS
67、pot 库存管理系统库存管理系统资料来源:Markovate公司官网,海通证券研究所多模态智能体通过结合图像识别系统,分析产品图像、货架状况和仓库环境,有助于快速评估库存水平、识别损坏情况并有效地进行产品分类。资料来源:Markovate公司官网,海通证券研究所图图2727 ShopSpotShopSpot 用户界面展示用户界面展示Use图图2929 ShopSpotShopSpot 多模态智能体图片多模态智能体图片识别功能展示识别功能展示资料来源:Markovate公司官网,海通证券研究所4.34.3ReplikaReplika:情感类智能体热度不减情感类智能体热度不减Replika 是一款
68、陪伴类智能体,她的创始人将自己与朋友大约8000条聊天记录输入谷歌的神经网络,创建了一个 AI 智能体,让用户获得更加拟人的交流体验。创始人表示约有40%的用户用这款智能体创造恋人角色。2017年3月Replika 首次公测,吸引了10万名用户参与,同年9月正式面向大众,在不到一年的时间里,积累了250万用户。截止到2023年1月,Replika 的产品全球流水可以达到200万美元/月,在安卓系统已累计1000万次下载,用户平均每天会与其中的智能体聊天70条左右,花费时间2-3小时。目前用户满意度为92%,有超过一半的人愿意为后续产品付费。其付费模式分为按月付款(19.99美元),按年付款(6
69、9.96美元),以及终身会员(299.99美元)。开通Replika Pro之后可以解锁更高版本的语言模型、无限的语音消息、图片生成等。图图3030 Replika付费模式付费模式Unlock Replika PROGet access to the advanced model,unlimited voicemessages,imagegeneration,activities,andmore.Save70%1month12 monthsbilledannually$19.99$5.83/mo资料来源:Replika用户注册界面,海通证券研究所Lifetimebilledonce$299.9
70、9Replika 吸引欧美中年男性居多。根据similarweb 截止2024年8月份的统计,Replika 男性用户约占64.67%,女性用户占35.33%。其中25-34岁的用户群体居多,占比约28.49%。前五地区的用户分别是美国、墨西哥、印度、英国、德国。图图3232截止截止20242024年年8 8月月RepRep likalika用户全球分布用户全球分布28.49%27.3%54.0%L5.6%5.6%3.8%3.8%0.00%25-3435-4445-5455-6465+资料来源:similarweb受众人口板块,海通证券研究所资料来源:similarweb 地理板块,海通证券研
71、究所4.4CharacterAI:自自研研大大 模模型型,打打造造智智能能体体社社区区Character.ai是一种神经语言模型聊天智能体,其较大特点是自主研发的Beta 语言模型。用户可以创建智能体并根据参数塑造他们的个性,然后将创建好的智能体发布到社区中与其他用户进行交互。另外,有些角色可以扮演助手模式,例如帮助你进行创意写作或打造一个文字冒险游戏等。用户不仅可以与单个智能体进行交流,还可以创建包含多智能体的群聊,这些智能体可以互相交谈且用户也能参与其中。2023年3月,Character.AI 完成了一笔1.5亿美元的融资,估值达到10亿美元,由 a16z 领投。公司的创始人 NoamS
72、hazeer曾是谷歌首席软件工程师,也是Transformer论文的作者之一。公司将这笔融资用于拓展模型的计算能力并提高其回答精度和推理能力。图图3333 Character.AI 用户界面用户界面For youcter选择现有的选择现有的智智能能 体体,由由其其他他用户创用户创建建wlanguagePracte nternewngWriteastoryAberLAnythgatot yicen助手类的智能体UsbaddyMo lon资料来源:Character.ai官网,海通证券研究所截止2024年7月,网站月平均访问量为2.15亿,且其访问量仍保持增长态势。据2024年7月30日的报道数据
73、,Character.AI 在已拥有1700万的月度活跃用户。截止2024年4月全球用户达到2.33亿人。网站目前的变现方式主要通过升级订阅服务,每月收费9.9美元,功能包括不限制聊天次数、拥有更快的反馈速度。30.00%25.00%20.00%15.00%10.00%5.00%图图3131 截止截止20242024年年8 8月月ReplikaReplika各年龄段用户占比各年龄段用户占比美国墨西哥印度英国口德国 其其他自定义角色声音,可以上传录音文件lon自定义你的智能体23.96%17.27%13.05%10.79%6.44%18-24图图3434CharacterCharacter.ai
74、ai20242024年年7 7月每日访问量月每日访问量character ai deepal.org notion.so huggingface.co215.2Mvs10.35M424.3M154.1M17.10M7400M7200M7.000M6 800M6.60 0M6400M01Jul03 Jul09Jul13Ju15Jul17Jut19Jul21Jul资料来源:similarweb访问量板块,海通证券研究所网站吸引年轻男生和女生,活跃用户粘性较大。网站受众人口的男女比率约为51%和49%,其中18-24岁的用户占比超过56%。前五地区的用户分别是美国、印度尼西亚、墨西哥、菲律宾和印度。
75、其中活跃用户每天约进行240轮对话,平均时长在2个小时。目前网页端的DAU/MAU比例为23%,APP端 DAU/MAU比例为41%。图图 3 3 6 6C C h h a a r r a a c c t t e e r r.A A I I 用用 户户 全全 球球 分分 布布23.39%48.32%12.71%5.90%4.58%5.10%0.00%18-2425-3435-4445-5455-64资料来源:similarweb受众人口板块,海通证券研究所公司通过自研模型减少成本,智能体研发技术先进。由于是自主研发的模型,其高效的LLM 算法大大降低了成本,根据 foresight news援
76、引海外独角兽团队测算,每个Query 的推理成本是 chatgpt 的5%以下。早在2023年2月份,Character.AI就使用了八位整型做计算,比16或32位浮点数效率有4倍-2倍的提升,这也归功于创始人 NoamShazeer对AI技术的独特理解。成本方面,根据foresightforesight newsnews援引海外独角兽团队测算character每次交互的成本为0.000027美元,一个 MAU的单月成本可以控制在不到0.1 美元4 4.5 5星星火火智智能能体体:布布局局智智能能体体平平台台,发发布布垂垂类类智智能能体体星火智能体平台目前由三大核心模块组成,分别是智能体、任务
77、链和知识库。智能体模块事先配备了预先设置,能够自主规划并调用工具执行任务。任务链是为智能体提供执行任务所需要的各类工具,能快速链接企业内部的知识、IT 系统和外部信源。知识库模块能让用户更快捷的查询垂类知识,让智能体更好的解决专业类知识,支撑其高效运行60.00%50.00%40.00%30.00%20.00%美国印度尼西亚口墨西哥菲律宾口印度 口其口其他他资料来源:similarweb地理板块,海通证券研究所图图3535 CharacterCharacter.AIAI 各年龄段用户占比各年龄段用户占比23 Jul25Ju27Jul29 Jul 31Jul10.00%22.72%65+全全部部
78、清清56.08%11.45%4.84%2.13%2.77%图图 3 3 7 7 科科 大大 讯讯 飞飞 星星 火火 智智 能能 体体 介介 绍绍16000+智能体深入垂直场景解决刚需问题,让每一个场景,都能找到开箱即用的大模型应用结结构构化化创创建建聚焦场景人物,结构化助手指令;通过角色设定和对话模块,基于自然语言快速创建助手。轻应用轻应用开发开发面向不同垂直场景,具有更优的使用体验和独立的交互方式。目前已接入智文,晓医智作,语伴等多个专业轻应用。流流程程图图式式编编排排基于丰富的工具集,快速配置各类节点,可视化拖拽操作,实现复杂功能,提高效率。资料来源:星火智能体,海通证券研究所2024年6
79、月,科大讯飞发布了星火大模型V4.0及相关落地应用。在去年11月份,讯飞星火 App 的用户已经累计开发了3.7万+的个性化Al 助手,可以满足职场、营销、创作等多场景需求。目前App已经累计在安卓市场下载1.31亿次,在国内通用大模型App 中排名第一。另外,讯飞星火首批上线面向特定场景打造专属助手。例如垂类智能体“讯飞晓医”,其覆盖了1600种常见疾病,2800种药物以及6000种医学检验,其满足了用户的一些医疗建议需求。图图3838部分星火部分星火AIAI 智能体展示智能体展示智能体中心智能体中心主主动思考与执行任务的智能助理工作台我的推荐职场绘画大师绘画大师已通加输入主题及要求,一键为
80、你创作图像文文 本本 扩扩 写写添加请输入文本,我来帮你扩写,比如“大语言-A 1596.6万文章改写助手文章改写助手+源加文章改写助手,对文本内容进行维改间色990.7万 z0资料来源:星火智能体,海通证券研究所风险提示:大模型发展不及预期,智能体下游需求不足。4.6 SkyAgents:自研模型降低成本自研模型降低成本天工SkyAgents 是基于昆仑万维天工大模型平台打造的,其具有从感知到决策,从决策到执行的自主学习和独立思考能力。用户能够通过自然语言创建一个或多个智能体,并将不同任务模块化。通过操作系统模块,可以执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取和 htt
81、p请求等任务。其中天工大模型的MoE架构能让 AI 获得更快的响应速度且面对复杂任务的处理能力更强。内容运营创作助手添加星火内容运营大师,致力于为内容运营工作A 1184.5万 136*6064扩写助手扩写助手+酒加hello,我是你的扩写助手,请输入文本,我。exywu49写作助手写作助手请说出您要创作的文章的类型,以及文章的3893万菌盛创作学习编程生活趣味营销情感三文章润色高级助手根据提供的文案,上下文结合进行润色986.4万 0189*5588文案大师文案大师输入一个主题,为你生出一篇文章万 131*9138朋友圈文案朋友圈文案酒加请输入要表达的关键词,为你生成对虚的期-OQ 报素智能
82、体。自建智能体SkyAgents智能体拥有成本优势,tokens价格低于OpenAI。天工大模型3.0版本图图3939 天工大模型能力展示天工大模型能力展示能力展示能力展示灵活、多样、可扩展性更强模型稀疏性使得在同等计算资源下能够扩增加专家模型数量、调整权重配比,具有更强的可扩展性,构建更为灵活、多样的新时代大模型资料来源:天工开放平台官网,海通证券研究所0.01元/千tokens,2.0版本0.005元/千tokens,价格普遍比GPT40更加划算,但天工3.0价格略贵于GPT3.5 turbo。若按照2000个 input tokens,输出1000个output tokens来计算,GP
83、T4o花费0.175元(汇率按照1:7),GPT 3.5turbo花费0.028元,天工3.0模型花费0.030元,2.0模型花费0.015元。图图4040天工天工AgentAgent计费模式计费模式A g e n t 类天工3.0系列模型AI AgentA I 对 话 3 0AGI Sky-Chat-3.0APIAI对话2.0:AGI Sky-Chat Sass AP欢迎咨询天工大模型天工大模型3.03.0 APIAPI在在2.02.0版本基础上,提供了搜索增版本基础上,提供了搜索增强模式,显著提升信息检索和知识整合能力。强模式,显著提升信息检索和知识整合能力。结合最新搜索引攀技术,能够快速
84、找到相关信息并进行智能分析,提供更精准和丰富的回答。在复杂对话和深度内容创作中表现更佳,如广告文案、小说写作、知识类写作和代码生成等场景。AGISky-ChatAGISky-Chat SassAPISassAPI提供了更强大的提供了更强大的问答和文本生问答和文本生成能力,非常适合复杂的对话交互和深度内容创作设计的场景。特别适用于需要高知识量、强推理能力和创造力的场景,例如广告文案、小说写作、知识类写作和代码生成等。0.0100.010元元/千千tokenstokens搜索增强:开启搜素增搜索增强:开启搜素增强模式使更多tokens消耗,当中调用搜索次数限耗,当中调用搜索次数限时免费时免费Sky
85、Chat-MogaVerse0.010元/千tokens0.005元/千/tokens资料来源:天工开放平台产品定价,海通证券研究所4.74.7商汤:联合清华、上海人工智能实验室打造商汤:联合清华、上海人工智能实验室打造GITM商汤、清华大学和上海人工智能实验室等机构的研究者们提出了一种名为 Ghost inthe Minecraft(GITM)的 通 才 AI 智能体。GITM能够在我的世界中表现优异,显著减少训练时间和资源。这一突破标志着通用人工智能(AGI)研究的重大进展,AGI的目标是开发能够在开放世界环境中进行感知、理解和交互的智能体。GITM通过自主学习,解锁了我的世界主世界的26
86、2 个物品,相较于之前智能体仅解锁的78个物品大幅提升。此外,GITMGITM在“获取钻石”任务上的成功率从 OpenAI提出的 VPT方法的20%提升至67.5%。GITM训练仅需一个 CPU节点两天完成,训练步数比之前方法减少了万分之一,大大低于 OpenAI 和 DeepMind提出的其他方法所需的 GPU天数。此项研究为机器人和自动驾驶等产业带来了巨大的潜力和突破。应应对对复复杂杂任任务务能能力力更更强强集成了多个专家模型,针对不同的数据分布和构建模式进行搭建,从而提升在各个细分领域的专业能力。在处理复杂任务多模态任务时有显著性能提升速速度度更更快快、效效率率更更高高:MoE 模型的推
87、理计算过程中只有少数特定专家模型被激活,呈现出极高的稀疏性,从而提高了推理计算效率,让用户获得更快的A响应速度。图图 4 4 1 1R R L L 架架 构构 对对 比比 G G I I T T M M 创创 新新 架架 构构RL-basedmethodgoalobseRLAgenGhost Inthe Minecraft(GITM)aclion isLLMDecomposefeedbackstructuredactionsEnvironmentkeyboarda moousesub-goaltreeLLMPlannergoal资料来源:机器之心,海通证券研究所传统 RL智能体在shang h
88、将复杂任务映射到底层键盘鼠标操作时面临困难,而GITM采用大型语言模型(LLM)作为核心,打破了这一传统架构。GITM由由 LLMDecomposer、LLM Planner和 LLM Interface三部分组成,逐步将复杂任务分解为子任务、结构化动作,直至最底层的键盘鼠标操作。LLMDecomposer利用外部知识将复杂任务分解为简单子任务;LLM Planner为每个子任务规划结构化动作,并根据反馈信息调整规划,不断总结成功经验;LLMInterface通过键盘鼠标操作执行结构化动作,并在与环境交互中获取观察信息。图图4242解锁科技树的成功率解锁科技树的成功率(蓝色是蓝色是GITM)e
89、rv3印资料来源:XizhouZhuGhostinthe Minecraft,海通证券研究所图图 4 4 3 3 各各 模模 型型 完完 成成 任任 务务 成成 功功 率率 对对 比比MethodSuccessRate(%)DreamerV3DEPSVPTOur GITM50.03.00.010090.080.073.310.00.6100.0100.0100.085.020.0100.0100.0100.095.067.5100.0100.0100.095.067.5资料来源:机器之心,海通证券研究所GITM 在我的世界主世界中实现了100%的任务覆盖率,成功解锁了完整的科技树,而此前所有智
90、能体总和只能覆盖30%。在备受关注的“获取钻石”任务上,GITM 的成功率达到67.5%,比目前最佳成绩(OpenAIVPT)的20%提高了47.5%。GITM的训练效率也显著提升,所需环境交互步数仅为已有方法的万分之一,单个CPU 节点训练2天即可完成,相比之前OpenAIVPT所需的6480个GPU天或DeepMindDreamerV3所需的17个GPU 天,取得了巨大的进步风险提示;智能体商业化不成熟,智能体下游需求不足。4.84.8字节跳动:豆包聊天助手字节跳动:豆包聊天助手在中国的AI聊天机器人竞争中,字节跳动已抢占先机。其最新推出的AI对话服务豆包在下载量和活跃用户数上均超越了百度
91、的文心一言。根据华尔街见闻援引互联网分析公司SensorTower的数据,自去年8月推出至今年4月,豆包在iOS 系统上的下载量近900万次,领先于文心一言的800万次。在月活跃用户数方面,豆包在iOS 端也已超过400万用户,显著高于文心一言。相比之下,OpenAl 的 ChatGPTApp在美国的月活跃用户数量为670万。根据2024年5月的数据显示,豆包PC、iOS 平台月活跃用户总数已达到 26 00 万。图图4444豆包智能体的对话界面豆包智能体的对话界面豆包+新 对 话你好,我是豆包准备好了吗?我随时可以开始哦!你可以尝试下面的示例AIAI 搜搜 索索d苹果为何将部分产能从印骑共享
92、单车比坐地铁还PDFPDF问问 答答发布版IntoO大模型测评报告操告性记段7M2017的以,大模技境力和丰田又陷造假门,7款车型涉案,有什么影响登录登录资料来源:字节跳动豆包,海通证券研究所相比市面上的收费大模型,豆包有价格优势。目前普通用户可以免费使用豆包,其大模型的API 定价也相对较低。按 Tokens实际使用量计算费用的“后付费”模式下,豆包通用模型-pro 和豆包通用模型-lite 的 3 2k 及以下窗口版本,模型限流为10KRPM和 8 0 0KTPM(以 RPM和 TPM其中之一达到上限为准)。相比之下,国内其他主流模型的 TPM限额多在100K 到 3 0 0K 之 间,R
93、PM则在60到120区间,轻量级模型的 RPM限额相对较高,但仅在300到500之间。字节跳动宣布企业市场定价为0.0008元/千 Tokens(约1500多个汉字),比行业标准便宜99.3%。风险提示:智能体商业化不成熟,智能体下游需求不足4.94.9腾讯:腾讯:AppAgentAppAgent 通过模仿人类行为,完成与智能手机的交互。腾讯的AppAgentAppAgent的智能Agent 能力可以用于操作任何 App,它在50个复杂手机任务上展示了强大的能力。根据 Chi Zhang等人的论文AppAgent:Multimodal Agents as SmartphoneUsersAppA
94、gent 介绍,这项技术通过引入一种基于大型语言模型(LLMs)LLMs)的多模态智能 Agent(Agent)框架,使智能体能够操作智能手机应用程序。与传统的智能助手如 Siri不同,AppAgent 并不依赖系统后端访问,而是通过模拟人类的点击和滑动操作,直接与手机应用的图形用户界面(GUI)互动。这种独特的方法不仅提高了安全性和隐私性,还确保了智能体能够适应应用界面的变化和更新。AIAI 解读奥运赛事解读奥运赛事口最近对话 关于豆包O 换一换图像生成图像生成D9图图4545 腾讯腾讯 AppAgent展示软件操作展示软件操作SendanTelegramghtronshotshowsaph
95、otoedtingapasmntphorewthaninaeded on the sThought To compl ete this tak.i should adjut the nomusing the slidoAction:swipe(23,rght,medum)资料来源:腾讯云,海通证券研究所AppAgent 的实验环境基于命令行界面(CLI),使 Agent 能够与安卓系统上的智能手机应用进行交互。Agent 接收两种关键输入:实时屏幕截图展示应用界面,以及详细描述交互元素的 XML文件。为了提升Agent 识别和交互这些元素的能力,每个元素都被赋予了一个唯一标识符。标识符要么来源
96、于 XML文件中的资源 ID(如果提供),要么通过结合元素的类名、大小和内容来构建。这些元素的标识符以半透明数字形式覆盖在屏幕截图上,帮助Agent 在不需指定精确位置的情况下准确互动,从而提高控制手机的精确度。动作空间模拟了人类与智能手机的常见交互方式,包括点击和滑动。设计了四个基本功能:点击(Tap)、长 按(Long Press)、滑 动(Swipe)和文本输入(Text),以及两个系统级功能:返回(Back)和退出(Exit)。这些预定义动作旨在简化Agent 的交互流程,并减少对精确屏幕坐标的依赖,解决了语言模型在准确预测中可能遇到的挑战。nshot dsplays a thoppi
97、ng appwith a variety of headsets liateght To complete this task,I shoul add theedheadsetshopping anttap(14)The image shows a screenshalarm applcatonTocomolkta ths tak Ithould dhable thepping onIGmailYouTubeEMUutthratenrch musicwdeoredutionleleaturetap(17图图4 6A p p A g e n t的的A p p探探 索索 学学 习习 阶阶 段段Ex
98、ploration PhaseTapSwipe“Swiping this Ul element allows theuser to adjust the colortemperature of theimage.DocforAppthe color settings to adjust thecolor of theimage.资料来源:腾讯云,海通证券研究所AppAgentAppAgent 框架的核心是探索阶段。Agent 通过自主交互或观察人类演示来学习应用程序的功能和特性。在自主交互模式下,Agent 被分配一个任务并开始与 UI 元素进行自主互动。Agent尝试不同的动作,并观察应用界
99、面的变化以理解其工作原理。Agent通过分析每个动作前后的屏幕截图,了解 UI 元素的功能和特定动作的效果。所有这些信息都会被记录成文档,详细记录下不同元素所执行动作的效果。如果某个 UI 元素被多次操作,Agent会根据之前的文档和当前的观察来更新信息,以提高认知质量。AppAgent专注重要操作,提高探索效率。如果当前 UI 页面与应用的主要任务无关(如广告页面),Agent 会停止进一步探索,并使用 Android 系统的返回功能返回到前一个 UI 页面。这种目标导向的探索方法,相比随机探索,确保Agent专注于对应用有效操作至关重要的元素。Agent 还利用语言模型对用户界面的现有知识
100、来提高探索效率,直到完成分配的任务。在观察人类演示进行探索的方式中,Agent 通过观察人类用户的操作来学习应用的复杂功能。这种方式尤其有效,对于那些难以通过自主交互发现的功能。Agent记录人类使用的元素和动作,这种策略缩小了探索空间,并阻止Agent与无关的应用页面进行交互,从而比自主交互更为高效和有条理。图图4 7A p p A g e n t的的 实实 际际 部部 署署 阶阶 段段遍DeploymentPhase:“beautifythisphotoforme”0Observe,Think,Act,andSummarize资料来源:腾讯云,海通证券研究所在经过探索阶段的训练后,AppA
101、gent 已准备好执行复杂任务。在部署阶段,Agent采用逐步方法操作,每一步包括获取当前用户界面的屏幕截图和动态生成的文档,详细描述了界面元素的功能及动作效果。首先,Agent 对当前用户界面进行观察,并阐述其关于任务和观察结果的思考过程。然后,Agent 通过调用可用函数执行动作。每次动作后,AgentAgent 总结交互历史和当前步骤中采取的动作。这些信息被整合进下一个提示中,为Agent 提供了一种记忆形式。这种细致的方法提高了Agent 动作的可靠性和可解释性,从而促进了更明智的决策。部署阶段持续进行,直到Agent 确定任务已经完成,此时它可以通过执行退出(Exit)动作结束过程。AppAgent 采用了多模态大型语言模型 GPT-4,能够处理图像和文本输入,解释并互动应用中的视觉及文本信息。通过简化动作空间设计,AppAgent大幅提升了准确性和效率,避免了生成精确 xy 坐标的需求,这一直是传统语言模型的难点。在成功率、奖励和平均步骤数等关键性能指标上,AppAgent 表现优异。即使任务步骤失败,它仍能根据最终状态获得奖励,显示出强大的适应性和韧性。风险提示:智能体商业化不成熟,智能体下游需求不足。