返回首页

贺军翔醉佳导演百度云

来源:www.fanlv.net  时间:2023-09-07 14:02   点击:221  编辑:admin   手机版

一、搜索引擎龙头,以AI破局“未来“

1.1、搜索与营销为基,“云+AI+智能驾驶”逐步成为新驱动力

百度公司是国内搜索引擎龙头,全球最大的中文搜索引擎,目前除移动生态之外,公司在AI生态上也实现全栈布局。移动生态端:公司采取X+Y型战略布局,即“横向开拓用户规模,纵向深耕行业垂类”的方式推进整个生态向服务化、人格化升级。横向上布局爱奇艺、好看视频、百度贴吧、百度主站APP、百家号等流量入口,扩大整体用户规模。

纵向上布局垂直行业:包括知识问答(百度知道、百度百科)、医疗(百度健康)、金融(度小满金融)、B2B(基木鱼、出海易、度小店)、教育(百度教育)、工具类(百度地图、百度网盘、百度文库、百度有驾)维护生态护城河。AI生态上:以百度智能云、百度大脑等能力为底座,逐渐扩展出生态应用场景,主要包括三大类:1)以小度音箱等智能家居场景;2)以百度希壤为代表的元宇宙场景;3)以百度Apollo造车及萝卜快跑为代表落地的无人驾驶场景。

盈利模式:在线营销为主要盈利模式,近年业务重心转移,核心在线营销占比降低,AI作为新驱动力带动业务收入占比提升。公司盈利主要来源于提供广告位及搜索广告竞价排名的在线营销模式、以百度云为核心布局的ToB云服务业务、爱奇艺分部的会员增值服务及内容分发服务。公司以搜索引擎业务起家,在线营销业务布局较早,盈利模式成熟,是目前公司的主要收入来源。从营收占比来看:公司盈利重心持续向云服务倾斜,转型趋势明显。公司AI为核心驱动的云服务和其他业务(包括软硬一体的智能业务,包含智能云、智能音箱与阿波罗自动驾驶等)近年来实现快速增长,云服务2020/2021/2022营收分别为91.73/150.70/177.21亿元,同比增长44.00%/66.29%/17.59%,未来随公司AI布局得更加完善,其业绩增长的驱动能力将不断增强。

1.2、从掌握流量入口到错失流量入口,“AI+”时代流量入口有望重塑

阶段一:PC时代——搜索引擎聚合用户需求,为该阶段流量入口。2000年1月公司成立,中国互联网刚刚起步,门户网站、搜索引擎为该阶段最具竞争力的互联网产品。公司最早为搜狐、网易、新浪等门户网站提供中文网页信息检索服务,2001年面向C端发布搜索引擎。2002年公司通过闪电计划拉平与Google引擎上的技术差距,并完成了部分指标上的反超,迅速占据国内市场成为首选搜索引擎,百度、Google、雅虎三强对峙。2002-2003公司陆续发布搜索伴侣、MP3、图片、新闻、贴吧等内容平台,维护用户流量护城河。公司PC时代的成功主要取决于两点:1)搜索引擎技术的壁垒相对较高,创始人李彦宏为技术出身,其超链分析专利及投票排名算法在市场中具备强竞争力;2)搜索引擎在此阶段为互联网生态的主要流量入口:公司稳固头部流量入口后扩展内容生态,发布百度贴吧,抓住PC时代的核心用户流量机遇。搜索引擎导流让百度贴吧用户具备“飞轮效应”,从而击败当时天涯论坛、搜狐网、腾讯论坛、博客成为最庞大的兴趣社交内容平台。

阶段二:移动互联网时代——错失流量入口,业务增长陷入瓶颈。2012年12月,国内4G牌照发布,上网设备革新,用户流量逐渐进入手机端,公司在互联网的竞争过程中逐渐掉队,未能抓住移动时代流量。进入移动互联网时代,腾讯发布微信,阿里发布手机淘宝,移动互联网的APP生态使得搜索引擎为流量入口的效果大幅减弱。移动互联网时代公司多方位布局寻求破局机会,但未能赶上发展浪潮。2012年竞购高德地图失败,成立LBS事业部、获得爱奇艺控股权益,布局视频业务。2013年收购91无线,2014年收购百度糯米,收购糯米布局o2o、发布百度钱包打通生态、收购传课网,布局教育2015年分别投资Uber、携程,推出百信银行、成立移动医疗事业部,多领域布局,但并未见明显成效,我们认为公司在移动端时代竞争力下降的原因在于:

1)布局落后,马太效应导致未能抓住流量入口,公司2012年的核心业务布局点仍然处于PC侧,并且发力重点仍在于基于搜索引擎的营销工具和产品的升级,在移动互联网爆发前夕未像BAT其他两家提早布局移动生态,布局各项移动端业务时已经落后于腾讯及阿里。2)搜索在移动端重要性下降。PC时代,互联网公司的服务大多通过网页进行提供,公司的搜索引擎成为核心流量入口,而移动时代的APP生态使得用户的具体需求分散至各个垂类平台,垂类平台内各自形成自己的生态闭环,对网页导流的需求降低,搜索在移动端的重要性走弱。

3)移动互联网时代比拼的更加是商业模式,公司技术方面的核心优势难以体现。公司以技术见长,本质观念落实在效率、能力上的提升。移动互联网时代核心是抓住C端流量的时间,而公司的搜索业务以效率为核心,搜索后未能有好的产品衔接形成生态闭环,基于搜索去做外延产品的能力较弱,难以抢占用户的使用时间。公司在移动应用领域的布局更类似PC端的移植,并未基于移动时代碎片化时间及相关交互模式开发出诸如短视频等业务的创新性应用。

阶段三:AI+时代——拥有AI全栈底座,有望在此浪潮中突围。传统移动端业务动力不足的情况下,公司以AI为切入点破局,重新调整战略重心。2013年成立深度学习研究院;2016年9月百度AI大脑面世、推出医疗大脑进军智能医疗;2017年月4推出Apollo自动驾驶平台,同年7月发布DUEROS布局智能驾驶。2018年公司成立智能事业生活群组、发布智能小程序平台、小度智能音箱,扩展智能家居场景。2019年发布飞浆深度学习平台夯实底层AI能力。

目前公司AI布局已初具成效:2021年ApolloRobotaxi于北京、上海、长沙多地开放试运营,2022年7月百度世界大会发布无方向盘无人车ApolloRT6,具备L4无人驾驶能力,可应对复杂城市道路。2023年3月发布文心一言大模型,成为中国首个Chat类聊天AI,截至目前超过650家企业宣布接入文心一言,在AI+浪潮中,流量入口有望重塑,公司有望获取先发优势。

1.3、公司技术底蕴深厚,AI时代有望占得先机

公司早期起家依靠搜索引擎的高技术壁垒占据市场,CEO李彦宏为技术出身也使得公司对技术更为注重,研发投入上维持高占比。在人员构成方面:研发人员占据公司主要组成部分,目前,公司研发人员数量占比超60%。研发费用端:持续投入,近年来同比增速较快,22年受降本增效人员裁减研发费用绝对值有所降低。公司近3年研发费用率分别达到20%/19%/19%,高于其他国内头部互联网公司。

公司技术底蕴深厚,AI技术方面布局长达13年。早在确立AI转型之前,公司在NLP、机器翻译、语音、图像、知识图谱、机器学习等技术方面就已经具备世界前列水准。公司2010年1月开始探索人工智能,同年10月在掌上百度上线语音搜索。2012年11月公司上线了第一款基于DNN的汉语语音搜索系统,成为最早采用DNN技术进行商业语音服务的公司之一。2013年,成立了深度学习研究院(IDL),专注于开发深度学习算法。2015年,公司的语音识别软件实现了97%的准确率,取得汉语语音识别技术重大突破。领先的布局+深厚底蕴让公司在AI竞争时代具备技术核心优势。根据《中国人工智能专利技术分析报告(2022)》,公司以16754件AI专利申请量、5705件专利授权量位居国内榜首,覆盖城市、交通、医疗、金融、工业、农业、教育等细分垂直行业。我们认为AI时代流量入口或重新洗牌,公司凭借技术优势有望重新塑造行业地位,抢占发展先机。

二、全栈布局AI打造第二增长曲线,“AI+”时代具备竞争优势

2.1、AI布局全面,长期技术积累+全栈自研能力有望取得先发优势

公司的百度AI大底座是国内首个全栈自研的AI基础设施,在“芯片-框架-大模型-垂直行业解决方案”拥有全栈布局。一方面AI布局底层架构的构建需要资金和时间积累,公司自2010年开始就布局,拥有长时间积累下的技术和底层资源;另一方面自研架构下底层和上层设施的耦合度相对较好,公司从芯片到行业解决方案的智能化闭环路径能够上承应用下接底座,使公司基础云业务与AI应用更为契合,实现端到端的优化。我们认为无论是AI还是云服务市场都具备“飞轮效应”,公司在技术层面的提前布局一方面让公司AI模型发布层面具备先发优势,另一方面B端行业用户也会更倾向于技术架构更为完整的科技公司,领先构建垂直行业生态的同时,也可通过行业数据反哺模型训练,形成良性循环。公司的AI布局主要包括基础层、技术层和应用层3个层面:基础层:以昆仑芯片为AI计算的核心,百度百舸AI异构计算平台提供包含计算(百度太行)、存储(百度沧海)、加速、容器四大IAAS层核心套件赋能AI底层架构。

中台技术层:以百度PaddlePaddle深度学习框架+文心大模型为核心,能够实现从数据准备、AI模型训练、生产、部署、测试的全链路、批量化生产。应用层:依靠公司十余年积累的行业数据,面向金融、能源、互联网、教育、运营商、制造、政府等行业提供垂直行业解决方案。

公司坚持“云智一体”战略,有助于后续云与AI商业化落地。组织架构上的统一有助于推动云与AI商业化落地:对标海外公司,微软2017年成立CloudAI平台部,2018年旗下资深副总裁级科学家及相关团队调任微软云体系,推动AI和云加速融合,同时微软云改名为微软云与人工智能事业部,在此之后微软云收入、AI影响力逐年上升。2020年5月公司将ACG(百度云)、AIG、TG(基础技术体系),整合为“百度人工智能体系”(AIG),由王海峰统一负责,自2020年至2022年,实现了“云智一体1.0”至“云智一体3.0”的进化。

2.2、AI大底座之飞浆PaddlePaddle:国内首个自研开源深度学习框架,迭代速度位居国内前列

PaddlePaddle为国内首个自研开源深度学习平台,助力公司构建AI生态。深度学习框架作为PASS层中台,上承行业应用,下接底层芯片架构,是智能时代的操作系统,降低了AI开发难度,开发者可通过其各种接口调取相应能力从而提升开发效率。

PaddlePaddle于2016年发布,最初用于促进公司内部机器学习和深度学习的应用和研究。自2017年开始,PaddlePaddle开源,并成为国内首个产业级深度学习平台,平台集工具组件、端到端开发套件、基础模型生态系统、核心框架于一体:核心框架涵盖开发、训练推理部署等细分领域,具备大规模分布式训练技术及产业级数据处理等训练,以及端边云深度优化的高性能推理能力。基础模型库包含经典的自然语言PaddleNLP、计算机视觉PaddleCV、语音技术PaddleSpeech和推荐技术PaddleRec及文心大模型。端到端开发套件则包括语义理解、图像分类、目标检测等开发套件。工具与组件包括强化学习、联邦学习、图神经网络,科学计算、量子机器学习、生物计算的工具组件及预训练模型应用工具、全流程开发工具、可视化分析工具以及安全隐私工具、资源管理与调度等等,能够让科技工作者和开发者简洁快速地进行技术创新和应用实践。公司的PaddlePaddle自发布以来经过多次版本迭代,目前底层搭建完备,具备良好的开发者和企业应用生态。截至2022Q4,平台上模型创造数量超过67万,开发者累计数量超过535万,使用企业数量超过20万。

PaddlePaddle在Github使用人数、贡献者人数和技术迭代速度上国内大幅领先,仅次于海外一线平台Pytorch和TensorFlow。根据《2022深度学习平台发展报告》,近年来飞浆平台发展增速加快,2022年贡献人数增速达60.80%,关注度增速37.60%,超过国内外其他平台,有望进一步缩短与国外头部深度学习框架差距。目前生态完善,使用率位居国内第一,根据信通院数据,截至2022年12月,百度飞桨已经成为中国深度学习市场应用规模第一的深度学习框架和赋能平台,汇聚535万开发者,服务20万家企事业单位,基于飞桨构建了67万个模型。

2.3、AI大底座之文心大模型:涵盖四大行业基础模型及垂直细分领域,降低AI应用开发者门槛

文心平台利用公司自研的深度学习平台飞桨打造,提供AI大模型与行业大模型,开发平台与开发工具,产品与社区等一站式AI开发服务。旗下“文心一言”作为国内首款正式发布的生成式语言大模型,拥有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等功能。

百度文心ERNIE最早源于2013年公司推出的神经网络语义匹配技术,其最初被用于改进搜索结果相关性,经过内部锤炼后对外开放。最早以公司核心技术的NLP模型为主,2019年先后发布1.0及2.0版本,2.0版本基于持续学习的语义理解预训练框架,使用多任务学习增量式构建预训练任务,在模型的效果上超越Bert。随后不断向外延展至各大AI基础领域和垂直行业(例如2021年5月开源的多粒度语言知识增强模型ERNIEGram、长文本理解模型ERNIE-Doc、融合场景图知识的跨模态理解模型ERNIE-ViL、语言与视觉一体的模型ERNIE-UNIMO等)并最终形成了目前AIPAAS文心平台架构。

文心大模型体系提供包括NLP、CV、跨模态、生物计算等四大AI核心应用领域的基础大模型及各细分垂直行业模型:文心NLP模型:是公司的核心AI技术领域,应用于语言理解、语言生成等NLP场景,具备超强语言理解能力以及对话生成、文学创作等能力,在不同垂类功能场景上布局不同侧重功能点语言大模型:1)PLATO:主要侧重人机对话领域,具备全球领先的开放域对话大模型,具备多轮流畅的聊天能力。2021年9月,公司发布了PLATO-XL,为全球首个百亿参数的中/英对话大模型。2)ERINE-Search:侧重开放域搜索领域,基于预训练语言模型(PLM)的神经检索模型,并创新性地引入自动态蒸馏方法和结合级联蒸馏过程,提高了双编码器作为检索器的有效性。

3)ERNIE-M:侧重跨语言领域场景,通过对96门语言的学习,使得一个模型能同时理解96种语言,该项技术在5类典型跨语言理解任务上刷新世界最好效果。4)ERINE-Code:侧重于自然语言代码生成,具备跨多种自然语言和编程语言的语义理解和生成能力。在代码生成任务、代码搜索任务,多语言代码摘要和代码文档翻译等多个公开的评估基准上取得领先效果。

5)ERINE3.0Zeus:综合开放问答、信息抽取、情感分析、语义匹配等各类NLP任务能力,是百度文心旗下最先进的千亿参数自然语言大模型,提出了层次化提示(Prompt)学习技术,将百余种不同的场景任务统一为自然语言形式,进一步提升下游任务建模能力。模型在文本分类、匹配、推理、识别、分析、生成等多个领域的领小样本/零样本学习能力领先行业其他大模型。6)ERINE3.0Tiny:ERINE3.0的轻量级版本,通过模型裁剪、量化感知训练、Embedding量化等压缩方案,在保持模型精度不降的情况下,完成模型的推理加速、内占用降低、体积缩小,将大模型由原先的GPU场景下放至CPU场景,拓宽应用面。

文心CV大模型:主要基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一站式应用服务。文心VIMER-UFO2.0是文心旗下目前最先进的统一任务大模型,主要应用场景为智慧城市。整体具备包含170亿参数,多个任务的数据训练一个功能强大的通用模型,可被直接应用于处理人脸、人体、车辆、商品、食物细粒度分类等20+CV基础任务。模型首创针对视觉多任务的超网络与训练方案,支持各类任务、各类硬件的灵活部署,在解决子任务过程中无需调用全体神经网络,而只需抽取部分节点,而抽取的单任务模型只包含6亿参数,基于单任务模型抽取的芯片级模型参数量可进一步降低到1亿规模模型,大大减少计算量,加速比近30倍。

其余VIMER-CAE、VIMER-StrucTexT2.0、VIMER-UMS分别覆盖图像分类、图像监测、分割;OCR文字识别;商品识别零售快消等其他行业常用场景,整体布局完善。

文心跨模态大模型:基于知识增强的跨模态语义理解,实现跨模态检索、图文生成、图片文档的信息抽取等应用的快速搭建,帮助产业智能化转型。旗下最先进的模型ERNIEViLG2.0:应用场景为图像生成、艺术创作、虚拟现实、AI辅助设计。采用基于知识增强算法的混合降噪专家建模,是全球首个知识增强的AI作画大模型,在文本生成图像上超越了StableDiffusion、DALL-E2等模型,取得了当前该领域的世界最好效果,并在语义可控性、图像清晰度、中国文化理解等方面展现出了显著优势。旗下剩余的ERINE-VIL、ERINE-LAYOUT、ERINE-Layout、ERINE-SAT、ERINE则分别覆盖视觉、文档、语音、地理等多个跨模态垂直领域。

文心生物计算大模型:融合自监督和多任务学习,并将生物领域研究对象的特性融入模型,构建面向化合物分子、蛋白分子的生物计算领域预训练模型。HelixGEM-2、HelixFold-Single-HelixFold分别应用于小分子药物研发、蛋白质结构预测等细分领域,赋能医药场景。文心行业大模型:文心官方与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设的行业AI基础设施。目前文心官方共发布11款行业大模型,涵盖能源、金融、航天、传媒、城市、社科、电影8个行业垂直领域。

目前国内大模型市场中,文心一言在产品能力、生态能力、应用能力上表现突出,属于第一梯队,下游应用厂商相继接入后续有助于其完善AI应用生态。2023年3月,公司ChatAI机器人“文心一言”发布,截至目前已有超过650位生态合作伙伴宣布接入,涵盖传媒、互联网、金融、消费、教育、求职、营销、生物、文物、能源、光电等多个行业垂直场景,有望丰富公司AI生态合作伙伴,拓宽AI赋能的行业场景。

2.4、AI大底座之昆仑芯:生成式AI催生算力需求,昆仑芯适合多种AI场景

生成式AI催生较大的算力需求。芯片在AI中主要用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。部署在云端的AI芯片,注重算力、扩展能力,以及它对现有基础设施的兼容性,移动端的AI芯片则更为注重低功耗、低延时、低成本。

公司较早布局AI芯片研发,目前已推出相对成熟的二代产品。2011年公司开始布局FPGAAI加速芯片,2017年发布昆仑芯XPU架构。目前芯片产品历经成熟迭代,首款昆仑芯一代2018年7月发布,并于2020年量产,目前在用的昆仑芯二代,采用7nm架构,配备GDDR6高速显存,内存带宽可达512GB/s,采用新一代昆仑芯XPU-R架构,通用性和性能显著提升,可提供256TOPS@INT8以及128TFLOPS@FP16,功能上支持虚拟化、芯片间互联、视频编解码等完备功能,性能上相较昆仑芯一代上提升2-3倍。目前昆仑芯与产业链上下游已经逐步构建起软硬一体化的AI芯片生态,产品已经与百度飞桨、PyTorch、TensorFlow等主流框架和服务器完成适配。

昆仑芯在提升AI经典负载性能和算法性能加速能力较好。根据百度昆仑官网数据,以推理场景中的吞吐率为例:在应对当前常见深度学习算法GENM和ResNet-50、Bert、Yolov5上表现不俗,对典型AI的负载性能提升在1.6倍左右。昆仑芯在公司搜索业务上已有较多部署,适用于大多数AI落地场景,并与飞桨PaddlePaddle共建生态。过往3年昆仑芯在公司搜索业务持续上量,在推理领域部署的比例远超50%。公司在Encoder和Decoding的优化技术已经沉淀为重要基建,并把Transformer相关的优化技术沉淀出来跟飞桨PaddlePaddle做全面整合,融入飞桨PaddlePaddle生态。公司的商业、飞桨和昆仑芯通力合作,能更早深入理解新的AI场景,并设计出有竞争力的软硬件产品,持续保持竞争力。

2.5、大模型在公司生态内具备落地场景,有望加速云智一体化变现进程

公司传统业务搜索引擎以及新兴业务智能驾驶、智能云、智能硬件等均为大模型实际应用落地场景,一方面大模型的开发可以最先应用于公司内部产品应用,另一方面公司产品的应用将对大模型后续开发和应用思路形成指导作用,在此基础上不断迭代优化,吸引更多生态伙伴。

随着文心一言通过百度智能云对外提供服务,云智一体的行业新格局有望重塑:通过云计算与人工智能(AI)的融合创新,打造智能基础设施和通用AI产品,降低企业获取和使用AI的门槛。过去云厂商格局上AI与云普遍处于两个不同体系,售卖计算、存储等资源型产品是主要商业模式,而当前背景下:云计算与AI模型深度融合,AI模型与底层架构整体配置耦合度更强,更受企业的青睐。我们认为云智一体化的有望推进将算力、框架、模型,场景应用融合打造为标准产品,云业务格局有望从IAAS层、PAAS层转向MASS层(模型及服务)。

行业布局上:公司通过实践中积累起来的解决方案,覆盖工业、金融、能源、智慧城市、数字人等各成熟垂类行业。22年9月智能经济高峰论坛上,行业垂直应用再度升级:首次发布汽车云,从车企集团云、网联云、供应链协同云,解决汽车行业生产、自动驾驶测试、供应链管理三大数字化应用难题。中国销量前15的车厂,百度智能云客户占比10家,头部新能源车企服务5家。在产业金融方面,公司智能云推出产业数字金融方案,涵盖普惠金融、绿色金融、农业金融,支持全行业跨越“数字鸿沟”。未来云业务的核心竞争力将由模型能力、框架架构、底层芯片及顶层垂直应用的协同能力共同决定,公司依托其自研全栈AI架构有望占得生态布局先机。

三、大模型赋能搜索业务升级,搜索有望再度成为流量入口

3.1、搜索引擎龙头,应用ChatGPT或可带动公司流量回拢

公司的搜索引擎国内处于龙头地位,市占率长期保持高位,但移动互联网中不同内容和服务供给形式使得搜索引擎的广告变现能力有所减弱。根据Statcounter,自Google退出中国市场后,百度搜索引擎国内市场市占率始终保持第一,但步入移动互联网时代后,短视频、电商、社交等不同类型生态聚拢用户流量,抢占用户使用时长,根据国金指数,百度系APP用户使用时长占比从2019年9.1%降至2023年的6.5%。在此情况下广告主预算发生一定转移,使得搜索广告市场份额持续收窄,根据中关村在线营销数据,搜索广告的市场份额已从2018年的21%,降至2022年的不足10%。公司在线营销业务主要依赖于公司的搜索引擎,在搜索广告被抢占市场份额及近两年疫情情况下公司在线营销业务陷入负增长。

ChatGPT提升人机交互体验,或可帮助公司回拢流量,提升市场份额。ChatGPT上线后,仅用2个月时间月活跃用户数就实现破亿,根据SimilarWeb,2023年1~3月,http://chat.openai.com网站流量实现快速增长,3月浏览量环比增长56%。

2月7日,微软推出由ChatGPT加持的NewBing后,根据数据统计机构data.ai,截至2月9日,Bing应用程序的全球下载量增长10倍,申请用户数量超过百万并位列AppStore最受欢迎的免费应用榜的第十名,日活用户突破1亿人,与此同时谷歌搜索页面访问量则下降1%,搜索应用下载量减少2%。根据Statcounter,2023年3月Bing的搜索引擎国内市场份额也出现明显提升。3月29日,谷歌宣布正式开放生成式AIBard的Beta测试版,首先将面向美国和英国地区启动。我们认为ChatGPT有望重塑流量入口格局,而搜索引擎或最先受到影响,若公司不跟随ChatGPT浪潮与搜索引擎结合,则其市场优势地位可能会受到挑战,若公司将ChatGPT与搜索引擎业务相结合并探索出新的服务提供方式,则有望帮助公司获取用户流量和使用时长,抓住成为新一代流量入口的机会。

3.2、“生成式AI+Plugin”或可打破搜索引擎仅B端付费的商业模式,实现B+C付费

目前公司的搜索引擎客户为各行业广告主,C端免费使用通过B端广告变现。公司的P4P服务链接广告主与搜索用户,广告主付费后主要通过竞价排名的方式向搜索用户展示其广告,在此过程中,搜索用户免费使用搜索引擎,付费者为广告主。

生成式AI的生成能力+Plugin或可延长用户对搜索引擎的使用时间,形成“搜索+答案+聊天+创造/转化”生态,从而突破搜索引擎以往仅B端付费的商业模式,探索出“B+C”付费模式。过往用户使用搜索引擎从搜索需求出发,当搜索到所需信息后仍需跳转到其他应用来实现进一步需求,而生成式AI在理解用户需求后,除了帮助用户生成相关回答、内容外,还可以接入第三方应用从而满足用户的最终需求。我们认为一方面ChatGPT与搜索引擎结合或能催生以下变现场景:1)为搜索引擎提供新的广告形式,如在对话框下方加入精准广告推荐;2)向接入Plugin的第三方应用收取渠道费用;3)向C端收取订阅制会员收费或按服务类型收费,以获取更高的使用权限,如更快的响应速度、更丰富的生成内容。

3.3、带动搜索引擎效果优化,关联查询更加精准

AI+搜索引擎使得搜索引擎对用户需求更具理解力,从而提供更为精确的查询结果。AI大模型经过大量数据训练,具备了较强的泛用语义理解能力,能够更好地理解用户的问题,传统搜索引擎主要通过“关键词”、“近义词”匹配和简单逻辑判断来呈现搜索结果,不具备对问题的理解能力。

四、大模型赋能智能驾驶业务,有望助力公司在智能驾驶领域保持优势地位

4.1、行业发展迅速,大模型有望加速L4级别自动驾驶商业化落地

自动驾驶的推进的依靠AI技术、芯片算力、感知技术及配套设施,近年来随核心技术与基建完善,整体市场目前增速发展。自动驾驶技术水平根据自动化水平从0~5级共分为6个层级,目前较多车企已具备L1、L2的技术积累,能够将其应用于汽车生产并量产,L3级别的自动驾驶也在部分新型车企和部分老牌车企的部分车型中有所应用,大模型能够在感知技术、数据挖掘与标注方面推动更高级别自动驾驶商业化的落地。

自动驾驶行业快速发展,L2级别自动驾驶渗透率迅速提升,后续L3/L4渗透率有望加速提升。自2021年开始,行业增长加速,根据艾媒咨询,2025年无人驾驶汽车规模将达到267.6亿元,自动驾驶整体渗透率有望达34.2%。细分层级来看,需要人工辅助驾驶的L2级别自动驾驶,在芯片算力、AI技术和感知技术上的要求更低,目前方案更为成熟,渗透率已经较高,未来对技术要求更高的L3/L4级别自动驾驶将是竞争关键。

4.2、公司智能驾驶软硬一体布局,通过Apollo开放平台形成智能驾驶生态

公司自2017年开始宣布Apollo开放计划,Apollo是公司的自动驾驶开放平台,能够帮助汽车行业及自动驾驶领域的合作伙伴结合车辆和硬件系统,快速搭建一套属于自己的自动驾驶系统,公司将自身自动驾驶技术和数据开放给业界,旨在建立一个以合作为中心的生态体系,发挥公司在人工智能领域的技术优势,为合作伙伴赋能,共同促进自动驾驶产业的发展和创新。目前Apollo已成为全球最活跃的自动驾驶开放平台,开源代码数量超过75万行,覆盖超过165个国家、拥有超过220个生态伙伴、10万个开发者。

自研技术沉淀至Apollo开放平台,8.0版本更加生态友好。主要分为3个阶段:1)第一阶段:从1.0封闭场地循迹自动驾驶到2.0的简单城市路况,Apollo搭建了基础的自动驾驶基础能力;2)第二阶段:从2.5限定区域视觉高速到6.0EDU的教育专版,Apollo积累了丰富的场景能力;3)第三阶段:从7.0开始,Apollo专注提升工程易用性,从开发者实际需求出发,帮助更多开发者更好更快的使用Apollo。当前的8.0版本由硬件设备平台、软件核心平台、软件应用平台和云端服务平台四层组成,能够帮助开发者从0到1快速部署自动驾驶系统。

公司的优势在于智能驾驶布局全面、市场布局早、自研造车方案成熟三大方面:1)智能驾驶布局:公司在自动驾驶汽车布局追求软硬件服务一体化,打造“基建-车-出行”完整体系,涵盖算法模型、AI基础设施、量产车、高精地图、V2X自动驾驶全面能力。基建:以百度智能云为代表,打造“端+云+内容”的车联网平台。车:包括智能车舱和整车体系,其中智能车舱涵盖智能助手(小度语音OS、百度地图,),智能驾驶(自动驾驶平台萝卜快跑、解决方案Minibus、技术MASS,泊车AVP端,行车ANP端)以及智慧交通引擎(百度ACE智慧交通方案)。出行:主要基于ApolloRobotaxi(无人自动驾驶出租队)开展应用。

2)布局较早:先发优势明显,在数据、经验和生态伙伴积累上具备优势。2013年百度开始研发自动驾驶技术,2017年宣布Apollo计划,出行上:全无人自动驾驶出行服务广受好评的同时规模快速增长。根据公司公告,百度自动驾驶出行服务平台萝卜快跑累计订单量已超200万,APP用户满意度评价达4.9分,其中5分满分好评占比高达94.19%。车企合作上:汽车智能化解决方案已在30+个汽车品牌的130+车型上实现量产,累计搭载超700万辆。3)自研造车方案成熟:目前百度Apollo汽车进行了多轮迭代,目前最新产品为第六代量产无人车ApolloRT6,作为全球第一款量产的无方向盘的自动驾驶车,ApolloRT6实现了100%车规级和整车全冗余系统,成本为行业的十分之一。

公司于4月16日发布城市智能驾驶产品ApolloCityDriveMax,搭载轻量级地图产品,整体内存占比低于传统高精地图近80%,形成覆盖“驾-舱-图”的完整自动驾驶链路。驾驶:四大方案涵盖高速、城市、泊车多垂直场景;座舱:小度车载OS作为整包方案,能快速搭载量产,小度语音SDK则基于大模型本地化部署,能实现全时全双工、百毫秒级响应。地图:车载导航地图、人机共驾地图、高精地图分别应对不同自动驾驶场景,满足产品差异化需求。行泊一体产品ApolloHighwayDrivingPro完成产品升级,能在更低算力、更低成本条件下实现更高阶的行泊一体功能。

4.3、大模型应用有望赋能自动驾驶业务,感知和数据挖掘有望受益

大模型落地有望从技术能力上提升公司业务竞争力。目前自动驾驶的核心技术依次可以分为环境感知、决策规划和控制三大部分,文心大模型的应用有望感知、决策、路径规划方面做出优化。感知侧:提升远视距感知能力。

公司感知系统历经三层次迭代:1.0版本主要以激光雷达点云感知,2.0版本增加了环视图像感知,与激光雷达点云感知形成了两层的感知融合。3.0版本自研了毫米波点云感知算法,形成了三层感知的融合,而传感器融合是实现L4自动驾驶的必要条件,其一大行业痛点在基于不规则条件下的感知、标注和数据挖掘。针对感知和数据标注,公司利用文心大模型自动驾驶感知的技术,来提升车载小模型的感知能力。感知需要标注大量的数据,2D标注数据通常容易获得,3D标注数据难求,公司采用迭代的自训练方案,充分利用2D标注数据和3D非标注数据,提升训练效率能力,新模型的效果在感知、预测车辆的距离等方面提升明显。

长尾数据挖掘:基于弱监督训练挖掘长尾数据提升训练效果。大模型可以实现直接通过文本进行挖掘,将物品输入至文本编码器形成一个文本特征向量,然后通过快速的向量搜索算法,在底库里面很快找到可能是该物品的图像出来,找到物品图像后可以把图像输入到图像编码器里面抽取视觉表征,然后类似的进行向量搜索。随着搜索增加带来的回传图像数量增加,可以训练fineclassifier完成进一步筛选,最终不断地提升数据挖掘的效果。公司发布的文心大模型-图文弱监督预训练模型,背靠文心图文大模型数千种物体识别能力,大幅扩充自动驾驶语义识别数据,针对少见的异型车、各色行人、低矮物体及交通施工元素,提升识别能力。

路径规划方面:以百度地图为核心,大模型的应用有望提升规划效率及用户体验。目前公司已发布文心交通大模型,创新性地将Transformer应用在交通领域将时序与交通道路拓扑结合,构造了大量的交通规律学习任务,泛化大模型的使用场景,总体提升通行效率达15%-30%。具备生成式AI具备跨模态、跨语言的深度语义理解与生成能力,降低百度地图用户的时间成本约70%。文心交通大模型依托北斗高精实时接入空余车位、空余充电桩、交通信号灯等动态信息,实时更新路径规划,提高用户体验感。目前,文心交通大模型车位覆盖破百万,车位级导航平均节省76.9%的找车位时间,全国新能源充电桩覆盖率超99%,红绿灯覆盖率超95%,助力全国35座城重点路口平均等灯时间下降约10%。

  1. 盈利预测

我们预计公司2023、2024、2025年营收分别为1370、1518、1670亿元,其中百度核心业务部门营收为1059、1183、1321亿元,爱奇艺业务部门营收318、342、357亿元。

1)百度核心部门:在线营销仍然将占据将作为公司主要的营收驱动力,过往几年由于疫情影响在线营销收入存在较大波动,预计2023年随疫情好转,广告主广告预算增加,公司在线营销业务将回归正增长,由于短视频广告目前在互联网广告中占比逐渐增加,预计公司以搜索为主的广告形式增速短期仍将维持在较低水平,随生成式AI带动的流量聚拢效应及新的广告变现模式影响,广告营销在后续有望收益。未来公司核心业务重心将向云业务转移,AI驱动的业务收入占比将持续增高,预计2023年云服务收入增速加快,疫情好转将推动以ToB业务模式为主的项目落地加速,大模型等新技术对算力需求增加、各行业AI渗透率的提升将带动云业务增长,此外自动驾驶、智慧交通的快速发展将拉动云业务的快速增长。

2)爱奇艺分部:预计后续驱动主要来自于会员费提价和广告收入,目前公司会员数量较为稳定,预计后续会员收入增长主要由提价驱动;随宏观经济市场回暖,广告主整体投放意愿及预算提升,广告大盘有望整体收益,长视频广告增速可能低于行业增速。爱奇艺是目前为国内三家头部长视频平台之一,主要营收来源为提供会员增值服务,近年来商业化进程加速。2020年至今:2020年11月、2021年12月、2022年12月,爱奇艺连续三年调整会员费用,连续包月价格从每月15元增长至25元。长视频平台竞争的核心在于内容的丰富度和独有性,根据云合数据《2022年连续有效播放榜单》:有效播放榜单前20剧集中爱奇艺拥有14个的播放权,其中作为独播平台的数量为9个,优质内容带动公司22Q4订阅会员净增1100万,同比+15%,创历史新高。

毛利率:我们预计公司2022、2023、2024年毛利率分别为49.91%,51.19%,52.18%,毛利率提升原因主要是1)公司将长期践行“降本增效”政策,以基本盘移动生态系统继续产生强劲现金流,为智能云及智能驾驶业务的投入提供资金,智能云及智能驾驶业务后续变现能力增强将带动毛利率优化;2)爱奇艺分部:公司近年自制剧集能力凸显,输出的爆款内容原创占比较高,自2022Q1以来平台自制内容账面净值占整个影视剧净值比例皆保持在60%以上,平台2022H2上线的《苍兰诀》《罚罪》《卿卿日常》《风吹半夏》《回来的女儿》皆为爆款自制剧集。

经营费用:预计随疫情回暖业务开展,公司销售及管理费用将有所增加,但在坚持降本增效前提下,预计销售及管理费用率水平低于2021年,我们预计公司2022、2023、2024年销售及管理费用率分别为17.18%,17.56%,17.63%;公司为研发驱动型,研发投入稳步提升,在降本增效大背景下其研发投入仅有少量收缩,预计在业务回暖、大模型等新技术开发下,公司研发投入将有所增加,我们预计公司2022、2023、2024年研发费用率分别为18.72%,18.28%,18.19%。根据以上假设,我们预计公司2023~2025年净利润分别为151、186、219亿元,NONGAAP净利润分别为224、255、292亿元。百度核心净利润分别为137、163、188亿元,爱奇艺净利润分别为15、23、30亿元。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】

顶一下
(0)
0%
踩一下
(0)
0%
相关评论
我要评论
用户名: 验证码:点击我更换图片
热门图文