轻松看懂饼多大、水多深
组委会 发自 凹非寺
非常AI | 公众号 QbitAI
是时候给出一份全面的洞察结果了——
行业首份AIGC产业全景报告,主打硬核干货,它来了!
2023年,被称作ChatGPT元年,ChatGPT现世至今,AIGC这把火彻底点燃了全世界。
巨头们卡着对手的时间点,争相发布新产品,ChatGPT自身在推出2个月后,月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序,必应也在接入GPT能力后日活突破1亿;行业大牛们则亲自下场,纷纷离职创业,激战AIGC。
由比尔盖茨口中“此生所见两项最具革命性的技术之一”引爆,AIGC让人梦回20年前互联网最令人兴奋的时刻。
发展到如今,AIGC的规模到底有多大?水有多深?里面能容纳多少玩家?谁能笑到最后?
非常AI今日举办的中国AIGC产业峰会,就重点发布了这样一份《中国AIGC产业全景报告》,帮助大家揭开这些问题的谜底。
这份由非常AI智库深入调研后发布的报告中,全面立体地回答了这些问题:
- 大模型与AIGC催生的内容生产与交互范式,会带来多大的市场机遇?
- 产学研界接连入局,可以抓住的赛道部署机会有哪些?
- 对不同行业而言,狂飙的AIGC产业将掀起什么样的变革?
- ……
此外,报告还提名了这条崭新赛道上实力强劲的玩家——“中国AIGC 50”,让市场看到值得关注与支持的AIGC优秀机构,以及它们背后的无限可能。
具体细节,我们翻开来看。
市场有多大?
170亿人民币。
这还只是2023年,非常AI智库预测,到2030年,AIGC市场规模将达到1.15万亿元规模。
为何做出这样的判断?让我们遵循第一性原理,从AIGC的概念说起。
AIGC全称为AI-Generated Content,指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻找规律,并通过释放泛化能力生成相关技术的内容。
进一步理解时,AIGC有狭义和广义概念之分。
狭义的AIGC与普通用户更为贴近,更关注图像、文本、音频、视频等内容生成,和Generative AI(生成式AI) 、Synthetic media(合成式媒体)等概念类似。
论广义概念,还包含策略生成(如Game AI中游戏策略生成)、代码生成(GitHub Copilot)、蛋白质结构生成等。
基于此,结合行业关键场景和玩家分布情况,目前,我国还处于AIGC发展的初期阶段,竞争趋势不明显,需要调整开发、资金等投入,寻求整体生态的快速搭建。
至2030年,AIGC产业发展共分三个阶段:
1、培育摸索期(2023-2025):整体均处于业务场景验证和变现探索期。
底层大模型发展加速,中间层尚未出现相关玩家,基于Stable Diffusion等开源模型的上层应用迅速出现,但受底层大模型接口限制,大部分技术尚未达到稳定进入实际生产环节的水平。
2、应用蓬勃期(2025-2027):基本价值创作路径和技术思路得到确认。
行业普遍尝试应用人机共创,且内容资讯、娱乐传媒等领域利用AIGC产生确定性价值。这一时期,底层大模型和中间层模型主要玩家基本确定,开放API增加,整体入局玩家增多,尤其是大量应用层玩家。
3、整体加速期(2028-2030):产业生态完善。
报告指出,2028年往后,AIGC在个性化、实时化、自主迭代等方向上的延展价值得到充分发挥,和其他业务系统进行紧密连接,会有相关初创公司产生完整解决方案。这一阶段AIGC成为内容领域基础设施,预计会催生出完全不同的新业态。
截至报告发布,国外AIGC赛道已有8家独角兽公司。
其中,推出了ChatGPT的OpenAI估值高达200亿美元,其次是Hugging Face 20亿美元。最新一家独角兽是成立16个月的Character.AI,估值10亿美元。此外,名单中还有Lightricks(18亿美元),Jasper(15亿美元),Glean和Stability AI(均为10亿美元),以及Anthropic(3亿美元)。
2022年以来,我国AIGC赛道出现了10余笔投资,其中融资体量最大的水上项目包括小冰公司(10亿元)、超参数科技、智谱AI、澜舟科技等。其余公司,包括数字力场、Tiamat、聆心智能、西湖心辰、深氧科技等,大多为数千万人民币级别融资。
然而,国内尚未看到与国外AIGC独角兽公司相匹配的收入产生。但经过对投资机构的广泛调研,多家机构已高度明确要将AIGC作为主投赛道,并推出了相应的孵化项目,预计本年度融资规模将有数倍增长。
伴随底层大模型生态的逐步开放,商业价值的落地验证,预计到2024年左右,融资规模将出现首次阶段性的指数级增加。
从融资现状来看,全球AIGC赛道持续走热,如何跑通商业模式产生实际营收,成为市场另一个关注焦点。
报告细分出5种不同的营收模式:
1、MaaS(Model as Service)
适用于底层大模型和中间层进行变现,按照数据请求量和实际计算量计算。
到2027年,MaaS模式占市场规模比例将从5%增长至47%。
2、按产出内容量收费
适用于应用层变现,如按图片张数、请求计算量、模型训练次数等收费。到2027年,该模式市场规模占比将从60%下降至32%。
该模式的关键在于如何从单次好奇驱动的行为切入,保证产品长期的复购率。
整个过程会受到具体属性影响,如版权授予(支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式,拥有设计图案的版权)、是否支持商业用途(个人用途、企业使用、品牌使用等)、透明框架和分辨率等。
3、软件订阅付费
第三种模式即ChatGPT Plus现有的盈利方式之一:每月向用户收取20美元费用。该模式在现有市场占有10%左右的比例。按照这种模式,Jasper等初创企业已经产生了营收。展开来说,Jasper以类SaaS服务的形式进行收费,分为初级、高级和订制三个模式,成立当年营收额就达到4500万美元,并收获了7万名用户。
这意味着AI正以越来越显性的方式产生商业模式。国内部分领先的AIGC公司,在用户规模、内容生成量上在2022年亦快速起步,2023年开始产生营收及盈利并非难事,但能否形成SaaS订阅模式尚待观察。
4、模型训练费用
即最为传统的项目开发制度,如今占据市场营收份额的25%,到2027年,预计将有12%左右的下滑。
5、其他模式
包括广告/流量模式,依靠产品获取用户点击,从中获得广告流量,这种营收模式的关键在于产品如何获得复购。
由于属于小型项目,在市场规模测算中暂不单独考虑。
玩家有几类?
如此大的市场规模,必然也会出现大量各具所长的玩家。
在这里,报告按照基础设施层、模型层和应用层将它们分为三大类。
基础设施层
这层玩家分别为行业提供数据、算力、计算平台、模型开发训练平台以及其他配套设施。
首先,数据方面,数据的数量、在行业/领域和颗粒度上的丰富性、以及和业务之间的反馈关系都有着极高的要求。
对于预训练大模型而言,多模态的数据集至关重要,以此才能让模型学习到更加完备的表示。
另一方面,如InstructGPT的作者曾说:
研究人类反馈数据比加大模型规模更重要。
因此互动反馈数据也是报告中特别提到的一点。
该层面的玩家包括数据提供方和服务方,前者可提供通用数据、垂类数据、特定任务下的标注数据、审核数据以及创作者生态;后者则主要负责数据分拆及标注等。
其次,算力方面。
据微软统计,光是GPT-3.5在Azure AI超算基础设施上消耗的总算力就需7-8个耗资30亿美元投资规模的数据中心来支持运行。
因此算力玩家也是其中无比之重的一环,可分类为:
以智算中心为代表的算力集群商、国产芯片商以及云服务商等。
(计算平台和模型开发训练平台略。)
最后,其他配套设施方面的玩家扮演的主要是检测审核、交易撮合方、第三方确权及计价方以及创作配合工具(如渲染引擎)等方面的角色。
模型层
这层主要分为底层通用大模型和中间层模型玩家。
前者相对最容易形成壁垒,影响因素包括人才、时间、数据和资金等多个方面。
按开放模式可以分为:
(1)完全自有、不对外开放;
(2)开源,如2022年下半年起带来文生图领域蓬勃发展的CLIP及Stable Diffusion;
(3)API对外开放,这类模型的输出结果相对固定,但不同接口之间能够相互结合得到更优产出或是跨领域的产出;
(4)模型站,如Hugging Face、魔搭ModelScope。
中间层模型玩家则主打垂直化、行业化和细分化,分为:
(1)中间集成商,主要组合多个接口,形成新的大模型;
(2)行业大模型商,由底层模型持有者进行端到端提供;
(3)以及二次开发商,主要增加行业特色数据和行业认知。
根据行业/场景的理解和资源累计程度、资金成本支撑、上层数据支撑、上层应用生态、战略生态合作/投资、工程效果与技术成本以及AIGC技术能力的成熟这7个指标,报告给出了目前模型层的代表玩家名单:
应用层
如果按照基于底层逻辑的应用,这层玩家涉及的业务分别包括:
1、生产可直接消费内容
其核心是AI在创意度和规模化中提供平衡点。对UGC而言,能够降低内容创作门槛;对PGC来说,能够代替人工完成完成声音录制、图像渲染等基础性创作工作。
需要注意的是,该场景的价值主要是降本增效。
报告指出,鉴于我国的内容供给市场相对饱和,相关公司需要关注对具体场景的供需情况进行谨慎分析,确定AI对内容供给速度的提升是否具有实际意义。
2、结合底层系统,生产含有附加价值的内容
例如超个性化、实时化、行业特色化。
注意由于需要和底层系统进行配合,相关提供方需要关注上下游业务接口的打通,以及相关领域知识的深化设计。
以内容营销领域为例,AIGC并不应当作为单独的服务对外提供,还是隶属于“创意供给—内容生产—内容管理(素材库与数据库)—内容分发—数据方案”中的内容生产部分。
由于品牌主最终是以整体的广告营销效果为标准,要使AIGC最终能够得到理想效果,基础素材、营销策略设定、技术生成、评估优化、数据回流等缺一不可。
3、提供内容生产辅助工具
模式包括:
由AI提供相关创作线索或基础草图,专业人员进行细致化调整或是补充特定素材;
由AI完成特定操作性工作,比如局部特效生成、低分辨率转高分辨率等。
该类玩家需要注意四点:
(1)国内对工具类产品的付费意愿有限,尤其是C端;
(2)需要关注场景本身的工具属性,据业内人士反馈,由于AIGC目前的生成可控性相对有限,创作工具在使用中的可介入程度会严重受到专业因素的影响;
(3)需关注相关业务平台的潜在跨界竞争,这主要是因为该赛道通常与内容分发及创作平台形成强绑定,大厂在垄断性方面也更强;
(4)人才结构的转移。
4、用于提供打包内容或解决方案
接下来,如果按照基于模态的应用分类,我们可以看到分别主营以下业务的玩家:
1、文本生成,包括:
(1)直接生成应用型文本,已发展较成熟,以客服类的聊天问答、新闻撰写等为核心场景。有相关行业人士预测,到2030年,90%以上的新闻将由机器人完成;
(2)直接生成创作型文本,适用于剧情续写、营销文本等细分场景,目前在语义层次的长文本通顺上还有较大的提升空间;
(3)生成交互型文本,典型场景为智能客服/聊天机器人/虚拟伴侣/游戏中的NPC个性化交互等;
(4)文本辅助生成,是目前国内工具落地最为广泛的场景,主要包括定向采集信息素材、文本素材预处理、自动聚类去重,并根据创作者的需求提供相关素材等功能,代表公司如写作猫。
2、音频生成,包含已经相当成熟的TTS场景和音乐创作。
该业务可提高歌曲乐曲、有声书、配音等内容的创作效率,实现有声内容的规模化生产。可实现声音IP化附属价值的语音克隆也算其中的一个应用。
3、图像生成,这一领域潜力巨大。据绘画生成网站6pen,未来5年全球10%-30%的图像有望由AI生成或辅助生成。
具体场景则可分为图像属性编辑、局部生成及更改以及端到端的图像生成。
4、视频生成,包括视频自动剪辑、属性编辑、视频到视频的自动生成等。
5、跨模态生成,包括文字生成图像(也分功能性和创意性)、文字生成视频(有更高的长序列建模要求,比文生图发展得要滞后两年左右)、图像/视频到文本(跨模态搜索、视觉问答系统、配字幕、标题生成)等。
6、策略生成,主要指AI基于特定问题和场景自主提出解决方案的过程,在游戏、自动驾驶、机器人控制等领域有极高的应用价值。
报告认为,总的来看,目前整体层级尚不够完整。由于资金量的需求,预计全栈全场景端到端的玩家数量相对有限。
其中模型层成为当前关键卡口,在一定程度上限制了上下层级的发展,应用层则是创业友好度最高的部分。
不过,若能在不同层级间形成良好的生态合作关系,整个行业的快速成长和成本分摊都能获得明显好处。
具体作用到哪里?
这个问题,我们从AIGC对不同行业的变革进行分析。
首先是线上游戏行业,它目前在AIGC领域中算相对最成熟、接受度最高的部分。
其应用从前期制作到后期运营以及游戏周边内容制作的全流程中均有涉及。其中的核心生产要素为:AI Bot(游戏操作策略生成)、NPC相关生成(包括逻辑和剧情)和相关资产生成(包括地图等)。
报告认为,这一行业是目前AIGC变现最为清晰的行业。
接下来是影视传媒,由于它和内容挂钩更为直接,AIGC对这一行业的整体影响更为明显。
具体受影响的细分领域包括电影及长视频(换脸、背景渲染、广告自动植入等)、网络直播(虚拟人)、短视频(影视作品剪辑)、在线音乐(自动编曲、作曲、AI唱歌)、图片版权(AI生图、AI修图)、网络文学(小说续写)等。
内容资讯行业则不必多言,主要是在新闻写作,目前落地应用也已较成熟。
电子商务行业也会受到影响,主要来自数字人直播带货及个性化营销这两方面。
办公软件行业同样受到冲击。最具代表性的当属微软Office全家桶的Copilot功能了,它被誉为一项“重新发明生产力”的重磅更新。
除此之外,相关独角兽企业如Notion AI也表现出色,截止2022年,该公司用户已达到3000万。
最后会引起变革的行业还包括训练数据(主要集中在自动驾驶和医疗行业)、社交软件(比如用特定性格的AI NPC设定满足线上社交功能)和在线教育等。
下面是报告根据行业变革迫切度、可变革程度,以及2023年相对市场规模绘制而成的行业矩阵变革图。
产业代表案例详情可查阅报告。
附AIGC 50榜单
最后,我们也给出了最具潜力的50家AIGC机构,在AIGC这一科技趋势已成定数的今天,为大家提供进一步的参考价值。
以下是完整榜单:
报告下载
在非常AI微信公众号后台回复关键字“AIGC”,即可获得下载地址。