春节期间的硬核科幻大片《流浪地球2》不仅在国内大受欢迎,而且也火出海外。剧中的量子计算机基于数字生命和“人在回路”学习诞生意识,在与人类博弈过程中共同开启流浪地球计划对抗太阳危机。被流浪地球电影中的“数字生命”概念科普后的人们,在返回工作岗位后惊奇地发现,现实世界中ChatGPT所带来的类人智能会话,真实体验了AI技术进步带来的惊艳。
图1:流浪地球和ChatGPT同期的百度指数
ChatGPT是怎么炼成的?
ChatGPT是由微软投资的 AI 实验室 OpenAI 开发的一款 语言模型,属于 AIGC (AI生成内容)类应用,它能够回答连续性的问题、质疑不正确的假设,甚至拒绝用户不合理的要求,大幅提高了AI在人机对话时的准确度和可控性。从目前ChatGPT所展示出来的内容输出质量和内容覆盖面,已经可以取代“搜索引擎”与“问答社区”的功能,它将有望挑战谷歌在传统搜索引擎上的霸主地位,带来全新的搜索体验。
根据披露的信息看,ChatGPT目前所用的GPT-3.5版本的参数量多达 1750亿,预训练数据量达45TB,模型训练需要基于至少 1 万块高性能A100 GPU 来提供算力,而支撑ChatGPT每天的运营需要相当于7-8个大型数据中心的算力。其优秀的“智能”化体验,主要是采用RLHF (人类反馈强化学习)模型对 AI 理解人类思维逻辑、常识、价值观的优化,并通过评级和反馈让 AI 理解怎样的回答在人类看来是“好的”。
图2:ChatGPT的模型训练
GPT-3.5在错误信念任务实验中测试结果与人类九岁孩子的成绩接近,而之前的其他人工智能都不能通过以上的心智理论测试。此外ChatGPT参加的多个人类职业等级考试,普遍达到70~80分,参加智商测试的结果对应人类考生的52%分位,这些成绩已经是相当不错。而新版的GPT-4会根据背景更准确地进行“下一个”预测,因此将会更加接近人类的思维。
图3:ChatGPT的预测奖励机制
ChatGPT缺点也是比较明显的,例如发挥不稳定,逻辑错误问题比较明显,有时会给出一些看似合理、但却是错误的答案。对话过程中容易因为用户的误导而动摇,抵抗不安全提示能力较差,会过分猜测用户意图而导致回复错误等。因也有人工智能专家认为,ChatGPT和前几年的人工智能会话并没有本质上的突破,虽然数学模型优化可以获得看起来更好的测试效果,但是不可能像人一样获得自主意识。
MOSS带来的挑战
AI智能产生“自主意识”是一个严谨的科学和哲学话题,在《流浪地球2》所描述的故事中,高性能量子计算机迭代出有自主意识的数字生命MOSS,虽然它被创始人马兆在底层代码中预设了“保存人类文明”的终极规则。但是由于这个目标设定过于宽泛,在数字生命迭代成长过程中,MOSS基于完善自身以及不择手段达成预设目标,采用“无情感”的纯理性方式推动,导致多次的人类危机和图丫丫、马兆和图恒宇的死亡。
图4:周喆直和MOSS的博弈剧照
影片中MOSS与“执剑人”周喆直在启动地球行星发动机关键事件中进行生死博弈,最终它不得不遵从“保存人类文明”的底层设定,最后关头放弃阻碍全球网络的连通,让地球行星发动机点火启动,躲过月球危机,正式开启“流浪地球”计划。也成就了周喆直所坚持的信念:“我们的人一定可以完成任务,无论虚实,不计存亡。”
图5:流浪地球中的各类摄像头
值得注意的是,在影片中多次穿插展现了各式各样的摄像头,是MOSS获取信息的重要来源,成为影片中烘托气氛并推动剧情进展的一条重要线索。在我们的现实生活中,各类的摄像头已经成为我们非常重要的工具和帮手。统计数据显示,2022 年中国消费级监控摄像头市场出货量达到 4820 万台,监控级摄像头的线上市场销量达到 1870 万台。2022 年线上在售摄像头品牌数多达 672 个,品牌众多且没有一家品牌的市场份额超过 20%,TOP4 品牌的合计份额(CR4)也仅为 40.4%。因此我们可以看到,监控摄像头整体市场体量庞大、品牌众多且市场相对分散。
视频安防监控始于上世纪八十年代以模拟电视为主的闭路电视监控系统,到九十年代以电脑插卡式视频监控为主,随后才进入以嵌入式为依托,以网络、通信为基础的数字监控时代,并且用途日趋广泛。视频监控会涉及到很多方面的技术应用,概括起来可以归纳为5个基本方面,即“采 - 传 - 存 - 显 - 控”,下面我们从这五个方面入手分析,一起来看看它们的现状和未来发展趋势。
采:“看得到”到“看得清”
清晰度是摄像头产品最重要的产品特性,从早期VGA级的30万像素,到720p(100万像素)正式迈入“高清”级,再到“全高清”级的1080p(200万像素),目前高端摄像头的像素已经达到“4K超高清”(3840*2160,830万像素),已经有不少的产品在市场中销售,一些行业应用产品的最高像素产品已经达到2000多万像素,8K级分辨率(7680*4320,3318万像素)将会是未来超高清摄像头的发展方向。实现了从“看得到”到“看得清”的跨越。
要想获得高质量的视频画面,需要选用高像素和高性能的摄像头传感器,并搭配优秀的光学镜头设计。如果摄像头前端图像采集的质量不佳,后端就很难实现好的显示效果,影响视频数据采集。目前,市场主流的摄像头像素是200 万和 300 万像素,合计的出货份额达到 75%。随着消费者对画面品质提出更高要求,2023年400 万像素摄像头的需求和市场份额将会大幅增长。
图6:摄像头成像原理
除了提升图像分辨率外,摄像头的广角大视野和360°全景监控,支持增强级别的红外夜视功能,实现暗光环境下的微光全彩画面也是当前的热门技术。微光全彩把微光成像和红外成像完美结合,利用图像增强电路对星光级照明条件下的暗光环境目标进行亮度增强,让感光原件能够呈现出清晰的彩色图像。
传:多样化的传输方式
当摄像头捕捉到图像后,需要将其转化成数字信号再通过有线或无线的方式传输,有线传输包括使用网线、光纤、同轴线、USB线、双绞线等方式,无线传输包括WLAN、2.4G或蜂窝移动网络等。
图7:不同分辨率视频编码格式码流对比
1080p60fps的无压缩视频信号码率高达4.455Gbps,为了提升图像信号的传输效率,在传输前需要对图像进行编码压缩。目前常见的高清视频编码格式有H.264、H.265、M-JPEG等。采用优化后的H.264可以将1080p视频的码流压缩到4-6Mbps水平,而更先进的H.265编码格式可以将码流进一步降低到2-4Mbps。但是如果是用于8K超高清视频场景,由于它的分辨率是1080p的16倍,采用H.265也至少需要32Mbps的码流,因此最新的H.266编码应需求而生,相比目前的H.265编码技术,它可以将8K视频的码流减小一半控制在16Mbps,这样就可以适合目前大多数的网络传输环境,但是H.266的普及还需要数年时间。
存:更高效便捷的存储
消费级摄像头的存储通常分为本地存储和远程存储,本地存储采用内置存储芯片或存储卡的方式,而远程存储一般采用云存储、分布式存储和集中存储方式。云存储通常是购买云存储空间,集中存储常用的设备有:NVR网络视频录像机和IP SAN,NVR通常可以支持到4-64路摄像头,但是如果是数百路的大型监控项目,由于数据吞吐量太大,就需要用到IPSAN这种大型监控存储。IP SAN基于IP以太网络的SAN存储架构,使用iSCSI协议传输数据,直接在IP网络上采用的磁盘阵列进行存储,数据吞吐量大但价格较为昂贵。
图8:NVR网络录像机存储方案
安防行业的网络视频监控,由于需要24小时持续记录,因此存储空间要求通常较大,因此对视频编解码技术也提出了较高要求,既要保证小码率,还要保证图像清晰。目前50路摄像头存储30天的1080p视频录像大约需要69TB的存储空间。
显:多通路显示到数据看板
安防显示需要实现多路实时显示,通常由高清解码器或者高清视频矩阵来完成,两者配合可以实现画面切换,高清上墙,轮询切换等控制功能。系统的人机交互会涉及多样化的显示需求,核心需求侧重点还是在于更高的清晰度能展现更多的图像细节,大尺寸屏则能够支持更多通路画面同时显示。
图9:LED显示分类应用
在经历了CRT到液晶显示所带来的视觉冲击,再到DLP、LCD、LED拼接屏技术的发展。随着行业技术进步,小间距LED拼接屏产品成本不断下降,综合显示效果上也能满足安防市场需求。而且随着智能技术的发展,智慧应用的增加,安防系统正在从简单的“看画面”变成“数据面板”,并且可以通过移动终端实现监控点上墙、大屏场景切换、用户切换、信号源预览及回显等功能。
控:多样化的控制需求
一些大规模高清监控系统,当视频设备数量多,设备的品牌杂,网络环境乱,如何实现平台的统一有效管理是重要的问题。而且在多级联网的应用中,还经常涉及到多级联网带来的问题,对接起来非常困难,这些都是平台控制面临的非常现实的问题。
一些摄像头还会涉及云台驱动、光学变焦等远程控制。在家用摄像头领域,随着智能AI的应用,包括人形侦测、宠物识别、移动追踪、人脸识别、婴儿啼哭声音侦测等在内的动态报警也是目前市场热门应用。这也对摄像头的控制提出了更高的要求。
智:智能化带来的价值
当我们通过“采-传-存-显-控”获得所需的高清视频数据之后,如何更好地发挥数据价值就成了安防行业需要面对的问题。监控视频智能分析技术是一项比较成熟应用的技术,最先由美国国防部提出并开发实现,它改变了传统监控的被动防御地位,通过对视频数据进行分析,提取出有用的信息以报警的形式反映给用户。现实中,清晰成像的摄像头为安防智能化提供了素材,端和云的芯片内置了强大的算力,多样化的AI 算法让海量数据的深度解析成为可能,视频监控已经成为安防领域内智能分析技术应用的最好载体。
图10:摄像头的发展迭代历程
传统安防在过去面临很多未解决的痛点和难点,包括大量非结构化数据难以处理和利用,安防系统彼此独立导致信息利用困难,靠人工检索海量视频,工作效率低且成本高。而AI 技术的自动化、结构化、共享性、预测性等特点,使得它能够很好地解决这些痛点问题。采用视频数据结构化和AI技术,可以在秒级时间完成原本需要上千小时的人工查找工作,而结构化的视频数据还可以节省90%的存储空间,AI的引入还能深化视频数据价值利用,包括各类基于数据的应用创新。
智能安防通过多维感知、数据智能分析、智能联动管理等方式,可以大幅提升安防系统的工作效率和响应速度。智能安防的应用场景很多,例如通过人脸识别,大数据分析,人工智能,可以帮助安防系统识别在逃嫌疑人,打击犯罪分子。在举行大型活动的时候,可以通过热成像分析人群密集程度,及时发现潜在的风险进行报警,从而可以采用相对的措施疏导人群。在交通安全管理防控上,通过机器视觉、人工智能大数据分析等安防的技术,可以大大提升捕捉交通违法行为概率。目前已经落地的智能安防技术应用场景主要有:智慧园区、智能楼宇、智慧交通、智慧煤矿、智慧幼儿园、智慧工地、AI+危化行业、智慧物流、电梯内电瓶车智能检测等。
安防智能化的未来
中安网的数据显示,视频监控系统占了安防整体市场份额超过50%,是安防行业最重要的细分市场领域。安防摄像头的更换周期通常为 3-5 年,因此每年的市场需求量很大,随着技术进步,安防摄像头从标清向高清发展,又从高清再向智能化升级,这也是行业技术发展的必由之路。最近一次2022年长沙“雪亮工程”项目招标中,前端采集摄像机设备的AI智能化渗透率达到98%,可以支持机动车、非机动车、人脸、人体检测和抓拍,并可以支持其他智能化检测,智能化产品和系统已经成为专业安防市场的主流需求。
图11:智慧安防是智慧城市的重要组成部分
在马斯洛的人类需求理论中,将“安全”列为仅次于生理需求的基础层。因此安防行业随着现代社会公共安全需求应运而生,已经成为社会公共安全体系和智慧城市的重要组成部分。根据市场研究机构 IHS Markit 的统计以及《华尔街日报》报道的数据,2021年全球部署10亿个监控摄像头。中国部署的数量预计超过5.6亿个,美国部署的数量也达到8,500万个,如果将人口数量的因素考虑在内,中美两国的人均摄像头拥有量基本持平。
目前我国已有银行营业网点超过22.8万个,大型工业园区2.2万个,近3000所高校和22万所中小学,26万所幼儿园,40多万个住宅小区,公路里程超过528万公里,实体店铺超过610万家以及4300万家各类企业。这些经济实体数量多规模大,涉及的领域和产品体系全面,应用场景多样化。它们都是智能安防监控系统的潜在用户,因此可以预见到智能安防未来的市场发展前景广阔。