两秒将想象变成现实 “商汤秒画”打造AI画图“模型超市”

新闻 2023-04-20

439 0

图说：秒画创作的“一只穿着盔甲的柯基” 采访对象供图（下同）

两秒钟，就能将你的想象变成“现实”。

在商汤技术日上，商汤“日日新”大模型体系正式问世，基于该体系的AI内容创作社区平台“秒画”也一并亮相。

秒画平台基于商汤大装置的GPU算力支撑，可帮助用户免除本地化部署流程，既能使用商汤自研作画模型高效地生成高质量内容，也可以将本地模型及其他第三方开源模型一键导入，生成更多样的内容。

秒画还提供特异性推理优化服务，开源模型导入后会自动采用秒画底层的模型编译技术进行加速，实测在本地RTX3070显卡需要10秒生成的图片通过秒画加速技术只需要2秒就可以生成。

图说：秒画创作的“航拍湖泊湖心小岛下雪天”

超10亿参数，多种风格秒生成

商汤自研的AIGC文生图大模型拥有超10亿参数，支持二次元、三次元等多种生成风格。用户无需复杂的编程知识，只需给定提示词，即可生成相应图像，最高可实现6K高清图。

无论是写实照片、脑洞大开的艺术画作，还是未来科幻场景，模型生成的图像都能根据用户需求，带来真实的光影效果以及丰富的细节内容。凭借超快的推理性能，商汤自研作画模型的文生图能力，每2秒就能生成1张512*512分辨率的图片。

高效释放图像生成“巧实力”

相比于爆红AI圈的Stable Diffusion，商汤作画大模型基于2019年开始研发的通用大模型设计体系，采用更先进的大模型结构设计与大batch训练优化算法，模型参数量大小为前者数倍。

核心技术包含了自研的多种算法，使其具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。

图说：商汤作画大模型与Stable Diffusion对比

此外，目前市面上所有的LoRA模型都是基于Stable Diffusion或者其变体训练的，依托商汤基模型本身强大的泛化能力，使用其替代Stable Diffusion模型可以基于更少量数据快速训练出质量更高的LoRA（记者注：LoRA，用于通过小数据继续训练，将大模型的能力适应到某个垂类领域，但会影响大模型的泛化能力）模型，实现更优的风格定制化图像生成，这样的功能在秒画平台通过5分钟即可实现。

摆脱算力掣肘满足进阶创意需求

对于有进阶需求的模型创作者，“秒画”平台也可支持自行上传数据集进行finetune、自训练等功能，定制训练属于自己风格的LoRA模型，通过拖拽20张图片训练集，仅需5分钟就能完成训练，显著降低模型的训练门槛。

同时，用户也可以一键导入Hugging Face, Civitai, GitHub 等第三方社区的开源模型进行体验，让用户免除本地化部署的繁琐流程，通过商汤AI大装置强大的GPU算力集群、推理加速功能，即可高效生成更多样的内容，创作更便利。

不仅如此，商汤还将面向B端开放API接口，结合商汤AI大装置提供的算力，为客户提供便利、高效的服务，打造多样性的平台和社区生态。

在大模型的驱动下，AI文生图技术快速发展，可以广泛应用于设计、营销、游戏动画、工程建筑、医学、教育科普等领域，帮助人们提高创造力。

商汤方面表示，“秒画”平台的推出，在为创作者打造低门槛、高效率的创作服务的同时，还能够充分整合社区力量连接更多资源，带来更加便利、完善的内容生产创作工具，让每一位创作者都能轻松地将想象变为现实。

新民晚报记者郜阳

举报/反馈

SD指南