创始人牛津毕业
明敏 发自 凹非寺
非常AI | 公众号 QbitAI
在Stable Diffusion以“免费开源”爆火AI画画圈后,背后公司的估值快速攀升到了10亿美元(约合人民币69亿)。
知情人士透露,Stability AI正在筹备一轮融资,金额为1亿美元(约合人民币6.9亿元)。
在此之前,它们才以1亿美元估值,通过SAFE票据至少融资了1000万美元。
如今,随着多方投资机构透露出对Stability AI的兴趣,其估值也从1亿美元、5亿美元、最终飙升到了10亿美元。
而现在距离Stable Diffusion对外发布,才过去了一个月。
而且,Stability AI连明确的商业模式都还没有形成——Stable Diffusion仅是一个在GitHub上对外开源的免费项目。
创始人向外界表示,对此不用担心,因为他们已经和政府等机构达成了合作。
开放?营利?
Stable Diffusion的爆火,主要靠的是足够开放。
和Dall·E、Midjourney不同,它是完全免费、不限次数、任何人都可用的。
对硬件的要求也不高,普通显卡上就能跑,显存不到10GB,也能在几秒钟内生成高清图像。
生成效果上,可以说完全不亚于Dall·E、Midjourney,因此在社交平台上风靡一时。
目前在GitHub上已经揽星超过2万。
但争议也随之而来。
前段时间,由于Stable Diffusion使用过于泛滥,牵涉到艺术版权的问题,一群艺术家们还吵了起来,并把一个非官方账号举报到封号。
它对外开源的特性,对生成图像的监管程度更低,不少人拿它来生成虚假名人照片等违禁图片。
Reddit已经禁掉了4个专门用Stable Diffusion生成敏感图片的社区。
显然,开源这件事给Stable Diffusion带来超高关注度的同时,也带来了一些麻烦。
加之它的代码就放在GitHub上,这使得别人可以轻而易举高仿一个Stable Diffusion出来。
前不久,一家公司照着Stable Diffusion做了个盗版,名叫Photosonic AI,结果在产品社区 Product Hunt上直接排到了第二名。
Stable Diffusion的项目基础是由慕尼黑大学机器视觉与学习研究小组和Runway的研究人员,基于CVPR2022的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》,并与其他社区团队合作开发的一款开源模型。
以及关键问题——开源项目如何赚钱?
Stability AI还没有给出明确的商业模式。
目前,该公司的大部分资金直接来自创始人兼CEO伊马德·莫斯塔克。
他现在39岁,2005年硕士毕业于牛津大学数学和计算机科学专业。
之前在英国做过对冲基金工作。2019年,和其他人一起创立了一个项目Symmitree,旨在为人们降低使用智能手机、上网的成本(不过现在似乎已经关闭了)。
2020年,他正式联合创立Stability AI。
公司的使命被定为“构建开源AI项目”,除了Stable Diffusion外,该公司还支持其他开源小组正在研发的工具。
在一次油管上的采访中,莫斯塔克透露,他们已经和政府等机构达成了合作,谈成了很多订单来售卖他们的技术。
并且他还表示,模型第一阶段的训练成本仅为600万美元,“这只是公司资金的一小部分”。
据了解,该模型训练是在4000个A100 Ezra-1 AI超大集群上完成的。
莫斯塔克表示,公司之前是完全独立的,除了75位员工外,没有其他任何控股方。
现在,他们要以10亿美元的估值,把10%的股份拿出来吸引投资者注资。
Lightspeed、Coatue等知名风投公司,都将是这一席位的有力竞争者。
One More Thing
值得一提的是,Stability AI因为提倡开源项目,不免会让人联想起OpenAI。
在接受微软的投资后,OpenAI转为了营利性组织,开始专注于将技术商业化,由此也引发了一些批评。
不过,Stability AI似乎从一开始就是以营利为目的的公司,创始人莫斯塔克表示,“这样开源项目可以惠及到更多人。”
参考链接:
[1]https://www.forbes.com/sites/kenrickcai/2022/09/07/stability-ai-funding-round-1-billion-valuation-stable-diffusion-text-to-image/?sh=2a268ea424d6
[2]https://techcrunch.com/2022/08/12/a-startup-wants-to-democratize-the-tech-behind-dall-e-2-consequences-be-damned/