清华系NLP公司哄抢未停:深言被曝估值已1亿美元,此前陷王慧文收购传闻

新闻 2023-04-09 衡宇
437

爆火“反向词典”原班打造

衡宇 发自 凹非寺

非常AI | 公众号 QbitAI

火热的大模型创投潮里,又有初创公司拿钱了。

非常AI独家获悉,清华系AI初创公司深言科技(DeepLang AI),快速完成新一轮高估值融资,最新市场估值约1亿美金。并且,深言科技更新的一轮融资又火速开启。

公开资料显示,深言科技创始团队几乎均出自清华大学自然语言处理实验室(THUNLP) 。

除了面向大模型,又师出名门,深言科技最近受万众瞩目还有一个原因——此前陷王慧文的收购传闻

AI科技评论报道,王慧文在收购一流科技、开启第二轮融资的同时,对两家孵化自清华NLP团队的初创公司很感兴趣,这两家公司的核心创始团队都属清华孙茂松、刘知远一脉,其中一家就是深言科技。

孵化自清华反向词典项目

扒一扒可以发现,深言科技算是国内较早入局大模型的玩家,成立于去年年中。

公司主要面向AI和NLP,目标是以自研中文大模型构建工业级中文信息处理引擎。

创始人兼CEO岂凡超,系清华大学电子工程系2013级本科,计算机科学与技术系2017级博士,主要研究方向为NLP,研究工作曾在EMNLP等发表。

△岂凡超

联合创始人兼COO李潇翔,清华电子工程系2017级博士。红杉中国合伙人张涵也是公司董事之一。目前,欧洲科学院院士孙茂松担任公司首席科学家。

公司公开的现有产品,包括WantWords、WantQuotes等。

WantWords,其实就是2021年11月在微博爆火,服务器多次被挤爆的神器反向词典

2019年,岂凡超和同学合作研发该产品,支持中文及跨语言查询,已经开源。该项目的指导教师之一,正是孙茂松。

所谓“反向”,指和常规词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。

具体操作上,在词典的搜索框中输入想表达的意思,就能得到几十上百个答案。背后的核心AI,名为多通道逆向词典模型,相关论文中选过AAAI 2020。

爆火的小程序背后,似乎是THUNLP早就在产学研融合上布局的一盘棋——2022年,岂凡超博士毕业,随即从THUNLP孵化出深言科技,核心团队均为清华硕博士背景。

同时,实验室的反向词典和后续推出的据意查句(WantQuotes)等,也划归深言名下。

扒完公司,再聊几句孵化出团队的THUNLP

它成立于上世纪70年代,是国内第一个开展NLP研究的科研单位。实验室牵头人是国内NLP研究领域的泰斗黄昌宁,孙茂松是他的学生。

反向词典另一名项目指导教师刘知远,则是孙茂松的弟子,同属THUNLP实验室。

实验室此前推出的项目,颇受关注的主要有三:

  • 2017年,中文诗歌自动生成系统九歌MixPoet,它训练过程中学习了80万首中国古诗;
  • 语言表征模型ERNIE(没错,和百度文心大模型同名),可与当时任务最优的BERT媲美;
  • 以中文为核心的预训练大模型清源CPM,是智源研究院大模型悟道·文源的前身。

上述项目的研发过程中,岂凡超等人尚未毕业,仍身处THUNLP。

大牛带队,高额融资推进顺利

王慧文收购传闻中涉及的另一家公司,面壁智能,也孵化自THUNLP。

公司同样成立于2022年,专注大模型加速与应用落地。

创始人兼CTO曾国洋在大二时加入THUNLP,是刘知远的学生。公司核心成员都曾参与智源研究院“悟道·文源”大模型研发,目前刘知远担任联合创始人,孙茂松、刘洋担任顾问。

△曾国洋

此前,面壁智能联合THUNLP、智源研究院发起了OpenBMB开源社区,推出的BMList大模型趋势图跟踪了大模型的演化趋势。

此外,面壁智能还针对产业落地推出了CPM-Live百亿中文大模型直播训练项目,以及大模型全流程加速平台ModelForce。

股权结构显示,智谱AI也在面壁智能持股5.22%

关于王慧文收购传闻的后续消息是,雷锋网从多处信源获知,王慧文与面壁智能的接触和交流最终以合作流产告终,“面壁智能还是综合考虑决定独立发展”。

像深言科技和面壁智能这般“名门出身”的AI初创公司,高额融资推进得十分迅速。

据爆料,前文所提智谱AI,身家价格已经在原有基础上翻了3倍不止,而AI大牛周明创建的澜舟科技,也在上月中旬刚刚完成了新一轮融资。

不过,据非常AI得到的消息,如火如荼的这一波创业,除了商业大佬或技术大牛带队号召的团队,多数在达到3000万美元后,融资进展都会放缓甚至停滞。而应用层的创业项目,估值天花板也就在几千万美金上下。

甚至有VC投资人告诉非常AI,不少美元基金考虑到项目质量和技术差距,已经半放弃国内AI创业项目,转身前往硅谷挖人。

看来,轰轰烈烈的AI创业潮里,并非所有的公司都是抢手的当红炸子鸡。

相关文章