从「以模型为中心」到「以数据为中心」
行早 发自 凹非寺
非常AI | 公众号 QbitAI
今天早上,吴恩达教授发推给大家推荐了一个新的资源站:Data-centric AI(DCAI)。
很高兴给大家介绍我们建立的一个新资源站Data-centric AI,这里有许多专家的文章和NeurIPS DCAI研讨会的交流谈话,来看看吧~
这个DCAI是什么来头?
它代表了最近AI从“以模型为中心”到“以数据为中心”的转变。
在过去几十年间,大多数的AI研究都集中在“code”上面,也就是提升模型或者算法。
不过目前在很多应用上,“code”已经基本上能够解决问题了,花时间改善一下数据往往会更有用。
然而现在构建、使用数据集这部分工作通常还是人工来做,费时费力,成本高昂,缺少高效的数据工具。
DCAI的出现就是为了解决这个问题。
这个新的资源站汇总了在数据这块最新的进展和最好的实践,目前共包含两大块内容:交流话题和NeurIPS研讨会资源。
其中交流话题现在共有3个:Labeling and Crowdsourcing(众包数据标注)、Data Augmentation(数据增强)、Data in Deployment(数据部署)。
分别由斯坦福计算机科学副教授Michael Bernstein、加州理工教授Anima Anandkumar和Google Brain研究负责人D. Sculley主导讨论。
在每个话题下面都会有教授进行介绍、举例、提出解决方法。
例如在数据增强这个话题下,Anima教授就从数据增强要解决的问题开始,给出解决方法,并介绍最新的研究成果:
在训练数据中仅使用边框标签来训练模型进行实例分割:
并在最后给出相关的资源以供参考。
DCAI包含的第二部分内容就是NeurIPS研讨会资源。
这里有各路大神在去年NeurIPS研讨会上的发言和谈话。
每个视频还都配有同步的PPT:
除了这两部分资源之外,你还可以成为DCAI社区的贡献者,在这里分享DCAI的研究项目、工具或者提议等内容:
自吴教授推文发布后,很快就收到了网友的热情回应。大伙纷纷希望加入社区,还有人表示会很快分享自己的成果:
如果有同学对“以数据为中心”的AI内容感兴趣,就赶快用起来吧~
DCAI地址:
https://datacentricai.org/
参考链接:
https://twitter.com/AndrewYNg/status/1494063769105821698