算法叫做MuSIC
晓查 发自 凹非寺
非常AI 报道 | 公众号 QbitAI
我们的细胞再向下一级究竟有什么?细胞核、线粒体、内质网、高尔基体……
在中学生物课里我们知道了这些,然而它们就是亚细胞结构的全部吗?
绝对不是!
加州大学圣地亚哥分校(UCSD)医学院的研究人员和合作者们,通过AI技术分析出了人类肾脏细胞的70种亚系统,发现其中有一半都是人类未知的。
这项研究登上了最新一期的Nature。
肾细胞中一半成分未知
科学家研究细胞内部的结构主要使用两种技术:荧光显微镜成像和生物物理关联。
第一种方法是用荧光物质标定蛋白质,并在显微镜范围内跟踪它们的运动和关联。由此科学家们得到了人类蛋白质图谱(HPA)数据。
生物物理关联,是使用一种特定的抗体将蛋白质从细胞中拉出来,分析蛋白质上结合着什么。现在,科学家们已经有了BioPlex这一数据库。
UCSD的研究者们,就是将HPA与BioPlex中的蛋白质数据集合到一起,然后输入到深度神经网络中。
AI会对蛋白质之间的“距离”进行计算分析,最后得到多尺度整合细胞图谱(MuSIC Map)。
多年来,UCSD团队一直对绘制细胞内部工作图感兴趣。MuSIC的不同之处在于使用深度学习直接从细胞显微镜图像绘制细胞图谱。
此前,他们构建了一种叫做DCell的神经网络,并且用酿酒酵母细胞作为基础研究模型。他们用所有关于细胞生物学和细胞层次的知识库,来训练这个标准AI算法。
DCell可以根据基因突变的信息,预测细胞可能发生的行为,结果与实验室里的细胞行为几乎一致
MuSIC也是一种神经网络,与DCell的不同之处在于,它是细胞显微镜图像到亚细胞结构的映射。
该团队已经将MuSIC的代码开源。
通过MuSIC,研究人员发现了一组蛋白质形成一种过去不熟悉的结构,最终确定该结构是结合RNA的蛋白质新复合体,该复合体可能涉及染色质的剪接。
未来将扩展到所有人体细胞
搞清楚亚细胞结构对于发现疾病病因有重要的意义,因为大多数疾病都可以归结于到细胞的哪个部分出了故障。
例如,肿瘤之所以能够生长,是因为基因没能准确转化为特定蛋白质;代谢疾病是因为线粒体没能正常工作。
但要了解在疾病中细胞的哪些部位出了故障,科学家首先需要一份完整的亚细胞结构清单。
这篇论文的通讯作者Trey Ideker教授指出,这是一项测试MuSIC技术的试点研究,他们只研究了661种蛋白质和一种细胞类型。
△ Trey Ideker教授的实验室团队
Ideker还表示,他们的下一步是研究整个人类细胞,然后再扩展到不同的细胞类型、人和物种。最终,通过比较健康和病变细胞之间的区别,更好地了解许多疾病的分子基础。
参考链接:
[1]https://ucsdnews.ucsd.edu/pressrelease/we-might-not-know-half-of-whats-in-our-cells-new-ai-technique-reveals
[2]https://www.nature.com/articles/s41586-021-04115-9
[3]https://idekerlab.ucsd.edu/music/
[4]https://github.com/idekerlab/MuSIC