陈怡然:是他带着我学了四年
梦晨 杨净 博雯 发自 凹非寺
非常AI 报道 | 公众号 QbitAI
一个34岁毕业的博士,如何评价?
如果还是一个志在科研,二刷博士学位的人呢?
最近,这样一个博士生在学界引发热议,不是因为他的得,而是因为他的舍。一个原本打算博士后进修的毕业博士,得知未来科研教职可能会受学校排名影响,向博士后“同事”提出了问题:
如果我来这里再读一个博士呢?
他叫李昂,拜杜克大学陈怡然教授门下,研究联邦学习。
就在前几天,他的论文被ACM主办的嵌入式网络传感器系统会议SenSys收录。
这是自去年4月份以来第六篇以第一作者身份被会议收录!还曾获KDD 2020最佳学生论文。
他被陈怡然盛赞是“系统层次研究联邦学习的新星”,
我并不是系统研究的专家,与其说我在技术上教了他什么,不如说他带着我学习了四年。
而更令人感叹的是,他疯狂产出背后的励志求学经历。
他本科就读于河南大学,之后在北京大学攻读软件工程硕士。
毕业工作一年后,放弃银行高薪工作只身前往阿肯色大学,攻读计算机博士。
之后第二次读博,被陈怡然教授破格录取。
在与非常AI的交流中,他强调:
任何时间都不能算晚。
因为没有所谓的起点和终点,最重要的还是最终能达到你自己想要的目标。
现实版人生重开模拟器
李昂在河南大学计算机专业读本科时就有想过要做研究,然后到北大软件工程专业读了硕士。
毕业后他在北京的银行当了一年的管培生,做的是金融管理方向。
在银行的工作虽然很惬意,但李昂还是觉得这种生活状态并不是自己真正想追求的。
一年后,他决定从银行辞职去读博,继续追求自己的学术理想。
李昂的第一个博士就读于美国阿肯色大学计算机科学专业,计算机学科并非这所学校的强项。
于是他打算继续从事博士后研究。而目标,是他一直关注的杜克大学陈怡然教授。
由于简历不够出色,当年他申请陈怡然教授的博士后时也只是抱着试试看的心态,没想过陈老师能够回复他。
没想到的是,陈老师不仅联系了李昂,还与他进行了一次比较深入的交流。
虽然如今,陈老师回忆起当年开玩笑称,是因为他的母校——河南大学,跟自己父母一个学校,于是就在人群中多看了一眼。
但李昂在当时那次交流中,感受到了陈老师是发自内心的去尝试理解一个学生的学术理想和职业规划,而不是仅从纸面上去判断一个学生。
当李昂问出“如果我来您这里再读一个博士会怎样?”那个改变他一生的问题时,陈怡然给出的回答是:
如果你有这个决心,一切皆有可能。
在采访中李昂总结道,他选择第二次读博的内因是他自身对学术的执着和热爱,而外因就是对陈老师的钦佩和崇拜。
以30岁的年纪重读博士,李昂比组里的其他同学都要大上不少,而让他焦虑的还不只是年龄。
读第一个博士的时候,李昂的主要研究方向是和移动计算相关的隐私保护和安全问题。
在陈老师主要做的AI相关研究上,李昂觉得自己这方面知识积累不够充分,对AI领域的发展也不是很熟悉。
那时候他心里很着急,总在想怎么能快速寻找到一个突破点,尽快展开研究来追赶上这个差距。
出于这样的心态,李昂天天跑到导师陈怡然的办公室里去,跟他讲文章的思路。
陈怡然却劝他不要着急发文章,要从研究方法学起,寻找问题、发现问题、解决问题以及最后怎么用论文的形式把成果展现出来。
这种对完整科研体系的训练,正是李昂在之前的学习和研究经历中所缺乏的。
后来,李昂在杜克大学的研究工作逐步走入正轨。
最开始的时候,他的论文常被拒稿。
李昂一方面陷入了对自己能力的怀疑,另一方面对审稿人也产生了负面情绪。
陈怡然就用自己的科研经验去开导他:
如果你一直用抵触的情绪去看待审稿人给你提的客观建议的话,对你研究的提升没有任何帮助。
从2019年的一篇投往Infocomm被拒稿的论文开始,李昂的心态慢慢发生转变。
他尝试站在审稿人的立场上去思考,究竟是自己的研究欠缺?还是论文的展现方式上有不足?
按着这个思路,最终李昂和团队对文章进行了大改,又补充了非常多的实验数据。
修改后再次投往MobiHoc 2020会议,就比较顺利的被接受了。
这也是李昂以一作身份在国际学术会议上发表的第1篇论文。
随后李昂对自己越来越自信,走上了“科研快车道”。
从2020年4月开始,他的论文连续被MobiHoc,KDD,IoTDI,MobiCom,SEC,SenSys收录,并获得KDD 2020最佳学生论文和SEC2019最佳海报奖。
李昂却说所谓快车道只是外界从产出角度看到的结果,背后是一个长期积累,量变到质变的过程。
他在二次读博期间积累了大量领域相关的理论知识,阅读了大量文献。
除了一直持续关注学术会议和期刊上的论文,还一直关注工业界发展的趋势。
在银行的工作经历让他能够积极主动和前辈和同学进行交流。
当然也离不开陈怡然老师的指导,对他采购各种实验设备的支持,以及对他参与国际学术交流的鼓励。
最关注隐私计算
说了这么多,你是否好奇李昂到底研究的什么领域,能受到众多学术会议的青睐。
拿这篇刚刚被SenSys收录的文章来说,就提出了一种新的联邦学习框架
这一框架能降低97%的通信成本,提高模型训练和推断效率,还能解决联邦学习训练过程中的数据异质性问题。
具体分为以下三个方面:
在联邦学习的训练过程中传递二值掩码(而非本地模型的参数)
利用客户端本地的数据学习二值掩码,通过嵌入本地数据的个性化信息解决数据异质性问题
对本地模型的参数进行冻结,并加入一些结构稀疏化的约束
而论文的主题联邦学习,正是李昂博士所研究的主要方向之一。
他表示,自己整体的研究方向该是比较偏应用的系统,但具体研究内容还是和理论密不可分。
比如差分隐私技术,就需要非常扎实的统计学理论知识作为基础。
联邦学习目前所面临的挑战:通信成本、数据异质性、计算能力或性能的不足,正是他现阶段主要研究的问题。
同时,寻找更好的隐私保护技术,也就成为了李昂博士的第二个研究方向。
在这篇KDD 2020最佳学生论文中,他就提出了一种用于隐私保护的数据众包框架:TIPRDC。
实验证明,这是一种在效用-隐私的权衡上优于现有的其他方法的框架。
具体的,TIPRDC框架能够隐藏中间表征中的隐私信息,同时最大限度地保留原始数据中嵌入的原始信息,以供数据收集器完成未知的学习任务。
也就是说,能在保护个人隐私的前提下,进行更便利的大数据收集。
在这种框架下,更大规模的深度学习模型及应用,也就能得到更好的训练和开发。
但应用在实际部署时,又常常受到计算资源的限制。
这也就来到了李昂博士的第三个研究方向:开发基于边缘端/服务器端的协同计算框架。
发表在边缘计算会议SEC 2021的这篇论文,就提出了部署在边缘设备上,通信效率更高的模型LotteryFL:
这一框架能够将推理准确率提高17.24%,并将通信成本减少了2.94%。
而纵观李昂博士已发表的论文,不难看出,隐私保护是他当前最关心的问题。
在接受采访时,李昂博士也表示,在现在这个物联网设备高度普及的生活环境下,我们所面临的隐私泄露的风险,比以往的任何时候都要高。
比如,像我们日常随处可见的虚拟助手、智能拍摄,还有各种各样的智能设备,都无时无刻地收集着我们的个人数据。
但大多数用户对这些数据的存储地点、流向,以及具体的使用场景完全不清楚。
如何保证数据流动的透明性,并向用户提供更明确的权限来管理这些数据?
李昂博士认为,这是一个非常值得深入研究的问题。
任何时间都不算晚
如今李昂即将毕业,获得第二个博士学位。
他仍坚持当初做研究的志向,打算在学界找一份教职。
谈及科研初心,李昂回忆起刚上大学对乔布斯的崇拜。
尤其感念于那种用不断迭代的智能设备、持续进步的科技,真正改变世界和人类生活的力量。
就连当下被问会推荐什么书籍,他也毫不犹豫地提起《乔布斯传》
这也就成为李昂最原始的动力,也是做研究的终极目标。
而在慢慢接触研究之后,李昂对科研的喜爱更进一步:它能给予我最大的自由度,
一方面,可以展开想象,去探索我想要了解的前沿领域。
另一方面,利用前沿技术来改变日常生活,亦或是融入到社会生产中去解决问题。
也正因为这样的原因,以及身边家人、同事以及陈怡然教授的鼎力支持,他才能一步一步抵抗外界非议,始终坚定地走科研这条路。
如此励志的求学经历,也激励了不少人。
有网友表示:是呀,有决心的话其实很多事情都能做!
还有人突然对读博感兴趣了。
我也想高龄读个博士。
也有网友感同身受,想到了自己的人生经历。
从二本一路走来,也真的对科研有着向往。现在刚开始第二年博后。
但正如李昂所强调的那样,任何时候都不算晚,只要坚持自己的理想。
对于一些立志想科研的人,他给出了这些建议。
第一点,不要着急,一定要静下心来踏踏实实去做自己的研究。
第二点,找到真正的兴趣,明确自己想要什么。当明确了自己的梦想和目标之后,就要开始提早规划自己的未来,然后剩下就是付出努力了。
这一点尤为关键,尤其在读博期间的瓶颈期,心态会改变很多事情。
特别的,李昂对正在从事交叉学科研究的同学们,提到了三个必备能力。
快速学习,对专业研究的甄别能力和交流协作的能力。
最后,祝福李昂博士一帆风顺,心想事成!
Ps:欢迎学界的各位学者和老师,随时与我们取得联系,多多交流( ̄︶ ̄),联系邮箱:ai@qbitai.com
主页:
https://sites.duke.edu/angli/
参考链接:
[1]https://weibo.com/2199733231/KxhNi2MXH
[2]https://www.linkedin.com/in/ang-li-3658273b