新浪网

珍贵实验数据误删除!他险些错失一篇Nature论文

中国科学报

关注

确定不再关注此人吗

文 | 《中国科学报》 记者 李清波

2020年,告别曼哈顿岛的繁华和国外导师穆萨教授,陈凌峰结束了纽约大学朗格尼医学中心的访学生涯,准备回国了。

在国内,他已经联系好了入职单位,他的妻子更是临盆待产。然而,归家心切的他,因一个误操作险些丢失自己两年来的研究数据。

临行前,陈凌峰的苹果笔记本电脑里保存着两年来的珍贵数据——3个四元复合物的蛋白质结构信息,包括原始数据、整理好的实验数据、制作好的图表。

“因为存储空间出现问题,我还特意将桌面文件备份至硬盘后,再将文件清空。桌面文件都是通向云端空间的链接,我满心以为删除掉链接,文件还存储在云端,不会丢,结果删除后云端的文件直接消失了,而硬盘备份的文件却是无法使用的镜像文件。”陈凌峰平淡地叙述着曾经让自己绝望的往事。

回国后,陈凌峰跟随博士导师梁广研究员入职杭州医学院,担任特聘研究员,却经常着急地往苹果公司售后跑,去询问数据恢复情况。

最终得知无法恢复后,连续数天,懊恼、悔恨、郁闷袭上他的心头。

所幸,之后的大半年里,陈凌峰在与穆萨的聊天记录、U盘、Email、OneDrive中,逐步找回了绝大部分资料,一个重要研究成果“续上了命”。

吃一堑长一智,陈凌峰现在每周备份一次实验数据。他毫不避讳地讲述自己犯过的低级错误,提醒同行不要像自己一样。

3年后的6月7日,这项成果在《自然》在线发表,首次解析了内分泌型成纤维细胞生长因子(FGF)激活受体的分子机制,为糖尿病、慢性肾病和脂肪肝等代谢性疾病治疗药物的研发提供了重要结构基础。陈凌峰为论文第一作者,他所在的杭州医学院首次以主要完成单位在《自然》发表论文。

陈凌峰在穆萨教授实验室处理FGFR高表达细胞。受访者供图

科研机密不方便说

在用冷冻电镜解析蛋白质结构的科研圈里,有个大家都知晓的常识,就是蛋白质浓度越高,冷冻电镜下能看到的蛋白颗粒越多,解析就越容易。

但是,这对陈凌峰要破解的蛋白质来说行不通。

陈凌峰想知道FGF配体、受体、共受体是如何组装成一个从未被人发现过的四元复合物,其中谁是参与者,谁是主导,谁不可或缺,谁先来,谁后到,要回答这些问题,分析它们精准的结构必不可少。

结构生物学家解析蛋白质结构,比较先进的办法就是给“蛋白质”拍个立体照片,解析三维结构。

分析用的高纯度蛋白质复合物要求质量过关、稳定性强。在解析FGF信号激活机制模式之前,陈凌峰花费了大量的时间精力,用来纯化蛋白。接下来,应该进一步浓缩蛋白质,把样品均匀分散在样品载网上,拿到冷冻电镜下去测试。

但在浓缩这一步,陈凌峰被卡住了。他们的蛋白质都是挤成一坨,无法分开。“怎么拍都不完美,试了很多次。”

因为研究对象的特殊,最后一步着实难倒了陈凌峰。“我们还请教了最权威的冷冻电镜专家,也没有办法”。

球到了禁区里,只差临门一脚。

陈凌峰认为,纯化之后就不能再浓缩蛋白了,于是他独辟蹊径,终于顺利拿到完美的样品和结构信息。

然而,关键一步如何操作?陈凌峰不愿意展开多说。涉及课题组机密,感兴趣的可以私下联系我。

凭借着“独门绝技”,陈凌峰所在课题组一口气拿到3个四元复合物结构信息。

做科研有时候需要缓一缓

2020年,陈凌峰的关键词除了低落,还有高光。

那一年,他还发表了一篇重磅研究成果,意外地加快了这篇《自然》论文的进程。

温州医科大学教授、中国工程院院士李校堃称赞2023年的这篇论文:完成了FGF信号激活胞外区域的“最后一张拼图”。前两张“拼图”,一个是陈凌峰的师兄、温州医科大学教授陈高帜作为一作,在2018年发表于《自然》的论文,陈高帜也是这篇新发论文的通讯作者;另一个是陈凌峰2020年作为一作,发表在《自然-化学生物学》的成果。结合前期的两个重要成果,最新的这篇论文给FGF信号激活机制研究画上了一个小句号。

高产的背后,既是团队独步该领域的实力使然,也是陈凌峰个人的机遇和努力。

2018年,与师兄短暂相聚后,陈凌峰独自留在了穆萨实验室,在老师的指导下开始试图揭秘四元复合物的结构信息。在FGF领域,穆萨实验室几乎是全世界最成熟的实验室。

前半年,陈凌峰只做了一件事,每天早上钻进实验室,晚上出来,表达四元复合物蛋白之一αKlotho蛋白和FGF23,每天进行着铺板、消化、再铺板,培养、表达、收回、纯化的重复性工作。

“大概半年时间,一直没有好的结果,做成这个样,穆萨教授都已经快放弃了。”出师不利,陈凌峰心情也不好。

一天组会上,穆萨和陈凌峰讨论起来,当细胞膜外的四元复合物分子组装完成后,两个FGFR受体会在细胞膜内互相磷酸化,这一过程的解析当时也是未解之谜。

于是,陈凌峰在穆萨的指导下调转方向,成功发现FGFR激酶域非对称的磷酸化机制,并发表论文。

陈凌峰总结说,“当时就是绷得太紧,做实验不顺利时可以缓一缓,换一个‘风景’,回头看思路说不定就打开了。”

这时候再回头看细胞膜外的工作,再也不像以前那样钻牛角尖了。

心情大好的陈凌峰胆子也大了起来,实验的规模逐渐增大,微调了以往的试验方法,一鼓作气,成果的前半部分完美攻克。

“做科研可能真的不能横冲直撞,欲速则不达。”陈凌峰说。

两项成果被迫合为一篇论文

付丽丽正在实验室收样。受访者供图

做结构生物学的科学家,最害怕自己手里握着一个蛋白质结构正在研究,而别人抢发了论文,几年付出烟消云散。

这篇《自然》论文一作之一、温州医科大学博士生付丽丽也曾在穆萨实验室工作过。几年来,她养成了一个习惯,每周固定时间都忐忑地打开电脑,刷新网页,看自己研究的领域有没有新的成果发出来。

那几年,付丽丽做实验的那根弦,时刻绷得紧紧的。

穆萨和陈凌峰解析出四元复合物结构信息后,需要在哺乳动物细胞内进行验证,验证模型是否准确,后续工作量非常庞大。FGF配体共有18个成员,分为5个旁分泌亚家族和1个内分泌亚家族。付丽丽负责旁分泌亚家族工作,其他参与者负责内分泌家族工作。

因为要表达的蛋白的特殊性,WB的指标特别多,课题组有时候一天用掉160盘150mm超大培养皿,抗体的量也消耗得很快,还有血清、试剂盒等等,经费在持续燃烧。

2022年8月份,论文进入投稿阶段。

由于成果扎实,创新点多,论文匿名评审进展得非常顺利,甚至有审稿人提前恭喜课题组。结果,收到审稿人第三轮意见后,本以为十拿九稳的事情,忽然又生事端。

“有一位审稿人‘威胁说’,你们要是不把旁分泌家族的验证工作也加进来,我就不同意发表。”这一要求打乱了课题组原来的计划。

付丽丽说,“我们本想把内分泌亚家族的工作做扎实了,配合四元复合物的结构解析发布一篇论文,之后再慢慢研究旁分泌家族的工作。原来可以发两篇高水平论文的计划搁浅,不得不把新的实验数据补充进论文。”

旁分泌家族比内分泌家族庞大。单就此课题的质粒构建,付丽丽就构建了300个左右,同时质粒转染到细胞过程的过程中,筛选需要历时一个月。“为了复刻信号激活传导的过程,我们同时需要培养20-30种转染了不同质粒的细胞,它们长相一样,但是突变不一样,如果稍微不留神出错,四五天以后才会发现,即使发现了也可能需要再花一个月乃至更久的时间去纠正,非常浪费时间。所以我们每次操作都需要很小心谨慎,再三确认,细胞房一呆就是一个半天”。

经历了大年三十的“突击”,挤出午饭时间做科研……付丽丽超额完成了论文发表所需要的工作量。

工作虽然扎实,但是论文篇幅有限,付丽丽只能挑选一小部分最具代表性的细胞工作和统计表格、图片传到论文上。

付丽丽坦言,整个课题组5年来几乎没有像样的成果,周围打听自己正在做什么的人越来越多,压力越来越大。但是论文真正发表后,延迟的喜悦其实没有剩下多少。

“能让我们再次激动起来的,估计只有下一个重磅成果了。”现在,课题组已经瞄准了新的目标,开始了下一个研究计划。

发布于:北京

特别声明:以上文章内容仅代表作者本人观点,不代表 新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与 新浪网联系。
加载中...