崩溃!别人质粒秒到我苦等半年发现序列全错……这些公益平台早该用起来

  熬过了导师的不管事净添乱,防住了同门师兄妹的捣蛋和暗算,逃过了实验室设备差出不来结果的劫难,到头来,你的学位论文还是翻车了......

  一年前,芝加哥大学人类遗传系终身正教授蓝田博士团队的研究揭示了一个残酷的事实——近半数实验室质粒存在设计缺陷。

  在科研这场力求精密的战役中,我们必须要保证实验原材料的准确性,这时候,一个可靠的公益科研平台就显得尤为重要。

  这就是顶尖实验室的工作效率吗?上午申请下午就收到邮件附带快递单号,一看快递员都取件了......而我昨晚发现平台有想要的质粒,今天磨磨蹭蹭尝试申请,还觉得自己老有行动力了

  2020 年 7 月,西湖大学牵头,联合浙江大学药学院和杭州市第一医院集团,共同建设成立了「生命科学和生物医学浙江省实验室」,它的「小名」叫西湖实验室。

  截止今年 4 月,实验室已在高水平期刊上发文超过 200 篇,在Cell、Nature等国际顶刊上发表论文 18 篇。而作为经浙江省政府批准设立的首批省级实验室之一,西湖实验室致力于打通从基础研究到产业转化的全链条,构建「前沿研究-技术攻关-成果转化-产业培育」的一体化创新体系,五年时间里孵化出的 42 家企业中,已有 8 家达到准独角兽规模。

  2023 年 12 月,西湖实验室建设并发布了「WeKwikGene 质粒库」,为国内科研人员提供速度快、质量高、经过验证且随时可用的质粒资源,满足国内科研人员对质粒等分子生物学操作工具的共享需求。

  WeKwikGene 质粒库由西湖实验室 Kiryl D. Piatkevich 团队发起,免费存储和分发质粒,缩短从国外获取需 4-6 个月的等待期,极大提高科研创新效率。

  截至今年年中,已有包括西湖大学、北京大学、浙江大学、复旦大学、清华大学、中国科学院等188 个科研机构的364 个实验室接入 WeKwikGene 质粒库。共有 49 个实验室累计在平台储存质粒 1200 余个。已有916个质粒通过 WeKwikGene 免费共享到全国50 个城市的科研实验室。

  除了西湖实验室的 WeKwikGene 质粒库,能帮助科研人的公益性平台还真不少,学霸君在这就挑几个代表性的说说(以下排名不分先后)。

  PubScholar 是中国科学院建设的普惠性文献资源共享型公益平台,于 2023 年 11 月 1 日正式对公众开放,旨在解决学术资源商品化、垄断化导致的高昂订阅费用和获取门槛问题,推动公共财政资助科研成果的开放共享,致力于实现与国内外各类学术资源拥有者、各类学术服务提供者的互利合作,实现共建共享。

  平台资源每日持续更新。目前平台可检索的元数据资源量约 1.8 亿条,包括科技论文元数据约 1 亿条,科技专利元数据约 8,364 万条,科学数据元数据约 58 万条。

  除此之外,平台还嵌入了 AI 大模型技术,提供 AI 检索、智能综述、多语种翻译等功能,还能主动推送高价值文献。截至目前,访问量已超 10 亿次,注册用户 37 万+,覆盖 158 个国家/地区。

  清华大学图书馆推出的 OpenSign 公益性学术资源服务平台于 2024 年 11 月已正式上线 万篇全球优质 OA 论文,为社会公众提供从资源检索到全文获取的一站式资源服务,面向国内外合作机构提供深度数据服务,并面向学者提供学者主页服务。

  OpenSign 平台主要是推广开放获取的学术资源,并开设了开放科学微信公众号,追踪开放科学与开放获取各领域的最新实践,为学者和机构提供开放科学相关的新闻动态、政策研究、出版支持等资讯。

  国际上最著名、最完整的蛋白质三维结构数据库是 1971 年美国纽约布鲁克海文国家实验室创建的 Prorein Data Bank(PDB),收录通过 X 射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构。数据库目前收录近 24 万个蛋白质结构,以及近 107 万蛋白计算结构。

  2003 年,PDB 走向世界,与英国和日本的研究者联合成立 Worldwide PDB,让更多人能够免费使用该数据库。

  Proteomes 数据库收录已经完成全基因组测序的物种、序列翻译已有注释的蛋白质信息,信息相对全面详细;

  UniRef通过聚类序列隐藏冗余序列以缩减数据库大小,可加快搜索的速度,包含UniRef100、UniRef90 以及 UniRef50 三个数据集;

  Biomni 是斯坦福 SNAP 团队开发的一款通用型生物医学 AI Agent,本周刚刚开源。结合大语言模型推理能力、信息检索、代码执行三大引擎,Biomini 的目标是让科学家只用一句自然语言就能完成复杂的科研任务。

  Biomni 包含了从基因编辑到蛋白质结构预测的 150 个专业工具,59 个核心数据库,能够总结文献,对基因测序的结果进行解读,还能够根据用户需求和参考文献设计实验方案并提示标志物和样本量,还能给出实验每个阶段的预期目标。

  如果一般的通用大模型是通才,那么 Biomini 则是专门针对生物医学领域的 AI 专才。开源后的 Biomni 将源代码放在 Github,感兴趣的伙伴可以直接下载后使用。

  今年 7 月 2 日,我国发布了具有完全自主知识产权的东壁全球科技文献数据平台,共收录全世界范围内近 9000 万条高质量科技文献元数据。

  该平台基于 AI 算法提供高效的文献检索、引文分析和数据追踪等服务,其基础功能对全球用户免费开放。

  目前,该平台仅支持英文关键词检索,但平台引入的「学者成果解读」和「综述自动生成」两大 AI 功能,相当于给每个用户都配备了「AI助手」,用户可以用通俗的语言向 AI 助手询问每一个学者的研究方向、研究特色、突出贡献,甚至可以进行不同学者之间的研究对比。

  作为科研人员,能有各种公益性科研平台助力自己的科研,提高实验效率,缩短成果周期,这可真是大好事儿。可咱用归用,有些规矩还是要知道的。

  即便是公益资源,通常也禁止商业用途。例如,贵安超算中心就明确要求,免费计算资源仅限科研项目,不得用于盈利活动,违者将终止服务并追责。另外,有些平台在用户使用其资源时,会要求使用者遵守材料转移协议,明确使用范围,以及禁止泄露未公开数据。

  正常使用,千万不要用插件或者外挂抢夺资源。比如,PubScholar 刚发布的时候,就曾因访问量骤增,服务器过载导致瘫痪。值得一提的是,很多平台都禁止使用类似爬虫程序的高并发工具,并且禁止批量下载文献或数据。

  如果能在发表的论文里引用一下使用过的科研平台,增加平台的曝光,那一定是极好的。引用方式一般都由平台给范例,直接复制就好。比如 UniProt 就有专门页面介绍如何引用,还给出了最新的例子。

  另外,主动参与平台优化,更新现有工具,通过官方渠道反馈系统漏洞或建议什么的,也非常不错。比如 Biomini 就在 Github 主页上邀请全球的研究者共同建设,欢迎提供新工具、数据集、软件、评估基准及其他诸如教程、示例和用例的所有资源。

  最后,还要强调一点,公益科研平台未必就一定是免费的,搭建运行都需要成本,但相比费用更高的营利性机构,这些公益科研平台已经在为每个科研人提供最大的便利。

  我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖PCR、细胞实验、蛋白研究、神经科学、肿瘤免疫、基因编辑、外泌体、类器官等领域,定期分享实验干货、文献解读等活动。

关键词:翻译研究综述

相关推荐