一个空培养皿,旁边是一个带有不断增长的菌落的培养皿。

足球比赛结果 焦点研究:针、干草堆和糖链

Tarun Dam 和 Dukka KC 跨学科合作,利用生物信息学的力量 加强和加速糖生物学的重要工作。

糖生物学家和计算机科学家联手寻找蛋白质结合聚糖 更快——理解人类健康和疾病的重大进步。

不久之后杜卡 KC2021 年秋季抵达校园,计算机科学向足球比赛结果的糖生物学家发送电子邮件塔伦大坝。达姆记得,这张纸条的实质内容是:“我发现你是一位糖生物学家。 我从事一些有关糖分子的生物信息学工作。也许有一天我们可以一起工作。”

两人很快就吃过午饭。他们发现他们来自亚洲邻国, 并成为了好朋友。 “我们聊了几个小时,”KC 回忆道。 “塔伦太棒了 如此热情。他的热情很有感染力!他热爱糖生物学。”

他们的友谊已成为他们专业合作的基础, 根据达姆的说法,这就是科学。 “在了解 Dukka 和他的作品之后 确实,我印象非常深刻。我认为这是一个非常好的合作机会。”

但是使用先进计算机技术的生物信息学领域如何 收集和分析生物数据,应用于糖生物学——结构研究 碳水化合物的生物学功能?答案需要简短的科学课。

蛋白质是氨基酸链。这些链可以是 2,000 个或更多氨基酸 长度,但它们会压缩自己以节省空间。为了发挥功能,蛋白质 链需要额外的附件——科学上称之为翻译后修饰, 或 PTM。

Dam 雄辩地将它们称为装饰品。

许多这些装饰物都是糖分子或聚糖,它们会自行附着 通过称为糖基化的过程形成蛋白质链。这个过程只能 发生在特定的氨基酸上,并且仅当它们以某些组合连接在一起时。 但有时,即使是正确的氨基酸序列也不会具有预期的效果。 装饰布置——达姆称之为“一个荒谬的问题”,尤其是 当了解这些聚糖的位置对于了解健康和 疾病。

“当人们患上癌症时,他们的糖装饰模式经常会发生变化,”达姆说。 “因此科学家需要知道蛋白质中的哪些氨基酸被聚糖占据 装饰品,哪些是空的,以及图案何时发生变化。”传统上, 糖生物学家已经在实验室中通过实验完成了这项工作。 “我们切割了一种蛋白质, 我们识别出糖链,然后写一篇论文。这是一项艰巨的工作。它 需要专业知识。这需要钱。这需要时间。有时需要数年时间才能生产 结果以了解整体情况。”

塔伦大坝

“我们所做的一切、我们的身份——全都是因为蛋白质。”

塔伦大坝
化学教授;生物化学与分子生物学学士主任 程序

当 Dam 收到 KC 的电子邮件时,他看到了利用机器学习力量的机会 使糖生物学过程更加高效。

与威奇托州立大学、堪萨斯州立大学的合作者合作, 美国休斯敦大学、日本东京创价大学、Dam、KC开始学习 称为天冬酰胺的氨基酸的糖基化。附着在天冬酰胺上的聚糖 被称为 N 连接聚糖,只有当天冬酰胺有两个时,它们才能附着在天冬酰胺上 其右侧有特定的氨基酸。第一个可以是 20 个常见的任意一个 除脯氨酸外的氨基酸,第二个必须是丝氨酸或苏氨酸。

由美国国家科学基金会、Dam 和 KC 及其合作者资助 开发了 LMnglyPred,一种基于深度学习的方法来预测 N-连接糖基化 使用预先训练的语言模型的嵌入来识别人类蛋白质中的位点。

“现在,甚至无需做任何实验,我就可以去找杜卡这样的计算机科学家, 如果我给他们一种已知的蛋白质,他们可以预测并说,‘好吧,你有五个 该蛋白质中含有天冬酰胺。三个将在这个位置有糖链。两个会 不。’无需任何实验!这就是机器学习和这种协作的力量。”

像所有优秀的老师一样,KC 使用熟悉的比喻解释了他在该项目中的部分。

“我们不能肯定地说,‘这就是针的位置,’”KC 说。 “但我们真的可以 缩小搜索空间,这样我们就可以搜索而不是查看所有内容 它最有可能出现的区域。”

杜卡 KC

“在生物信息学中,我们常说我们并不是大海捞针。 我们正试图在大海捞针中找到最有可能出现针的几个地方 将会是。”

杜卡 KC
计算机科学教授;计算机学院研究副院长

KC 说计算机科学领域和糖生物学已经合作了近二十年,但使用深度学习 这项工作中的工具和大型语言模型非常新,以至于 KC 认为他, Dam 和他们的合作者可能是第一个使用语言模型来预测的人 糖基化。对达姆这样的糖生物学家以及医学领域的影响 作为一个整体——潜力是巨大的。

尽管大型语言模型和其他人工智能取得了巨大的飞跃 近年来,KC 很快就承认了他的工作基础 休息。

“这是一个循环,对吗?” KC 说。 “像塔伦这样的实验家生成了所有这些数据, 我们用它来训练我们的模型。然后我们使用蛋白质语言模型来告知 更多更好的实验。所以他们的数据帮助我们的模型变得更好,而我们的模型 帮助他们的实验变得更好。这是一个循环。”

Dam 表示,他和 KC 对于在蛋白质方面进一步合作有“伟大的想法”,特别是 那些具有癌症生物标志物的人。

“Tarun 只关心糖,”KC 笑着说,像老朋友一样取笑 Dam。 “并不是要贬低糖的含量,而是有 400 种翻译后修饰, 糖基化只是这 400 种中的一种。但当我和 Tarun 交谈时,他做到了 听起来好像那个装饰品是世界上唯一重要的东西。”

Dam 向 KC 开起了善意的玩笑。 “是的,是的,他研究另一个 装饰品也一样,”达姆假装不屑地说。 “但其他修改不会影响 70%的蛋白质。只有糖基化会影响蛋白质从出生到死亡的整个过程。 我试图说服杜卡在糖生物学方面做更多的事情。它是如此巨大,如此重要。”

KC 笑了,然后承认他和 Dam 正在考虑探索“相声” 磷酸化和 O-GlcNAc 之间的关系。”他对这些重要性的解释 糖基化对生物学和人类健康的影响引起了他朋友的钦佩 和同事。

“杜卡不是糖生物学家,但他理解它的重要性,就像 他就是其中之一,”达姆说。 “和他一起工作很有趣。我们尊重彼此的专业知识。 我们两个实验室都在做意义重大的工作,而这种意义只会 随着我们合作的持续不断发展。”

KC 同意。 “当然,我们也有自己的其他兴趣,但我们发现了一些共同点 兴趣——这些糖将我们联系在一起。”

足球比赛结果是一所 R1 公立研究型大学,成立于 1885 年,位于霍顿,拥有来自全球 60 多个国家的近 7,500 名学生。密歇根州旗舰科技大学的投资回报率一直名列全美最佳大学之列,提供超过 185 个本科毕业生科学技术、工程、计算机、林业、商业、健康专业、人文、数学、社会科学和艺术领域的学位课程。乡村校园距离密歇根州上半岛的苏必利尔湖仅数英里,提供全年户外探险的机会。