清华大学・鲁志实验室 科研课题
[ English | 中文 ]
Goals
我们致力于生物信息学研究,从结构和转录后调控(例如剪接和编辑)等多个角度、多个模型探讨非编码RNA的调控作用,并探索其在复杂疾病精准诊疗上的具体实践。
在具体的课题研究中,我们充分发挥生物信息学这一交叉学科优势,利用最新的AI技术和多组学数据,通过和【北京协和】、【北大一院】、【清华长庚】等一线医生专家的合作,在癌症、自身免疫疾病等复杂疾病上探索新的以非编码 RNA 为表现形式的靶标。在研究其免疫调控网络的同时,部分靶标可以应用为个性化精准诊疗时的生物标志物,部分靶标可以做为药物靶点通过AI进行药物设计,在复杂疾病(如癌症和自身免疫疾病)的临床诊断和治疗两个方面实现应用价值。
Projects
我们围绕非编码 RNA(ncRNA)在两个主要的科研方向上进行探索和研究:I. 生信驱动的精准医疗;II. AI驱动的核酸模型和药物设计。
A1. RNAfinder
Discoverying novel noncoding RNAs: 随着测序技术的进步,尤其是单细胞、单分子水平的测序技术的发展和成熟,我们有能力从更多物种、更多组织、更多细胞类型中发现新的非编码RNA(noncoding RNA)。例如,我们可以从人类基因组的各类重复区域(Transposable Elements)、纷繁复杂的微生物群落的宏转录组(Meta-transcriptome of Microbes)中发现和研究不同环境和条件下的新非编码 RNA。这些研究不仅将扩大我们对生命多样性的理解,还可能揭示新的、跨物种的生物学机制。
see more in Background
A2. RNAfinder - Applications
A2.1 [Medicine] Precision Medicine 精准医学
cell-free RNA (cfRNA): 临床血浆样本中的 cfRNA 含量很低且碎片化,需要解决测序数据信噪比低、成本昂贵等问题。我们应用模板转换、早期标记、分子标签和CRISPR-Cas9等技术,开发新型 cfRNA-seq 技术,降低构建高通量测序文库的经济成本并提高了测序数据的信噪比。
exRNA (extra-cellular RNA) 在很多临床研究尤其是液体活检研究中又称为 cfRNA (cell free RNA) ,包括了很多非编码 RNA (ncRNA),如 miRNA,lncRNA,srpRNA,circRNA等。
Clinical applications: 我们将上述方法应用在液体活检上,助力解决临床问题,例如癌症早筛。
通过将转录组学数据与其他多组学数据整合,我们旨在从综合的、多维的水平上去解释复杂疾病的发展。 我们开发测序和生物信息学方法来研究编码和非编码 RNA (ncRNA) 的细胞和细胞外转录组,从单细胞水平和多分子水平研究患者各种免疫细胞内外编码和非编码基因的调控图谱。
对于复杂疾病来说,准确选择最佳的诊疗方案很重要,但也很困难。 例如,一些靶向药物已被批准用于许多复杂疾病,但不同药物的受益人群尚不清楚,需要准确的生物标志物。 因此,通过将免疫细胞数据与血浆中的cfDNA/cfRNA数据以及临床数据相结合,我们开发药效预测模型,为治疗复杂疾病的精确药物指导提供多模态标志物模型。同时,我们针对这些数据探索深度学习、迁移学习、相似性网络融合,以及其他生物信息学分析技术。
我们将上述方法应用于精准医疗,重点关注两类疾病:1)自身免疫疾病;2)癌症。
“癌症和自身免疫疾病,这两者就像硬币的两面:若癌细胞通过某种机制逃脱了免疫系统监视、无法被清除,恶性肿瘤便开始滋长;而当正常细胞因某种原因打破了身体原本的免疫耐受机制,就可能引发自身免疫疾病。” -- 反向疫苗:自身免疫病奇解《环球科学》(Scientific American) 2024年12月号
A2.2 [Biology] Synthetic Biolgy 合成生物学
RNA structure prediction: 我们开发针对 RNA结构的预测模型和算法,对 RNA 结构的准确预测,将帮助我们更好地理解 RNA 的调控和功能,并应用于基于 RNA酶和RNA疫苗的设计。例如,mRNA,以及环装RNA(circular RNA)等,可以用来做为RNA疫苗。在 RNA 疫苗设计中,RNA 结构、密码子和修饰的设计都是非常重要的研究方向。不论是 RNA干扰还是RNA疫苗,提高RNA 在存储和运输中的稳定性,递送到细胞和人体内的有效性和靶向性,都是非常重要和前沿的研究方向。
RNA Design: 不同领域的新方法和新思维的引入,往往能带来本学科的突破性进展,所以我们尤其注意将最新的计算领域的新技术和新思维(例如基于大语言模型的新型 AI 技术)引入到生物数据的研究上。我们针对RNA,尤其是 非编码 RNA (ncRNA),的结构、调控和靶标等问题,开发新型的核酸模型。最终,这些新型的模型将会带领我们进入一个崭新思维的酶设计、疫苗设计和药物设计的新时代。
B1. RNAtalk
RNA-RNA interaction (trans-pair) : RNA靶向RNA在各种生物过程中发挥着至关重要的作用,包括基因调控、RNA加工和病毒复制。 预测 RNA-RNA 相互作用涉及识别和表征两个 RNA 分子之间的结合位点,这可以深入了解它们的功能关系和调控机制。 值得注意的是,由于 RNA 结构的复杂性、巨大的序列空间以及经过实验验证的相互作用数据的有限性,预测 RNA-RNA 相互作用仍然是一个具有挑战性的问题。 因此,预测的准确性可能会根据所使用的具体方法和输入数据的质量而有所不同。 我们开发和完善用于预测 RNA-RNA 相互作用的计算方法,旨在提高对 RNA 生物学的理解,并促进新的治疗靶点和基于 RNA 的调控机制的发现。
B2. RNAtalk - Applications
B2.1 RNAi & AIVC 小核酸和虚拟细胞
siRNA prediction: siRNA已成为一种广泛使用的转录后调控实验方法,并且越来越显示出其作为未来靶向药物的潜力。 然而,高效siRNA的预测仍然受到数据集偏差、预测方法的不足以及脱靶效应的存在的阻碍。为了克服这些限制,我们开发新的人工智能方法来预测和设计高效的siRNA。
RNAi screen for therapy development in AIVC. "开发成功疗法的一大挑战在于,药物发现和开发过程中难以全面整合疾病的遗传、分子和细胞基础。这些特定情境下的基础机制尚未完全明确,且在人类患者和临床前研究中使用的模型系统之间往往存在差异。通过整合来自不同来源的与特定疾病情境相关的生物学数据,基于人工智能的虚拟细胞(AIVC: AI based virtual cell)可以构建一个环境,用于在计算机模拟中测试不同的治疗干预措施,并识别改造细胞以逆转疾病表型的方法,同时考虑不同治疗方法和患者特征的影响。AIVC 能够呈现特定患者群体的整体疾病表型(而非一次只针对一个特定的生化靶点),从而实现虚拟表型筛选。尽管计算机模拟实验并非总是完全准确,但通过优先筛选成功率更高的虚拟候选药物,AIVC 可以降低实验成本并加快研发进程。" (2024 Cell - How to build the virtual cell with artificial intelligence - Priorities and opportunities)
modified from "2024 Cell - How to build the virtual cell with artificial intelligence - Priorities and opportunities"
B2.2 Small-molecule Drug Design 小分子药物设计
Small molecule drug design targeting RNA: 可作为小分子药物靶标的人类蛋白数量非常有限:在人类的2万个左右的蛋白编码基因(占人类基因组总长度的1.5%左右)中,大约有 10%-15%与疾病直接相关;而在这些基因中,据估计仅有不到 700 个的蛋白产物是可以成药的 (仅占人类基因组总长度的 0.05%左右)。另一方面,人类基因组的~70%甚至更多都会被转录成 RNA,其中大多是非编码 RNA (ncRNA)。因此,近年开始有越来越多的研究者试图将 RNA 作为药物靶标,并初步证明了这一策略的可行性。尤其值得我们注意的是,新冠病毒就是 RNA 病毒,其基因组本身也有希望被作为药物靶标。此外,利用非编码RNA进行疾病治疗也是一个有前景的研究方向,例如,基于 siRNA 的RNA干扰(RNA interference, RNAi)系统等已经被用于开发新的基因治疗方法。由于 RNA 结构的高度复杂性和可变性,以及实验方法的限制,目前我们对于 RNA 的三维结构的了解仍非常有限,靶向 RNA 的药物研发也处在起步阶段。 我们将充分发挥人工智能的优势,利用深度学习等最新的计算技术整合多方面的信息,设计新药物靶标RNA。







