化学经纬
化学经纬

DNA编码化合物库技术(DELT)

chem药物研发93690



DNA编码化合物库技术(DNA Encoded Library Technology, DELT)是一种新兴的药物早期发现技术。它通过合成超亿级巨型化合物库,结合亲和筛选和测序解析,从而发现苗头化合物(hit)。该技术涉及多学科,并历经20多年发展。尤其自2015年以来,该技术得到学术和工业界广泛关注和运用,成为药物早期发现的常规技术之一。药石科技DELT平台具备新颖分子砌块的独特优势。


  1. 01

    技术背景


DNA编码化合物库技术的设想与组合化学密切相关,上世纪90年代,传统高通量筛选(High Throughput Screening, HTS)兴起并得到广泛的运用,从而推动高通量筛选技术各个环节的改进。高通量筛选库中化合物主要是通过组合化学逐个合成,因此研究者们发明标记组合化学技术,促使合成效率极大提高,虽然化合物是以混合物形式存在,但通过标记技术能识别单个化合物。1992年,Scripps研究所的Sydney Breener和Richard Lerner提出DNA编码来标记化合物,并合成DNA编码化合物库的概念[1]。DNA中的四个碱基A、G、C、T能够随机编码组合成不同的DNA序列,方便用以标记。随后,各种建库策略涌现,主要分为单药效团库(Single-Pharmacophore Library)双药效团库(Dual-Pharmacophore Library) 单药效团建库方法有DNA-recorded synthesis[2]、 DNA-templated synthesis[3]、DNA-routing synthesis[4]、YoctoReactor技术等[5];双药效团库有Encoding self-assembled chemical library (ESAC)[6]。期间,第二代高通量测序技术和液相合成操作的出现,极大推动DEL技术的发展及实际运用。

  1. 02

    技术流程

各种策略的技术流程大体类似,如图一所示,可分为6个环节。

DNA编码化合物库技术(DELT) 第1张

图一: DNA编码化合物库技术流程图

2.1 库合成流程

化合物标记通过DNA编码分子砌块来实现,比如3循环库,需要3套分子砌块,则设计3套DNA编码一一对应,库化合物是3套分子砌块的组合,相对应的3套DNA编码组合就完成该化合物的标记。DNA中A、G、C、T四个碱基按一定规则组合,将产生几千条到几万条9-13碱基长度的DNA链,可分别用于标记不同循环的分子砌块。库设计遵循组合化学,一般2-4循环,每循环含连接分子砌块的化学反应,连接DNA链的酶连反应,及去保护反应等。根据所含反应官能团的多少,分子砌块可分为单、双和三官能团。连接分子砌块的反应在水与有机溶剂的混合溶剂中进行,而DNA 链对酸、碱、高温等比较敏感,可使用的反应受到一定限制,但常见可平行进行的药化反应已经能够实现[7],化学家也致力开发更多的反应[8]DEL库设计就是用DNA兼容的反应将单、双和三官能团分子砌块组合起来,库化合物的多样性主要来源于分子砌块的多样性和新DNA兼容反应DEL库合成是微量操作,单孔反应体积仅几十微升,基本是利用生物实验室设备来进行有机合成操作。单个库合成量一般在几到几十微摩尔,用冻存管保存于低温冰箱中,可使用上千次以上。

如下图二,展示了一个3循环(cycle)的库合成流程,起始Headpiece (HP)相当于一个可两端进行反应的连接子,一端为一条短的DNA链,可以通过酶连反应连接DNA编码;另一端为NH2, 可连接分子砌块。将HP分装到96孔板的每个孔中(split过程),紧接着,每个孔分别加入1条第一个循环的DNA链(tag 1),与HP的DNA一端进行酶连反应,再在每个孔中加入1个第一个循环的分子砌块(BB1),该分子砌块将与HP另一端的NH2进行酸胺缩合,这样使每个孔中含一个Tag 1和一个BB1,确保了每个BB1被一条独特Tag1标记。将所有的孔合并到一个离心管中(pool过程),完成第一个循环。然后,重复操作,进行下2个循环[2]。该库的大小:96 X 96 X 96 = 884,736化合物。如果每个循环为1000个分子砌块,则3个循环后,库的大小为:1000 X 1000 X 1000 = 10亿化合物

DNA编码化合物库技术(DELT) 第2张

图二: DNA编码化合物库合成流程图

2.2  筛选流程

DEL库是混合物形式,亲和筛选极为合适。亲和筛选的原理是利用高浓度的蛋白驱动吸附小分子结合到活性口袋的过程,几轮筛选后,有结合作用的小分子将富集起来。蛋白需带有标签,如His或Biotin tag等标签,通过标签,可将蛋白固载到磁珠(Beads)或者树脂(resins)上。筛选的库用量为纳摩尔级,依据不同的筛选条件,仅需几百微克蛋白用量,50-100微升溶液体积,在1.5毫升的离心管中即可进行筛选操作。如下图三,筛选流程含4个主要步骤。在离心管中将蛋白固载到磁珠后,将DEL库加入(load),进行孵育(bind),随后用缓冲液洗涤除去不能吸附的DNA小分子复合物(wash),然后加热将蛋白变性,游离出被吸附的DNA小分子复合物,并用洗脱液将之收集起来(elute),进行下一轮筛选,一般2-3轮。可筛选的靶点类型有激酶、水解酶、蛋白酶、G蛋白偶联受体、蛋白-蛋白相互作用靶点和转录因子等几十种靶点类型[9]。理论上,可以表达纯化的蛋白,都可尝试做亲和筛选。近年来,人们也在尝试液相、共价、细胞内、细胞表面、RNA等筛选方法[10]。筛选实验前,可做一些预实验,比如,蛋白固载效率,筛选缓冲液对蛋白的活性影响等;也可以增加一些对照条件,比如,不加蛋白,加入已知抑制剂等。

DNA编码化合物库技术(DELT) 第3张

图三: DNA编码化合物库亲和筛选流程图

2.3  测序

筛选完后,洗脱液中的样品浓度极低,使用PCR技术将样品拷贝数呈指数级递增,同时PCR能将测序引物接头引入。第二代高通量测序技术(next generation sequencing)能快速收集成百上千G的数据,当前常见的测序仪都能满足DEL技术要求,如Hiseq, Novoseq等。

2.4  数据分析

将测序数据用数据分析程序进行解码,对照库设计时DNA编码和分子砌块的对应关系,可解码化合物结构,从每个化合物编码的序列重复数(counts),初步看出化合物的富集程度。筛选和测序时会引入一些假阳性,需要开发一些特殊的数据分析方法做进一步分析,如自动进行富集度计算、画出各种2维和3维的图形等,并结合SAR和类药5规则,找出可能有结合活性且性质较好的化合物(binders),并确定优先化合物。尤其,在2维或3维图中观察到明显的线或面信号,代表一个结构系列,且丰富的SAR。

2.5  化合物重合成

上述只是从数据中分析出可能的活性分子,这些分子带DNA链,而且库合成的是混合物,筛选和测序过程中可能会引入假阳性,亲和筛选也仅能体现结合力(Kd),而不是功能性活性(IC50),需要再合成去掉DNA链的化合物(Off-DNA化合物)来进行验证。另外,化学反应通常不能反应完全,也可能有副产物和中间体生成等,导致这些化合物和目标化合物共用同一条DNA编码链。可以合成带DNA链的化合物(On-DNA化合物),用ASMS方法判别到底是目标化合物还是副产物或中间体等产生的富集。Off-DNA化合物合成耗费较多的人力和时间,可以根据项目和结构系列的情况,综合考量,挑选可接受binders数,进行Off-DNA重合成。

2.6  苗头化合物验证

对于Off-DNA化合物的活性验证,通常检测亲和力Kd和功能性活性IC50,也可根据靶点和项目的需求进行更多的测试。如表一,DELT产生的hit已有3个项目推进到临床,大多数还在临床前[11]

表一: DEL筛选苗头化合物与优化后临床化合物

DNA编码化合物库技术(DELT) 第4张

表格来源于https://doi.org/10.1021/acsptsci.1c00118

  1. 03

    优势和挑战


与传统化合物库相比,DELT具备许多优势,尤其可低成本快速建立百亿级规模的化合物库,保存所有化合物仅需要一台低温冰箱;亲和筛选流程简单,周期短,蛋白用量少,成本极低[11]。如下表二。

表二: DNA编码化合物库与传统化合物库比较

DNA编码化合物库技术(DELT) 第5张

DEL技术也面临一些挑战,如DNA可兼容反应有限、新颖的双三官能团分子砌块较难获得、固载筛选仅限于可表达纯化的蛋白、新筛选方法的通用性尚待进一步验证、成本较高等。这些也是DEL技术可进一步改进和发展的方向,提升库化合物的多样性、新颖性和类药性,以及拓展DEL技术的应用场景。相比其它药物早期发现技术,DEL仍属于较新兴前沿技术,相信随着更多的hit优化进入临床,将见证DEL技术产生的上市药物,并持续性帮助和推动药物研发。

  1. 04

    药石科技DELT平台


药石科技专注分子砌块业务近15年,形成60+结构系列,其中18个核心骨架结构处于行业领导地位,常年20000+库存,并年递增数千新分子砌块。依托分子砌块的独特资源,药石科技以更好的起点,建立起全流程的DELT平台,含87个库,共85亿化合物,全部为2或3循环库。除此之外,针对DELT的现有不足,已开发10个新反应,平行合成近2000个药物中的优势骨架,进一步加强库多样性、新颖性和类药性。经过一段时间的内部验证,已经可以开展DEL BB kits销售和靶点筛选服务。

我们已经成功筛选数十个不同类别靶点,如图四,其中3个靶点的苗头化合物活性IC50 < 10 nM,其中最好活性为IC50 = 0.85 nM

DNA编码化合物库技术(DELT) 第6张

图四: DELT苗头化合物分布

我们也对部分靶点的苗头化合物进行优化,如图五,是其中一个靶点的筛选及优化案例。分别从13个库和22亿化合物中筛选到7个化学结构系列的信号,Off-DNA合成及验证后,初始苗头化合物结构新颖且活性高达5.4 nM,是一个项目很好的起点,进一步考察SAR并优化,迅速发现一个高选择性的化合物。

DNA编码化合物库技术(DELT) 第7张

图五: DELT筛选及优化案


参考文献


[1] Brenner, S. and Lerner, R. A. Encoded combinatorial chemistry. Proc. Natl. Acad. Sci., 89, 5381–5383 (1992).

[2] Clark, M. A., Morgan, B. A. et al. Design, synthesis and selection of DNA-encoded small-molecule libraries. Nat. Chem. Biol., 5, 647−654 (2009).

[3] Liu, D. R., et al. DNA-Templated Organic Synthesis and Selection of a Library of Macrocycles. Science 305, 1601−1605 (2004).

[4] Halpin, D. R., and Harbury, P. B. DNA Display I. Sequence-Encoded Routing of DNA Populations. PLoS Biol. 2, e173 (2004).

[5] Hansen, M. H., Hansen, N. J., et al. A yoctoliter-scale DNA reactor for small-molecule evolution. J. Am. Chem. Soc. 131, 1322−1327 (2009).

[6] Melkko, S., Scheuermann, J., Dumelin, C. E., and Neri, D. Encoded Self Assembling Chemical Libraries. Nat. Biotechnol. 22, 568−574 (2004).

[7] Richard, J. F., Ryan, T. W., Christopher, D. H. The expanding reaction toolkit for DNA-encoded libraries. Bioorg. Med. Chem. Lett. 51, 128339 (2021).

[8] Wang, J., Baran, P. S., et al. Kinetically guided radical-based synthesis of C(sp3)-C(sp3) linkages on DNA. Proc. Natl. Acad. Sci. 115 (28), 6404–6410 (2018).

[9] Christopher C. Arico-Muendel. From haystack to needle: finding value with DNA encoded library technology at GSK. Med. Chem. Commun. 7, 1898-1909 (2016).

[10] Satz, A. L., Brunschweiger, A., Flanagan, M. E. et al. DNA-encoded chemical libraries. Nat. Rev. Methods Primers. 2, 3 (2022).

[11] Dario Neri. et al. DNA-Encoded Chemical Libraries: A Comprehensive Review with Successful Stories and Future Challenges. ACS Pharmacol. Transl. Sci. 4 (4), 1265–1279 (2021).

[12] Foley, T. L. et al. Selecting Approaches for Hit Identification and Increasing Options by Building the Efficient Discovery of Actionable Chemical Matter from DNA-Encoded Libraries. SLAS Discovery. 26 (2), 263–280 (2021).


发布评论0条评论)

您需要 登录账户 后才能发表评论

还木有评论哦,快来抢沙发吧~