精准医疗时代下生物样本库的建设与发展特点
2022-5-26 11:08:002016年10月,中共中央国务院印发了《“健康中国2030”规划纲要》,在“健康中国”大背景下,精准医疗(precision medicine)和生物样本库迎来了快速发展的黄金时期。精准医疗与生物样本库在发展进程中相辅相成,相互促进。一方面,精准医疗的药物和技术研发,对生物样本资源产生大量需求,同时也对生物样本库的建设标准提出了更高要求,促进了生物样本库的发展和完善;另一方面,生物样本库的建设成为精准医疗发展的基石,为其提供便利的平台和丰富的资源,助力精准医疗的快速发展。本文主要阐述精准医疗时代生物样本库的发展现状、特点以及存在的问题与不足。
1 精准医疗时代生物样本库的发展现状
精准医疗是以个体化医疗为基础、随着基因组测序技术的快速进步以及生物信息与大数据科学交叉应用而发展起来的新型医学概念与医疗模式,其本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对大样本人群与特定疾病类型进行生物标志物的分析、鉴定、验证与应用,从而精确寻找疾病原因和治疗靶点,并对一种疾病的不同状态和过程进行精确亚分类,最终实现对疾病和特定患者进行个性化精准治疗的目的,提高疾病诊治与预防效益[1]。精准医疗概念的提出始于2011年美国国家科学院发布的《迈向精准医疗:构建生物医学研究和知识网络及新的疾病分类体系》报告,其将精准医疗视为癌症及其他部分重症治疗的最优方式之一[1]。此后,发达国家相继启动国家政策和大型精准医疗研究项目。2012年,英国启动了“10万人基因组计划”,2017年完成了10万人基因组测序工作;2016年,法国启动了基因组和个体化医疗项目“法国基因组医疗2025”,并在全国范围内建立了12个基因测序平台、2个国家数据中心[2]。此外,韩国的万人基因组计划、澳大利亚的个性化儿童癌症治疗项目——儿童零癌症计划(Zero Childhood Cancer)等亦纷纷开展[3]。2015年3月,我国成立了精准医疗战略专家组;2016年12月,国务院印发了《“十三五”国家战略性新兴产业发展规划》,从国家政策层面推动精准医疗的发展。近年来,随着生物医药技术的不断发展,国内精准医疗行业备受关注,与精准医疗相关的各个细分领域如免疫细胞治疗、3D打印、人工器官、液体活检等产业和技术发展如火如荼[4]。
生物样本库保存的人类生物资源及相关信息,是转化医学研究的重要资源,是精准医疗的前提之一。精准医疗各细分行业的发展均依赖大量高质量的生物样本和信息资源作为研究材料。以“十二五”及“十三五”精准医疗实施为背景,为整合完善的临床样本和疾病信息资源库,加强资源共享网络建设,我国出台了一系列相关政策。国内各大医院纷纷成立了精准医疗中心,建设医疗信息大数据平台,同时建立生物样本库,作为助力精准医疗转化研究的支撑平台。生物样本库的建设同时取得政府部门、大学及医疗机构的政策和经费支持,其在顶层设计、建设规划、功能布局及质量控制等方面均纳入精准医疗的发展需求,以提供针对性的支撑服务。
目前,精准医疗的发展成果主要集中在肿瘤领域,随着肿瘤研究的发展,肿瘤治疗的聚焦方案从针对细胞周期靶点的化疗药物,到针对基因突变的分子靶向药物,再到针对免疫治疗靶点的免疫疗法,精准医疗的理念贯穿其中并逐步完善[5-7]。与此同时,生物样本库作为标准化采集、处理、储存和应用健康与疾病生物体的生物大分子、细胞、组织和器官等样本(包括人体器官组织、全血、血浆、血清、生物体液或经处理DNA、RNA、蛋白质等)以及与这些生物样本相关的临床、病理、治疗、随访、知情同意等资料及其质量控制、信息管理与数据应用系统的综合性建设工程,成为精准医疗发展的坚实基础,进入快速发展的黄金时期。
随着生物技术的快速发展,精准医疗概念的内涵与外延也在发生演变,在精准分子诊断和分子治疗的基础上,细胞治疗亦具有广阔的发展前景。新型细胞治疗技术、肿瘤免疫检查点抑制剂、间充质干细胞临床应用、干细胞移植治疗、基因编辑等成为细胞治疗研究的热点。备受关注的细胞免疫治疗已从早期的淋巴因子激活的杀伤细胞、肿瘤浸润淋巴细胞、多种细胞因子诱导的杀伤细胞及细胞毒性T淋巴细胞等传统或非特异性细胞疗法,发展为特异性的新型细胞疗法。如嵌合抗原受体T细胞免疫疗法(chimeric antigen receptor T-cell immunotherapy,CAR-T)是一种新兴的精准医疗手段,其利用患者的自身细胞,提取血液中的免疫T细胞,在体外进行基因工程改造,令其识别肿瘤细胞表面抗原,然后通过CAR-T技术以及T细胞受体嵌合型T细胞技术再把这些细胞回输至患者体内,以达到识别、杀死肿瘤细胞的目的。
随着细胞治疗领域科研投入的加大和技术实力的不断增强,监管政策也逐渐明朗,干细胞新药临床试验申请相继获批。截至2020年底,我国干细胞临床研究备案机构已达119家,备案项目达87项,细胞资源库成为生物样本库建设的重要分支。如上海市东方医院建立了以干细胞临床研究和基础研究等资源为一体的标准化生物样本库,中国人民解放军总医院等大型医院也相继建立了临床干细胞存储服务体系,包括围产期干细胞资源库、自愿献血者免疫细胞库等。
2 精准医疗时代生物样本库的发展特点
2.1 生物样本库的建设需要标准化和规范化
精准医疗涉及个性化和标准化两个理念的平衡,这亦是现代医学发展的必由之路。从精准医疗所依托的基因测序技术平台可以看出,基因测序技术标准正处于逐步完善的进程中。同样,作为样本资源和数据信息整合平台的生物样本库也需要实施标准化和规范化建设。在生物样本库建设和发展初期,各区域、各级医疗单位的生物样本库建设工作缺乏统一的规范和标准,造成样本质量良莠不齐、利用率低,资源共享和流通困难等问题,限制了大型多中心临床研究的开展。
近年来,我国生物样本库的建设、管理等各方面工作不断迈向标准化和规范化。为推动我国生物样本库标准化建设的发展,2009年中国医药生物技术协会组织生物样本库分会正式成立,并组织编写了《中国生物样本库与数据库建立指南》,于2011年出台了《中国医药生物技术协会生物样本库标准(试行)》。2015年,我国成立了全国生物样本标准化技术委员会,主要负责生物样本的采集、处理、存储、管理、分发及相关技术、方法、产品领域国家标准的制订和修订工作。2019年7月,《中华人民共和国人类遗传资源管理条例》发布,对我国人类遗传资源采集和保藏等相关管理工作作出了明确规定。2019年8月,中国国家标准化管理委员会发布了《生物样本库质量和能力通用要求》,规定了生物样本库能力、公正性、持续运行(含质量控制)的通用要求,确保生物样本和数据资料的质量。
国际、国内生物样本数据标准化及数据库建设工作亦在不断完善中。泛欧洲生物样本库与生物分子资源研究平台(BioBanking and Molecular Research Infrastructure,BBMRI)提出了生物样本库信息共享的最小数据集(minimum information about biobank data sharing,MIABIS),规定了生物样本共享标准化的52个属性,要求包含必需的基本信息,以实现生物样本库之间的合作以及生物样本与数据的交换。2017年,中国国家组学数据百科全书(National Omics Data Encyclopedia,NODE)成立,提供了一个集成、兼容、可比、可扩展的多组学资源平台。NODE采用分层数据架构,支持多组学数据的存储,包括454、IonTorrent、Illumina、SOLiD、Helicos和Complete Genomics等平台的测序数据、基于MS的蛋白质组学数据、基于MS或NMR的代谢组学数据和荧光成像数据。NODE提供组学数据的全生命周期功能,从数据归档、数据请求/响应到数据共享、数据分析、数据审核和发布,已为世界各地的研究人员收集和发布超过900 tb的组学数据,其中22%包含多种组学数据。
2.2 生物样本库的发展依赖信息化建设和发展
精准医疗基于大数据建设的完善和数据挖掘解读技术的发展,大量基因测序数据的传输、整合和挖掘解读均需要高通量大数据快速分析和云计算的帮助;同时,要将数以百万计的健康志愿者信息、临床诊疗信息、基因组信息汇集储存,传输到不同的云端或平台,以实现数据分析和信息共享,均离不开信息化技术的支撑。
现代生物样本资源库分为“湿库”和“干库”,作为数据资源的“干库”与实体样本资源同等重要,是生物医学研究的基石。通过对生物样本数据库中组学数据与临床资料(病史、影像学、实验室、病理、随访及生存信息等)的整合,有助于寻找表型与基因组学之间的联系并发现精准治疗靶点。
信息化建设是生物样本库建设首要考虑的顶层设计问题,国内外大型优质的生物样本库在信息化建设方面均具备良好的基础,并不断探索创新。2018年,UK Biobank发布了50万名参与者的全基因组遗传数据分析结果,这些基因数据可从UK Biobank获取,供全世界开展生物医学研究。目前已有数百项研究项目围绕该数据库展开,在癌症、心脏病、糖尿病、卒中、骨质疏松和精神分裂症等领域获得了新的研究发现。
“十三五”规划以来,我国实施了一系列国家政策将医疗信息化推向了快速发展的新阶段,如复旦大学中山医院设立了大数据人工智能中心,南京医科大学设立了生物医学工程与信息学院,实践医疗信息化的专职管理部门和学科建设工作。
2.3 生物样本库的发展离不开多中心联盟与共享
任何诊断治疗方案均源于严格的临床试验证据,包括精准医学在内的现代医学应遵循循证医学原则。从近年来的相关研究可以看出,大型多中心临床研究促进了精准医疗的发展,如对恶性肿瘤靶向药物的开发及细胞程序性死亡配体-1(programmed cell death-ligand 1,PD-L1)相关免疫治疗在临床的快速进展和突破,完善的生物样本库建设及大型多中心临床研究的开展发挥重要作用[8-9]。
知名的大型生物样本库一般采用多中心联盟形式。如BBMRI,囊括了欧洲 30 多个国家的 200 多所机构,现存样本量超过5000万份。此外,美国癌症生物医学信息网络(Cancer Biomedical Informatics Grid,caBIG)[10]、美国生物存储和生物样本研究中心(Biorepositories and Biospecimen Research Branch,BBRB)、加拿大肿瘤资源库协作网(Canadian Tumor Repository Net-work,CTRnet)、英国生物样本库(UK Biobank)等均在国家层面自上而下进行管理,制定统一的样本采集、存储及资料信息化管理标准[11]。
2015年,科技部成立了“国家人类遗传资源共享服务平台”,设立北京、上海、广州3个中心,纳入数百家生物样本库建设单位,促进样本资源的流通和共享。2016年,中国生物样本库联盟成立,在生物样本公开、共享、可持续发展与建设新模式等方面进行探索与实践,促进各专病生物样本库之间的沟通与合作,促进多中心研究和资源共享,推进大数据的转化研究进程,推动和提升我国在该领域内的数据共享应用[11]。此外,北京、上海、江苏等地多家生物样本库也形成了区域性的样本库联盟,在标准化共享方面不断探索新模式。
2.4 生物样本库的发展需要多学科融合支撑
精准医疗是一项复杂的系统工程,它将组学技术、数字影像、系统生物学、信息科学、大数据等现代科技与传统医疗进行融合创新,形成精准医疗的体系和范式,指导医学实践。精准医疗所涉及的技术贯穿疾病预防、诊断、治疗及生物试剂、新药开发等整个医疗流程,包括基因测序、3D 打印、造影、器官移植等高新技术,以基因测序产业链为例,涵盖上游的测序仪器与试剂耗材、中游的基因测序服务和下游的生物信息学分析。
作为精准医疗基础平台的生物样本库涉及多学科知识,包括样本科学、低温生物学、生物信息学、统计学、伦理学等,从前期实体样本库的选址、设计等,到运行阶段样本的采集、处理、质控、运输、项目管理,再到后期的医学研究成果转化、共享规范、知识产权分配等,需融合多个基础学科,样本库从业人员需不断充实和学习多方面的知识和技能。目前,国内已有医学院校设立了生物样本库专业,为生物样本库领域培养专业化人才。
3 精准医疗时代生物样本库的发展阶段
生物样本库的发展阶段与精准医疗的发展阶段是同步推进的。随着精准医疗的发展,生物样本库以精准医疗项目为导向开展建设,成为其提高价值和利用率的有效方案;当生物样本库发展至更为成熟的阶段时,将更好地支撑精准医疗的发展。
3.1 初级阶段:生物样本和信息资源的整合平台
初级阶段启动基础设施建设,制定标准化工作流程,开展生物样本和信息资源的采集及标准制订工作,初步建成采集和管理生物样本及其临床信息的工作平台。该阶段为生物样本库建设的基础阶段,可完成并实现样本资源与生物信息的“输入”功能。组成生物样本库和信息库的主要要素包括多种类型的实体样本、生物样本衍生物、相关伦理文件(如知情同意书等)以及捐献者的临床信息、实验室检测信息、组学数据等,研究人员可从多个层面开展精准医疗相关的研究和验证,其产生的数据仍返回至样本库,与原有实体样本和信息数据融合,不断丰富和拓展生物样本库的内涵。
3.2 中级阶段:精准医疗研究的支撑服务平台
中级阶段的生物样本库不仅作为样本采集存储的场所,而且还提供各类技术服务平台,实现生物样本资源和研究数据的转化,如样本存储平台,生物大分子提取检测平台,组织、细胞、分子等多水平试验平台,以及生物样本下游的精细化加工和处理平台等。根据精准医疗的研究需求,聚焦临床重大疾病,建立生物芯片数据分析、蛋白质组数据分析、人类疾病高通量生物信息学等筛选技术体系,形成相应的生物信息数据挖掘和技术开发能力,一站式获取所需信息和数据。该阶段是生物样本库建设过程中的关键阶段,是生物样本库从临床样本信息资源采集平台转变为精准医疗研究项目支撑服务平台的角色转化阶段。
3.3 高级阶段:精准医疗成果的转化合作平台
生物样本库的建设和维护需要大量投入,合理制定生物样本有偿使用服务价值体系,用于生物样本库的运行和维护,是实现生物样本资源价值属性、保障生物样本库可持续发展的有效途径。2016年,国务院印发的《“十三五”国家战略性新兴产业发展规划》[12]明确指出,应建设生物资源样本库、生物信息数据库和生物资源信息一体化体系,建设具有重要产业应用价值及科研前瞻性的国家精品样本库和实时全景生命数据库,搭建信息资源研究开发的基础性支撑平台。同时指出,依托现有生物产业基地、园区和集群,有步骤、有重点地推动若干生物经济集群建设,促进人才、技术、资金等资源向优势区域集中,引导生物产业特色化、集聚化发展,使生物产业在促进产业转型升级中发挥引领作用。加快构建贯穿整个创新链条的生物科技创新创业服务平台。
该阶段生物样本库需寻求与生物医药企业合作的途径,建立包括生物样本数据库在内的整合数据库体系和技术标准。在建成标准化、可共享的生物样本大数据中心与协作网络支撑平台的基础上,实现连接多种生物样本类型数据的存储、传输和共享,通过基于生物样本资源、生物信息大数据以及对外科研服务,实现可操作的生物样本资源和信息资源共享机制和合作渠道,体现生物样本资源的经济价值,为区域内生物医药、临床医学及生物技术领域的科学研究提供资源和技术服务,在实施精准医疗成果转化的同时,实现生物样本库的可持续发展。
4 生物样本库发展中的问题和不足
生物样本库作为一个新兴领域,存在地区间发展不平衡、样本利用率低、资源整合不足等问题。部分生物样本库在前期建设阶段,由于缺乏完善的顶层设计,建设过程中走了很多弯路,造成 “死库”“垃圾库”的出现,导致资源浪费。此外,生物样本库建设项目在数据安全、伦理争议及可持续发展等方面,亦存在诸多问题和不足。
4.1 数据安全和隐私保护问题
在精准医疗的发展进程中,移动医疗和大数据技术被广泛应用,患者的隐私保护、基因技术引发的伦理问题等随之出现。大数据时代,个人信息价值日益得到市场及各行业领域的认可,数据信息的价值和挖掘越来越凸显其重要性。目前,基于生物样本库产生的大数据在共享和权利保护方面的边界仍未明确。与此同时,在利润的驱使下,非法使用个人信息的事件频繁发生,引发了隐私保护、伦理、法律等多方面问题,阻碍了大数据应用技术的发展。对于知情同意、捐献者隐私保护等相关问题,目前尚无统一的共识和规范,各国均未出台较为系统、全面的法律法规[13]。
4.2 可持续发展运营问题
精准医疗的研发耗资巨大,尤其是靶向药物的研发成本高昂,为保障精准医疗尤其是精准药物的研发有序开展,持续的经费支持是必备条件,仅依靠财政投入无法实现行业发展的可持续性,同时应通过政策支持,允许医药企业合法获得相应利润,以促进社会资本的积极参与,为精准医疗的发展注入充裕资金[14]。目前国内生物样本库的运营经费主要来源于国家和省市级重大项目支持及医院的基础建设投入,运营过程中面临如何进行“自身造血”的问题,建议拓宽经济来源渠道,寻找适合自己的发展模式,与精准医疗领域的相关企业开展合作研发项目,实现样本资源的价值转化。
5 小结
人类社会的发展已进入到人工智能时代,智能化技术对各行各业的发展均产生较大的影响和冲击。在精准医学领域,人工智能已成为创新药物研发和精准医疗的重要发展方向。在不远的将来,智能化诊断分析技术将对现有医疗模式带来颠覆性改变。近年来,生物样本库大型自动化智能设备不断普及,基于物联网技术的智能化自动化样本处理、存储、检测设备不断推陈出新,生物样本库基础建设的标准和规模亦不断提高。此外,被称为下一代生物样本库的“活体”样本库,利用细胞原代培养和复苏、细胞重编程等技术,从有限的样本量中获取大量能够真实反映体内生物学状态的研究材料,突破了生物样本库的现有瓶颈,满足精准医疗的更高要求,是生物样本库未来的发展方向,有着广阔的发展前景。