工作空间

文章信息

徐钢春, 杜富宽, 卞超, 石琼, 徐跑
鱼类基因组研究进展
生物技术通报, 2017, 33(9): 23-31

XU Gang-chun, DU Fu-kuan, BIAN Chao, SHI Qiong, XU Pao
Research Progress on Fish Genomicsv
Biotechnology Bulletin, 2017, 33(9): 23-31

文章历史

收稿日期:2017-04-23

鱼类基因组研究进展
徐钢春1,2, 杜富宽2, 卞超3, 石琼3, 徐跑1,2     
1. 南京农业大学无锡渔业学院,无锡 214081;
2. 中国水产科学研究院淡水渔业研究中心 农业部淡水渔业和种质资源利用重点实验室,无锡 214081;
3. 深圳市华大海洋研究院 深圳华大基因研究院,深圳 518083
摘要:鱼类基因组研究利用大规模测序获取有关物种的基因组序列信息,进而阐明鱼类生物学特性、表型变异与基因组结构之间的关系,在鱼类的种质鉴定、遗传育种、动物营养、环境毒理和病害防治等领域具有巨大的应用潜力。自2001年首先对斑马鱼的基因组测序起,到目前为止已有近40个鱼类物种的全基因组测序完成,且其相关的生物学特征、遗传进化规律等得到较全面的解析。将从鱼类全基因组测序技术发展历程和鱼类基因组解析两大部分对鱼类基因组研究进展进行综述,旨在进一步了解鱼类基因组的研究现状、发展趋势和应用前景,为后续鱼类基因组研究提供参考。
关键词鱼类    基因组    基因组学    
Research Progress on Fish Genomicsv
XU Gang-chun1,2, DU Fu-kuan2, BIAN Chao3, SHI Qiong3, XU Pao1,2     
1. Wuxi Fisheries College, Nanjing Agricultural University, Wuxi 214081;
2. Key Laboratory of Freshwater Fisheries and Germplasm Resources Utilization, Ministry of Agriculture, Freshwater Fisheries Research Center, Chinese Academy of Fishery Sciences, Wuxi 214081;
3. BGI Shenzhen Academy of Marine Sciences, BGI, Shenzhen 518083
Abstract: Fish genome sequencing is utilized for searching the genomics sequence information, subsequently clarifying the fish biological characteristics, and the relationship between the phenotypic variation and genome structures.. It has great applicable potential in fish research and economic fields, such as germplasm identification, genetic breeding, animal nutrition, environmental toxicology, disease control, and so on. Since the first report of zebrafish genome sequencing in 2001, nearly 40 fish genomes have been sequenced and published, which also illuminated their related biological characteristics and provided comprehensive interpretation of genetic evolution with high-yield and low-cost development of the genome sequencing technologies. The main aim of this review is to summarize research progress on the whole genome sequencing technology and the deep data analyses of fish genomes, and to further understand the recent development of fish genome researches and application prospects, so as to provide comprehensive references for subsequent fish genome researches.
Key words: fish     genome     genomics    

基因组学(Genomics),是研究生物基因组以及如何利用基因的一门学科,其研究内容涉及基因作图、测序和整个基因组功能分析[1, 2]。基因组研究可以解析基因组信息及基因功能,可用于解决生物、医学、甚至是工业领域的重大问题。鱼类是所有脊椎动物中种类最多的群体,同时鱼类又是效率最高的优质动物蛋白来源,中国的淡水鱼对世界粮食有重要的贡献[3]。据估计,全球鱼类约有3万余种,许多鱼类具有极大的经济价值和医学价值,在生态保护中起着重要的作用,是自然界生物多样性的一个重要组成部分。因此,有必要借助鱼类基因组学的研究,系统解密鱼类的起源、进化、生殖、发育、性别调控和免疫等问题。而这些问题的解决有助于科研人员开发出新的技术及策略,以更好地应对鱼类育种、疾病防控、海洋食品安全和生物多样性保护等带来的诸多挑战。本文从全基因组测序技术和鱼类基因组解析两大部分对鱼类基因组研究进展进行综述,旨在进一步了解鱼类基因组的研究现状、发展趋势和应用前景,为后续的鱼类基因组研究提供参考。

1 基因组测序技术 1.1 基因组测序组装策略

生物的基因组十分庞大,不能通过直接读取生物的基因组DNA序列的方式进行测序。因此,大规模基组测序必须通过一套完整测序组装策略来进行。1981年,Anderson等[4]提出鸟枪法(Shotgun sequencing)作为全基因测序的策略。鸟枪法的基本原理是将基因组打断成大量的DNA小片段并分别对这些进行测序,再通过之间的重叠部拼接和组装成完整的基因序列。

早期,为了适用于Sanger测序技术建立了分级鸟枪法(Hierarchical shotgun sequencing),如人类基因组计划就是通过这种方法完成的[5]。之后,又发展出了全基因组鸟枪法(Whole genome shotgun sequencing,WGS)[6],该策略是将基因组DNA分子打断成不同长度的随机片段并连接到克隆载体上,制备成DNA克隆文库。然后,通过链终止法使克隆的两端产生两个较短(500 bp-1 000 bp)的末端序列。接着,利用测序技术对末端序列中的一端(Single-end)或两端(Paired-end)进行测序。产生的测序结果通过组装软件按照数学逻辑和算法进行拼装,还原出基因组的真实序列信息。果蝇、人类的基因组测定即是通过这种策略完成的[7-8],鱼类也是参考这种策略完成基因组组装[9]

伴随着鸟枪法测序组装策略的逐步完善,基因组测序技术也先后经历了一代、二代和三代技术的高速发展过程,呈现成本低、周期短和读长长的趋势。

1.2 基因组一、二代测序技术

1975年,Sanger等率先使用DNA聚合酶和带放射性标记核苷酸的测序技术,并于1977年完成了噬菌体ΦX174的全基因组,这是最早完成的全基因组序列测定,最终发明链终止合成法(Chain-termination method),被称作Sanger法[10],这标志着全基因组测序体系的建立。以Sanger法为代表的第一代测序技术自产生以来就得到了广泛的应用,但其存在着速度慢、通量低、成本高等缺点。进入21世纪后,随着生物统计、材料科学、计算机科学的飞速发展,测序技术发生了革命性的进步,以Roche 454、Illumina Solexa和Life Technologies SOLiD为代表的一批新技术兴起,被称为下一代测序技术(Next generation sequencing,NGS),即二代测序技术,通过边合成边测序的方法同时对数十万甚至上百万条DNA分子进行测定,使得测序操作以超大规模的方式进行[11]。最早的高通量测序平台是由生命科技公司(Life Sciences,后被Roche公司收购)于2005年推出的454测序仪,采用了焦磷酸测序法(Pyrosequencing)[12]。焦磷酸测序法掀开了二代测序技术的先河,并在生物科技行业中引起强烈反响,此后,AB和Illumina公司分别开发了SOLiD系列高通量测序仪和HiSeq系列高通量测序仪[13-14]。目前,主流的HiSeq测序仪包括HiSeq2000、HiSeq2500、HiSeq4000和HiSeqX等。至此为止,测序技术已实现完全的智能化,极大推动了基因组测序的应用范围,但仍存在样本制备花费大、测序读长短的不足[15-17]

1.3 基因组三代测序技术

为弥补测序读长短的问题,更新的测序技术逐步发展起来。先是强化版的二代测序技术(也称二代半技术)——半导体测序技术(Ion Torrent)。它通过使用半导体芯片微孔固定模板DNA链后,依次掺入4种不同的dNTP分子,当正确的互补配对反应发生时,会释放出一个游离氢离子;通过感应器检测氢离子的变化便能实时读取碱基序列的顺序。半导体技术使测序的化学反应和数字信号之间建立起了直接的联系,不需要对样本进行荧光标记处理,避开了二代测序技术中复杂苛刻的光学技术要求,在加快测序速度的同时也简化了对样本处理要求[18]。目前基于半导体测序技术的测序仪,主要为Life Technologies公司推出的Ion Torrent PGM测序仪和Ion Proton测序仪。如今,单分子实时测序技术(Single molecule real-time,SMRT)已成为最广为关注和应用的第三代测序技术,由Pacific Biosciences公司推出。该方法采用4种荧光标记的dNTP分子和被称为零级波导(Zero-mode waveguides,ZMW)的纳米结构对单个DNA分子进行测序。SMRT技术的最大优势是它拥有超长的读长,PacBio RSⅡ测序仪平均读长达到了14 kb,并且能够得到的最大读长已经超过40 kb。与第二代测序技术相比而言,第三代测序技术在精准度方面并不具有优势,错误率通常在15%左右[19],而且对样本的质量要求较高、测序成本也相对较高。

2 鱼类基因组研究

对鱼类基因组序列进行系统的研究,不仅可以获得基因组大数据和重要功能基因的序列信息,而且对于理解鱼类生物学特征、性别分化、生殖方式和调控模式的基本原理、阐明整个脊椎动物遗传进化历程,都具有重大意义。全基因组de novo测序也称为从头测序,不用依赖任何现有的序列资料,而直接对鱼类的基因组进行测序,然后利用生物信息学分析手段对序列进行组装和注释,从而获得该物种的基因组序列图谱以及基因信息。

2.1 国外鱼类基因组研究

硬骨鱼类的物种丰富、品系繁多并且极易相互交配,往往难以得到纯系品种。由于硬骨鱼类之间基因组差别极大,杂合度高并且缺乏合适的物种作为模式参考基因组,因此,对硬骨鱼类的基因组研究在很长一段时间内进展十分缓慢。斑马鱼(Danio rerio)是最早开始进行基因组测序的硬骨鱼类,也是目前被广泛研究的模式鱼类。2000年,Sanger研究所就专门成立了斑马鱼研究中心(Sanger Institute Zebrafish Workshop)并于2001年正式开始了对斑马鱼的测序工作,采用的是Sanger法进行测序组装。随着转基因技术的兴起,斑马鱼由于拥有几乎透明的胚胎,方便基因敲除、编辑或超表达的研究,目前已成为最受欢迎的功能基因研究模式物种之一。斑马鱼基因组重复序列多,虽然经过了多次加测数据和重复组装,但仍然有很多缺失之处[20]。此外,斑马鱼的基因组(1.4 Gb)不到人类基因组的一半(3.2 Gb),但是编码基因的数目(26 097) 却要超过人类和大多数哺乳动物(20 300),基因复制现象十分普遍[21]。因此,对斑马鱼的基因组和基因功能的研究将是一个漫长过程。

迄今为止,国外研究者已经完成28个鱼类物种的全基因组测序(表 1)。2002年,日本科学家领衔的团队通过全基因组鸟枪法率先完成了对红鳍东方鲀(Takifugu rubripes)的基因组测序[9]。随后,法国科学家Jaillon等[22]完成了对另一种绿河鲀(Tetraodon nigroviridis)的基因组测序并构建了其基因组精细图。两种河鲀的基因组测序完成后,通过和人类基因组比较发现,硬骨鱼类和哺乳动物的分化时间大约在4.5亿年前,并证实了鱼类中存在第三次的全基因组复制事件。2007年,日本科学家Kasahara等[23]又完成了另一种重要硬骨鱼类青鳉(Oryzias latipes)的基因组测序,进一步阐明了脊椎动物基因组系统进化问题。早期硬骨鱼类基因组研究主要围绕进化问题展开,随着高通量测序组装技术的发展,硬骨鱼类的基因组研究也突破了往日技术和高额费用的瓶颈,有了较大的突破。2011年,大西洋鳕鱼(Gadus morhua)的基因组测序完成并着重探讨了其独特的免疫系统[24]。2012年,三刺鱼(Gasterosteus aculeatus)的基因组被公开发表并讨论了盐度适应性进化机制[25]。最近几年,硬骨鱼类的基因组研究有了突飞猛进式的发展,先后有剑尾鱼[28](Xiphophorus maculatus)、腔棘鱼[29](Latimeria chalumnae)、虹鳟[31](Oncorhynchus mykiss)、尼罗罗非鱼[33](Oreochromis niloticus)、舌齿鲈[34](Dicentrarchus labrax)、斑点叉尾鮰[38](Ietalurus punetaus)、大西洋鲱[43](Clupea harengus)、大西洋鲑(Salmo salar)[44]等硬骨鱼类基因组被公布出来,主要研究了鱼类复杂特性的进化规律、鱼类鳍条分化、第四次全基因组复制、体色分化、鳞片形成及生态适应等机制。

表 1 国外已完成全基因组测序的鱼类物种清单
2.2 国内鱼类基因组研究

中国鱼类基因组学研究虽然起步较晚,但是发展迅猛,特别是全基因组测序方面,部分研究成果已达到国际先进或领先水平。目前,已完成全基因组测序的硬骨鱼类包括鲤鱼(Cyprinus carpio)[45]、半滑舌鳎(Cynoglossus semilaevis)[46]、弹涂鱼(Periophthalmus cantonensis)[47]、大黄鱼(Larimichthys crocea)[48-49]、草鱼(Ctenopharyngodon idellus)[50]、金线鲃(Sinocyclocheilus)[51]、亚洲龙鱼(Scleropagesformosus)[52]、斑点叉尾鮰(Ietalu-rus punetaus)[53]、大银鱼(Protosalanx hyalocrani-us)[54]、褐牙鲆(Paralichthys olivaceus)[55]等10个物种。

2011年,中国水产科学研究院、深圳华大基因研究院等单位以鲤鱼雌核发育纯系单个个体作为测序对象,启动了我国鱼类第一个全基因组测序计划,也是世界上第一个鲤科经济鱼类基因组计划,并于2014年完成了鲤鱼全基因组测序[45]。结果显示,鲤鱼是目前完成全基因组测序研究物种中染色体数目最多的动物(50对染色体),鲤鱼基因组大小约为1.7 Gb,测定了超过100倍覆盖率的高质量数据,组装所获得的Scaffold N50为404 kb,含有52 610个功能基因,为多数硬骨鱼类基因数目的两倍。此外,还产生了7万多条鲤鱼BAC克隆末端序列、166万条的表达序列标签和由8万多个BAC克隆组成的基因组物理图谱。分子钟证据表明,鲤鱼基因组四倍化约发生在820万年前,是迄今在脊椎动物中发现的最近的全基因组倍增事件。同时,对来自世界各地10个代表性品系(种群)的33尾鲤鱼进行基因组重测序证实了鲤鱼的两个亚种鲤(C. carpio Haematopterus)和西鲤(C. carpio carpio)单一的起源,首次绘制了全球鲤鱼的单碱基分辨率基因组遗传变异图谱。利用多态性扫描和比较转录组分析等方法,定位了鲤鱼鳞被缺失、体色决定等性状相关的遗传位点、功能基因和调控通路。研究结果为脊椎动物基因组进化和基因衍化机制研究提供了模型。

2014年,中国水产科学研究院黄海水产研究所、深圳华大基因研究院等单位联合完成了半滑舌鳎全基因组的测序和组装,绘制了半滑舌鳎全基因组序列图谱[46],使半滑舌鳎成为世界上第一个测定了全基因组序列的鲽形目鱼类。半滑舌鳎基因组大小为520 Mb,重复序列含量9.5%,基因2万多个,其中18 000多个基因与其它物种具有不同程度的同源性。同时,结合高密度遗传连锁图谱,构建了Z染色体精细图谱和W染色体序列图谱;其中,W染色体积聚了29.94%转座元件和19.74%假基因,Z染色体则为13.13%和3.54%,而常染色体仅为4.33%和2.48%,半滑舌鳎性染色体高度分化。通过比较基因组分析发现,半滑舌鳎dmrt1基因是Z染色体连锁、雄性特异表达、精巢发育必不可少的关键基因,表现出性别决定基因的特性。研究结果为其他脊椎动物性染色体进化和性别决定机制提供了借鉴,同时也为半滑舌鳎性别控制、全基因组选择育种提供了重要的基因资源和技术手段。

2014年,深圳华大基因研究院对大弹涂鱼属(Boleophthalmus)、弹涂鱼属(Periophthalmus)、青弹涂鱼属(Scartelaos)和齿弹涂鱼属(Periophthalmodon)4种代表性的弹涂鱼进行了全基因组测序,阐明了环境适应潜在的分子机制[47]。他们发现弹涂鱼中一些先天免疫系统基因发生了扩增,有可能提高了对陆地病原体的防御能力。弹涂鱼鳃中与氨排泄通路相关的基因经历了正选择,从而使弹涂鱼对水环境的氨浓度更加耐受。而视觉相关的基因差异性地丢失或突变,暗示弹涂鱼的眼睛也能适应陆地环境。此外,对暴露于空气中的弹涂鱼进行转录组分析,揭示出了响应缺氧上调或下调的一些调控信号通路。该研究为了解脊椎动物从水生向陆生过渡潜在的分子机制提供了一个宝贵的资源。

2014年,浙江海洋学院、上海交通大学、复旦大学等机构联合破译了大黄鱼全基因组序列,构建了大黄鱼基因组图谱,基因组预估大小为728 Mb,具有19 362个蛋白质编码基因[48]。分析发现大黄鱼具有发育良好的先天免疫系统,形成了一套独特的免疫模式,部分基因在大黄鱼先天性免疫方面起重要作用。2015年,国家海洋局第三海洋研究所联合浙江大学、深圳华大基因及中国海洋大学等单位构建BAC文库后测序,进一步完成了大黄鱼全基因精细图谱绘制[49]。此次组装的大黄鱼基因组大小为679 M,包含25 401个蛋白编码基因。研究结果显示,大黄鱼不仅具有发达的先天性免疫系统(与Wu等[48]的研究结果一致),还具有相对完整的获得性免疫系统,其中大多数CD4+1型辅助性T细胞、CD4+2型辅助性T细胞和CD8+T细胞相关基因都存在于大黄鱼基因组中。进一步研究还揭示了神经-内分泌-免疫/代谢新的调控网络通路,在大黄鱼脑应答低氧胁迫中发挥着重要的作用,皮肤黏液蛋白在大黄鱼应对空气暴露胁迫中的多重保护功能。

2015年,由中国科学院水生生物研究所、中国科学院国家基因研究中心和中山大学等机构合作完成草鱼全基因组序列图谱绘制[50]。研究分别对一尾雌性(人工减数分裂雌核发育个体)和一尾雄性(野生个体)草鱼进行了全基因组测序,成功获得雌性(0.9 Gb)和雄性(1.07 Gb)草鱼基因组组装序列。结果显示,雌核发育的雌性草鱼的基因组杂合度显著降低,获得了高质量的组装序列;雄性野生草鱼的基因组组装质量明显下降,其结果为雄性基因组特异片段的挖掘提供了基础数据。结果还显示,草鱼基因组中并不存在纤维素降解酶基因;进一步通过比较转录组分析发现,草鱼在草食性转化过程中,肠道中昼夜节律相关基因的表达模式发生了重设,肝脏中甲羟戊酸通路和类固醇生物合成通路被激活。推测草鱼通过持续高强度的食物摄入,获取足够的可利用营养以维持其快速生长。草鱼全基因组序列的解析将为植食性鱼类重要经济性状相关基因的发掘和养殖新品种的遗传改良提供关键技术支撑。

2016年,中国科学院昆明动物研究所与深圳华大基因研究院合作利用高通量测序技术完成了地表种类——滇池金线鲃(Sinocyclocheilus grahami);半洞穴种类——犀角金线鲃(Sinocyclocheilus rhinoce-rous)和洞穴种类——安水金线鲃(Sinocyclocheilus anshuie-nsis)3种金线鲃属鱼类的全基因组测序[51],全基因组大小分别为1.75、1.73和1.68 Gb。研究发现,3种金线鲃种群动态变化与上新世以来青藏高原隆起的几次大的地壳运动具有密切的相关性,青藏高原的隆升在很大程度上影响了鱼类物种的形成。通过比较基因组研究发现,洞穴种类存在许多重要的基因丢失(如视蛋白基因)、突变(如色素相关基因)、假基因化(如晶状体蛋白基因)、片段缺失(如鳞片相关的基因)的遗传变化,这些改变可能是其眼睛退化、皮肤白化、鳞片退化等典型退化性性状的重要遗传机制。与之对应,一些味觉相关转录因子拷贝数发生了增加,这可能是其补偿性进化性状的一种反应。所以,洞穴种类味蕾数目比地表或半洞穴种类均要多。洞穴适应是一个漫长的过程,一些性状的退化通常会伴随着另一些性状的增强,终年在黑暗洞穴的环境中,洞穴鱼类展现出了与地表种类在极端环境适应中不一样的生物学特性。研究首次报道了3种中国洞穴鱼类的全基因组。

2016年,深圳华大基因研究院、新加坡国立大学淡马锡生命科学研究院等单位组建国际合作研究团队联合破译了美丽硬仆骨舌鱼(俗称金龙鱼)(Scleropages formosus)全基因组图谱,获得高质量的染色体水平参考基因组(25对染色体),也完成了红色美丽硬仆骨舌鱼和青色美丽硬仆骨舌鱼两个亚种的基因组草图[52]。金色美丽硬仆骨舌鱼、红色美丽硬仆骨舌鱼和青色美丽硬仆骨舌鱼3个亚种装配后的基因组大小分别779 Mb、753 Mb和759 Mb。系统进化分析提出了一个新的观点:骨舌总目和海鲢总目互为姐妹群,两个演化支的组合与包含其他所有硬骨鱼的骨鳔总目形成姐妹群。研究中还发现一个潜在的雌性异配性染色体,与已知ZW性别决定机制的半滑舌鳎基因组比对发现,美丽硬仆骨舌鱼17号染色体与Z、W染色体匹配度最高(分别为89%和40%),推断美丽硬仆骨舌鱼为ZW/ZZ性别决定机制。

2016年,江苏省淡水水产研究所与深圳华大基因研究院合作,对在国内养殖超过三代的斑点叉尾鮰进行全基因组测序,获得高质量的基因组图谱[53]。与同期发表的美国养殖斑点叉尾鮰序列[38]相比,有关的基因组数据存在一定的差异,可能与使用的分析软件或参数设置等不同有关。新数据表明,斑点叉尾鮰的基因组大小估计为0.839 Gb,组装为0.845 Gb,其中275.3 Mb为重复序列;注释基因数达21 556个,为后续的染色体图谱绘制和分子育种工作奠定了基础。

2017年,中国水产科学研究院淡水渔业研究中心、深圳华大基因研究院等完成了大银鱼全基因组测序,获得高质量的基因组图谱[54]。结果显示大银鱼的基因组大小估计为0.525 Gb,组装为0.536 Gb,注释基因数达19 884个,为后续的染色体图谱绘制和体色分化研究奠定了基础。

2017年,中国水产科学研究院黄海水产研究所、上海海洋大学、德国维尔茨堡大学、葡萄牙阿尔加夫大学、深圳华大基因研究院等联合破译了褐牙鲆全基因组序列,绘制了褐牙鲆染色体图谱,通过与半滑舌鳎全基因组比较分析,初步揭示了比目鱼类变态发育的分子机制[55]。通过比较基因组学分析,筛选到与细胞分裂和凋亡、眼睛大小调控、视网膜神经递质、体轴发育、甲状腺激素、视黄酸信号通路以及光传导通路等比目鱼变态过程中的生理和形态学变化密切相关的基因、基因家族,揭示了褐牙鲆眼睛的移动受到甲状腺激素和视黄酸信号通路的拮抗调控,首次揭示了比目鱼体色左右不对称的形成机制。

3 展望

由于鱼类种类多样,生活环境多变,导致不同物种基因组结构差异较大,因此,鱼类基因组研究是一个巨大的挑战。经过全世界多个研究团队15年的共同攻关,已经完成了近40种鱼类的全基因组测序工作。其中,模式生物斑马鱼和青鳉全基因组测序的完成为后续发育学、免疫学等基础研究提供了重要的参考数据;特别是重点解析了大西洋鳕鱼、虹鳟、尼罗罗非鱼、斑点叉尾鮰、半滑舌鳎、鲤鱼和草鱼等重要经济物种的生长、免疫、食性转化、体色、盐度适应、性别等调控机制,为后续精准育种提供了重要的靶标基因。同时也包含弹涂鱼、金线鲃等特殊生境物种,阐明了其为了适应特殊生境,而进化出的特殊免疫系统、视觉系统、氨排泄及低氧适应机制。

由此可见,鱼类的全基因组研究已经取得了重要的研究进展。利用全基因的研究方法,人类第一次可以从系统生物学的层面去理解鱼类的某个性状,这种研究方法显然更接近于生命本来的面貌。但是,已有研究中也显示出目前的基因组测序技术有很多不足:已经完成的鱼类基因组测序,除了早期斑马鱼的工作,其余均借助二代测序完成的。二代测序技术具有通量高及准确率高的特点,但是其读长较短,这就迫使在基因组组装过程中要不断优化组装方法,以达到更理想的组装效果。从目前的情况来看,对于普通的二倍体物种,通过该方法基本可以达到理想的组装效果,但是对于发生过基因组加倍和高复杂度的物种,目前的测序及组装就很难达到理想效果。如斑马鱼全基因组重复序列多,给测序和组装带来了巨大的困难,经过BAC末端一代测序数据的补充及组装算法的不断优化,才达到了理想的组装效果。在各个过程中,时间和资源的耗费也是巨大的。这就表明,目前的基因组测序和组装技术有待于进一步升级,使其能够轻松应对复杂基因组的解析。

要从根本上解决重复序列和基因组复杂度对全基因组测序和组装的干扰,就要增加测序的单次读长。而最近几年兴起的三代测序技术,就很好的解决了该问题。目前的三代测序,其平均N50读长大于10 kb,这次技术的革新,将使鱼类基因组的解析变得更加简单、准确,是一场根本性的变革。当然,三代测序也不是完美的,其准确率明显低于二代测序,只有通过增加测序深度或与二代结合,才能更完美地解决该问题。

由此可见,在不远的将来,全基因组测序和组装将不再是问题,未来基因组的发展必将转向基因功能的解析。虽然已经开发出多种基因敲除和敲入的方法,且使用也日渐成熟;但是,这些方法的通量低,要使用这些方法将整个基因组的每个基因研究一遍,成本很高,且耗时很长。因此,未来必须开发一套高通量的基因功能解析方法,而基因组编辑技术正逐渐成为将鱼类基因组数据转化为基因功能和应用信息的最主要手段之一,目前被广泛采用的核酸酶介导基因组编辑技术主要包括3种:锌指核酸酶(Zinc-finger nucleases,ZFNs)技术、转录激活因子样效应蛋白核酸酶(Transcription activator-like effector nucleases,TALENs)技术及CRISPR/Cas9(Clustered regularly interspacedshort palindromic repeats and CRISPR associated)技术。其中,CRISPR/Cas9作为基因编辑工具,一经问世便受到了鱼类基因编辑领域科研工作者的追捧;随着这些高通量方法和基因组编辑技术的日渐成熟,人类也才有可能真正解读鱼类基因组,从真正意义上实现鱼类基因组水平的精准应用。

参考文献
[1] 孙瀚昌. 鱼类基因组研究概述[J]. 北京水产, 2015(1): 41–43.
[2] Weissenbach J. The rise of genomics[J]. Comptes Rendus Biologies, 2016, 339 (7-8): 231–239. DOI:10.1016/j.crvi.2016.05.002
[3] Brown LR. Who will feed china?:Wake-up call for a small Planet[M]. New York: W. W. Norton & Company, 1995: 1-163.
[4] Anderson S. Shotgun DNA sequencing using cloned DNase I-generated fragments[J]. Nucleic Acids Research, 1981, 9 : 3015–3027. DOI:10.1093/nar/9.13.3015
[5] Lander ES, Linton LM, Birren B, et al. Intital sequencing and analysis of the human genome[J]. Nature, 2001, 409 : 860–921. DOI:10.1038/35057062
[6] Fleischmann RD, Adams MD, White O, et al. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd[J]. Science, 1995, 269 : 496–512. DOI:10.1126/science.7542800
[7] Adams MD, Celniker SE, Holt RA, et al. The genome sequence of Drosophila melanogaster[J]. Science, 2000, 287 : 2185–2195. DOI:10.1126/science.287.5461.2185
[8] Venter JC, Adams MD, Myers EW, et al. The sequence of the human genome[J]. Science, 2001, 291 : 1304–1351. DOI:10.1126/science.1058040
[9] Aparicio S, Chapman J, Stupka E, et al. Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes[J]. Science, 2002, 297 : 1301–1310. DOI:10.1126/science.1072104
[10] Sanger F, Air GM, Barrell BG, et al. Nucleotide sequence of bacteriophage phi X 174 DNA[J]. Nature, 1977, 265 : 687–695. DOI:10.1038/265687a0
[11] Seo TS, Bai XP, Kim DH, et al. Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides[J]. PNAS, 2005, 102 (17): 5926–5931. DOI:10.1073/pnas.0501965102
[12] Wheeler DA, Srinivasan M, Egholm M, et al. The complete genome of an individual by massively parallel DNA sequencing[J]. Nature, 2008, 452 : 872–876. DOI:10.1038/nature06884
[13] Bentley DR, Balasubbramanian S, Swerdlow HP, et al. Accurate whole human genome sequencing using reversible terminator chemistry[J]. Nature, 2008, 456 : 53–59. DOI:10.1038/nature07517
[14] McKernan KJ, Peckham HE, Costa GL, et al. Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding[J]. Genome Research, 2009, 19 : 1527–1541. DOI:10.1101/gr.091868.109
[15] Schuster SC. Next-generation sequencing transforms today's biology[J]. Nature Methods, 2008, 5 : 16–18.
[16] Metzker ML. Sequencing technologies-the next generation[J]. Nature Reviews Genetics, 2010, 11 : 31–46. DOI:10.1038/nrg2626
[17] Liu LD, Li YH, Li SL, et al. Comparison of next-generation sequencing systems[J]. Journal of Biomedicine and Biotechno-logy, 2012 .
[18] Rothberg JM, Hinz W, Rearick TM, et al. An integrated semiconductor device enabling non-optical genome sequencing[J]. Nature, 2011, 475 : 348–352. DOI:10.1038/nature10242
[19] Liao YC, Lin SH, Lin HH. Completing bacterial genome assemblies:strategy and performance comparisons[J]. Scientific Reports, 2015, 5 : 8747. DOI:10.1038/srep08747
[20] Howe K, Clark MD, Torroja CF, et al. The zebrafish reference genome sequence and its relationship to the human genome[J]. Nature, 2013, 496 : 498–503. DOI:10.1038/nature12111
[21] Kettleborough RNW, Busch-Nentwich EM, Harvey SA, et al. A systematic genome-wide analysis of zebrafish protein-coding gene function[J]. Nature, 2013, 496 : 494–497. DOI:10.1038/nature11992
[22] Jaillon O, Aury JM, Brunet F, et al. Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype[J]. Nature, 2004, 431 : 946–957. DOI:10.1038/nature03025
[23] Kasahara M, Naruse K, Sasaki S, et al. The medaka draft genome and insights into vertebrate genome evolution[J]. Nature, 2007, 447 : 714–719. DOI:10.1038/nature05846
[24] Star B, Nederbragt AJ, Jentoft S, et al. The genome sequence of Atlantic cod reveals a unique immune system[J]. Nature, 2011, 477 : 207–210. DOI:10.1038/nature10342
[25] Jones FC, Grabherr MG, Chan YF, et al. The genomic basis of adaptive evolution in threespine sticklebacks[J]. Nature, 2012, 484 : 55–61. DOI:10.1038/nature10944
[26] Davidson WS, Koop BF, Jones SJ, et al. Sequencing the genome of the Atlantic salmon(Salmo salar)[J]. Genome Biology, 2010, 11 (9): 403.
[27] Henkel CV, Dirks RP, de Wijze DLD, et al. First draft genome sequence of the Japanese eel, Anguilla japonica[J]. Gene, 2012, 511 (2): 195–201. DOI:10.1016/j.gene.2012.09.064
[28] Schartl M, Walter RB, Shen Y, et al. The genome of the platyfish, Xiphophorus maculatus, provides insights into evolutionary adaptation and several complex traits[J]. Nature Genetics, 2013, 45 : 567–572. DOI:10.1038/ng.2604
[29] Amemiya CT, Alföldi J, Lee AP, et al. The African coelacanth genome provides insights into tetrapod evolution[J]. Nature, 2013, 496 : 311–316. DOI:10.1038/nature12027
[30] Nakamura Y, Mori K, Saitoh K, et al. Evolutionary changes of multiple visual pigment genes in the complete genome of Pacific bluefin tuna[J]. Proceedings of the National Academy of Sciences, 2013, 110 (27): 11061–11066. DOI:10.1073/pnas.1302051110
[31] Berthelot C, Brunet F, Chalopin D, et al. The rainbow trout genome provides novel insights into evolution after whole-genome dulication in vertebrates[J]. Nature comunications, 2014, 5 : 3657.
[32] Shin SC, Ahn DH, Kim SJ, et al. The genome sequence of the Antarctic bullhead notothen reveals evolutionary adaptations to a cold environment[J]. Genome Biology, 2014, 15 (9): 468. DOI:10.1186/s13059-014-0468-1
[33] Brawand D, Wagner CE, Li YI, et al. The genome substrate for adaptive radiation in African cichlid fish[J]. Nature, 2014, 513 : 375–381. DOI:10.1038/nature13726
[34] Tine M, Kuhl H, Gagnaire PA, et al. European sea bass genome and its variation provide insights into adaptation to euryhalinity and speciation[J]. Nature Comunications, 2014, 5 : 5770.
[35] Rondeau EB, Minkley DR, Leong JS, et al. The genome and linkage map of the northern pike(Esox lucius):conserved synteny revealed between the salmonid sister group and the Neoteleostei[J]. PLoS One, 2014, 9 (7): e102089. DOI:10.1371/journal.pone.0102089
[36] Gallant JR, Traeger LL, Volkening JD, et al. Nonhuman genetics. Genomic basis for the convergent evolution of electric organs[J]. Science, 2014, 344 (6191): 1522–1525. DOI:10.1126/science.1254432
[37] Mcgaugh SE, Gross JB, Aken B, et al. The cavefish genome reveals candidate genes for eye loss[J]. Nature Communications, 2014, 5 : 5307. DOI:10.1038/ncomms6307
[38] Liu ZJ, Liu SK, Yao J, et al. The channel catfish genome sequence provides insights into the evolution of scale formation in teleosts[J]. Nature Comunications, 2016, 7 : 11757.
[39] Domingos JA, Zenger KR, Jerry DR. Whole-genome shotgun sequence assembly enables rapid gene characterization in the tropical fish barramundi, Lates calcarifer[J]. Animal Genetics, 2015, 46 (4): 468–469. DOI:10.1111/age.2015.46.issue-4
[40] Arthofer W, Bertini L, Caruso C, et al. Genomic resources notes accepted 1 February 2015-31 March 2015[J]. Molecular Ecology Resources, 2015, 15 (4): 1014–1015. DOI:10.1111/1755-0998.12419
[41] Fraser BA, Künstner A, Reznick DN, et al. Population genomics of natural and experimental populations of guppies(Poecilia reticulata)[J]. Molecular Ecology, 2015, 24 (2): 389–408. DOI:10.1111/mec.13022
[42] Harel I, Benayoun BA, Machado B, et al. A platform for rapid exploration of aging and diseases in a naturally short-lived vertebrate[J]. Cell, 2015, 160 (5): 1013–1026. DOI:10.1016/j.cell.2015.01.038
[43] Barrio M, Lamichhaney S, Fan GY, et al. The genetic basis for ecological adaptation of the Atlantic herring revealed by genome sequencing[J]. Elife, 2016, 5 : e12081.
[44] Lien S, Koop BF, Sandve SR, et al. The Atlantic salmon genome provides insights into rediploidization[J]. Nature, 2016, 533 : 200–205. DOI:10.1038/nature17164
[45] Xu P, Zhang XF, Wang XM, et al. Genome sequence and genetic diversity of the common carp, Cyprinus carpio[J]. Nature Genetics, 2014, 46 : 1212–1249. DOI:10.1038/ng.3098
[46] Chen SL, Zhang GJ, Shao CW, et al. Whole-genome sequence of a flatfish provides insights into ZW sex chromosome evolution and adaptation to a benthic lifestyle[J]. Nature Genetics, 2014, 46 : 253–260. DOI:10.1038/ng.2890
[47] You XX, Bian C, Zan QJ, et al. Mudskipper genomes provide insights into the terrestrial adaptation of amphibious fishes[J]. Nature Comunications, 2014, 5 : 5594.
[48] Wu CW, Zhang D, Kan MY, et al. The draft genome of the large yellow croaker reveals well-developed innate immunity[J]. Nature Comunications, 2014, 5 : 5227.
[49] Ao JQ, Mu YN, Xiang LX, et al. Genome sequencing of the perciform fish Larimichthys crocea provides insights into molecular and genetic mechanisms of stress adaptation[J]. PLoS Genetics, 2015, 11 (4): e1005118. DOI:10.1371/journal.pgen.1005118
[50] Wang YP, Lu Y, Zhang Y, et al. The draft genome of the grass carp(Ctenopharyngodon idellus)provides insights into its evolution and vegetarian adaptation[J]. Nature Genetics, 2015, 47 : 625–631. DOI:10.1038/ng.3280
[51] Yang JX, Chen XL, Bai J, et al. The Sinocyclocheilus cavefish genome provides insights into cave adaptation[J]. BMC Biology, 2016, 14 : 1. DOI:10.1186/s12915-015-0223-4
[52] Bian C, Hu Y, Ravi V, et al. The Asian arowana(Scleropages formosus)genome provides new insights into the evolution of an early lineage of teleosts[J]. Scientific Reports, 2016, 6 : 24501. DOI:10.1038/srep24501
[53] Chen XH, Zhong LQ, Bian C, et al. High-quality genome assembly of channel catfish, Ictalurus punctatus[J]. Gigascience, 2016, 5 (1): 39. DOI:10.1186/s13742-016-0142-5
[54] Liu K, Xu DP, Li J, et al. Whole genome sequencing of Chinese clearhead icefish, Protosalanx hyalocranius[J]. Gigascience, 2017, 6 (4): 1–6.
[55] Shao CW, Bao BL, Xie ZY, et al. The genome and transcriptome of Japanese flounder provide insights into flatfish asymmetry[J]. Nature Genetics, 2017, 49 : 119–124.