时间:2024-05-24
邹 杰,彭慧婧,郑德斌,张守都
( 1.广西科学院,广西 南宁 530000; 2.广西海洋研究所有限责任公司,广西 北海 536000; 3.天津渤海水产研究所,天津 300457; 4.山东省海洋科学研究院,山东 青岛 266000 )
合浦珠母贝(Pinctadafucatassp.martensii),又称马氏珠母贝,是我国培育海水珍珠的主要贝类。广西为合浦珠母贝主产地和南珠发源地,近年来,养殖环境日渐劣化、养殖群体生长性状衰退、繁育个体趋小型化等因素,均限制了南珠产业的健康可持续发展。由于重新选育合浦珠母贝优良品种所需成本高、时间长,为适应新的养殖形势和环境变化,需要快速改良广西合浦珠母贝的种质资源,杂交育种是能够短时间内提升种质资源的方式之一。有关不同地理群体合浦珠母贝杂交研究较多[1-2],其具有一定的杂种优势[3],但关于广西合浦珠母贝地理群体内杂交的研究较少。要加快广西合浦珠母贝群体杂交育种应用,首先要了解广西合浦珠母贝主要群体的遗传背景。目前广西合浦珠母贝地理群体内经人工繁育或选育分化成3个主要群体:选育群体“海选1号”、养殖群体和野生繁育群体。选育群体是以广西涠洲岛海域野生群体选育出的优质新品种,已在广东和广西应用多年,生长性状具有显著优势[4];养殖群体则是合浦传统南珠养殖区继代繁育养殖群体,存在一定的抗逆优势;野生群体表型分化较大,遗传资源可能具有潜在的复杂多态性。这3个分化群体可作为广西合浦珠母贝群体杂交亲本的潜在来源群。由于长期混杂养殖,3个分化群体间理论上存在基因交流,在进行杂交育种时应首先掌握选择亲本群体的真实遗传分化状况,分析不同群体的近交水平遗传分化程度,进而提升杂交育种的预期效果。鉴于遗传标记多态性可有效分析合浦珠母贝的遗传差异[5-6],笔者通过对3个群体中的适龄种贝作为样本进行简化基因组测序,通过单核苷酸多态标记解析3个样本群间的遗传关系,从一定程度上反映3个群体的遗传背景,探索出不同群体间的最佳杂交组合方式,为广西合浦珠母贝杂交育种中的亲本选择提供参考。
分别从野生群体(F1)、选育群体(“海选1号”F4)和养殖群体中随机挑选15个2龄种贝,组成3个样本群体,分别采集软体部-80 ℃保存(3个月内),利用1端EcoRⅠ(G^AATTC)和2端NlaⅢ(Hin1Ⅱ,CATG^)进行双酶切,将质检合格的DNA样品500 ng采用ddRAD建库方式构建长度在300~500 bp的双端测序文库,基于Illunima HiSeq 2500高通量测序。
1.2.1 数据质控
对片段测序得到的原始读长进行数据评估,得到各个样品的原始数据,通过碱基质量值(Q)进行质控获得高质量数据。
碱基质量值(Q)与错误率(Re)的关系式为:
Q=-10lgRe
1.2.2 信息分析
将序列读长使用BWA比对到近缘[7]参考物种覆瓦珠母贝(P.imbricata)染色体上(GCA_002216045.1_PinMar1.0),根据高质量数据在参考染色体的定位结果,未挂载上染色体的拼接序列共同作为参考基因组,使用Picard(0.7.17-r1188)的Mark Duplicate工具去除重复,屏蔽PCR重复数据的影响,使用GATK进行变异检测,变异位点质量值重新校正,后进行测序深度过滤,平均测序深度为5×,最小等位基因频率为0.05,样品信息完整度为0.70,变异位点质量值Q>30,过滤获取可靠变异结果形成单核苷酸多态标记,用于后续分析。基于单核苷酸多态标记,对序列双端比对基因组率超90%个体,通过软件GCTA(1.92.1,http://cnsgenomics.com/software/gcta/#Overview)进行主成分分析,得到样品的主成分,运用R软件绘制主成分分析图,利用软件FastTree(2.1.9)中的极大似然法构建极大似然进化树;使用软件PopLDdecay(https://github.com/BGI-shenzhen/PopLDdecay)进行连锁不平衡衰减分析,参数为:-OutPairLD5;在软件vcftools(0.1.16)中,参数设为以100 kb为一个滑动窗口,10 kb为步长取一个区域,计算群体在这个区域内的群体分化指数(Fst);在R软件(R包:detectRUNS)中,设定每一个滑动窗口至少要有20个单核苷酸多态标记,滑动窗口阈值使用默认参数0.05,每一个滑动窗口中允许的相反基因型数目为1个,每一个滑动窗口中允许丢失的基因型为1个,组成长纯合片段(ROH)之间的单核苷酸多态标记的最大间隔为1 Mb,长纯合片段的最小长度设为0.25 Mb,基于参考染色体统计长纯合片段,基于每条染色体分析近交系数(FROH)。
FROH=∑LROH/Lgenome
式中,∑LROH为染色体上长纯合片段的长度之和,Lgenome为染色体的物理总长度。
45个样品共产生49.79 Gb高质量数据,对测序数据进行质控评估结果见表1,质控平均Q30为92.17%,3群体GC含量34.59%~35.04%,低于AT含量。组装参考基因组大小为990 984 031 bp,未挂载参考染色体的基因组大小为137 058 386 bp,样品平均比对读长为768 337 bp,平均覆盖基因组大小为85 103 126 bp,平均覆盖深度为13.84,平均基因组覆盖深度为0.99,选育群体的平均比对、双端比对读长均较低。
表1 不同群体测序碱基分布和与参考基因组比对结果(均值)Tab.1 Distribution and comparison of sequencing bases with reference genome in different populations (mean)
样品与参考基因组之间单核苷酸多态标记检测平均转换数量为206 641个,平均颠换数量为184 471个(图1a),转换/颠换为1.12,转换发生率高于颠换,平均杂合类型单核苷酸多态标记数量为151 042个,野生群体杂合程度最高,平均纯合单核苷酸多态标记数量为240 070个,选育群体平均纯合单核苷酸多态标记数量高于野生群体和养殖群体。群体单核苷酸多态标记过滤后,1、3、9和10号染色体单核苷酸多态标记数量较多(图1b),以20 kb为一个窗口,统计窗口内的单核苷酸多态标记数量,单核苷酸多态标记在染色体上的密度分布较均匀(图1c),染色体单核苷酸多态标记较多与其长度相关。统计单群体内的双等位基因型群体遗传指标平均值,群体信息统计见表2,群体内单核苷酸多态标记统计数量超过58万个,选育群体的观测杂合度最低,平均近交系数(Fis)与养殖群体相近,野生群体观测杂合度最高,近交系数(Fis)最低,野生群体相对具有较好的群体遗传多态。
表2 群体遗传信息统计Tab.2 The statistics of population genetic information
图1 单核苷酸多态标记统计Fig.1 SNP statisticsa.单核苷酸多态类型变异数量统计;b.染色体单核苷酸多态标记数量统计;c.染色体单核苷酸多态标记密度分布.a.SNP type variation statistics; b.statistics of chromosome SNPs; c.distribution of chromosome SNP density.
利用与参考染色体高比对(>90%)样品的单核苷酸多态标记进行系统进化树(图2)和主成分(图3)分析,结果显示,选育群体与养殖群体部分样品亲缘关系较近,预示选育群体和养殖群体可能有部分相同的亲本来源,主成分分析基本将样品分成3个类群,主成分1显示野生群体分类较好,主成分2显示选育群体和养殖群体存在群体交杂,分析结果与进化树分析一致。通过计算区域平均遗传分化指数(Fst),野生群体-选育群体、野生群体-养殖群体和选育群体-养殖群体的遗传分化指数均值分别为0.068、0.065和0.030,选育群体和养殖群体之间的遗传分化指数最低,多态性相近,进一步表明部分亲本来源相同的可能性较大。
图2 系统进化树Fig.2 Phylogenetic tree个体编号中,M1表示野生群体,M2表示选育群体,M3表示养殖群体.In the individual number, M1 represents wild population, M2 represents breeding population and M3 represents cultured population.
图3 主成分分析Fig.3 Analysis of principal component analysis
野生群体、选育群体和养殖群体的平均长纯合片段数分别为59.1、49.5个和56.6个,长纯合片段平均长度分别为0.312、0.313Mb和0.311Mb,平均单核苷酸多态标记含量为59、50个和73个,1号和10号染色体长纯合片段平均含量较多,为6.5个,7号最少,为1.9个。基于长纯合片段分布和比例计算的近交系数(FROH)见图4,野生群体、选育群体和养殖群体的近交系数(FROH)分别为0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,14号染色体近交系数(FROH)最高,野生群体近交系数(FROH)略高于选育群体和养殖群体,3个群体近交系数(FROH)均低于0.060。整个染色体内的连锁不平衡衰减结果见图5。一般把连锁不平衡系数(r2)降低至0.1~0.2时的遗传距离认为是该物种的衰减距离。r2为0.2时,野生群体、选育群体和养殖群体的平均连锁不平衡的距离为0.4、0.4 kb和0.2 kb;r2降为0.1时,野生群体、选育群体和养殖群体的平均连锁不平衡距离增至40.5、>300.0 kb和4.0 kb。衰减速度为养殖群体>野生群体>选育群体,养殖群体具有较高的群体内核酸多态性(表2),结果与其衰减速度最快相一致,选育群体由于连续多年人工选育,群体内核酸多态性较低,衰减速度最慢。
图4 不同染色体近交系数统计Fig.4 Statistics of FROH in different chromosomes红色代表野生群体,绿色代表选育群体,蓝色代表养殖群体.Wild population is shown in red color, breeding population is shown in green color and cultured population is shown in blue color.
图5 不同群体连锁不平衡衰减Fig.5 Linkage disequilibrium decay in different populations
为获取有效的杂种优势,杂交亲本应选用不同分化亚群或具有较好遗传资源的群体(系)或品系,并从来源群体中选择具备一定表型优势的亲本,野生群体作为来源时应该纯化亲本[8]。合浦珠母贝养殖性状中生长速度[9]和存活率均是影响产珠的重要选择性状,在难以估计存活性状的情况下,生长相关表型性状成为亲本的首选性状,笔者均利用人工繁选群体作为亲本的来源群,保证了亲本的纯化和优势性状亲本的选择,方便准确分析适合作为杂交亲本的遗传信息。
本研究中,3个群体经过群体多态指数比较、主成分分析交叉位点和系统进化树分析得出,选育群体和养殖群体群体分化程度最低。遗传分化指数是衡量群体间的遗传分化程度的重要指标,当0<遗传分化指数<0.05时,表明各群体之间分化很小,几乎可以忽略;当遗传分化指数>0.05时,各群体之间才存在中度以上的遗传分化[10]。马氏珠母贝的不同壳色家系间遗传分化指数为0.113~0.793[11],表明各个家系之间存在极大的分化,可能与连续多年的家系选育以及近交引起家系内基因频率发生较大变化有关;在马氏珠母贝近交与杂交4个家系间的平均遗传分化指数为0.1049[12],表明4个家系间存在中度的遗传分化,同杂交和近交的不同交配方式对基因频率改变存在重要关系;本研究的平均遗传分化指数相对较低,其中野生群体-选育群体和野生群体-养殖群体的遗传分化指数均值分别为0.068和0.065,表明野生群体-选育群体、野生群体-养殖群体之间存在中等程度的分化,与选育群体的连续多年选育,以及养殖群体在养殖中被有意识作为一个独立群体繁育有关。选育群体-养殖群体的遗传分化指数均值为0.030,表明选育群体和养殖群体间几乎没有遗传分化,表明本研究中的2个群体间的基因频率差别不大,群体来源相同或部分个体来源相同的可能性较大,这可能与本研究选用来源群体的粗放保种以及生产中的不当操作串种有较大关系。广西合浦珠母贝产业受养殖环境的影响,导致传统养殖群体萎缩,而随着选育群体在广西的推广应用力度加大,一定程度上造成传统养殖群体与选育群体的混杂并存,且选育群体本身具有优势生长表型性状[4],所以在选择同质种贝样本时,样本同源的概率较大。连锁不平衡衰减速度能够反映群体选择强度或群体多态性[13],野生群体受人工选择的压力较小,养殖群体虽然多态性标记数量(546 380个)最多,但与选育群体分化程度偏低。为了引入更多的优秀基因,在没有专门化群系条件下,进行快速育种时可优先考虑野生群体×选育群体或野生群体×养殖群体杂交组合方式。而通过全基因组关联分析时,连锁不平衡衰减越快,分析所需的标记密度越大,与目标性状表型变异关联的显著性位点离功能基因位点距离会越近,进行全基因组关联分析时,野生群体×养殖群体杂交组合方式可提高基因定位精度。
水产动物具有较强的繁殖力,在短期内经过高强度的人工选择可以实现性状的快速改良,同时也意味着繁育的大部分个体父母本可能来自少数个体,育种群体的近交系数可能升高很快[14-15]。已有研究表明,贝类存在明显的近交衰退问题[16-18]。了解群体的繁殖规律并掌握群体近交系数,有助于了解父母本的亲缘关系,并通过杂交的方式降低近交的影响[12]。本研究结果显示,野生群体、选育群体和养殖群体的群体内近交系数(Fis)分别为0.2075、0.3449和0.3465,选育群体和养殖群体接近近交系(Fis>0.375)[19]的水平,选育群体和养殖群体可以被视为具有一定纯化水平的群系,无论是杂交育种或通过杂交方式降低群体近交系数,野生群体均可作为主要亲本群。近交系数在进行杂交子代的遗传参数分析时,可作为重要的参考依据。一般杂交父本和母本分别来自不同群体(系),父本和母本被默认为无亲缘关系,但父本或母本个体间却存在一定的亲缘关系,利用基因型作为固定效应计算亲缘系数会优于系谱计算。长纯合片段反映了子代从有共同祖先的亲代遗传了相同的染色体片段[20],也可以帮助了解群体近交程度和群体多样性,相较于群体内近交系数Fis,基于长纯合片段所计算的近交系数FROH更接近于真实近交水平,已在畜禽遗传研究中普遍应用[21-22],而本研究结果中,野生群体、选育群体和养殖群体的近交系数(FROH)分别为0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,3个群体近交系数(FROH)相近并低于多数畜禽(FROH>0.05)[23-25],同时结果也明显低于群体信息统计计算的近交系数,除物种差异因素外,结果偏低也与简化测序结果与基因组覆盖率低有关,且多数贝类没有明显性染色体[26],计算时以全基因组长度作为参数。近交系数(FROH)可作为群体内无直接亲缘关系个体的亲缘关系参考系数,在缺少基因型计算亲缘系数时,近交系数(FROH)可直接作为合浦珠母贝选择群体的近交系数进行因子计算,不同染色体长纯合片段的分布也表明了3个群体从共同祖先遗传染色体概率相近。
笔者通过分析广西合浦珠母贝3个不同群体间的遗传关系,发现不同群体间存在一定程度的遗传分化,并指出通过野生群体×选育群体或野生群体×养殖群体组合方式开展杂交育种,具有较大获得杂种优势的潜力。研究结果可为广西合浦珠母贝通过杂交育种对种质资源改良提供新的思路和途径。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!