PBJ | 华金平/孔杰团队及合作者利用336份重测序数据及GWAS解析海岛棉谱系演化并鉴定到多个与纤维品质和抗性相关的重要基因

发布日期2021-11-26 浏览次数 信息来源农学院

海岛棉是世界上最优良的棉纤维,其热胀冷缩的性能突出,有“羊绒质感,丝绸光泽”的美誉。海岛棉纤维非常细长,因此又称为长绒棉,强度也特别高,是纺织纤维的上上品。以海岛棉织造的衣服色彩亮丽鲜明、吸湿和脱湿快、有极佳的触感及良好的透气性与吸汗力;海岛棉织物坚牢耐磨,洗涤时缩水不超过1%,能够洗涤和在高温下熨烫;抗皱、起球性能优于其他棉织物。

海岛棉原产南美热带和西印度群岛、中美洲和加勒比地区。最早广泛栽培海岛棉是南美洲的智利到厄瓜多尔地区,以后陆续传入北美洲、非洲的埃及、苏丹和亚洲的一些国家。

中国20世纪50年代从苏联成功引种海岛棉在新疆种植,先后育成了“军海 1号”和“新海棉”系列品种,已经进行多次棉花品种更换。目前,我国的自育海岛棉品种产量高、品质优良、抗病性好,满足了新疆南疆地区大面积种植生产需求。但是,迄今为止,对于海岛棉品种之间的遗传变异、系谱选择的影响以及关键性状的基因调控缺乏系统分析和深入研究。

近日,中国农业大学华金平团队联合新疆农业科学院孔杰团队和美国爱荷华州立大学Jonathan F. Wendel团队,在国际知名学术期刊Plant Biotechnology Journal上在线发表题为“Genomic and GWAS analyses demonstrate phylogenomic relationships of Gossypium barbadense in China and selection for fiber length, lint percentage, and Fusarium wilt resistance” 的研究论文。文章通过对336份自育和引进品种组成的海岛棉群体进行基因组分析和全基因组关联分析,揭示中国海岛棉的谱系基因组关系,并筛选到5个参与调控衣分,纤维强度、长度,枯萎病抗性的基因,剖析了海岛棉品种优异基因资源的遗传传递机制。

利用336份自育和引进品种组成的海岛棉群体的全基因组测序数据,进行了系统发育和群体结构分析,发现该群体主要由两个亚群组成:亚群1主要包括我国西北内陆棉区近年选育的纤维较长、较强的海岛棉品种,亚群2包含世界主要产棉国的大部分早期海岛棉品种,纤维较短且强度较低;地理传播和杂交育种又衍生出第三个混合亚群,该亚群海岛棉主要包括来自中国主要棉区的地方品种和来自世界其他棉花生产国的过渡品种,纤维质量中等

基于对该海岛棉群体株型、熟性、产量、纤维品质和抗病性等15个性状进行了全基因组关联研究,获得关联位点;基于多个环境重复检测到的峰值SNP,筛选其邻近影响性状表型变异的关键基因,通过转录组分析和VIGS实验进行了初步验证。

首先,在A05染色体发现了一个编码含U-box结构域的E3泛素连接酶 (PUB4) 基因(GbFL2),单个核苷酸(T/G)的转化导致氨基酸的改变(由亮氨酸(L)变成缬氨酸(V)),分别对应海岛棉长(T)/短(G)纤维表型。大部分早期引进海岛棉品种均为长纤维单倍型(T);在育种过程中长/短纤维单倍型比例接近相等;近期选育的主栽海岛棉品种中,长纤维(T)单倍型尤为突出,占整体的83.33%。进化分析显示在育种过程中GbFL2经历了定向选择。不同发育时期的纤维转录组数据显示,GbFL2在长纤维品种中的表达量显著低于短纤维品种;qRT-PCR表达和VIGS基因沉默验证该基因的负调控模式。通过分析基因频率分布,发现纤维长度在中国海岛棉的育种过程中是更为优先选择的品质性状。此外,在D11号染色体上鉴定到了一个编码酪蛋白激酶1样蛋白(HD16)基因(GbFS1),转录组数据分析显示它对纤维强度起负向调控作用。

其次,在A05染色体上还鉴定到一个编码ATP依赖的RNA解旋酶 (DEAH12)基因(GbLP1),在高衣分材料纤维发育早期高表达,对衣分起正向调控作用。海岛棉引种之后,高衣分单倍型品种的数量总体上呈现逐渐减少的趋势,高/低衣分单倍型比例出现先增加后降低的波动。进化分析显示该基因经历了正向选择,而它在D亚组中的同源基因则经历了纯化选择。值得注意的是,大多数现代海岛棉品种都是长纤维、低强度、低衣分,其次是高衣分但纤维短而强度低的品种,由此可见,中国海岛棉最优先的定向选择是针对长纤维的,其次是高衣分。

本研究还鉴定到了与海岛棉枯萎病抗性相关的2个紧密连锁的基因(GbDP1和GbDP2),它们位于D03染色体上,分别编码锌指同源结构域蛋白6 (ZHD6)和细胞壁相关受体激酶样14 (WAKL14);2个基因均表现出对海岛棉的枯萎病抗性起负向调控作用,即基因沉默后的植株的枯萎病抗病性显著增强。

最后,深入分析了供试海岛棉材料的一个抗枯萎病品种表型的系谱——该系谱11个共同亲本,最终选育出两个性状迥异的主栽品种,新海39和新海60,分别具有长纤维和高衣分。通过与亲本基因组序列比对,分别追踪到4.57%和3.78%的遗传片段,其中,大多数位于At基因组。新海39号的遗传片段中分别有32和178个基因是定位的纤维长度和强度相关基因,其中Gbar_A04G013270(三磷酸异构酶)和Gbar_A04G013290(功能未知)等2个基因在10-15 DPA纤维有较高表达且为正调控模式,遗传来自亲本86430(13个亲本中纤维最长的材料)。新海60号的遗传片段中发现了70个基因是定位到的衣分相关基因,其中Gbar_D04G017350 (微管α -2链)在纤维发育早期(0、5、10、15 DPA)有较高表达且为负调控机制,来自亲本军海1号(在所有亲本中衣分最低)。

本研究丰富了海岛棉研究的基础数据,全面解析了中国海岛棉育种谱系及其选择效果,揭示了自育海岛棉产量、品质和抗病性改良的遗传增益。

图1 在At05染色体上鉴定到的纤维长度关键基因GbFL2

中国农业大学博士研究生赵楠、新疆农业科学院王为然副研究员和美国爱荷华州立大学Corrinne E. Grover博士为论文共同第一作者,新疆农业科学院阿里甫·艾尔西研究员、河北省农林科学院耿军义研究员和郭宝生研究员、山西农业大学棉花研究所李朋波研究员和潘转霞研究员等参与研究工作。中国农业大学华金平教授、新疆农业科学院孔杰研究员和美国爱荷华州立大学Jonathan F. Wendel教授是论文的共同通讯作者。该研究得到了国家重点研发计划、农业农村部棉花产业体系、新疆农业科学院科技创新重点培育项目、山西农业大学农业科技创新项目、河北省农林科学院现代农业科技创新项目的资助。

论文链接:

https://onlinelibrary.wiley.com/doi/abs/10.1111/pbi.13747