近日,华大在深圳国家基因库正式对外发布一项迄今为止最大规模的中国人基因组学大数据研究成果。
这是由中国科学家主导,历时两年,对14余万中国人的无创产前基因检测数据进行深入研究后,首次揭秘中国人群基因遗传特征的科研成果,也是由华大主导的“百万人群基因大数据研究”项目的首秀。
对此,华大生命科学研究院院长、文章第一通讯作者徐讯博士表示,本次研究成果有两个重要意义,首先,这标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。
据了解,华大在2016年正式发起“百万人群基因大数据研究”项目,此次研究项目正是其第一期的成果。
南北方6大遗传差异
在本次研究中,华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库(CMDB),其中约有20万个多态性位点属于首次发现,这是目前正式发表的最大规模的中国人群基因频率数据库。
值得一提的是,研究小组确定了6个在地区纬度方向上受到强烈自然选择的基因,它们在基因频率上呈现明显的南北差异,充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。
比如,由于古代在北方、西北等地区如新疆、青海和内蒙古等地可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大,因此,促进脂肪代谢率的等位基因在这些地区有明显富集的趋势。
与机体免疫功能相关的编码红细胞补体受体I的基因CR1呈现了南方富集的现象。古代中国南方被称为南蛮瘴气之地,自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。
北方体味小
此外,与耳垢干湿、体味(如狐臭)、大汗腺分泌等相关的ABCC11基因,也呈现了明显的南北方选择差异。除了部分广西、广东和海南的中国人没有这个基因突变之外,绝大部分的生活在北方温带气候地区的人们都有这个基因突变,突变结果表现为干性耳垢、体味较小、大汗腺分泌较少,这样可能更有利于北方的生存环境。而在南方,则没有这方面的自然选择压力,从而使野生型基因在南方长久地流传下来。
甘肃以及靠近甘肃省的宁夏和青海省有较高的欧洲血统
研究小组通过分析人群遗传距离的变化和基因流方向,揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚人群的基因交流程度(或者说是通婚程度),发现当今中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响。
本次研究发现,甘肃以及靠近甘肃省的宁夏和青海省的汉族人群体中所含有的欧洲人成分高于其它省份,为全国平均水平的1.7倍,达到0.115%。这个地区在古代恰巧是丝绸之路的必经之地——河西走廊的所在之处,是中西方人群汇聚的地方,很可能由此导致该地区汉族人有较高的欧洲血统。
首次发现“怀双胞胎”基因
通过数据分析,研究小组一次性发现并且验证了48个与身高以及13个与BMI显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。
随着研究的进一步深入,科学家和算法工程师有可能可以利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。
另外,研究小组对怀孕年龄和双胎怀孕两个表型进行了深入分析,发现了两个与怀孕年龄显著相关的基因位点,暗示着这两个位点的突变与生育力密切关联; 与此同时,还在NRG1基因中发现了一个和双胞胎妊娠显著相关的突变位点,也就是说携带NRG1基因的突变,有更高的几率怀上双胞胎。
首次揭示中国人病毒图谱:乙肝病毒排首位
华大的研究小组还首次全面揭示了全国31个省级行政单位的人群病毒感染发生率以及病毒在血浆中丰度的分布。
研究发现,中国人血浆的病毒组与欧洲人存在比较大的差异,比如,在欧洲人群中排名前两位的分别是与皮肤急疹相关的疱疹病毒7型及与鼻咽癌相关的疱疹病毒4型,而在我国人群中排在首位的则是乙肝病毒,其感染发生率大约为2.5%。
2018年10月10日,华大在深圳国家基因库正式对外发布一项迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人的无创产前基因检测数据进行深入研究后,首次揭秘中国人群基因遗传特征的科研成果,也是由华大主导的“百万人群基因大数据研究”项目的首秀。
对此,华大生命科学研究院院长、文章第一通讯作者徐讯博士表示,本次研究成果有两个重要意义,首先,这标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。
华大填补多项基因组学研究空白
基因是生命的密码,国家级人群基因组学研究以及对遗传资源的保护与应用是精准医学的基础,直接影响到一个国家在生物医学领域的核心竞争力。大规模人群基因组学的研究,可以发现与疾病(或表型性状)显著相关甚至是起决定性作用的遗传变异。
因此,美、英等多个国家发起了国家级人群基因组学研究计划并公开数据供全球科学家研究使用,为全人类的医疗健康事业做出了巨大贡献。2018年10月3日,英国政府宣布将在未来五年内开展五百万人基因组计划,并表示从2019年起,全基因组测序将被作为标准之一辅助重病患儿、患有难治愈或罕见疾病成年患者的治疗。这标志着精准医学研究进入了大数据时代。
中国在国家级人群基因数据研究上暂时处于落后的状态,主要原因在于大型研究项目的完成需要较长周期,项目设计、样本采集及基因测序需要花费大量的时间与资金,合理利用已有的数据将大大加速这一进程。华大的科学家们发现,无创产前基因检测的基因组测序数据,可以为大规模的人群队列研究提供一个全新的思路。
据估计,目前全球的无创产前基因检测已超过1200万例,仅华大基因一家机构已完成逾350万例,为出生缺陷防控做出重大贡献。截至目前,华大基因累计发表无创产前基因检测相关的科研论文53篇,其中SCI论文47篇 (46篇为与多家医疗机构合作共同发表),内容涉及方法学、临床验证、临床案例、无创双胎、无创单基因病&全基因组、无创染色体微缺失/微重复综合征等。
由于无产创产前基因检测数据的特殊性,使得现有的分析方法都不能对其进行深层次的研究,导致其蕴含的巨大价值无法被挖掘。此次发表于《细胞》的成果,是华大研究团队在大规模人群队列研究的一次尝试, 取得了极其显著的成果。
华大研究员、文章第一作者刘斯洋博士表示,在这次研究中,我们建立了全新的研究思路和分析算法,突破了当前组学领域难以使用超低深度全基因组测序数据进行遗传学研究的局限和挑战,首次证明了无创产前基因检测数据可用于回答遗传学以及医学领域多个重要问题的价值和潜力,该方法和策略可被全球基因组学研究参考与应用。
在严格遵从《人类遗传资源管理暂行办法》和生命伦理原则的规范下,以及充分重视知情同意和隐私保护的前提下, 华大研究团队选取了14余万无创产前基因检测数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,揭示了包括31个省、36个少数民族与汉族在内的中国人群精细的遗传结构,实现了多种表型的全基因组关联研究,揭示了中国人群中病毒序列分布特征,构建了包含约900万个多态性位点的炎黄中国人群基因频率数据库 (CMDB),并成功发表于最新一期的国际顶级学术期刊《细胞》中。
徐讯表示,此次研究成果不仅填补了大规模中国人基因组学研究领域的众多空白,并表明无创产前基因组测序数据或者类似的全基因组超低深度测序数据可以有效地用于群体遗传学、疾病与表型等领域的高水平研究,并将在遗传病诊断、肿瘤研究、药物研发等领域得到广泛的应用。
图1. Cell 文章截图
华大迈出“百万人群基因大数据研究”第一步
值得一提的是,这是高水平国际学术期刊第一次认同在其上发表基因组学文章所使用的数据仅需保存于深圳国家基因库,而无需向海外数据库进行备份,这意味着国际学术期刊对我国遗传资源的充分尊重与认同,也代表着中国已经完全有能力与实力管理与保护我国重要的遗传资源。
自2016年正式运营以来,深圳国家基因库已成为我国生物遗传资源存储的重要基础支撑,为我国的遗传资源提供了至关重要的保护,让中国可以将重要的数据存储于国内,而无需上传至国外的数据库进行保存;同时,在确保安全性和规范化的前提下,支持对数据开展严谨的科学研究,这对于我国的基因数据自主权以及行业发展都具有非常重要的战略意义。
徐讯认为,此次研究成果也证明了生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代。未来,我们将借助对基因大数据的研究和分析,更深刻地了解人类的生老病死,进一步促进我们对复杂疾病、罕见病、药物研发、肿瘤基因解读等方面的研究与应用开发,从而推动精准医学事业的发展,加速基因科技在出生缺陷、癌症、感染等领域的应用,并更好地指导个人的健康管理。
据了解,华大在2016年正式发起“百万人群基因大数据研究”项目,此次研究项目正是其第一期的成果。华大希望通过对百万中国人群基因组测序数据的综合研究,促进遗传学研究与精准医学事业的发展,更好地实现基因科技造福人类的愿景与使命。
中国南北方6大遗传差异首次被揭开 南方人免疫力更强
虽然我国人口众多,历史悠久,但长久以来,由于实验研究抽样不充分,导致我们对自身的遗传特征认识不多。
在本次研究中,华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库(CMDB),其中约有20万个多态性位点属于首次发现,这是目前正式发表的最大规模的中国人群基因频率数据库。
值得一提的是,研究小组确定了6个在地区纬度方向上受到强烈自然选择的基因,它们在基因频率上呈现明显的南北差异,充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。
图2. 6个在中国受到显著自然选择的基因位点
比如,由于古代在北方、西北等地区如新疆、青海和内蒙古等省份可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大,因此,促进脂肪代谢率的等位基因在这些地区有明显富集的趋势。
与机体免疫功能相关的编码了红细胞补体受体I的基因CR1呈现了南方富集的现象。古代中国南方被称为南蛮瘴气之地,自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。
此外,与耳垢干湿、体味(如狐臭)、大汗腺分泌等相关的ABCC11基因,也呈现了明显的南北方选择差异。除了部分广西、广东和海南的中国人没有这个基因突变之外。绝大部分的生活在北方温带气候地区的人们都有这个基因突变,突结果表现为干性耳垢、体味较小、大汗腺分泌较少,这样可能更有利于北方的生存环境。而在炎/闷热的南方,则没有这方面的自然选择压力,从而使野生型基因在南方长久地流传下来。
同时,研究小组通过分析人群遗传距离的变化和基因流方向,揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚人群的基因交流程度(或者说是通婚程度),发现当今中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响。
本次研究发现,甘肃以及靠近甘肃省的宁夏和青海省的汉族人群体中所含有的欧洲人成分高于其它省份,为全国平均水平的1.7倍,达到0.115%。这个地区在古代恰巧是丝绸之路的必经之地——河西走廊的所在之处,是中西方人群汇聚的地方,很可能由此导致该地区汉族人有较高的欧洲血统。
首次发现“怀双胞胎”基因 后代的真实身高也可能通过基因测算
图3. 四个重要表型的GWAS研究
通过数据分析,研究小组一次性发现并且验证了48个与身高以及13个与BMI显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能可以利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。
另外,研究小组对怀孕年龄和双胎怀孕两个表型进行了深入分析,发现了两个与怀孕年龄显著相关的基因位点,暗示着这两个位点的突变与生育力密切关联; 与此同时,还在NRG1基因中发现了一个和双胞胎妊娠显著相关的突变位点,也就是说携带NRG1基因的突变,有更高的几率怀上双胞胎。
首次揭示中国人病毒图谱 发现中国人的乙肝病毒携带率最高
华大的研究小组还首次全面揭示了全国31个省级行政单位的人群病毒感染发生率以及病毒在血浆中丰度的分布。
研究发现,中国人血浆的病毒组与欧洲人存在比较大的差异,比如,在欧洲人群中排名前两位的分别是与皮肤急疹相关的疱疹病毒7型及与鼻咽癌相关的疱疹病毒4型,而在我国人群中排在首位的则是乙肝病毒,其感染发生率大约为2.5%。
此外,在分析病毒易感性和基因型之间的关系时,在MOV10L1与MLC的基因区域首次发现了一个与疱疹病毒6型易感性极显著相关的基因突变。疱疹病毒6型可引发幼儿丘疹,另外也可导致中枢神经系统症状,最新的研究还发现疱疹病毒6型的感染与阿兹海默症(老年痴呆症)显著相关。如果这个研究能够进一步得到证实,未来就有可能通过基因检测一个人是否容易感染疱疹病毒6型,从而间接推断其易感阿兹海默的几率。因此,这项结果对阿兹海默症的研究也有重要的参考价值。
每一个生活在不同地域的人,受到当地的环境,文化,历史不一样,也产生了不一样的性格。下面来瞧一瞧中国各省都有哪些特点吧。
北京人总的来说很善良,大气,有同情心,讲义气,热心肠,喜欢管闲事,在中国来讲算是高素质的了。
天津男人性格豪爽豁达,但有安于现状之嫌,做人义气,办事果断,喜欢结交朋友。天津女人也是比较男性化,做老婆不如做朋友,绝不温柔。
河南人其实大部分河南人很勤奋,能吃苦,生活朴实。乡土观念比较重,有点封闭保守。但在全国的印象不怎么好,以前在广东很多工厂都不愿意雇佣河南人,更是说出“防火防盗防河南人”。很多在外的河南人胡作非为,糟蹋了一个省的名声。
河北人自古就是燕赵之地,慷慨悲歌之士较多。河北人忠厚踏实,甘做绿叶。女孩朴实善良,适合做老婆。
山西人文化底蕴厚,自古就有闻名的晋商。山西人老实本分,忠诚可靠,喜欢按部就班。但也固执,拘谨怕事。
内蒙古人形体粗壮,声音洪亮,威猛彪悍,是匹夫之勇的楷模。但心里善良,为人敦厚,性格豪爽,敢爱敢恨,少有歪门邪念。酒量更是惊人。
黑龙江,吉林,辽宁统称东北人,自古在一起,所以性格差别不大,东北人性格中优缺点最鲜明,内质刚毅,外表强悍,性格豪爽,讲义气不重法律。性格随意而张狂,好勇斗狠。喜欢路见不平拔刀相助。
山东是孔孟之乡,礼仪之乡。山东男人责任感重,忠厚直爽,讲究孝顺,侠义尚武,深受儒家文化的熏陶。女人贤惠顾家,但有的比较泼辣,不讲理。地域自豪感强。
江苏是才子佳人最多的地方,江苏人话语温柔,行为矜持,人情练达,精于细算,讲理守法,但也比较懦弱。
上海人包容性较差,外地人很难融入,有着强烈的地域归属感,上海女人举止得体,言谈柔和,很有女人味。上海男人胆小,懂得尊重女性,生活讲究,诚实守信。
浙江自古就是中国的富裕之地,商人较多,浙江人精明,头脑灵活,勤于思考。女人则是温柔得体。
江西是鱼米之乡,江西大部分是客家人,江西人安于现状、中庸保守、忠诚守信,冒险意识较差,家族观念极强。
台湾人主要由原住民、早期的闽南移民、国民党迁台的大陆移民组成。台湾族群感强,气度不够,喜欢作秀,不过台湾人还是很讲究规矩,长幼有序,男尊女卑。
广西人性格软弱,诚实憨厚,没什么攻击性,但属于沿海,观念还是比较开放。帅哥美女全国最少。
海南人有很强的保守主义,目光狭隘,讲究享乐,淡泊名利。性格比较柔缓,不太冲动,容易相处。海南人是受得了穷,吃不了苦,岛民思想严重。
湖北人好斗而勇猛,但缺乏理智思考,能韬光养晦,聪明人比较多,聪明的有点狡猾,农村人比较实在。
四川男人好战,好喝酒,也喜欢窝里斗,随遇而安。但勤劳勇敢、不怕困难、勇往直前。女人则是全国文明,美女如云,号称第一美女大省。
重庆男人好色,喜欢搓麻将,也喜欢好打抱不平,愿意助人为乐,能内外兼修,容纳外人。女人则是眉清目秀,身体纤细,妩媚、时髦、开放。跟四川妹子有得一比不分上下。
贵州人精壮能干,敏于新潮,缺少吃苦精神,"麻将在手,小吃在口,三天两头,狐朋狗友",对本省的落后处境缺乏危机感。女孩也同重庆女孩一样天生丽质,带点"辣妹"气质。贵州人家庭意识不强。
云南人身材矮小单薄,俊男靓女也很少,云南人安居乐业,绝大多数是善良、友好的,不喜欢到外面去闯荡。
西藏人由于紫外线照射较多,皮肤比较黝黑,西藏人纯真,宽容,对朝拜特别重视,是佛教的圣地。
陕西人"国"字型脸的人很普遍,朴讷温厚而又爽直豪放,男人比较恋家,女孩温柔顺从,但内心炙热如火。
宁夏主要是回民,好羊肉,忌讳谈猪,宁夏人外表凶悍,内心宽厚,大部分信奉伊斯兰教。
甘肃古代战事较多,当地人受影响比较大,甘肃人 过于保守,性格呆板,少创新,对于新东西,甘肃人接受总是慢半拍。女孩子言谈举止都非常开放。
青海人性格豪爽,民风淳朴,善良厚道,还没怎么被外界污染,青稞酒最为出名。
新疆男人长得英俊帅气,男人气质明显,女人穿着严禁暴露,美女很多,但后狐臭的也很多。但在外地的新疆人名声不好,小偷较多。
广东人比较矮小,充满活力,比较看重价值,喜欢先行动在思考。对外表不太注意,广东人不关心国事,邻里间也不关心,来往很少,广东人迷信思想严重。
湖南人刀刚火辣的性格特征十分鲜明,湖南人能说会道,质朴,倔强,不怕死。但性情比较急躁。美女也有很多,湘妹子比较出名,放的开,也比较泼辣。需要男人有一定的定力才能镇的住。
香港人收西方思想的影响较为严重,具有东西方双重性格,具有精明强干、坚忍不拔、脚踏实地、紧张忙碌的性格,但也比较迷信。
澳门人度量很大,小事不计较,责任感强;澳门女人是"守家婆",忠于家庭。
福建人的性格就是憨厚老实非常明显,谦和而不软弱,比较沉默,话不多,但能相处和睦,也很狡猾,拼搏力不咋的。
上述文章内容有限,想了解更多知识或解决疑问,可 点击咨询 直接与医生在线交流
MONTH'S ATTENTION
HOT QUESTION
MONTH'S ATTENTION
PHYSICIAN RECOMMENDATION