畜牧兽医学报  2017, Vol. 48 Issue (12): 2258-2267. DOI: 10.11843/j.issn.0366-6964.2017.12.005    PDF    
基于GBLUP与惩罚类回归方法的猪血液性状基因组选择研究
张巧霞1, 张玲妮1, 刘飞1, 刘向东1, 刘小磊1, 赵书红1,2, 朱猛进1,2     
1. 华中农业大学 农业动物遗传育种与繁殖教育部重点实验室, 武汉 430070;
2. 生猪健康养殖协同创新中心, 武汉 430070
摘要:旨在探讨GBLUP与惩罚类回归方法用于猪血液性状基因组选择的相关问题。以本实验室收集的免疫资源猪群体13个血液性状为分析对象,结合Illumina公司猪SNP60K基因芯片分型数据,以加性模型和加性-显性模型为基础,利用GBLUP和3种惩罚类回归方法(ridge、lasso与elastic-net)开展基因组选择分析。研究发现,基因组选择的准确性与性状芯片遗传力估计值呈正相关。交叉验证分析结果表明,4种方法对13个血液性状预测准确性最高的性状均是MCV(平均红细胞体积),而加性模型和加性-显性模型的预测准确性在不同性状中的表现不同。在多数性状中,lasso和elastic-net回归的预测准确性低于ridge回归和GBLUP法,但在NE%(嗜中性细胞百分比)等少数性状中则刚好相反。综上说明,没有适用于所有性状的最佳基因组预测方法,基因组预测方法的选择应考虑目标性状的遗传特性。本研究为猪免疫性状基因组选择的实际应用提供了重要参考信息。
关键词    血液性状    基因组选择    GBLUP    惩罚类回归    
A Study of Genomic Selection on Porcine Hematological Traits Using GBLUP and Penalized Regression Methods
ZHANG Qiao-xia1, ZHANG Ling-ni1, LIU Fei1, LIU Xiang-dong1, LIU Xiao-lei1, ZHAO Shu-hong1,2, ZHU Meng-jin1,2     
1. Key Laboratory of Agricultural Animal Genetics, Breeding and Reproduction of Ministry of Education, Huazhong Agricultural University, Wuhan 430070, China;
2. The Cooperative Innovation Center for Sustainable Pig Production, Wuhan 430070, China
Abstract: This study aimed to explore the application of GBLUP and penalized regression methods in genomic selection of the hematological traits in pigs. We chose 13 hematological traits from the immune resource population collected by our laboratory as the analyzed objects. We used the genotyping data of Illumina PorcineSNP60 Genotyping Beadchip to conduct the genomic selection analysis, in which GBLUP and 3 penalized regression methods (ridge, lasso and elastic-net) were used based on additive model and additive-dominance model. The results showed that the accuracy of genomic selection was positively correlated with estimated values of chip heritabilities of traits. The results of cross-validation analysis showed that the MCV (mean corpuscular volume) had the highest prediction accuracy among 13 hematological traits. The prediction accuracy of additive model and additive-dominance model were different in different traits. In total trend, the prediction accuracy of the lasso and elastic-net regressions were lower than that of the ridge regression and GBLUP. But in a few traits, such as NE%, it was opposite. In conclusion, there is no optimal genomic prediction method that could be suitable for all traits, and we should consider the genetic characteristics of the target traits when choosing a genome evaluation method. This research provides important reference information for the practical application of genomic selection for immune traits in pigs.
Key words: porcine     hematological trait     genomic selection     GBLUP     penalized regression    

我国是当今世界猪肉产量与消费量最大的国家,养猪业在农业生产中占据着举足轻重的作用。随着我国养猪业的不断发展,猪病也呈现出病原谱复杂化、爆发周期密集化的趋势,猪病已成为制约我国养猪业健康、稳定发展的重要因素之一。培育高抗病力猪种,可以从源头提高猪群抗病力,既符合新时期绿色健康养殖的理念,又能在某种程度上达到降低猪群发病几率、控制猪场疫情的目的。所以,近年来猪的抗病育种工作开始受到国内外学者的高度重视。

继最佳线性无偏预测(Best Linear Unbiased Prediction,BLUP)、分子标记辅助选择(Marker-Assisted Selection,MAS)、分子标记聚合育种(Pyramiding Breeding)之后,基因组选择(Genomic Selection,GS)已开始逐渐成为当前家畜育种的重要手段[1]。基因组选择最早由T.H.Meuwissen等[2]于2001年提出。基因组选择可视为在全基因组水平开展标记辅助选择的一种新遗传评估方法,与其他遗传评估方法相比较,基因组选择具有预测准确率高、世代间隔短、选择效率高[3-4]等优点。目前,基因组选择已在奶牛育种中得到了广泛应用,如中国[5]、澳大利亚、新西兰、美国、法国、德国、荷兰[6-10]等国已相继展开了基于基因组选择的奶牛育种工作,并取得了显著成效[6, 11-12]。近年来,以丹育(DanBred)为代表的国际大型猪育种公司已在育种实践中全面应用基因组选择技术,但国内猪基因组选择技术的实际应用还处于起步阶段。

猪抗病力及其组分性状多为中低遗传力性状[13],常规育种取得的遗传进展较慢。随着基因组学技术的高速发展,以猪基因组信息为基础的分子育种技术已成为猪经济性状改良的重要手段[14]。基因组选择已被学界公认优于传统选择指数或BLUP法,基因组选择技术为猪抗病力的遗传改良提供了有效手段。血液性状是猪抗病力的重要组分性状,血液指标可间接反映猪个体的健康状况与抗病潜力。血液性状采集、测定相对容易,对猪造成的伤害和应激较小,无论是抗病力机理解析,还是育种实践应用,血液性状均是较为理想的指示性状。因此,开展猪血液性状基因组选择相关的研究具有重要的意义。

鉴于此,本研究拟利用我室已有的免疫试验猪群数据,开展与猪抗病力密切相关的血液免疫性状的基因组选择研究,利用GBLUP、ridge回归、lasso回归、elastic-net回归4种常用基因组选择方法,通过预测准确性的比较,筛选猪血液性状基因组选择合适的方法,从而为猪血液性状基因组选择的实际应用提供重要参考信息。

1 材料与方法 1.1 试验猪群

试验猪群来自我室构建的免疫资源群体,原始数据样本包含大白猪、二花脸猪的F2遗传设计交配后代1月龄仔猪394头,所有入试个体来自同一猪场,饲养管理条件和方式、营养水平、免疫程序均一致,系谱、测定批次、性别信息完整。数据经预处理,剔除表型缺失值,保留样本含量达到200以上的性状,最后纳入分析的性状包括白细胞(WBC)、嗜中性粒细胞(NE)、淋巴细胞(LY)、单核细胞(MO)、嗜酸性粒细胞(EO)、嗜中性粒细胞百分比(NE%)、淋巴细胞百分比(LY%)、单核细胞百分比(MO%)、红细胞(RBC)、血红蛋白(HGB)、平均红细胞体积(MCV)、红细胞分布宽度(RDW)、血小板(PLT)等13个血液性状。

1.2 基因组SNPs数据处理

免疫试验猪群SNPs数据由Illumina公司猪60K芯片(Illumina PorcineSNP60 Genotyping Beadchip)测定。用经典的酚/氯仿法(CITE HERE)从试验猪群采集的耳朵或尾巴组织提取全基因组DNA。所有DNA样本经检测合格,终浓度标准化为50 ng·μL-1,然后送交商业化公司完成基因芯片杂交试验。获得原始数据后,对基因型数据开展质量控制分析,质控标准设置:基因型缺失率10%、检出率或杂交阳性率(Call rate)90%、最小等位基因频率(MAF)1%、以及是否偏离哈代温伯格平衡(HWE)(P>0.05)。基因型缺失值采用R程序包synbreed的codeGeno命令进行填充(Imputation),填充参数nmiss=0.1,最后获得59 559个有效SNPs用于基因组选择的交叉验证分析。

1.3 基因组选择模型 1.3.1 GBLUP模型

GBLUP用全基因组标记构建的关系矩阵(即G矩阵)代替了传统BLUP由系谱构建的分子血缘矩阵(即A矩阵)[7, 11]。GBLUP的模型:

$y = X\beta + Zu + {e^{\left[ {7,11,15} \right]}}$

其中,y为观测值向量,X为固定效应设计矩阵,Z为随机效应设计矩阵,β为固定效应向量,u为随机效应向量,e为残差向量。

1.3.2 Ridge回归模型

在全基因组回归模型y=+e中,由于SNP数目(p)远大于样本含量(n),不能用常规最小二乘方法(Ordinary Least Squares, OLS)估计每个标记的参数,构成了所谓的p>>n回归问题。惩罚类回归利用稀疏假设(相当于假设基因组中绝大部分SNP效应为零)对最小二乘估计过程施加正则化项(Regularizer)或惩罚项(Penalty term)约束,将常规最小二乘法转化为惩罚最小二乘法(Penalized Least Squares),从而实现非零标记效应的参数估计。Ridge回归的惩罚项叫做L2惩罚,即ridge回归使用L2惩罚最小二乘法(L2 Penalized Least Squares)实现p>>n的高维回归参数估计问题:

$\hat \beta = \arg \mathop {\min }\limits_\beta \left\| {y - X\beta } \right\|_2^2 + \lambda \left\| \beta \right\|_2^{2\left[ {16} \right]}。$

式中,||y-||22为最小二乘项,λ||β||22为L2惩罚项,为β平方的λ倍。

1.3.3 Lasso回归模型

Lasso回归通过对基因组SNPs的回归系数实施L1惩罚(L1 Penalty)解决p>>n的回归问题:

$\hat \beta = \arg \mathop {\min }\limits_\beta \left\| {y - X\beta } \right\|_2^2 + \lambda {\left\| \beta \right\|_1}$

式中,||y-||22为最小二乘项,λ||β||1为L1惩罚项,为β绝对值的λ倍。

1.3.4 Elastic-net回归模型

Elastic-net回归组合了lasso回归与ridge回归的特点,将L1惩罚和L2惩罚限制性条件同时纳入参数估计过程[17-19]

$\hat \beta = \left( {\frac{{1 + {\lambda _2}}}{n}} \right)\left\{ {\arg \mathop {\min }\limits_{\rm{ \mathit{ β} }} \left\| {y - {\rm{X \mathit{ β} }}} \right\|_2^2 + {\lambda _2}\left\| {\rm{ \mathit{ β} }} \right\|_2^2 + {\lambda _1}{{\left\| {\rm{ \mathit{ β} }} \right\|}_1}} \right\}$

式中,||y-||22为最小二乘项,λ2||β||22+λ1||β||1分别对应ridge和lasso回归中的L2、L1惩罚项。

1.4 基因组选择参数设置和分析工具

基因组选择交叉验证(Cross-validation)的参数设置:重复数为25和50,交叉验证倍数(k-fold)设为5和10。对于5-倍交叉验证,先将样本随机等分为5份,然后每1份样本依次作为测试集,剩余4份作为训练集,依次循环5次,使每份样本轮流充当1次测试集,估计预测值与实际值的相关系数,上述过程重复25或50次,最后用相关系数的平均值作为预测准确性的评估指标。在10-倍交叉验证中,每次重复则将样本随机等分为10份,其中9份为训练集,1份为测试集,依次循环10次。基于加性模型的GBLUP用于比较,而ridge、lasso和elastic-net回归则同时运行加性模型和加性-显性模型,其中加性模型以“0-1-2”编码基因型,而加性-显性模型则以“0-1-2”和“0-1-1”编码基因型,同时将加性基因型矩阵和显性基因型矩阵纳入分析模型。统计分析在R语言(3.2.2版本)环境中完成,其中程序包synbreed[20]用于基因型数据填充(Imputation),惩罚类回归由程序包glmnet[21]实现,GBLUP由rrBLUP[22]实现。

2 结果 2.1 各性状遗传力的估计

遗传力由基因组SNPs信息构建的遗传关系矩阵替代传统加性血缘关系矩阵而估计,该遗传力又称为芯片遗传力(Chip heritability)。利用填充后的基因型矩阵,构建加性遗传关系矩阵,建立混合线性模型,用平均信息约束最大似然法算法(Average Information Restricted Maximum Likelihood, AIREML)估计遗传方差与剩余方差,通过加性遗传方差占总方差的比例估计各性状的遗传力。通过刀切法(Jackknife)依次抽去一条记录、保留其他记录估计遗传力,循环直至每条记录被依次抽去一次,再利用循环所得遗传力向量估计平均值和标准误,各性状的遗传力均值和标准误估计结果见表 1。MCV性状的遗传力最高,HGB次之,MO与MO%的遗传力最低。除NE、MO和MO%性状属于低遗传力性状外,其他血液性状的遗传力估计值均达到了中、高遗传力的水平。

表 1 各性状遗传力估计结果 Table 1 Results of heritability estimation for each trait
2.2 基于GBLUP的基因组选择交叉验证

使用不同重复次数和交叉验证倍数的参数组合,用GBLUP法对各性状开展基因组预测,用预测值与真实值之间的相关系数表示预测准确性,各性状的预测准确性见表 2(表 3~5中的数字亦为相关系数估计的预测准确性)。预测准确性最高的是MCV性状,HGB次之,准确性最低的是MO与MO%性状。对照各性状遗传力估计值与GBLUP预测准确性,可发现GBLUP的预测准确性大致表现出与各性状遗传力呈正比的关系。

表 2 各性状基于GBLUP的交叉验证分析结果 Table 2 Results of cross-validation based on GBLUP for each trait
表 3 各性状基于ridge回归的交叉验证分析结果 Table 3 Results of cross-validation based on ridge regression for each trait
表 4 各性状基于lasso回归的交叉验证分析结果 Table 4 Results of cross-validation based on lasso regression for each trait
表 5 各性状基于elastic-net回归的交叉验证分析结果 Table 5 Results of cross-validation based on elastic-net regression for each trait
2.3 基于ridge回归的基因组选择交叉验证

表 3展示了不同重复次数和交叉验证倍数组合下,各性状基于ridge回归的交叉验证分析结果。由于基因组选择多以加性模型为主,同时考虑到加性-显性模型因纳入了加性基因型矩阵和显性基因型矩阵,基因型矩阵倍增而使得计算负担大、耗时长,所以在本研究中3种惩罚类回归的加性-显性模型均只分析了重复数为25、交叉验证倍数为10的一种参数组合。如表 3所示,ridge回归在总体趋势上与GBLUP预测结果相似,其中预测准确性最高的是MCV性状,HGB次之,准确性最低的是MO与MO%性状。从性状内来看,不同交叉验证倍数的预测准确性略有差异,交叉验证倍数与预测准确性间的关系在不同性状中的表现并不一致。在多数性状中,随着交叉验证倍数的增加,基因组选择的验证结果准确性也随之增加。另外,比较相同交叉验证参数,除LY、HGB、RDW等少数性状外,基于ridge回归的加性-显性模型的预测准确性表现出比加性模型略高的趋势。

2.4 基于lasso回归的基因组选择交叉验证

使用加性模型和加性-显性模型的lasso回归分析结果见表 4。与GBLUP、ridge回归的结果相似,lasso回归预测准确性最高的是MCV性状,准确性最低的也是MO、MO%与PLT性状。但与ridge回归不同的是,lasso的加性-显性模型预测准确性不及加性模型,而且在相同交叉验证参数组合下,MO、MO%和PLT的加性模型、以及WBC、RDW和PLT的加性-显性模型的预测准确性出现负相关系数估计值。而且,在MO、MO%、NE与EO性状中,lasso回归出现了无效预测值或无区分度的预测值,导致预测值和实际值之间的相关系数估计值为无效值(NA)。这说明lasso回归在处理小样本数据时,其鲁棒性(Robustness)不及GBLUP和ridge回归。

2.5 基于elastic-net回归的基因组选择交叉验证

以0.1为步长,在0.1至0.9区间内筛选各性状elastic-net回归的最优alpha参数,预测准确性最高对应的alpha值为最优,其中图 1显示了在重复数为10、交叉验证倍数为10的加性模型下,各性状基因组预测的准确性与alpha值的对应曲线(该参数组合下MO和EO性状无数据)。图中每条曲线代表一个性状的基因组预测准确性随alpha值变化而变化的情况,每条曲线最高点对应的X轴值为该性状的优化alpha值。在经过alpha参数优化筛选后,得到加性模型和加性-显性模型elastic-net回归的交叉验证分析结果(表 5)。如表 5所示,预测准确性最高的同样是MCV性状。与lasso回归分析相似,elastic-net回归的加性-显性模型预测准确性亦不及加性模型。另外,elastic-net回归分析结果也出现了预测值与实际值之间相关系数的负估计值和NA估计值。这不难理解,由于elastic-net回归兼具了lasso回归与ridge回归的特点,所以lasso回归所遭遇的统计问题,elastic-net回归也不能避免。

图 1 各性状elastic-net回归的优化Alpha参数筛选 Figure 1 Optimal selection of alpha parameters of elastic-net regression for each trait
2.6 4种方法基因组预测效果的比较

图 2为3种惩罚类回归方法与GBLUP在各个交叉验证参数组合以及不同模型下的各性状预测准确性的直接比较。为直观显示不同alpha值的预测准确性差异,图 2同时给出了elastic-net回归全部alpha值的预测准确性,图中条柱从左至右依次为elastic-net回归(alpha参数为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9)、ridge回归、lasso回归及GBLUP的预测准确性。从图 2显示的趋势看,ridge回归与GBLUP的预测准确性比elastic-net回归与lasso回归高,特别是在WBC、NE、MO、MO%、RDW、PLT等性状中,ridge回归与GBLUP预测准确性明显高于elastic-net回归和lasso回归。单独比较ridge回归与GBLUP法的准确性,当重复次数较大(如r=50)时,除EO性状外,在大多数性状中ridge回归的预测准确性都达到甚至超过了GBLUP方法,尤其是RBC、LY、RDW和NE性状,ridge回归的预测准确性分别比GBLUP提高了77.9%、28.0%、23.8%和22.3%。不过,在加性模型中,NE%性状的预测准确性出现了相反的结果,elastic-net回归与lasso回归的预测准确性要高于ridge回归与GBLUP,而在加性-显性模型中,并没有这一现象。

Elastic-net回归中alpha参数为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9 The alpha parameters of elastic-net regression are 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 图 2 3种回归方法与GBLUP在不同的重复次数与k-fold值以及不同模型下的预测准确性比较 Figure 2 Comparison of 3 regression methods and GBLUP for predicting accuracy of each trait in different repetition times and k-fold values under different models
3 讨论

本研究较为系统地探讨了GBLUP与3种惩罚类回归方法用于猪13个血液性状基因组选择的相关问题。首先,研究发现基因组选择的准确性与性状遗传力估计值呈正相关,4种方法对13个血液性状预测准确性最高的性状均是MCV(平均红细胞体积),准确性最低的均为MO与MO%性状,而且性状遗传力对基因组选择准确性的影响与所使用的基因组选择方法无关。虽然基因组选择可提高低遗传力性状的选择效果,但这并不意味着基因组选择应该首选低遗传力性状,相反在育种实践中,为了取得最佳的遗传进展,应用基因组选择技术时仍需优先考虑高遗传力性状。

本研究重点探讨了GBLUP、ridge、lasso和elastic-net回归法对各性状基因组选择的适用性,发现4种基因组选择分析方法在不同性状中的预测准确性并不一致。对于LY、MO%、HGB、RDW和PLT性状,ridge回归是预测准确性最高的方法,而对于WBC、NE和MO性状,在不同交叉验证参数组合下,ridge回归与GBLUP各有优势,但总体上两者预测效果大致接近。虽然GBLUP是基因组选择最常用的方法之一,但与惩罚类回归方法相比,GBLUP在预测准确性上并没有表现出优势。对于3种惩罚类回归方法,由于elastic-net回归方法兼具了lasso和ridge回归的优点[16],一般认为elastic-net回归的预测准确性应该高于lasso和ridge回归。但从本研究的实际结果来看,elastic-net回归的预测准确性在多个性状上均不如ridge回归,只在NE%等少数性状中,elastic-net回归才优于ridge回归。从统计学角度讲,ridge回归是实现“组选择”(Group selection),反映到基因组预测过程就是选中每个有效应的LD模块,而lasso回归则是从每个组中选择代表性变量,即只选中每个LD模块中的代表性SNP,elastic-net则是实现部分的组选择,选中SNPs界于整个LD模块与代表性SNP之间[22]。所以,可能是因为各血液性状调控基因在猪基因组中的分布特性(即LD结构),导致了elastic-net回归在多个性状上的表现均不如ridge回归。另外,本研究还发现,当交叉验证倍数较大,预测小样本数据时,ridge回归和GBLUP法的鲁棒性要高于lasso回归和elastic-net回归。综合来看,对于基因组预测方法的选择,可能没有绝对的标准,最适基因组选择方法应是性状特异性的,没有适用于所有性状的最佳基因组选择方法,基因组选择方法的选择应考虑目标性状的遗传特性。

此外,本研究亦简单揭示了影响交叉验证结果的其他因素,包括模型(加性模型、加性-显性模型)、交叉验证倍数(k-fold)和重复数对交叉验证过程中基因组预测准确性的影响。虽然有效群体大小、染色体长度、标记数量与密度、参考群体的规模和结构、连锁不平衡状态、显性效应等诸多因素均有可能影响基因组选择的效果[23-24],但由于本研究分析的对象是已存在的真实数据集,其有效群体含量、猪基因组结构以及性状的遗传特性均已固定,这些因素均无法探讨。对于模型、交叉验证倍数和重复数,经研究发现,加性模型与加性-显性模型的预测准确性存在差异,从全部13个血液性状的预测结果来看,加性模型和加性-显性模型的预测准确性在不同性状中的表现不同,每种模型都有准确性最高或准确性相对较高的预测结果,显然并不存在适用于所有性状的最优模型。对于交叉验证倍数,大致表现出随着交叉验证倍数的增加,预测准确性随之增加的趋势,但超过一定的验证倍数后,其预测准确性可能反而下降,尤其是统计鲁棒性较低的lasso和elastic-net回归法,甚至可能出现无效预测或无区分度的预测结果。所以,在开展基因组选择的交叉验证时,需要综合性状遗传特性、以及样本含量等因素确定适宜的交叉验证倍数。由于交叉验证分组是采用随机分组法,理论上存在参考群和测试群均值出现显著差异的分组概率,所以在交叉验证过程中,重复次数越多,基因组预测的平均结果也越准确。不过,重复次数与计算量(计算时间)是对应的,重复次数应根据样本含量与计算机性能综合确定。

4 结论

本研究应用GBLUP和3种惩罚类回归方法(ridge、lasso与elastic-net)对猪13个血液性状进行了基因组选择分析。研究发现,性状遗传力对基因组选择的准确性有显著的影响,无论何种方法,基因组选择准确性最高的均是MCV(平均红细胞体积)性状,准确性最低的均是MO(单核细胞)和MO%(单核细胞百分比)性状。在预测小样本数据时,ridge回归和GBLUP法的鲁棒性要高于lasso回归和elastic-net回归。除NE%等少数性状外,在多数性状中ridge回归和GBLUP的预测准确性要优于lasso回归和elastic-net回归。本研究结果提示,没有适用于所有性状的最优方法,基因组选择方法是性状特异性的,基因组选择方法的选取,需要根据所研究性状的遗传特性进行优化和筛选。本研究为猪免疫性状基因组选择的实际应用提供了重要参考信息。

参考文献
[1] 李娅兰, 梅盈洁, 刘敬顺, 等. 基因组选择及其在猪育种中的应用[J]. 广东农业科学, 2012, 39(17): 106–109.
LI Y L, MEI Y J, LIU J S, et al. Genomic selection and application on swine breeding[J]. Guangdong Agricultural Sciences, 2012, 39(17): 106–109. DOI: 10.3969/j.issn.1004-874X.2012.17.037 (in Chinese)
[2] MEUWISSEN T H, HAYES B J, GODDARD M E. Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819–1829.
[3] DAETWYLER H D, VILLANUEVA B, BIJMA P, et al. Inbreeding in genome-wide selection[J]. J Anim Breed Genet, 2007, 124(6): 369–376. DOI: 10.1111/j.1439-0388.2007.00693.x
[4] 王晨, 秦珂, 薛明, 等. 全基因组选择在猪育种中的应用[J]. 畜牧兽医学报, 2016, 47(1): 1–9.
WANG C, QIN K, XUE M, et al. Application of genomic selection in swine breeding[J]. Acta Veterinaria et Zootechnica Sinica, 2016, 47(1): 1–9. (in Chinese)
[5] DING X, ZHANG Z, LI X, et al. Accuracy of genomic prediction for milk production traits in the Chinese Holstein population using a reference population consisting of cows[J]. J Dairy Sci, 2013, 96(8): 5315–5323. DOI: 10.3168/jds.2012-6194
[6] HAYES B J, BOWMAN P J, CHAMBERLAIN A J, et al. Invited review:genomic selection in dairy cattle:progress and challenges[J]. J Dairy Sci, 2009, 92(2): 433–443. DOI: 10.3168/jds.2008-1646
[7] VANRADEN P, TOOKER M. Methods to explain genomic estimates of breeding value[J]. J Dairy Sci, 2007, 90(S1): 374.
[8] MOSER G, TIER B, CRUMP R E, et al. A comparison of five methods to predict genomic breeding values of dairy bulls from genome-wide SNP markers[J]. Genet Sel Evol, 2009, 41: 56. DOI: 10.1186/1297-9686-41-56
[9] WINKELMAN A M, JOHNSON D L, HARRIS B L. Application of genomic evaluation to dairy cattle in New Zealand[J]. J Dairy Sci, 2015, 98(1): 659–675. DOI: 10.3168/jds.2014-8560
[10] COLOMBANI C, LEGARRA A, FRITZ S, et al. Application of Bayesian least absolute shrinkage and selection operator (LASSO) and BayesCπ methods for genomic selection in French Holstein and Montbéliarde breeds[J]. J Dairy Sci, 2013, 96(1): 575–591. DOI: 10.3168/jds.2011-5225
[11] HABIER D, TETENS J, SEEFRIED F R, et al. The impact of genetic relationship information on genomic breeding values in German Holstein cattle[J]. Genet Sel Evol, 2010, 42: 5. DOI: 10.1186/1297-9686-42-5
[12] SCHAEFFER L. Strategy for applying genome-wide selection in dairy cattle[J]. J Anim Breed Genet, 2006, 123(4): 218–223. DOI: 10.1111/jbg.2006.123.issue-4
[13] 施启顺. 畜禽抗病育种研究进展[J]. 中国畜牧杂志, 1995, 31(6): 48–51.
SHI Q S. Research progress of breeding for disease resistance in livestock and poultry[J]. Chinese Journal of Animal Science, 1995, 31(6): 48–51. (in Chinese)
[14] 彭中镇, 赵书红, 刘榜, 等. 自主育种是中国种猪企业提升种猪竞争力和走向世界的必由之路[J]. 中国猪业, 2016, 11(4): 9–18.
PENG Z Z, ZHAO S H, LIU B, et al. Independent Breeding is the only way for Chinese Boar Breeding Enterprises to enhance their competitiveness and go to the world[J]. China Swine Industry, 2016, 11(4): 9–18. (in Chinese)
[15] EL-KASSABY Y A, KLÁPŠTĚ J, GUY R D. Breeding without breeding:selection using the genomic best linear unbiased predictor method (GBLUP)[J]. New Forest, 2012, 43(5-6): 631–637. DOI: 10.1007/s11056-012-9338-4
[16] OGUTU J O, SCHULZ-STREECK T, PIEPHO H P. Genomic selection using regularized linear regression models:ridge regression, lasso, elastic net and their extensions[J]. BMC Proc, 2012, 6 S2: S10.
[17] ZOU H, HASTIE T. Regularization and variable selection via the elastic net[J]. J R Stat Soc Series B Stat Methodol, 2005, 67(5): 301–320.
[18] CHO S, KIM H, OH S, et al. Elastic-net regularization approaches for genome-wide association studies of rheumatoid arthritis[J]. BMC Proc, 2009, 3(S7): S25.
[19] WU T T, CHEN Y F, HASTIE T, et al. Genome-wide association analysis by lasso penalized logistic regression[J]. Bioinformatics, 2009, 25(6): 714–721. DOI: 10.1093/bioinformatics/btp041
[20] WIMMER V, ALBRECHT T, AUINGER H J, et al. Synbreed:a framework for the analysis of genomic prediction data using R[J]. Bioinformatics, 2012, 28(15): 2086–2087. DOI: 10.1093/bioinformatics/bts335
[21] FRIEDMAN J, HASTIE T, TIBSHIRANI R. Regularization paths for generalized linear models via coordinate descent[J]. J Stat Softw, 2010, 33(1): 1–22.
[22] ENDELMAN J B. Ridge regression and other kernels for genomic selection with R package rrBLUP[J]. Plant Genome, 2011, 4(3): 250–255. DOI: 10.3835/plantgenome2011.08.0024
[23] 张哲, 张勤, 丁向东. 畜禽基因组选择研究进展[J]. 科学通报, 2011, 56(26): 2212–2222.
ZHANG Z, ZHANG Q, DING X D. Advances in genomic selection in domestic animal[J]. Chinese Science Bulletin, 2011, 56(26): 2212–2222. (in Chinese)
[24] 王延晖, 朱波, 李俊雅. 基于显性模型的基因组选择中贝叶斯方法研究[J]. 畜牧兽医学报, 2017, 48(1): 60–67.
WANG Y H, ZHU B, LI J Y. Bayesian models including dominant effects for genomic selection[J]. Acta Veterinaria et Zootechnica Sinica, 2017, 48(1): 60–67. (in Chinese)