(李寻亚)近日国际生物信息学顶级期刊《Briefings in Bioinformatics》在线发表了威廉希尔彭小宁教授课题组研究长文(Article)“Improving feature selection performance for classification ofgene expression data usingHarris Hawks optimizer withvariable neighborhood learning”。该研究采用了一种新的智能算法-哈里斯鹰优化算法(variable neighborhood learning Harris Hawks optimizer,VNLHHO)并结合朴素贝叶斯分类器选择肿瘤特征基因,为肿瘤关键基因的识别提供了一种新的思路。
从基因表达数据中挖掘出与肿瘤相关的关键基因在癌症的诊断和治疗中起着至关重要的作用。然而,由于表达数据的高维性和样本数量的有限性,从表达数据中获得这些关键基因一直是一项具有挑战性的难题。课题组采用VNLHHO算法对8种肿瘤基因表达数据集(数据来源:http://csse.szu.edu.cn/staff/zhuzx/Datasets.html)的研究显示:VNLHHO在Colon、Central Nervous System和Lung 3种肿瘤的平均分类精度都达到了96.128%以上,对另外5种肿瘤(Leukemia, Lymphoma, Myeloid/Lymphoid Leukemia(MLL), Ovarian, andSmall Round Blue Cell Tumors (SRBCT))的分类精度达到了100%。与其它目前常用算法的对比,结果显示VNLHHO在分类精度和AUC值方面都具有明显优势。对测试样本的基因表达谱数据进行了层次聚类分析,热图显示采用VNLHHO法所筛选出的基因能够很好的区分各种不同类型的样本。通过对所筛选出的特征基因进行医学验证,进一步验证了VNLHHO算法的正确性和有效性。
威廉希尔彭小宁教授为该文的通信作者,彭小宁教授指导的生物资源与环境科学学院2019级硕士张露鹏、李金龙为该文并列第1作者。《Briefings in Bioinformatics》为中科院SCI期刊分区生物大类一区,在Mathematical & Computational Biology小类中排名第2,在Biochemical Research Methods小类中排名第3,2020年影响因子为11.622。