宏基因组
产品简介:
宏基因组测序是一种利用新一代测序(NGS)技术检测样本中所有微生物信息的方法。从人类肠道到海洋、沙漠和各种极端环境,它不需要对样本中微生物进行分离培养,也不需要对特定目标区域进行扩增。宏基因组测序不仅可以分析各种样本中微生物的多样性,还可以对微生物群落功能进行深入探索。此外,还可以收集表型数据与微生物数据进行关联分析。随着测序技术的快速发展和生物信息分析方法的突飞猛进,基于新一代测序技术的宏基因组测序已成为微生物多样性和功能挖掘的主要研究策略。
应用方向:
· 医学方向:biomarker筛选、功能性研究、机制研究
· 植物方向:叶际微生物互作研究、根际微生物互作研究
项目流程:
实验流程
生物信息分析流程
生信分析:
组间差异物种的LEfSe分析
LDA值分布柱状图中展示了LDA Score大于设定值(默认设置为4)的物种,即组间具有统计学差异的Biomarker,柱状图的长度代表差异物种的影响大小(即为 LDA Score)。
差异物种的进化分支图,由内至外辐射的圆圈代表了由门至属(或种)的分类级别。在不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈直径大小与相对丰度大小呈正比。着色原则:无显著差异的物种统一着色为黄色,差异物种Biomarker跟随组进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,绿色节点表示在绿色组别中起到重要作用的微生物类群。
功能注释分析Functional annotation analysis
分别使用KEGG、eggNOG、CAZy等数据库进行功能注释分析,从各个分类层级上的丰度表出发,进行注释基因数目统计,相对丰度概况展示,丰度聚类热图展示,PCA和NMDS降维分析,基于功能丰度的Anosim组间(内)差异分析,代谢通路比较分析,组间功能差异的Metastat和LEfSe分析。
环境因子关联分析
与微生物菌群相关的环境因子较多,但这些环境因子之间经常具有多重共线性。多重共线性是指环境因子之间高度相关,会导致模型失真或难以估计准确。所以环境因子分析前需要先进行过滤,只保留对菌群影响较大的环境因子。CCA/RDA 分析是基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。
随机森林分析
随机森林属于集成类型的机器学习算法。随机森林利用自助聚集(bootstrap aggregating)重抽样方法从原始样本中有放回的抽取多个样本作为训练集,对训练集进行决策树建模,然后组合多个决策树的预测,通过投票得出最终预测结果。RF 具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不易出现过拟合。
推荐文章
武汉迈维代谢生物科技股份有限公司
科服医学热线:027-62433042
科服农学热线:027-62433072
临床检测热线:400-9616-061
科服咨询邮箱:support@metware.cn
临检咨询邮箱:medsupport@metware.cn