脑网络机器学习工具包NS_CPM

NS_CPM是本站开发的用于连接组信号进行机器学习分析的GUI工具包。NS_CPM使用一元线性模型、lasso回归或者相关向量回归(rvr)预测连续的行为变量,且搭建好了广泛使用的k-fold交叉验证框架和置换检验。NS_CPM可以输出重叠(Overlapping)的特征,用于特征泛化。NS_CPM提供简明的可视化操作,以及高自由度的脚本操作。其所有功能均支持并行运算,可以快速地在高性能服务器上开展数据分析工作,且已在MATLAB2010a及以上版本(WIN/LINUX)测试通过。

特征输入

连接组数据作为在认知神经科学领域常见的用于机器学习的特征,是本工具最初设计服务的方向。连接组有着较为深厚的研究基础和研究潜力,在将来较长的一段时间内都有较高的研究价值。功能连接组以及结构连接组数据都可以作为特征输入。作者将来也可能会将其它模态的数据加入到NS_CPM中。

模型构建

  1. CPM(Shen., et al., 2017)。作为一种基于一元线性模型的方法,有着更少的假阳性结果和更强的解释性,并受到广泛的应用。
  2. LASSO回归。LASSO正则化和连接组有着一个关键的相似性,即稀疏性。常被用于机器学习的特征提取,也可以用于模型构建。
  3. Elastic-net。脚本模式也支持弹性网络回归(elastic-net),通过调整L1和L2正则化的比例来调整特征与模型。出于简明的考虑,此模型暂时未加入到GUI中。
  4. rvr。相关向量回归算法。

模型评估

NS_CPM提供了交叉验证框架。由于留一法可能会导致模型的高估,并不被推荐用于认知神经的模型评估(Poldrack, et al., 2020)。NS_CPM目前只加入了k-fold交叉验证框架。

置换检验可以用来进一步评估模型,即通过随机置换标签后,重复模型构建,获得模型评价指标的分布。检验的p-value定义为:置换分数高于原始分类的分数的百分比。

结果输出

NS_CPM使用预测值与真值的相关系数作为模型的评估指标,通过置换检验计算p值以增强结果的可信度。同时NS_CPM可以输出overlapping特征用于特征泛化。

参考文献

Shen, X., Finn, E. S., Scheinost, D., Rosenberg, M. D., Chun, M. M., Papademetris, X., & Constable, R. T. (2017). Using connectome-based predictive modeling to predict individual behavior from brain connectivity. nature protocols12(3), 506-518.

Poldrack, R. A., Huckins, G., & Varoquaux, G. (2020). Establishment of best practices for evidence for prediction: a review. JAMA psychiatry77(5), 534-540.

脑网络机器学习工具包NS_CPM

https://neurospider.cn/post/62271/

Author

SuperSpider

Posted on

2021-11-06

Updated on

2022-05-07

Licensed under