CPM-鲁棒的认知神经预测方法
CPM (connectome-based predictive modeling) 是近些年流行的神经影像分析方法之一。研究者通常借助CPM方法,探究某些认知特征背后的神经连接组模式。关于CPM的具体细节在Xilin Shen于2017年在nature protocol上发表文章中有详细阐述。以下为该文章的部分总结,可以供初学者了解。
文章梳理
CPM的优势:prediction power和现有方法一样甚至更好,且对于不熟悉机器学习的研究者来说更为友好。
CPM数据适用:functional connectivity based on fMRI or DTI or EEG
公开数据库:可以用于验证模型的适用性
使用CPM的文章:两篇nature neuroscience
最简单最流行的心脑关联方法:相关和回归模型
- 容易产生过拟合,缺乏普适性
可类比CPM的方法
- HCP Netmats ……的多元预测和一元回归
- 针对rest fmri
- 使用ICA和偏相关构建连接矩阵
- 使用更复杂的方法建立心脑关联
- CPM的优势
- 简单
- 容易解释
- 支持向量回归SVR
- 基于支持向量机分类框架,赋予全脑特征不同的权重来预测行为
- 和CPM在性能上有差别
- 其它基于机器学习的方法
- 基于离散变量甚至二分变量,而不是基于连续变量
- 基于二分的需要有精确的分类,特别是针对边缘部分
- 对健康群体的辨别力差
- 基于离散变量甚至二分变量,而不是基于连续变量
预测与相关
- 预测常常作为相关的一种表述
- 严格来说,相关并不能称为预测
- 数据过拟合的问题
- 用相关为什么会过拟合?
- 缺少交叉验证导致推广性差
- 在脑影像的众多特征中进行选择性的分析可能会导致完全错误的结论(kriegeskorte2009)
- 数据过拟合的问题
CPM的功能
- 通过连接矩阵和行为指标建立模型
- 选择特征而非用全脑特征
- 对预测力显著性进行置换检验
- 结果可视化
- 交叉验证
CPM的使用要求
- 功能连接矩阵
- 连续数据,且代表连接强度
- 辨别力较大的行为指标
CPM的优势
- 线性运算
- 更快速,更简单,对特征权重更容易解释
- 在~45000个功能连接中提取最好的一些特征
- 提高预测力
- 交叉验证
- 控制基于全脑分析的假阳性结果
- 替换传统的多重比较校正
CPM的局限
- 使用简单的线性模型,对于复杂、非线性的功能链接与行为的关联的拟合不是最好的
- 模型预测出的结果的变异小于真实结果的变异
- 对行为指标两端的预测有偏差
- 预测准确率低于SVR或多变量的方法
- 近期研究表示,结合多种方法可能更好
CPM的注意事项
- 头动不应与行为指标相关
- 剔除头动过大被试
- 年龄、性别等等混淆因素应当使用偏相关排除
- 二分行为变量不适用于CPM
- 应该排除掉
CPM的过程
- 选择和行为相关显著的特征
- 合并特征值建模
- 交叉验证
- 置换检验(如果是独立样本验证,则不需要置换检验)
CPM结果可视化
- 载入节点定义文件
- 节点nift文件或者节点MNI列表txt
- 载入特征选择的二元矩阵(比如264*264) 可以用dlmwrite写入
- 需要对称矩阵,三角矩阵不可用 –>测试可用
- 根据需要绘制连接图
参考文献
Shen, X., Finn, E. S., Scheinost, D., Rosenberg, M. D., Chun, M. M., Papademetris, X., & Constable, R. T. (2017). Using connectome-based predictive modeling to predict individual behavior from brain connectivity. nature protocols, 12(3), 506-518.
CPM-鲁棒的认知神经预测方法