转录组-影像空间关联分析
背景知识
基因探针(probe):是一段带有检测标记,且顺序已知的,与目的基因互补的核酸序列(DNA或RNA,单链)。
转录组测序:对细胞内所有转录产物(各种RNA)的集合进行测序(主要技术:RNA-Seq)。不同组织样本的转录产物不同,工程量浩大。
Allen Brain:一个公开数据库,其中包含了人类基因组在人脑中的表达信息。
目的
用 transcriptome-neuroimaging spatial correlations (TNSC) analyses,的方法,识别与皮层某些区域的FC关联的基因。
方法
- 定义ROI(regions)
- 计算FC
- genes * subjects * regions matrix (与常见的有一点区别)
- 计算的是sub-regions和tissues的相关
- 这么做的原因: 基因数据只有一组,而非每个人都有
- genes * subjects * regions matrix (与常见的有一点区别)
- 1280个区域的5013个标准化基因表达数据
- 用TNSC找到有关的基因
数据长什么样?
易混点:此处的功能连接与传统分析不同,非ROI-ROI的连接。
- 基因转录组矩阵是什么样的?
- tissues * genes 的矩阵,值表示某个基因在某份组织中的表达水平
- FC矩阵
- ( tissues * subjects ) * ROIs 的矩阵
- 相关矩阵(结果)长什么样?
- genes * subjects * regions
- 单独看每个sub-region,有tissues* subjects的矩阵
- 每个被试都有1280个FC值 (向量:tissues * 1)
- 每一个基因都含1280份组织的表达信息 (矩阵:tissues * genes )
- 两者相关,每个被试得到genes个相关值 (向量:genes * 1)
- 重复以上过程,得到所有被试的结果
- 每个区域重复以上过程,得到所有区域的结果
- 单独看每个sub-region,有tissues* subjects的矩阵
- genes * subjects * regions
Brain gene expression data processing
Arnatkeviciute et al., 2019
工具:Re-Annotator转录组预处理
- 更新基因注解(Re-Annotator)
- intensity-based filtering排除probes
- 通过overlap RNA-seq和microarray来排除genes
- 在余下基因中,排除相关较小的基因
- within-sample cross-gene and within-gene cross-sample normalization
- DS:consistent regional variation across donor brains
- 选取高一致性(DS score over 50% rank)的基因进行分析
- 结果: a sample × gene matrix of 1280 × 5013 (5013 genes for 1280 tissue samples)
构建FC
- 在AHBA的tissue sample的中心画球形来构建tissue based ROI (tsROI)
- 计算sub-region和tsROI的相关作为FC vector
- 每个区域都可以得到tissues * subjects的FC矩阵, N of samples = 1280
- 结果:genes * subjects * regions的相关矩阵
识别关联基因
- 单sub-region的结果
- genes * subjects的相关矩阵做Bonferroni矫正(p<0.05/5013), 被试间取90%的阈限
- 背景噪声检测:对以上结果做permutation检验
- spatial autocorrelation correction :BrainSMASH
Gene enrichment analysis
- functional annotate: ToppGene portal
- molecular functions
- biological processes
- cellular components
- biological pathways and related diseases
- conduct tissue, cell type, and temporal specific expression analyses: online tools
- tissue-specific expression (TSEA) (http://genetics.wustl.edu/jdlab/tsea/))
- cell type-specific expression (CSEA) tools (http://genetics.wustl.edu/jdlab/csea-tool-2/)
- assess the significance of the above-mentioned enrichment analyse
behavioral relevance of genes related to rsFC
Protein-protein interaction analysis
转录组-影像空间关联分析