数据库代码公开:单肿瘤中两个基因的相关性计算

作者:半步博导 时间:2024年6月29日 21:04 阅读量:237


#以MKI67与CENPF为例
gene1 = "MKI67" 
gene2 = "CENPF"
#以LUAD为例
CancerName = "LUAD"
#读取gene1的表达的肿瘤数据,不包含正常样本
data1 = read.table(paste0("expTime.",gene1,".txt"), header=T, sep="\t", check.names=F,row.names = 1)
#读取gene2的表达数据,不包含正常样本
data2 = read.table(paste0("expTime.",gene2,".txt"), header=T, sep="\t", check.names=F,row.names = 1)
#两个数据获得共同的肿瘤样本
samesample = intersect(rownames(data1),rownames(data2))
#将两个数据合并
data = cbind(data1[samesample,c(gene1,"CancerType"),drop=F],
           data2[samesample,gene2,drop=F])
data = as.data.frame(data)
#将提取LUAD数据
data = data[data$CancerType == CancerName,]
# 用cor函数计算的相关系数
r.cor <- cor(data[,gene1], 
             data[,gene2],method = "pearson")
r.cor
# 用cor.test函数计算的相关p值
p.cor <- cor.test(data[,gene1], 
                  data[,gene2],method = "pearson")$p.value
p.cor