GEO数据库处理教程
引入R包
library("fromto")
下载GSE103668数据集-镜像版
geoget(GEO_IDs = "GSE103668")
下载GSE103668数据集-NCBI版
geoget2(GEO_IDs = "GSE103668")
R语言解压已下载的GSE103668数据集压缩包
library(tidyverse) library(R.utils) list.files() %>% grepl(".txt.gz$", ., fixed = FALSE) %>% which() %>% list.files()[.] %>% gunzip(., remove = FALSE, overwrite = TRUE)
输入GSE103668数据集的平台文件,采用geoann函数将探针名转换为基因名
data = geoann(GPL_ID = "GPL570",GEO_ID = "GSE103668")
采用fromtoupdate函数将老的基因名转换为最新的基因名
data_new = fromtoupdate(data)
采用geocli函数整理GEO临床数据
clinical = geocli(GEO = "GSE103668")