GEO数据库处理教程

引入R包

library("fromto")

下载GSE103668数据集-镜像版

geoget(GEO_IDs = "GSE103668")

下载GSE103668数据集-NCBI版

geoget2(GEO_IDs = "GSE103668")

R语言解压已下载的GSE103668数据集压缩包

library(tidyverse)
library(R.utils)
list.files() %>% grepl(".txt.gz$", ., fixed = FALSE) %>% which() %>% list.files()[.] %>% gunzip(., remove = FALSE, overwrite = TRUE)

输入GSE103668数据集的平台文件,采用geoann函数将探针名转换为基因名

data = geoann(GPL_ID = "GPL570",GEO_ID = "GSE103668")

采用fromtoupdate函数将老的基因名转换为最新的基因名

data_new = fromtoupdate(data)

采用geocli函数整理GEO临床数据

clinical = geocli(GEO = "GSE103668")