附源代码
#if (!requireNamespace("BiocManager", quietly = TRUE))
#install.packages("BiocManager")
#BiocManager::install("GEOquery")
#BiocManager::install("reshape2")
rm(list=ls()) #清空环境内变量
options(stringsAsFactors = F) #避免自动将字符串转换为R语言因子
suppressMessages(library(GEOquery))
library(stringr)
library(ggplot2)
library(reshape2)
library(limma)
gset = getGEO('GSE143303', destdir=".", AnnotGPL = F, getGPL = F) #设置后两个为T比较耗时,而且作用不大
exp<-exprs(gset[[1]]) #exp即为表达矩阵
pdata<-pData(gset[[1]])
#临床信息中哪一列提供了分组信息需要自己去鉴别
#采用字符串分隔函数按空格进行分隔取第三位
group_list<-str_split(pdata$characteristics_ch1.1,':',simplify = T)[,2]
#设置样本分组
group_list = factor(group_list,levels=c('healthy','Severe asthma')) #设置为因子变量
table(group_list)