- 想问问女侠,在这儿PageRank是怎么用的啊?有根据使用武器人的武功牛逼程度加权吗
回复 第2楼 的 linjuemin1911:其实不涉及太多生物方向的知识,生物只是背景
如题,,求指导啊,,看了好多文献都只是说BOX-COX变换是用于线性模型,但是对于t检验不知是否适用
国家重点实验室 招收 数学建模、数据挖掘 方向 客座研究生
随着现代生物技术的迅猛发展,从基因组、转录组、蛋白质组、代谢组、表型组等多层次、多角度对生物样本进行刻画,特别是第二代高通量并行测序技术(Next Generation Sequencing)的发展极大地提升了人类获取生物信息的广度、速度,使得可获得的生物信息呈指数形式增长。“组学(omics)”数据往往是产生科学假说的基础与源泉;而具有良好的顶层设计、完整性、一致性好的数据集,是一个研究领域的核心资源。对大型“人与环境”科学实验中的“组学”数据与丰富的人体表型信息进行集成、挖掘、联合建模,将极大地释放大型“人与环境”科学实验的科学价值。
本国家重点实验室立足于生物大数据的建模、挖掘,为所在行业提供“基础数据平台”。将高通量的分子信息数据(如基因表达、DNA甲基化等)与人体医学(如免疫学功能)、认知功能指标数据进行整合,形成“数字化人体表型与分子事件数据库”,并进行数据挖掘,探索新的科学规律。本团队为生物医药、信息学交叉团队,得到国家重点型号任务、“重大新药创制”重大专项、自然科学基金“重大研究计划”、国家重点实验室基金等资助。
特别欢迎具对生物大数据挖掘、生物医学数据建模有浓厚兴趣,热衷于观察、挖掘大量数据的人才。
本实验室希望与对上述话题感兴趣的高校、科研机构建立长期、深度合作。2.要求
(1) 导师同意作客座研究生;
(2) 良好的英文读写能力;逻辑清晰;
(3) 工作认真踏实,有责任心,有团队合作精神;
(4) (统计学、信息类背景)熟悉Matlab/R/Java/数据库开发(其中之一种);
(5) (生物类背景)对生物信息学、生物统计学有浓厚兴趣,热衷于观察、挖掘大量实验数据,有一定计算机科学方面的理论、技术经验;
(6) 可稳定工作1年;
参加过数学建模比赛并获奖者优先考虑。3.待遇
提供具有竞争力的研究生补助、进度奖励等。可以以第一、或并列第一作者身份发表高水平论文。4.其它
工作地点:北京 或 深圳有兴趣者请将本人简历发送至email: jxiong AT cuhkri.org.cn
国家重点实验室 招收 数学建模、数据挖掘 方向 客座研究生
随着现代生物技术的迅猛发展,从基因组、转录组、蛋白质组、代谢组、表型组等多层次、多角度对生物样本进行刻画,特别是第二代高通量并行测序技术(Next Generation Sequencing)的发展极大地提升了人类获取生物信息的广度、速度,使得可获得的生物信息呈指数形式增长。“组学(omics)”数据往往是产生科学假说的基础与源泉;而具有良好的顶层设计、完整性、一致性好的数据集,是一个研究领域的核心资源。对大型“人与环境”科学实验中的“组学”数据与丰富的人体表型信息进行集成、挖掘、联合建模,将极大地释放大型“人与环境”科学实验的科学价值。
本国家重点实验室立足于生物大数据的建模、挖掘,为所在行业提供“基础数据平台”。将高通量的分子信息数据(如基因表达、DNA甲基化等)与人体医学(如免疫学功能)、认知功能指标数据进行整合,形成“数字化人体表型与分子事件数据库”,并进行数据挖掘,探索新的科学规律。本团队为生物医药、信息学交叉团队,得到国家重点型号任务、“重大新药创制”重大专项、自然科学基金“重大研究计划”、国家重点实验室基金等资助。
特别欢迎具对生物大数据挖掘、生物医学数据建模有浓厚兴趣,热衷于观察、挖掘大量数据的人才。
本实验室希望与对上述话题感兴趣的高校、科研机构建立长期、深度合作。2.要求
(1) 导师同意作客座研究生;
(2) 良好的英文读写能力;逻辑清晰;
(3) 工作认真踏实,有责任心,有团队合作精神;
(4) (统计学、信息类背景)熟悉Matlab/R/Java/数据库开发(其中之一种);
(5) (生物类背景)对生物信息学、生物统计学有浓厚兴趣,热衷于观察、挖掘大量实验数据,有一定计算机科学方面的理论、技术经验;
(6) 可稳定工作1年;
参加过数学建模比赛并获奖者优先考虑。3.待遇
提供具有竞争力的研究生补助、进度奖励等。可以以第一、或并列第一作者身份发表高水平论文。4.其它
工作地点:北京 或 深圳有兴趣者请将本人简历发送至email: jxiong AT cuhkri.org.cn
回复 第2楼 的 肖楠:恩恩~十分感谢啊~我看了~学到很多东西~不过我还想问问,单机多核要怎么做啊,,对机器要求高吗?[s:11]
我现在又两个50-70M的数据,分别为a(485512行,36列),b(45行,36列),我想提取A中的每一行与B中的每一行做相关性检验,提取P值以及相应统计量(代码如下),但是我现在遇到一个问题就是程序运行太慢,而且只能在8G,64位的机器上运行,换成4G,32位的机器就会报错,无法分配矢量。我试过ff包,还是很慢,因为我用的是最低效的for循环,不知道我的程序上能不能有什么改进。
</p><br /> PValue_Spearman<-matrix(NA,nrow=485512,ncol=45)<br /> Statistics_Spearman<-matrix(NA,nrow=485512,ncol=45)</p> <p>for (i in 1:485512){<br /> for (j in 1:45){<br /> Cor_Spearman<-cor.test(a[i,],b[j,],meth='spearman',exact=FALSE)<br /> Statistics_Spearman[i,j]<-round(Cor_Spearman$estimate,digits=3)<br /> PValue_Spearman11[i,j]<-round(Cor_Spearman$p.value,digits=3)<br /> }<br /> }<br />
国家重点实验室招收生物信息学、生物统计学客座研究生(生物医药或信息学背景)
特别欢迎具有生物类背景、对生物信息学、生物统计学有浓厚兴趣,热衷于观察、挖掘大量实验数据的人才。本团队具备将生物背景学生培训成为具有生物、计算交叉复合、无缝对话人才的经验。
1. 研究方向
本团队为生物医药、信息学交叉团队,得到国家重点型号任务、“重大新药创制”重大专项、自然科学基金“重大研究计划”、国家重点实验室基金等资助。
综合运用各种“组学”技术,并探索新的信息探测技术与生物信息学方法,进行以转化医学为目标的研究。涉及biomarker筛选与验证、疾病诊断预后预测模型的建立与验证、药物疗效预测、网络药理学等。团队自主产生了大型in house 数据集(如RNA-seq, small RNA-seq组成的第二代测序数据集),建立了国际上大型共享数据的集成挖掘系统。所在实验室具备各种人体试验、动物、细胞与分子生物学实验的条件。
2.要求
(1) 导师同意作客座研究生;
(2) 良好的英文读写能力;逻辑清晰;
(3) 工作认真踏实,有责任心,有团队合作精神;
(4) (统计学、信息类背景)熟悉Matlab/R/Java/数据库开发(其中之一种);
(5) (生物类背景)对生物信息学、生物统计学有浓厚兴趣,热衷于观察、挖掘大量实验数据;
(6) 可稳定工作1.5年;
3.待遇
提供具有竞争力的研究生补助、进度奖励等。可以以第一、或并列第一作者身份发表 “干”、“湿”结合的系统生物学论文。
4.其它
工作地点:深圳 或 北京有兴趣者请将本人简历发送至email: jxiong AT cuhkri.org.cn