zt2730
我想些关于数据挖掘的决策树方面的论文!不知道怎么用SAS去处理!请前辈们给予指导!
yihui
一定要用SAS?
zt2730
我见过用R语言去处理的!每种软件都不是太懂!我是写的本科论文!算法还没确定好!想用ID3或者是C4.5!不知道后期怎么用软件处理数据!我是学卫生统计的,刚考上研究生!现在是本科实习阶段,想写“基于决策树的某种病的诊断”论文!还没有入门,很多东西都不会!老师让我自己去选算法和软件,我就学过一点sas,所以想用sas!但是网上关于sas的em模块我有找不到相关的详细介绍.
请谢老师给予指导!!!!
yihui
R中rpart是一个比较简单的包。
zt2730
谢谢您!你本科是学统计的吧 (是不是也是03级本科的?)!应该称前辈了(虽然你年龄还没我大几个月呢)!希望以后多跟你学习学习!我算刚开始接触统计(也就一个月的时间),刚开始挺迷茫,现在好点了!
zt2730
能不能给上传一个介绍rpart包的资料或者课件!
yihui
推荐一篇很好的介绍性材料:An introduction to recursive partitioning using the rpart routine
自己去google吧,有pdf
zt2730
thanks
zt2730
我用sas里em的帮助把数据输入一步一步操作了!但是结果明显不对!
我的数据是140例包括胃癌和非胃癌患者!有五个生化指标:水试验,兰色试验,血清铜兰蛋含量,吲哚乙酸,和中性硫化物测定。建数据集我用六个属性变量:在五个生化指标基础上加了一个x6 (是否胃癌0/1) 。我感觉在设置目标变量时出了问题!data partition 也出了问题.不是很理解!树如下结果只有一个分类属性x6!
本人不知道哪儿出了错误?疑惑是有的:
1.数据集建立是应该有几个变量?
2.目标变量设置中加上一个tummybin 是什么意思?
请前辈指点!!!!!!!
zt2730
我按照帮助里面去建树 ,为何结果无法运行?我的数据是2000例,变量18个!我感觉是不是在设置变量时出了毛病!在日志里也看不出是哪儿出了毛病 !希望有用过sas/em的前辈给与指导!我论文马上就要交了 !可是结果老出不来!真急人啊 !还有就是我先前用的140个样本量的数据 就能运行成功,变量是5个!这是为何?我用的sas版本是9.1。是不是因为版本的问题 才会出现问题啊?
zt2730
我的实验结果终于出来了!太高兴了!原来是数据格式的问题!我把数据从SAS里导出到TXT文本文件里 然后再导到SAS里就能运行成功里!这是一个极易忽略的问题!其实很简单!我以前一直不知道错在了哪里!来回试就是不行!关键还是没找到根节所在!!!!18个变量我是一个一个的试的!原本的数据只有5个能够实现运行!18个变量中有WEIGHT(体重) 和 HEIGHT(身高),前者在时能运行,但是后者在时就不能运行!后来我就把2000多例的前20例拿出来去建立决策树!但还是不成功!我最后就把这20例数据输入了一遍!竟然能够运行了!于是我就开始怀疑是其中的数据格式出现里问题!按照我的想法处理了原数据,最后终于成功了!
niuwussc
不知所云~~
eagle_7621
工具只是工具,需要了解模型的工作原理和你分析的目的
zxcv_bnm
工具只是工具,需要了解模型的工作原理和你分析的目的
这句话同感
zt2730
谢谢各位关心,我论文已经完成了!我的论文题目是:基于信息熵的决策树在临床药物疗效(医学应用)预测中的应用。我的研究背景是在现在数据挖掘的盛行情况下,而数据挖掘的相关模型在医学中应用很少,我的论文是探索决策树模型以及它在医学中的具体应用。数据来源是一个降脂药的四期临床试验,有17个影响其疗效的因素。我的研究目的是建立决策树模型对该药物疗效进行分类预测!
我选择SAS/EM模块作为建树实现软件。结果基本理想。分类一致性的KAPPA=0.456!一致性强度为中等!
我所建立的模型能运用于临床上,如果一个患者用该药物我可以根据他的基本信息,依据决策树的分类规则来预测该患者用药的疗效!树模型筛选了11个对该药物疗效又影响的因素!其中有:身高,体重,年龄,家族史,运动情况,高血脂症,吸烟,高血压,病情等!!
lishimin
前辈您好,我正在学习关于数据挖掘方面的内容,我想用SAS EM处理,但是我装的SAS是盗版的,没有EM模块,您能给我传一份吗,谢谢。
以后有不会的问题还要向您多多请教。谢谢:)
我的邮箱是sunmingling@eyou.com