Tatiana97

  • 2019年5月27日
  • 注册于 2018年3月30日
  • 二分类预测出来只有一个值 ,求助

    代码如下:
    library(rattle)
    audit=audit[,-c(1,11,12)]
    audit=na.omit(audit)
    index=sample(nrow(audit),nrow(audit)*0.75)
    train=audit[index,]
    test=audit[-index,]
    #构造one hot endoding数据
    library(caret)
    library(magrittr)
    dummies <- dummyVars( ~ ., data = train)
    trainn <- predict(dummies, newdata = train) %>% as.data.frame()
    dummies2 <- dummyVars( ~ ., data = test)
    testn <- predict(dummies2, newdata = test) %>% as.data.frame()
    #建模
    library(neuralnet)
    coly=51
    formula <- names(trainn[,-coly]) %>% paste(collapse = "+")
    formula <- paste("TARGET_Adjusted ", formula, sep = "") %>% as.formula()
    nn <- neuralnet(formula = formula, data = trainn,
    hidden = c(2), err.fct = "ce",
    linear.output = F)
    pred=compute(nn,testn[-coly])
    result=pred$net.result;result
    idx=apply(result,1,which.max)
    table(testn$TARGET_Adjusted,idx,dnn=c('真实值','预测值'))

  • tctcab

    你好,这是18年7月更新的tm包解释文件,的确没有使用dictionary函数了,但是我还是有如上报错。谢谢~
    library(tm)
    library(NLP)
    adress=system.file("texts","crude",package="tm")
    reuters=Corpus(DirSource(adress),readerControl=list(reader=readReut21578XML))

    reuters=tm_map(reuters,PlainTextDocument)
    corpus_clean <- tm_map(reuters, tolower)
    corpus_clean <- tm_map(reuters, removeNumbers)
    corpus_clean <- tm_map(reuters, removeWords, ("english"))
    corpus_clean <- tm_map(reuters, removePunctuation)
    corpus_clean <- tm_map(reuters, stripWhitespace)
    dtm <- DocumentTermMatrix(reuters)
    #找出发生5次及以上的条目
    findFreqTerms(dtm, 5)
    #找相关性,比如对于opec,找到相关系数在0.8 以上的条目
    findAssocs(dtm, "opec", 0.8)

    #要考察多个文档中特有词汇的出现频率,可以手工生成字典,并将它作为生成矩阵的参数
    inspect(DocumentTermMatrix(reuters, list(dictionary = c("prices", "crude", "oil"))))

  • 对TM包解释文件中的reuters数据做字典索引

    #要考察多个文档中特有词汇的出现频率,可以手工生成字典,并将它作为生成矩阵的参数
    d <- Dictionary(c("prices", "crude", "oil")))
    inspect(DocumentTermMatrix(reuters, list(dictionary = d)))

    报错:Error in [.simple_triplet_matrix(x, docs, terms) :
    Repeated indices currently not allowed.
    有人知道如何解决吗,感谢。

    • sas studio 导入文件
      infile '/Users/wang/Desktop/Garden.dat';
      报错
      ERROR: 物理文件“/Users/wang/Desktop/Garden.dat”不存在。
      路径名称没有问题,文件存在,请问怎么解决。

    • 初学SHINY包,在一个新目录shinyapp里创建ui.R,server.R两个脚本文件。最后运行

       library(shiny)
       runApp("~/shinyapp")

      的时候报错 No Shiny application exists at the path
      请问怎么解决呢?感谢!