这几天已经在看《Data Mining with R -- Learning with Case Studies 》了,作了一些笔记:
### 疑问
单引号 或 双引号? 有啥区别?
> gl(2, 5, labels = c("female", "male") )
> gl(2, 5, labels = c('female', 'male') )
Preface - 序言
------------
本书特色:通过实践案例来学习用R进行数据挖掘。
怎么处理大量数据? R语言 + MySQL数据库。
书中说到R packages可以包含datasets ?不太理解。
Chapter 1 Introduction
----------------------
R语言怎么跟MySQL数据库打交道? RMySQL !
1.1 How to Read This Book?
--------------------------
Learning by doing it! 通过实践来学习!
书上所有代码和数据都可以下载,真棒!
http://www.liaad.up.pt/~ltorgo/DataMiningWithR/
1.2 A Short Introduction to R
-----------------------------
R是一种函数式语言。 嗯,我记得Python是脚本语言。函数式语言的特别之处在哪里?
### 1.2.1 Starting with R
CRAN: Comprehensive R Archive Network. 直译过来是:深邃的R归档网络。
CRAN是啥东东?我现在只知道可以从CRAN下载R包。
> q() # 退出
怎么安装R包:
> install.packages('RMySQL') #安装包
> installed.packages() #已经安装的包
> library() #已经安装的包
> old.packages()
> update.packages()
怎样获得帮助:
> help(plot)
> ?(plot)
> help.start()
> RSiteResearch('neural network')
** R搜索网站: http://www.rseek.org/ 好像国内打不开**
### 1.2.2 R Objects
R语言的核心概念:objects 和 functions。 对象和函数。
对象可以看作带有名称的存储空间。变量、数据、函数等等,都是对象。
函数是对象的特殊类别。
赋值操作符: <-
> x <- 945
> i <- ( z*2 + 45)/2
怎样查看内存空间:
> ls()
> rm(x,y) # 不留痕迹
### 1.2.3 Vectors 矢量
所有的对象都有具备模式(mode)和长度(length),矢量也不例外。
Vector 矢量
> v <- c( 1, 3, 5 )
> length(v)
> mode(v)
> v <- c(4, 7, 23.5, "rrt" ) # 注意模式必须相同
> u <- c(4, 6, NA,2) # NA 空值
> k <- c(T, F, NA, TRUE) # 逻辑判断
> v[2] <- "hello" # 取元素
> x <- vector() # 空矢量
> v <- c(v[5], v[7]) # 矢量重新赋值