在拖延了半年之后,这本书终于完稿,也即将付印了。译者包括了我,邓一硕,严酷的魔王何通以及北京理工大学数学院的副教授刘旭华老师。译者均是在COS论坛上征集到的。因此,最终的译作反馈和与读者的沟通,自然也应该在COS论坛里进行。本书相对基础,比较适合对统计有一定了解,R语言入门级别的读者。
欢迎大家拍砖指教
目录如下:
目录
序 10
第一章 基础知识 13
1.1 初始步骤 13
1.1.1 一个大型计算器 14
1.1.2 赋值 15
1.1.3 向量的运算 16
1.1.4 标准过程 18
1.1.5 作图 19
1.2 R语言基础 21
1.2.1 表达式和对象 21
1.2.2 函数和参数 22
1.2.3 向量 23
1.2.4 引用和转义序列 24
1.2.5 缺失值 25
1.2.6 生成向量的函数 25
1.2.7 矩阵和数组 27
1.2.8 因子 29
1.2.9 列表 31
1.2.10 数据框(Data frames) 32
1.2.11 索引 32
1.2.12 条件选择 33
1.2.13 数据框的索引 35
1.2.14 分组数据和数据框 37
1.2.15 隐式循环 38
1.2.16 排序 40
1.3 练习 41
第二章 R语言环境 42
2.1 会话管理 42
2.1.1 工作空间窗口 42
2.1.2 文本输出 43
2.1.3 脚本 44
2.1.4 获取帮助 44
2.1.5 包 45
2.1.6 内置数据 46
2.1.7 attach 和 detach 47
2.1.8 subset, transform和 within 48
2.2 作图系统 50
2.2.1 图形布局 51
2.2.2 利用部分构造图形 52
2.2.3 par的使用 53
2.2.4 组合图形 54
2.3 R编程 55
2.3.1 流程控制 56
2.3.2 类和类函数 57
2.4 数据输入 58
2.4.1 读取文本文件 58
2.4.2 read.table 的进一步讨论 62
2.4.3 数据编辑器 63
2.4.4其他程序的接口 64
2.5 练习 65
第三章 概率和分布 66
3.1 随机抽样 66
3.2 概率计算和排列组合 67
3.3 离散分布 68
3.4 连续分布 68
3.5 R中的内置分布 69
3.5.1 密度 69
3.5.2 累积分布函数 71
3.5.3 分位数 72
3.5.4 随机数字 74
3.6 练习Exercises 75
第四章 描述性统计和图形 76
4.1 单组的汇总统计量 76
4.2 分布的图形展示 80
4.2.1 直方图 80
4.2.2 经验累积分布 82
4.2.3 Q–Q 图 82
4.2.4 箱式图 84
4.3 分组数据的汇总统计量 86
4.4 分组数据作图 89
4.4.1 直方图 89
4.4.2 并联箱式图 90
4.4.3 带状图 91
4.5 表格 94
4.5.1 生成表格 94
4.5.2 边际表格和相对频数 99
4.6 表格的图形显示 100
4.6.1 条形图 101
4.6.2 点图 103
4.6.3 饼图 104
4.7 练习 105
第五章 单样本与双样本检验 106
5.1 单样本t检验 106
5.2 Wilcoxon符号秩检验 109
5.3 两样本t检验 111
5.4 比较方差 114
5.5 两样本Wilcoxon检验 114
5.6 配对t检验 115
5.7 配对Wilcoxon检验 118
5.8 习题 118
第六章 回归与相关性 120
6.1 简单线性回归 120
6.2 残差与回归值 125
6.3 预测与置信带 128
6.4 相关性 132
6.4.1 皮尔逊相关系数 132
6.4.2 斯皮尔曼相关系数 134
6.4.3 肯德尔等级相关系数τ 135
6.5 习题 136
第七章 方差分析与Kruskal-Wallis检验 137
7.1 单因素方差分析 137
7.1.1 成对比较和多重检验 141
7.1.2 放宽对方差的假设 144
7.1.3 图像表示 145
7.1.4 Bartlett检验 146
7.2 Kruskal-Wallis检验 147
7.3 双因素方差分析 148
7.3.1 重复试验的图像 152
7.4 Friedman检验 153
7.5 回归分析中的方差分析表 153
7.6 习题 155
第八章 表格数据 156
8.1 单比例 156
8.2 两个独立的比例 158
8.3 k比例,检验趋势 160
8.4 r×c表格 163
8.5 练习 166
第九章 功效与样本容量的计算 168
9.1 功效计算原则 168
9.1.1 单样本 t 及配对样本 t 检验的功效 169
9.1.2 两样本 t 检验的功效 170
9.1.3 近似方法 170
9.1.4 比较比例的功效 171
9.2 两样本问题 172
9.3 单样本问题及配对样本检验 173
9.4 比例的比较 174
9.5 练习题 175
第十章 数据处理的高级技术 176
10.1 变量的重编码 176
10.1.1 cut函数 176
10.1.2 处理因子 178
10.1.3 日期的使用 180
更多的时间类 183
10.1.4 多变量重编码 184
10.2 条件计算 185
10.3 合并与重构数据框 186
10.3.1 数据框的追加 186
10.3.2 合并数据框 188
10.3.3 重塑数据框 191
10.4 数据的分组及分案例操作 194
10.5 时间分割 196
10.6 练习题 201
第十一章 多元回归 202
11.1 多维数据绘图 202
11.2 模型设定和模型输出 204
11.3 模型筛选 208
11.4 习题 213
第十二章 线性模型 214
12.1 多项式回归 214
12.2 过原点的回归分析 217
12.3 设计矩阵与虚拟变量 219
12.4 组间的共线性 221
12.5 交互效应 226
12.6 可重复的双因素方差分析 227
12.7 协方差分析 228
12.7.1 图形描述 230
12.7.2 比较回归线 233
12.8 模型诊断 239
12.9 习题 246
第十三章 逻辑回归 248
13.1 广义线性模型 249
13.2 表格化数据的逻辑回归 249
13.2.1 偏差表分析 255
13.2.2 与趋势检验之间的关联 257
13.3 似然剖面分析 259
13.4 让步比估计的表达 261
13.5 原始数据的逻辑回归 261
13.6 预测 264
13.7 模型检查 265
13.8 练习 271
第十四章 生存分析 272
14.1 一些重要概念 272
14.2 生存对象 272
14.3 Kaplan-Meier估计 274
14.4 对数秩检验 278
14.5 Cox比例风险模型 279
14.6 练习 282
第十五章 比率和泊松回归 283
15.1 基本思想 283
15.1.1 泊松分布 283
15.1.2 带有常数风险的生存分析 284
15.2 泊松模型的拟合 285
15.3 计算比率 290
15.4 带有常数强度的模型 294
15.5 练习 300
第十六章 非线性曲线拟合 301
16.1 基本用法 302
16.2 寻找初值 304
16.3 自启动模型(self-starting models) 310
16.4 剖面分析 312
16.5更好地控制拟合算法 314
16.6 练习 315
附录A 获取并安装R以及ISwR包 316
附录B ISwR中的数据集1 318
附录C 341
附录D 练习题答案 349