mxnet:结合R与GPU加速深度学习
9 天 后
赞,魔王真是颜酷啊!
xgboost 和 mxnet 包都有个地方我觉得不是特别方便,就是打印那一长串训练精度,不知道能否改成用折线图的形式展示呢,打印不仅占屏幕空间大(训练完一个模型可能需要往回猛滚鼠标),而且肉眼比较数字大小是一件很困难的事情,用个折线图很容易就能看到训练精度的走向,就像 http://playground.tensorflow.org 这里面的一样。
还有就是每次见魔王写例子我看都会重复一件事情,就是分拆样本为训练集和测试集,觉得有点枯燥。caret 里大概有现成的函数,不过我觉得做个 shiny 应用来做这些事情应该更容易也方便吧,要是 shiny 应用再结合 RStudio 插件,那就满分了,用户只需要在 RStudio 里咣击点两下,拆数据、选参数,然后就可以端杯茶在一边看折线图上的误差刷刷下降了,不然每次都是重复敲类似的代码。
xgboost 和 mxnet 包都有个地方我觉得不是特别方便,就是打印那一长串训练精度,不知道能否改成用折线图的形式展示呢,打印不仅占屏幕空间大(训练完一个模型可能需要往回猛滚鼠标),而且肉眼比较数字大小是一件很困难的事情,用个折线图很容易就能看到训练精度的走向,就像 http://playground.tensorflow.org 这里面的一样。
还有就是每次见魔王写例子我看都会重复一件事情,就是分拆样本为训练集和测试集,觉得有点枯燥。caret 里大概有现成的函数,不过我觉得做个 shiny 应用来做这些事情应该更容易也方便吧,要是 shiny 应用再结合 RStudio 插件,那就满分了,用户只需要在 RStudio 里咣击点两下,拆数据、选参数,然后就可以端杯茶在一边看折线图上的误差刷刷下降了,不然每次都是重复敲类似的代码。
[未知用户] 折线图是个好想法!
之前dmlc尝试过做一个在线图像识别的shiny应用: http://dmlc.ml/rstats/2015/12/08/image-classification-shiny-app-mxnet-r.html。 但是后来发现免费版的shiny只能单线程,服务器承受不了于是就没有做一个这样的demo出来。
之前dmlc尝试过做一个在线图像识别的shiny应用: http://dmlc.ml/rstats/2015/12/08/image-classification-shiny-app-mxnet-r.html。 但是后来发现免费版的shiny只能单线程,服务器承受不了于是就没有做一个这样的demo出来。
[未知用户] 我的意思不是一个具体的 shiny 应用案例,而是一个类似使用向导的东西,选数据、拆、选参数、训练、预测之类的。这个 shiny 应用放在包里,用户可以在本地跑就可以了,不需要部署出去。
折线图可能会有点耗时间,另一个可能的办法是用古董的打印文本方式,比如文本进度条(关键就是 \r 字符),这样显示应该会快很多,用户也可以很直观看见训练的精度变化。
折线图可能会有点耗时间,另一个可能的办法是用古董的打印文本方式,比如文本进度条(关键就是 \r 字符),这样显示应该会快很多,用户也可以很直观看见训练的精度变化。
[未知用户] 忽然觉得,如果这个shiny能放在html版的vignettes里面会挺有意思的
[未知用户] H2O有个模块叫h2o flow,就是这么做的,深受众多MBA的喜爱。
6 天 后
最近想山寨alphago的策略 用mxnet搞旅行者问题(图的最短距离遍历)
https://en.wikipedia.org/wiki/Travelling_salesman_problem#Exact_algorithms
自己生成了10000个22个城市节点的样本,然后去训练几个神经网络
1、预测遍历的起点
2、遍历的下一步
3、预测最短路径的长度
打算用这两个网络去优化路径的搜素过程,和下围棋还是蛮像的
结果参数搜索到6层神经网络,训练集效果没有变好的趋势
╮(╯▽╰)╭ 不知道该不该继续下去
继续添加训练样本成本也不小,原始算法复杂度至少2^n
不过有个比较明显的问题,就是两个节点间有链接的话,边的距离大部分10以内,对于无连接的边,用Inf 或者一个较大的数,对于网络权重的训练 好像都不是很好,目前卡在这里了╮(╯▽╰)╭
https://en.wikipedia.org/wiki/Travelling_salesman_problem#Exact_algorithms
自己生成了10000个22个城市节点的样本,然后去训练几个神经网络
1、预测遍历的起点
2、遍历的下一步
3、预测最短路径的长度
打算用这两个网络去优化路径的搜素过程,和下围棋还是蛮像的
结果参数搜索到6层神经网络,训练集效果没有变好的趋势
╮(╯▽╰)╭ 不知道该不该继续下去
继续添加训练样本成本也不小,原始算法复杂度至少2^n
不过有个比较明显的问题,就是两个节点间有链接的话,边的距离大部分10以内,对于无连接的边,用Inf 或者一个较大的数,对于网络权重的训练 好像都不是很好,目前卡在这里了╮(╯▽╰)╭
1 个月 后
[未知用户] 没有ddl就没有生产力……
1 个月 后
同一段代码运行两遍就会在使用模型的时候报“object 'mx.ctx.internal.default.value' not found”的错,重启再跑才可以。类似这两个issue:https://github.com/dmlc/mxnet/issues/870 https://github.com/dmlc/mxnet/issues/714
这个问题有解么?
这个问题有解么?
18 天 后
[未知用户] shiny单线程其实没什么,其实内核是nodejs。问题是shiny是个全栈框架,而且默认前后端用websocket链接,框架耦合性比较高,想要性能优化又奈何自己web开发水平不够。。。
上面的linux下的mxnet安装方法的链接貌似打不开啦
6 个月 后
载入需要的程辑包:mxnet
Error : 'namespace:DiagrammeR'没有出口‘combine_edges’这个对象
R version 3.3.1 windows 10
请问是什么原因呢?
Error : 'namespace:DiagrammeR'没有出口‘combine_edges’这个对象
R version 3.3.1 windows 10
请问是什么原因呢?
11 天 后
[未知用户] DiagrammeR 升级之后不支持了,得降版本
install_version("DiagrammeR", version = "0.8.1", repos = "cran.us.r-project.org")
install_version("DiagrammeR", version = "0.8.1", repos = "cran.us.r-project.org")
2 个月 后
Error in resize(croped, 224, 224) : Expecting a four-dimensional array
最后一个crop的时候会出错,怎么回事?
最后一个crop的时候会出错,怎么回事?