IBM 数据科学及大数据分析师资研修班通知
Data Science with R
2017年7月26-29日 | 青海西宁
人工智能时代,什么最贵?掌握数据科学与大数据技术的人才最贵。
怎样对接产业需求,落实新工科建设?如何借助领先技术企业的教育资源以及混合式教学的工具,开出受学生欢迎的数据科学与大数据技术相关课程与专业方向,真正培养出适应新经济发展的应用型人才?
欢迎大家来参加2017年7月26-29日在青海西宁举办的IBM数据科学与大数据分析师资研讨会。作为Gartner数据科学魔力象限排名第一的技术公司,IBM在数据科学教育领域与国内外诸多大学开展了颇有成效的合作实践。此次研讨会,我们将邀请IBM资深数据科学家为我们培训数据科学基础知识、R 编程语言、数据分析、数据可视化以及机器学习的内容,全程采用上机实践和案例研究。此外,还邀请IBM教育合作专家以及兄弟院校的知名教授与我们一同分享在数据科学与大数据技术教学合作方面的宝贵经验。
参加研修班能有哪些收获?
1. 了解、掌握并带回 IBM 大数据大学丰富的教育资源
2. 体验并熟练操作 IBM 大数据大学虚拟实验室以及基于 R 的数据科学教学案例
3. 通过已经开发好的“样板课程”学习如何借助 IBM 技术微课程与“好大学在线”慕课平台快速开发适合混合式教学管理的新课程
4. 了解“教育部 - IBM 协同育人项目”以及 IBM 其他大学合作项目的合作方案
谁适合来参加这个研修班?
本研讨会的设计是针对从事数据科学及大数据分析技术领域教学工作的老师。对该领域感兴趣的大学高年级学生和研究生也欢迎加入。学员将学习 R 编程、数据分析、数据可视化、机器学习的基本概念,并通过 R 语言的实操,得到锻炼这些技能的机会。
参加前要做哪些准备?
1. 参加者须自带笔记本电脑
2. 提前完成 IBM大数据大学 www.bigdatauniversity.com.cn 以及大数据大学虚拟实验室 https://datascientistworkbench.cn 的注册
3. 提前完成好大学在线www.cnmooc.org 的注册。
重要报名信息
技术支持: IBM认知学堂(原IBM大数据大学)
会议时间: 2017年7月26日至29日
报到时间: 7月25日,14:00-21:00报到
会议地点: 青海西宁
嘉宾介绍
朝乐门
中国人民大学数据工程与知识工程教育部重点实验室、信息资源管理学院副教授,博士生导师。全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长。撰写我国第一部系统阐述数据科学理念、理论、方法、技术和工具的重要专著《数据科学》(清华大学出版社,2016)
蒋建伟
上海交通大学慕课推进办公室副主任,中国高校计算机教育MOOC联盟企业合作工作委员会主任。主持“好大学在线”慕课平台建设和运行,致力于探索基于慕课的混合式教学模式改革。
汪卫
复旦大学计算机科学技术学院副院长。目前担任中国计算机学会数据库专业委员会委员,上海市计算机学会理事,数据库专业委员会副主任。
魏建国
天津大学软件学院副院长,日本北陆先端科学技术大学院大学信息科学哲学博士,法国国家科学研究中心CNRS/Telecom博士后。近年来致力于生理语音学和语音生理图像方面的研究。ACM和CCF专业委员会委员。
苏永康
上海交通大学“好大学在线”平台运行主管,中国高校计算机教育MOOC联盟上海培训中心主任。美国密西根大学及普渡大学长期访问学者。致力于研究慕课应用过程中的教学管理机制创新及学分认定机制。
周恩昌
IBM大中华区大学合作部教育合作项目总监,负责IBM与中国合作伙伴高校在数字化教育平台、大数据分析以及商学院高管教育培训等项目上的全方位合作,在高等教育合作领域有近15年的经验。
常鹏飞
来自IBM SPSS Component Team的数据科学家,主要负责SPSS algorithms的测试工作,熟悉时间序列,线性回归,SVM和关联分析等算法,拥有深厚的数据分析功底。除此之外,积极研究Spark ML,R和Scikit-learn这三个开源机器学习算法库,并致力于不同机器学习算法库的比较。
刘默驰
IBM 中国开发中心DSM团队数据科学家。毕业于美国乔治华盛顿大学统计学系。曾在美国Anant初创公司就职,开发并维护公司基于Solr的搜索引擎产品,使用基于R的NLP技术为产品提供智能搜索。现担任IBM中国开发中心DSM团队软件工程师和数据科学家。曾为该产品设计、实现基于Spark,Hadoop,Kafka的大数据解决方案,并实现R、Python机器学习模型支持产品的智能监控和预测。
会议议程
7月25日
14:00-21:00
会议报到
讲师
7月26日
上午
世界一流大学数据科学专业特色课程及启示
朝乐门
《数据科学导论》课程建设经验分享
下午
面向新工科的产学融合与教育创新
蒋建伟
大数据第二专业课程体系-复旦大学的初步实践
汪卫
IBM大数据大学(认知学堂)与云端虚拟实验室
周恩昌
生理语音学及大数据(暂定)
魏建国
基于慕课平台的混合式教学实现
苏永康
7月27日
上午
数据科学中的R编程语言
常鹏飞
下午
用R进行数据分析
7月28日
上午
用R实现数据可视化
刘默驰
下午
用R进行机器学习、深度学习
7月29日
上午
用R进行大数据分析(Spark)
刘默驰
下午
数据科学实验项目
内容详解
第一天上午:数据科学课程建设经验分享
数据科学是什么?什么是数据科学的知识体系?如何设计《数据科学》课程?知名教授朝乐门老师将分享其针对10所世界一流大学数据科学专业及特色课程的调研分析所得出的10大启示,同时分享其在开设《数据科学导论》课程中的宝贵经验。
第一天下午:借助IBM大数据大学(认知学堂)助力开展混合式教学
当前,大多数学校还没有能够构建出符合数据科学与大数据分析实际教学需求的课程体系,课堂教学内容也与时下热门的业界技术存在着较大的差异。IBM大数据大学 (现已更名为认知学堂)及其基于云端的虚拟实验平台,能够有效地解决教师在数据科学与大数据分析教学实践过程中遇到的技术、数据、案例以及平台工具的难题,同时结合基于MOOC/SPOC平台的混合式教学管理方式,可以更好地助力教师快速升级现有的教学内容,实现与业界技术的对接,给予学生更好地学习体验。
• 涉及主题:
o 基于慕课的工程教育探索与实践
o IBM大数据大学(认知学堂)在线教育资源介绍
o 试用IBM数据科学虚拟实验室,感受流行的开源数据科学工具(Jupyter Notebooks、RStudio IDE和Apache Spark)
o 产学合作的混合式教学设计
第二天上午:数据科学中的R编程语言
R是数据科学领域常用的编程语言。学习R语言的目的是通过这个模块掌握数据清理、分析、可视化和建模的正确工具。
• 涉及主题:
o R在数据科学领域的历史和应用
o R环境和函数库
o R中的数字、变量和逻辑语句
o 数组、矩阵、列表和数据框
o 读取文件中的数据
o 循环和条件语句
o 自定义函数
第二天下午:用R进行数据分析
数据分析包括清理数据、处理数据以及从数据中获取洞察。您将学习基本统计数据以及如何在R语言中使用DataFrames,还将了解相关性和线性回归的原理、应用和限制。
• 涉及主题:
o 描述性统计
o 数据类型
o R中的数据集 – 导入CSV、TXT、Excel文件
o 清理数据
o 描述性统计(总计、计数、平均值、极值、异常值)
o 过滤和操作数据框
o 相关性
o 线性回归
第三天上午:用R实现数据可视化
数据可视化是通过数据讲故事。在这一模块, 您将了解何时使用不同的可视化,可视化有意义的原因是什么,以及您可能从未见过的可视化。在R语言中,您将探索一些更先进的库,以产生美妙的可视化效果。
• 涉及主题:
o 条形图、饼图
o 散点图
o 线形图
o 直方图、盒形图
o 地图
o 交互式可视化
第三天下午:用R进行机器学习(分类和聚类)、深度学习
我们如何能让机器自主从数据中学习?这个部分,您将对机器学习算法以及深度学习进行一个概览学习。
• 涉及主题
o 机器学习概览
o 回归分析
o 分类(决策树)
o 聚类(K均值)
o 推荐系统(协同过滤)
o R深度学习(CNN,RNN)
第四天上午:用R进行大数据分析(Spark)
您将学习如何使用Apache Spark处理大数据。Spark是一个轻量前端函数库,用于大数据的分布式处理。您将从一个大数据集中读取数据、预处理并应用预处理操作。
• 涉及主题
o Apache SparkR介绍
o 从一个大数据集中读取数据
o 数据选择、过滤以及数据聚集
第四天下午:数据科学实验项目
在讲师的指导下使用R完成一个真实问题的挑战。项目内容包括发现问题、寻找公开数据集、数据预处理、数据汇总及可视化,以及运用机器学习的方法来发现数据背后的洞察,最后在线发布发现结果并做课堂演示。
会务须知
会务费:2600元/人(含场地费、讲课费、资料费等),委托北京时代亮点科技有限公司收取费用并开具发票。
参会人员食宿统一安排,费用自理。由于假期交通紧张,飞机火车购票都需要实名制,请各位老师注意安排好会议往返交通。
统一安排住宿地点:西宁万祥精品酒店(城东经济开发区沪宁路6号)430元/晚/间
会务联系人
任老师,18017094890,8191593@qq.com
可通过扫描报名二维码直接在线报名,或者以Email形式发送回执至任老师邮箱。
报名成功以收到会务组回复的电子邮件为准,如未收到,请及时与会务联系人联系。
IBM认知学堂(原IBM大数据大学)
青海民族大学
2017.7.7
在线报名二维码