上海证券交易所在这个界面列出了其上市公司的名单
上交所上市公司代码列表
其网页上的数据结构是这样的:
证券代码 证券简称
600000 浦发银行
600004 白云机场
600005 武钢股份
600006 东风汽车
600007 中国国贸
600008 首创股份
600009 上海机场
600010 包钢股份
600011 华能国际
600012 皖通高速
600015 华夏银行
600016 民生银行
600017 日照港
600018 上港集团
600019 宝钢股份
600020 中原高速
600021 上海电力
600022 山东钢铁
600023 浙能电力
600026 中海发展
600027 华电国际
600028 中国石化
600029 南方航空
600030 中信证券
600031 三一重工
600033 福建高速
600035 楚天高速
600036 招商银行
600037 歌华有线
600038 中直股份
600039 四川路桥
600048 保利地产
600050 中国联通
600051 宁波联合
600052 浙江广厦
600053 中江地产
600054 黄山旅游
600055 华润万东
600056 中国医药
600057 象屿股份
600058 五矿发展
600059 古越龙山
600060 海信电器
600061 国投安信
600062 华润双鹤
600063 皖维高新
600064 南京高科
600066 宇通客车
600067 冠城大通
600068 葛洲坝
但是它所有的数据分散在22个页面上,请问如何用R读取这22个页面上的列表数据,然后存储在一个数据集中?
---
顺便也问下怎么提取深交所的数据吧,因为发现这两个网站的结构似乎不一样。
深交所上市公司代码列表
深交所的数据在177个页面上。
上交所上市公司代码列表
其网页上的数据结构是这样的:
证券代码 证券简称
600000 浦发银行
600004 白云机场
600005 武钢股份
600006 东风汽车
600007 中国国贸
600008 首创股份
600009 上海机场
600010 包钢股份
600011 华能国际
600012 皖通高速
600015 华夏银行
600016 民生银行
600017 日照港
600018 上港集团
600019 宝钢股份
600020 中原高速
600021 上海电力
600022 山东钢铁
600023 浙能电力
600026 中海发展
600027 华电国际
600028 中国石化
600029 南方航空
600030 中信证券
600031 三一重工
600033 福建高速
600035 楚天高速
600036 招商银行
600037 歌华有线
600038 中直股份
600039 四川路桥
600048 保利地产
600050 中国联通
600051 宁波联合
600052 浙江广厦
600053 中江地产
600054 黄山旅游
600055 华润万东
600056 中国医药
600057 象屿股份
600058 五矿发展
600059 古越龙山
600060 海信电器
600061 国投安信
600062 华润双鹤
600063 皖维高新
600064 南京高科
600066 宇通客车
600067 冠城大通
600068 葛洲坝
但是它所有的数据分散在22个页面上,请问如何用R读取这22个页面上的列表数据,然后存储在一个数据集中?
---
顺便也问下怎么提取深交所的数据吧,因为发现这两个网站的结构似乎不一样。
深交所上市公司代码列表
深交所的数据在177个页面上。