python数据分析之 A股上市公司按地区分布与可视化 地图显示
首先传统方法是使用数据库:
地区 数目
浙江 431
江苏 401
北京 316
广东 303
上海 285
深圳 283
山东 196
福建 132
四川 120
湖南 104
安徽 103
湖北 101
河南 79
辽宁 72
河北 56
新疆 54
天津 50
陕西 49
重庆 48
吉林 41
江西 41
山西 38
黑龙江 37
广西 37
云南 33
甘肃 33
海南 31
贵州 29
内蒙 25
西藏 18
宁夏 13
青海 12
看看我们的641主席的功劳,江浙一带的上市公司数量已经超过广东了。
接下来我们使用pandas进行数据可视化:
首先读入数据:
然后直接统计:
看是不是比mysql语句简单多了?
得到一样的数据。
接下来使用图像来显示我们的数据:
什么? 一条命令就可以啦~ 实在太强大了!
从这个柱状图上,可以更加直观地看到A股上市公司的分布情况,东部长三角和珠三角的公司数目最多。而西部只有东部的零头。
接着把数据转化为百分比数据:
可以看到江浙地区占了22%的数量,体量还是很大的。
接下来,为了数据更加直观,把数据在地图上显示出来:
点击查看大图
颜色越红,表明上市公司越多。现在数据够直观了吧。
实现代码:
更多的数据分析,请关注本网站。
不定期更新哦
原创文章
转载请注明出处:
http://30daydo.com/article/388
SELECT area `地区`,count(*) as `数目` FROM `tb_basic_info` GROUP BY area order by 数目 desc;得到下面的结果: 接着我们使用pandas进行数据可视化。
地区 数目
浙江 431
江苏 401
北京 316
广东 303
上海 285
深圳 283
山东 196
福建 132
四川 120
湖南 104
安徽 103
湖北 101
河南 79
辽宁 72
河北 56
新疆 54
天津 50
陕西 49
重庆 48
吉林 41
江西 41
山西 38
黑龙江 37
广西 37
云南 33
甘肃 33
海南 31
贵州 29
内蒙 25
西藏 18
宁夏 13
青海 12
看看我们的641主席的功劳,江浙一带的上市公司数量已经超过广东了。
接下来我们使用pandas进行数据可视化:
首先读入数据:
# A股上市公司分布:engine为from sqlalchemy import create_engine 中的连接引擎。
df = pd.read_sql('tb_basic_info',con=engine)
然后直接统计:
result = df['area'].value_counts()
得到的result就是统计结果:看是不是比mysql语句简单多了?
得到一样的数据。
接下来使用图像来显示我们的数据:
什么? 一条命令就可以啦~ 实在太强大了!
从这个柱状图上,可以更加直观地看到A股上市公司的分布情况,东部长三角和珠三角的公司数目最多。而西部只有东部的零头。
接着把数据转化为百分比数据:
total = result.sum()
ration = result/total*100
可以看到江浙地区占了22%的数量,体量还是很大的。
接下来,为了数据更加直观,把数据在地图上显示出来:
点击查看大图
颜色越红,表明上市公司越多。现在数据够直观了吧。
实现代码:
# 热力图
def create_heatmap(attr,value,name,maptype):
style = Style(title_color="#fff", title_pos="center",
width=1200, height=600, background_color="#696969")
# 可视化
geo = Geo(name,**style.init_style)
geo.add("", attr, value, visual_range=[min(value), max(value)], symbol_size=8,
visual_text_color="#000",
is_visualmap=True, type='effectScatter',effect_scale=7,is_random=True,is_roam=False,is_piecewise = True,visual_split_number= 10,
)
geo.render('{}.html'.format(name))
create_heatmap(attr,value,'公司分布','china')
更多的数据分析,请关注本网站。
不定期更新哦
原创文章
转载请注明出处:
http://30daydo.com/article/388