最近一些在闭关修炼python数据爬取、分析、可视化。导致微信公众号一直没搭理,没能及时回复大家信息,今天阳光明媚,出来冒个泡泡,发一波推送来撩动大家的心弦,引诱大家踏上python贼船。
话不多说,在现在信息大爆炸时代,有没有办法一眼扫过去,就知道一篇很长的文章是讲什么的呢?词云图,就是做这个用途, 就像下面这张图:
看到之后你是什么感觉?想不想自己做一个? 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒…… 如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。
大家先自行安装好python,并建议安装pycharm编辑器,以便写代码(这两个软件安装回头发推送,或者大家自行百度下)。做完这些工作后,大家还需在pycharm里自行安装好以下这些库:
其中, PIL(Python Image Library)是python平台图像处理标准库,jieba处理中文截词,wordcloud是将中文词频嵌套在画布中。matplotlib进行可视化,numpy我也不太清楚。 处理好这些配料后,接下来就是如何炒菜?也就是编写代码。这里将十九届四会报告进行词云分析为例。
最终跑出来的结果显示:
有可能大家觉得这种四方图不好看,没事,我们可以继续将背景图替换,例如我想换成中国地图背景,没问题,无非多几行代码,按以下操作来:
是不是特别漂亮,大家也可以拿走本文中的代码,做其他文档温习,只要将文档路径更换一下就可以,当然也可以对背景图换成自己的喜欢的样子,只要记得改路径就可以,不过背景图选取是一定要白色背景的背景图。
本文转载来自 曾冰在路上 仅供个人学习交流 版权归作者所有,如有侵权请联系删除
|