python绘制词云图

102 篇文章 10 订阅
订阅专栏
11 篇文章 0 订阅
订阅专栏

词云图是文本分析中比较常见的一种可视化手段,将出现频率相对高的词字体相对变大,让重点词,关键词一目了然

主要用到了python的两个库:wordcloudjieba,直接pip安装即可

jieba主要用于中文分词,wordcloud主要用于统计词频和绘图

这里主要记下jieba的分词功能:

# -*- coding: utf-8 -*-
import jieba
str = "我爱我的祖国,他的名字叫中国"
list1 = jieba.cut(str)
list2 = jieba.cut(str, cut_all=True)
list3 = jieba.cut_for_search(str)
print("精准模式:" + '/'.join(list1))
print("全模式:" + '/'.join(list2))
print("搜索引擎模式:" + '/'.join(list3))

这里还可以设置自定义词典,比如因为我和我的祖国一刻也不想分割,我们可以将“我的祖国”,‘他的名字’放入自定义词典

 

自定义词典的格式:一个词占一行,比如我们设置的dict_self.txt是

看下加上自定义字典的效果:

# -*- coding: utf-8 -*-
import jieba
str = "我爱我的祖国,他的名字叫中国"
#使用自定义字典
jieba.load_userdict('dict_self.txt')
list1 = jieba.cut(str)
list2 = jieba.cut(str, cut_all=True)
list3 = jieba.cut_for_search(str)
print("精准模式:" + '/'.join(list1))
print("全模式:" + '/'.join(list2))
print("搜索引擎模式:" + '/'.join(list3))

可以看到我的祖国他的名字都出现了

代码:

from wordcloud import WordCloud
import jieba
import numpy as np
import PIL.Image as Image
def chinese_jieba(text):
    wordlist_jieba=jieba.cut(text)
    space_wordlist=" ".join(wordlist_jieba)
    return space_wordlist
text=open('skill.txt',encoding="utf8").read()
text=chinese_jieba(text)
# 调用包PIL中的open方法,读取图片文件,通过numpy中的array方法生成数组
mask_pic=np.array(Image.open("China.jpg"))
wordcloud = WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",#设置字体
                      mask=mask_pic,#设置背景图片
                      background_color="white",#设置背景颜色
                      max_font_size=150,# 设置字体最大值
                      max_words=2000, # 设置最大显示的字数
                       stopwords={'Python'}, #设置停用词,停用词则不再词云图中表示
                      ).generate(text)
image=wordcloud.to_image()
wordcloud.to_file('industryField.png')
image.show()

 学习链接:

1.https://blog.csdn.net/qq_26450765/article/details/81362634

2. https://blog.csdn.net/Tang_Chuanlin/article/details/79862505

Python绘制基础词云图
hu20100913的博客
01-11 5979
python制作词云图
Python制作词云图
郭小撮
09-16 1175
在一些简单的数据分析场景中,制作词云图是一个非常基本的数据可视化操作。由于词云图的直观性,在很多业务场景中使用都很频繁,不管是做的人、用的人、看的人都不需要有太多的技术背景。制作简单、直观美观让词云图在很多业务场景中都能脱颖而出,尤其是汇报展示,词云图通常可以用最直观的视觉冲击起到事半功倍的效果。 常用包介绍 Python制作中文词云图最为常用的方法之一就是 wordcloud + jieba。 jieba jieba库是Python的第三方库,是一个中文分词库,是Python中目前最受欢迎的中文分词工具,
python词云图
03-02
这是词云图代码,可用于文本可视化,简单易懂。不错的资源。
python词云图
高空的博客
11-20 1679
python词云图
使用 Python 绘制词云图的详细教程
最新发布
小高~的博客
08-22 1097
词云图(Word Cloud)是数据可视化中常用的一种技术,通过将文字以不同的大小、颜色和方向排列,以展示文本数据中词汇的频次和重要性。对于文本分析、情感分析、关键词提取等应用,词云图都能够直观地展现信息。本文将详细介绍如何使用 Python 中的 wordcloud 库从 Excel 数据绘制词云图,帮助您快速上手词云图的生成和定制化。
Python做中文分词和绘制词云图
12-04
通过窗体自选文本文件和词云绘制图文件绘制词云,可自行设置词云的词数量和词云字体大小
Python 绘制词云图:更改或自定义背景颜色,图片轮廓,图片大小等,根据词频生成(放入自写库,一行代码快速实现复杂绘图)
12-22
词云的作用已不必多说,也有许多不同版本生成词云的方法,但有时候调整图片细节能把人给调得脚趾头不自觉的瞉起。所以为何不直接将其封装进一个函数中,将各种绘制参数都事先准备好,尽可能一了百了呢?说干就干,看...
使用Python绘制词云图
Alex_7_7的博客
01-27 6596
使用Python绘制词云图片过程如下: 在官网下载一个Python的安装包。首先,查看自己电脑是32位还是64位。针对不同的电脑选择不同的版本。 64位地址为:https://www.python.org/ftp/python/3.9.0/python-3.9.0-amd64.exe 32位地址位:https://www.python.org/ftp/python/3.9.0/python-3.9.0.exe 下载完成后,按照提示进行安装。路径选择在D盘中。路径为D:\Python python 安装完成后
python绘制词云图的心得体会,python如何制作词云图
wenangou6
01-17 474
大家好,给大家分享一下基于python的词云生成及可视化,很多人还不知道这一点。下面详细解释一下。现在让我们来看看!大家好,小编来为大家解答以下问题,python制作词云图片的三个步骤,python绘制词云图的心得体会,今天让我们一起来看看吧!**
Python制作词云图代码
03-09
本代码由Python编写,主要实现统计文本文档中的高频词汇并进行词云图展示。该案例以《三国演艺》为例,主要展示出现频率极高的人物名称,对无关词汇进行简要筛选。
科研数据可视化- 基于Python绘制词云图-词云图(代码+数据).zip
04-26
Python中常用的绘制词云图的库有`wordcloud`和`matplotlib`。`wordcloud`库主要用于创建词云,而`matplotlib`则负责图形的显示和定制。 3. **安装库**: 在Python环境中,可以通过以下命令安装这两个库: ``` ...
Python制作自己想要的词云图吧!
12-21
简单词云的做法 我们经常可以见到可视化表示的生动形象的词频图片,这便是词云,比如统计2019年的搜索热词,我们便可以把搜索量前十的词语做成词云图,搜索量越大,图中出现的词频数就越高,如此就可以生成鲜明的可视化词频图了,那么这样的图片如何通过python批量生成呢? 很幸运,python的wordcloud库为我们提供了现成的方法。 最简单的英文词云生成方法 import matplotlib.pyplot as plt import wordcloud #此段用于创建一个存储词汇的字典并导入词汇 dic={} f=open('source.txt','r') ‘for each in s:
Python实现词云图的3种方式(词频,一段文本,自定义样式)
rphyllis的博客
07-24 9416
不一样的高端操作——python实现词云图
软件测试|教你使用Python快速绘制酷炫词云图
Tester_muller的博客
02-17 517
词云图现在似乎成了各个互联网产品年终盘点的标准形式,比如我们的热搜,我们QQ音乐网易云音乐最喜欢的歌手最喜欢的歌曲等等,词云图实在是太契合互联网时代了。那么我们能不能自己也去画一个词云图出来?就用我们的Python来完成这个目标。本文主要介绍了词云图绘制词云图是一个新鲜的互联网工具,能够帮我们直观的了解互联网的热点事件等等,本文就介绍到这里,后续我们将继续讲解一些有趣的图表绘制。更多技术文章。
4.Python实战小项目—用Python轻松创建词云图
weixin_50804299的博客
04-22 5026
词云图,又称为文本云或标签云,是一种数据可视化技术。它通过将文本数据中的词汇以视觉化的形式展示出来,帮助人们快速理解文本的主题和关键信息。在词云图中,不同的词汇会以不同的大小、颜色和字体显示,这些视觉元素通常与词汇在文本中出现的频率或重要性相关联。词云图的基本原理是对文本进行分词处理,然后统计每个词汇的频率或权重。接着,根据这些频率或权重来调整词汇在图中的大小、颜色和位置等视觉属性。这样可以使得出现频率较高或较重要的词汇更加突出,而出现频率较低或较不重要的词汇则相对较小或较不明显。以山河作礼。
python词云图制作
CBCY_csdn的博客
07-08 1万+
优美词云图制作
利用python制作词云图
热门推荐
cjiaaaa的博客
08-12 7万+
词云图是一种为了文本数据的视觉表示,由词汇组成类似云的彩色图形,当需要统计文本中出现词汇的规模大小时,我们可以使用此类图形。本文将介绍如何用python代码制作词云图
python制作词云图
m0_51863774的博客
05-19 1万+
前段时间,在上课的时候,老师发布了一个在线讨论,后面,老师把所有同学的回答结果展示了出来,不同颜色和不同大小,这样就一目了然看出了同学们回答的最多的是哪些关键词,这让我对词云图产生了兴趣,于是参考了下面博主代码,自己做了测试。2.安装相关包:打开Anaconda Powershell Prompt。上面这个链接是我获取文本内容的地方,下面是我复制下来的文本内容。1.运行工具:jupyter,无版本、环境要求。3.运行代码:记得修改文本打开路径和保存路径。
写文章

热门文章

  • matlab中cell数组用法 253209
  • matlab中eval用法 121311
  • python列表中查找某个元素的索引 66502
  • 如何用pandas提取指定时间段的数据 36948
  • 如何去掉python字符串两端的引号 35950

分类专栏

  • pandas 付费 15篇
  • 数据分析 19篇
  • 机器学习 19篇
  • 因果推断 4篇
  • Python 102篇
  • 可视化 11篇
  • numpy 3篇
  • geopandas 5篇
  • 爬虫 9篇
  • 时间处理 7篇
  • 数据结构 5篇
  • Spark 5篇
  • Matlab 15篇
  • 交通 12篇
  • Sql 14篇
  • Qgis 1篇
  • 杂七杂八小tip 17篇

最新评论

  • 3张图让你吃透MDE

    悟空没有尾: 老哥 能指导一下 数据分析的 学习路线吗

  • 3张图让你吃透MDE

    CSDN-Ada助手: 不知道 算法 技能树是否可以帮到你:https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

  • matlab中eval用法

    泫溯: [code=plain] eval(str2); %读方案层的判断矩阵 [/code] 请问这个在层次分析法里是什么作用呀

  • 如何将python3 gui界面(py文件)打包成exe文件

    lincong07: 加载权重就会出现问题,怎么解决

  • 利用sklearn.svm分类后如何画出超平面

    m0_48555946: R 语言可以实现嘛?

最新文章

  • 3张图让你吃透MDE
  • 【广州】买套二手房需要多少钱?
  • 上岸国考有多难?
2024年7篇
2023年15篇
2022年3篇
2021年22篇
2020年81篇
2019年52篇
2018年26篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fff2zrx

谢谢老板

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家无锡卡通玻璃钢雕塑福州环保玻璃钢雕塑生产厂家杭州道路护栏玻璃钢花盆草地玻璃钢抽象雕塑订做玻璃钢彩绘卡通动物雕塑徐州玻璃钢仿真水果雕塑厂家春季花海商场美陈山东商场创意商业美陈策划大涌商场美陈登封玻璃钢雕塑加工厂家上海开业商场美陈市场价江门会发光的玻璃钢雕塑西安玻璃钢雕塑考拉报价商场美陈利润多少乌鲁木齐玻璃钢彩绘雕塑新年牛商场美陈装饰敦煌玻璃钢仿铜雕塑广州 商场美陈济南周边商场美陈北京主题商场美陈市场价玻璃钢咖啡杯座椅雕塑泸州大型玻璃钢雕塑沈阳玻璃钢花盆批发江宁商场周年美陈专做园林景观玻璃钢写实雕塑深圳联点玻璃钢雕塑厂电话紫金玻璃钢花盆花器里水玻璃钢人物雕塑免费咨询海棠湾玻璃钢雕塑厂家惠州玻璃钢透光雕塑现货香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化