新大榭论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

《新大榭》- 创大榭地方网络社区先锋品牌 新大榭始终专注于地方网络社区平台的建设 关于我们- [大记事]- 留言建议- [新手报道]

发布 .新大榭软件管家(Excel版) V5.9版 财务/仓库/生产/销售/采购/行政/人事/校园 .公告 - 客户 - 打赏 - 职场 - Excel - Python.

新大榭镜像-音乐-法律-图书-高中课堂-实验 广告是为了能更好的发展 [欢迎商家支持本站互利共赢] 广告位招租.首页黄金广告位等您来!联系 13566035181

查看: 803|回复: 2

[模块] 7450 - Python库【wordcloud】模块介绍(上)

 关闭 [复制链接]
发表于 2021-7-24 15:29:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转新大榭论坛!

您需要 登录 才可以下载或查看,没有账号?注册

x
wordcloud库基本介绍
" J  I- a, c) {1.1 wordcloud库概述7 w) Y% x9 F/ [0 W
wordcloud是优秀的词云展示第三方库6 s$ T# V$ \: d  _7 e: ?
7450-01-01.jpg
; M' F1 g6 u0 x9 y, ~2 B
  • 词云以词语为基本单位,更加直观和艺术的展示文本  [& Z: [$ O- N# Z

2 U3 s* J( U' Q0 T# g1.2 wordcloud库的安装2 y) c; D! j, O% `- C0 M) v& K
pip install wordcloud (cmd命令行)
" G" f9 v$ p. v 7450-01-02.jpg
; y) v; _5 D& `' \' x1 Y  T& u+ W# t8 u9 x
wordcloud库使用说明
0 h6 X- Y4 V' t- {* `2.1 wordcloud库基本是使用8 k  O4 W* @) y# H8 A' Q
wordcloud库把词云当作一个WordCloud对象
  K$ H2 `0 x+ d* ?$ T
  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定
    4 f' n5 C/ _" I# u

1 k! Q' ^! ~) a( F  D2.2 wordcloud库常规方法

* ~* L, G, a' K; I0 t% |) Z/ M
  1. w = wordcloud.WordCloud()
复制代码
  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件; U7 U0 [' v5 u+ G# L8 u2 u$ J' j

. `( G! S' M4 z6 m6 m. ^
方法 描述
w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
w.to_file(filename) 将词云输出为图像文件,.png或.jpg,w.to_file("outfile.png")
" D! m( g7 O/ w1 J- F( `* ^$ E* J
  • 步骤1:配置对象参数
  • 步骤2:加载词云文本
  • 步骤3:输出词云文件! t% E# [# l" ?( |: v
  1. import wordcloud6 R; e& P9 L' [! Q

  2.   M2 D  Q1 g7 P, H8 o8 x/ U/ |, L5 ~
  3. w = wordcloud.WordCloud()7 O! G8 Q2 s- [' Y3 ?+ e  W
  4. w.generate("Python and WordCloud")
    / O; d4 R& m5 [% e
  5. w.to_file("pywordcloud.png")
复制代码
7450-01-03.jpg 7450-01-04.jpg
7 b! X4 f. h3 I1 b1 S( P& z
: |( j* C; \4 I9 _# j3 R- a: @2.3 配置对象参数
  1. w = wordcloud.WordCloud(<参数>)
复制代码
参数 描述
width 指定词云对象生成图片的宽度,默认400像素
9 k+ W4 X; d. Q1 L; d2 U+ p- aw=wordcloud.WordCloud(width=600)
height 指定词云对象生成图片的高度,默认200像素
8 o1 a; Y; `: M: Q0 ~# y: t+ [* |w=wordcloud.WordCloud(height=400)
min_font_size 指定词云中字体的最小字号,默认4号! T. ^' \1 U" g: b
w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定词云中字体的最大字号,根据高度自动调节
  @. X- J" x7 x( i, i; ~w=wordcloud.WordCloud(max_font_size=20)
font_step 指定词云中字体字号的步进间隔,默认为1
! _3 n6 R4 J5 s5 cw=wordcloud.WordCloud(font_step=2)
font_path 指定字体文件的路径,默认None
- I) }/ B1 ?5 H) \w=wordcloud.WordCloud(font_path="msyh.ttc")
max_words 指定词云显示的最大单词数量,默认200
5 g& M) E- ?- o1 |. ]- hw=wordcloud.WordCloud(max_words=20)
stop_words 指定词云的排除词列表,即不显示的单词列表
7 C: g3 [2 n/ m1 @, ]8 F: ?w=wordcloud.WordCloud(stop_words="Python")
mask 指定词云形状,默认为长方形,需要引用imread()函数
, `0 g( g( j& v8 r& dfrom scipy.msc import imread3 q; C) i! q- P% W; k, g$ {, c
mk=imread("pic.png")& B4 e0 _7 [5 B% _1 _! ?
w=wordcloud.WordCloud(mask=mk)
background_color 指定词云图片的背景颜色,默认为黑色1 n/ q# j; W8 |* m) A
w=wordcloud.WordCloud(background_color="white")
  1. # mask2 \6 v7 A5 p4 q3 g) h. q* ?
  2. from scipy.misc import imread
    3 W- C! Z0 k% D' G4 Q
  3. 7 {$ D7 a0 R# p$ c: n4 K# K
  4. mk=imread("pic.png")7 f: R( t1 e5 ~" z1 ^) Q8 {
  5. w=wordcloud.WordCloud(mask=mk)
复制代码

1 ]# H5 }: A' C: S1 a2.4 wordcloud应用实例  I8 L& _& v6 }& f- j& z8 i4 H/ y( z
  1. import wordcloud
      L/ ]1 m8 m6 h8 u

  2. , z2 B% f9 O* Y! V2 G4 H" g6 @
  3. txt = "life is short, you need python"
    , s- x: G/ L1 d) B0 m
  4. w = wordcloud.WordCloud(background_color="white")2 U3 q6 j2 ^8 _6 C1 _. k2 |2 w! D  p
  5. w.generate(txt)
    - w. Y9 [1 w) _' l2 t7 a, m# m
  6. w.to_file("pywcloud.png")
复制代码
7450-01-05.jpg
8 w3 w$ I$ Y0 s# r3 R9 I2 j/ M# Z& Q( V% x, ~/ s
中文需要先分词并组成空格分隔字符串7 ?. A/ K$ K- B# K
案例:
$ j$ {0 p2 A7 d% i4 z9 _9 ~9 j
  1. import jieba
    % m% y" j$ b1 T2 @! J4 l& |1 p
  2. import wordcloud
    , t/ @& K. e7 U# H# {
  3. txt="import jieba' H$ p# X0 e& `& g" I# j+ p) d! [
  4. import wordcloud" Q, @, o5 E7 Z8 N6 C) Z
  5. txt="新大榭Python学习社区《声明》: Python学习社区 http://www.daxie.net.cn/py/  Python官网 https://www.python.org(一)这里是专为浙江高考生深入学习《信息技术》课程而倾情打造的python学习专栏!(二)建议用户提前注册新大榭官方社区账号并用电脑端登录参加Python系列课程的学习;(三)为提高本社区人气,保护题库答案不被提前泄密,帖子设置了回复主题查看答案功能;(四)如未特别说明本站发布的所有源代码均适用于 Python 3.x 语法体系(与高考语法同步);(a)图灵算法;(b)大数据分析;(c)物联网;(d)人工智能、神经网络;(e)网络爬虫;(f)数据可视化编程;【中级教程】:以大学计算机Python专业课为基础,深入学习和研究Python高级语法框架、网络爬虫、大数据可视化编程、核心算法及实例开发应用;(明年发布,大学适用)-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+//  【竞赛】:收录985、211院校计算机专业Python系列考题,全国计算机蓝桥杯大赛(Python组)试题,对学有余力的重点高中学生提升拓展练习;//  【镇中/仑中/柴中/泰河/明港/滨民/高职】:Python全程公益解答,每人每日限1题,只要上传题目,本站有问必答!(声明: 所有上传的例题将被我们收录题库公益分享)//// 目前社区管理员私下已与 镇中、仑中、柴中、泰河、明港 等宁波北仑周边高中学生家长建立了 Python习题 微信免费咨询答辩沟通渠道(目前已累计解答例题20+);+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+>> 学习流程:【高中】(必修一) >>【笔记】(知识点) >>【模块】(第三方库) >>【微课】(课外拓展) >>【题库】(测评) >> { 终极考场 } 学考 加油!高考 加油!+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+//  ↓【高中】:指由浙江教育出版社官方发行的高中同步课程《信息技术》(必修一)课内同步作业参考答案在线解答;(必修课:零基础用户学习-仅限课内同步作业解答)//  ↓【笔记】:本栏作为高中必修课的补充,深入系统地全方位学习Python系列基础课程,掌握Python基本语法、自变量、函数、流程控制、算法及经典案例的编程实例分析;//  ↓【模块】:新大榭为网友提供部分优秀的Python第三方库模块专题系列知识点的讲解,让学员快速掌握Python优秀第三方库理论知识、编程技巧及实践案例的应用;//  ↓【微课】:新大榭论坛新增网红微课图文讲解,为学生提供课外阅读电脑编程专题微课的讲解,进一步拓展学员深入理解编程思维及对多维度算法的掌握及灵活应用;//  ↓【题库】:①浙江高中段《信息技术》(必修一)同步配套教材实例 ②全国计算机二级等级考试题库 ③蓝桥杯大赛考试题库 ④宁波本地高中各校区公开习题库 ⑤其他;+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+//  ?【作品】:本站原创作品或互联网大佬优秀作品推荐分享(注:新大榭工作室因近期忙于筹备编写Python内部学习资料,当前暂未推出重磅级作品,敬请明年期待~)+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+温馨提示:新大榭于2021年1月正式上线 Python3.X 系列课程,其中 高中教材《信息技术》课堂同步作业解答 已撰写完毕,该课程基于 高中《信息技术》(必修一) 教学大纲,特别适合 新高一 或 新高二 学生在线免费学习,在学习过程中遇到疑难困惑欢迎来社区发帖提问,站长不定时免费亲临授课解答;如果你高考选课为技术,那么本站建议你继续参加提高班课程的学习,我们对部分知识考点做了更加深入的课外拓展训练,部分内容提前渗透了大学编程及算法理论课程,更适合有一定编程基础或学有余力的学生自学辅导。最后,欢迎零基础学生来本站一起在线免费学习python,这个暑假新大榭在这里等你...... “ 携手Python,新大榭与你同行!”+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+特别声明:本栏学习 Python 全程公益免费,但对部分知识点本站设置了会员权限(比如仅浏览看看,只须注册会员就可以了,但如果要下载源代码则一般需要一星以上会员),会员成长按论坛规则,只要用户登陆账号多互动,多发言,常在线,都能记录成长值,很快你就会成长为一星会员、二星会员、三星会员啦!(注:级别越高,福利越多!)+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+《 挑战书 》:不管你是中学、高中还是大学生,如果你自认为 Python 学得还不错,那就来挑战一下我们 200+ 的《题库》吧!+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+题库测评:如成功挑战 50% 题目,学考至少B级以上;如挑战 75% 则高考赋分85分以上;如挑战 90% 则高考赋分可接近满分!(仅限《信息技术》Python编程能力而言)+-----------------------------------------------------------------------------------------------------------------------------题库等级:A 容易题;B 中等题;C 稍难题;D 最难题;【 学考:挑战AB题库,冲刺C题库】│【 高考:挑战ABC题库,冲刺D题库 】 [ 题库等级正在分类中... ]"
    ; j; _* B( }, ]7 T$ t4 x/ ]. Z2 i
  6. w=wordcloud.WordCloud(width=1000,font_path="C:\\Windows\\Fonts\\simhei.ttf",height=700)  B$ b+ \, V. _7 g* E! C' ^. z
  7. w.generate(" ".join(jieba.lcut(txt)))
    , b# ~7 p3 |. Q% W3 ^4 n% u
  8. w.to_file("新大榭python社区.png")
复制代码
新大榭python社区.png 8 h  T( o/ d9 ^; A6 D
未优化原始效果图:如下所示 ↑↑↑
9 x% ]- {8 @+ F. X2 E
# x$ i# `& \1 c9 E( B 新大榭python学习社区_优化.png
- G& F  T  t$ V3 ]4 X已优化升级版效果图:如下所示 ↑↑↑+ T' S' C5 ?& V/ q+ d! g
注:过滤无效词汇统计(如“”,“” 等),新增专用关键词(如“仑中”,“蓝桥杯” 等
温馨提示:想要详细了解请访问《7361 - 新大榭微课№:016 - 【模块】中文标签云应用实例讲解(原创 - 公开课)

7450-01_未优化.zip

2.94 KB, 下载次数: 121, 下载积分: 财富 -1 点

课件源代码下载

7450-01_已优化.zip

3.16 KB, 阅读权限: 5, 下载次数: 0, 下载积分: 财富 -1 点

课件源代码下载(升级版)

新大榭Python学习社区培训、Excel业务指导、办公软件定制、网站建设;新大榭探索实验室欢迎您!http://lab.daxie.net.cn/
Q群推荐 大榭本地求职招聘QQ群,欢迎转发分享本地招聘信息资讯! 官方招聘1群(已满);官方招聘2群:315816937 *
 楼主| 发表于 2021-8-8 21:15:28 | 显示全部楼层
【拓展篇 - 生成个性化词云】(暂未优化)
0 {4 `& l8 r6 x7 `* n
词云.png
. h! v7 v- J( R5 m8 u( g: v- L  T% n, j% K% ~, q* m9 M
7450-02-01.jpg * J$ p# z/ p2 x9 N8 F( L
  1. # -*- coding: utf-8 -*-+ Z# S5 {* [) d8 ?, c, A, ?! U
  2. import pickle  
    5 L( d; T( }- W  v2 `
  3. from os import path    R: e( y- u! q( I0 y7 Z$ c$ c7 r
  4. import jieba  : g1 O  b; _7 \( C* k. J1 V
  5. import matplotlib.pyplot as plt  
    ' f3 n8 `7 A$ Z
  6. from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator  
    $ N$ G6 h3 }  ?  H  \5 s
  7. text ='' . }, R2 ^, z7 V; c; ?2 ~* T" x. O; o
  8. with open('text.txt', 'r', encoding='utf8') as fin:  * Z" }' n2 K) @5 z
  9.     for line in fin.readlines():  
    , A: [$ f! I1 w8 v
  10.         line = line.strip('\n')  
    5 i. L2 d+ t! X
  11. # sep’.join(seq)以sep作为分隔符,将seq所有的元素合并成一个新的字符串  
    3 C3 f. u  J" H4 s1 ]/ F
  12. text += ' '.join(jieba.cut(line))  # l0 z  i5 ]& a, l# f# H, I6 |
  13. backgroud_Image = plt.imread('遮罩.jpg') #此处不能使用PNG图片 / s; J# r1 J5 L; N" f( h
  14. print('加载图片成功!')3 R# K$ K/ e) Z& X

  15. % \* E. h4 J9 O. s6 W) T: ?
  16. '''设置词云样式'''  3 s/ L9 |* a" s9 Q& J+ G# z
  17. wc = WordCloud(  - M0 i! R1 e& m! j8 C6 g
  18.     background_color='white',# 设置背景颜色  
    , _; l- d! c( p% Q0 j
  19.     mask=backgroud_Image,# 设置背景图片  
    ' Q  w4 [7 D' e7 N$ A: i
  20.     font_path='C:\Windows\Fonts\STZHONGS.TTF',# 若有中文的话,这句代码必须添加,不然会出现方框,不显示汉字  
    0 l7 ]* G  h5 L; W0 G- g
  21.     max_words=1000, # 设置最大现实的字数  
    6 m# T, k  R$ Q2 L, O0 h
  22.     stopwords=STOPWORDS,# 设置停用词  
    2 b- K1 Y& @- o- N. ?" H. f$ n
  23.     max_font_size=120,# 设置字体最大值  6 y9 {, z( h6 V3 T+ f% `& d
  24.     random_state=30 # 设置有多少种随机生成状态,即有多少种配色方案  
    4 G" v% D% }& I( J: U: J. Z  d
  25. )  
    & @' V5 C3 m' ~* j# n! P+ R$ z6 W
  26. wc.generate_from_text(text)  
    : R% V8 k* Y5 f$ S' B
  27. print('开始加载文本')
    & ]' F- x4 N1 E! ]2 j# B" F" l0 }' \

  28. 0 v( Z6 q! G5 b# l* T" _# r
  29. #改变字体颜色  6 q0 K. u$ J% p$ r3 m) @+ h8 \6 t& H
  30. img_colors = ImageColorGenerator(backgroud_Image)  4 h! v8 A$ L5 @! ^" E
  31. #字体颜色为背景图片的颜色  - |! M' c$ k4 m7 |/ X9 \4 Q
  32. wc.recolor(color_func=img_colors)  
    ) v  g& H2 Q' m; {! [
  33. # 显示词云图  ; v3 z. U& T) B8 `) w  z9 @
  34. plt.imshow(wc)  2 q: V: M& U" K! H1 _6 ?' _1 ^
  35. # 是否显示x轴、y轴下标  
    " R/ i6 ?0 D/ G8 e  Q) W
  36. plt.axis('off')  - p4 w- X: J' U* N0 K0 j3 ^7 y
  37. plt.show()  3 \2 N4 U: U6 g# x2 |
  38. # 获得模块所在的路径的  - f: Z, m7 S- Y! L# ^3 }6 e7 r
  39. d = path.dirname('file')  1 y' S" a0 Q, Q5 n- i/ b9 m- N7 T
  40. # os.path.join():  将多个路径组合后返回  
    + A4 B/ |- D8 }. x, a! ^& \; ?# ]
  41. wc.to_file(path.join(d,'词云.png'))
    : q. Q  }' y3 l! X% k
  42. print('生成词云成功!')
复制代码

$ x* g+ Y7 k3 ?! L% B 7450-02-02.jpg

7450-02.zip

554.6 KB, 下载次数: 0, 下载积分: 财富 -1 点

售价: 1 个金币  [记录]  [购买]

课件源代码下载(整套)

新大榭Python学习社区培训、Excel业务指导、办公软件定制、网站建设;新大榭探索实验室欢迎您!http://lab.daxie.net.cn/
新大榭官方公益帮帮群:6603298 官方Excel学习交流群:82064486  欢迎您加入
 楼主| 发表于 2021-8-8 21:45:35 | 显示全部楼层
这是wordcloud的所有参数,下面具体介绍一下各个参数
font_path : string //字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = '黑体.ttf'3 I0 X; @: A$ {- k7 Q
width : int (default=400) //输出的画布宽度,默认为400像素* P- h5 H' `/ C: l6 T
height : int (default=200) //输出的画布高度,默认为200像素+ E: l8 ]% \9 V! d4 J: r
prefer_horizontal : float (default=0.90) //词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
; z# V1 m4 l8 B' `6 }2 zmask : nd-array or None (default=None) //如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。
0 z# P- B$ z" Z, q1 b- A4 S除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread('读取一张图片.png'),
* O% \2 w9 v: Q2 U- Z背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。/ _+ N4 e" u$ j8 ?
scale : float (default=1) //按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍。  H% F  }0 T& ^
min_font_size : int (default=4) //显示的最小的字体大小
/ }8 l" k8 Q7 r5 p7 afont_step : int (default=1) //字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差。
0 |0 v5 u0 y8 u: Kmax_words : number (default=200) //要显示的词的最大个数
; R, Q& V% W" D: t2 _7 c- t% Jstopwords : set of strings or None //设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS4 C  r9 B' h& z
background_color : color value (default=”black”) //背景颜色,如background_color='white',背景颜色为白色。* I$ ^7 E2 o4 o& m2 ]0 _
max_font_size : int or None (default=None) //显示的最大的字体大小$ |/ Z& y/ N, g6 ]( v3 X
mode : string (default=”RGB”) //当参数为“RGBA”并且background_color不为空时,背景为透明。# {; X4 F* [$ W9 G0 X" F0 W& l# d1 w
relative_scaling : float (default=.5) //词频和字体大小的关联性3 {. f* M9 n% K# @7 H8 ^
color_func : callable, default=None //生成新颜色的函数,如果为空,则使用 self.color_func
! p7 R2 a* }. R, s1 |3 Fregexp : string or None (optional) //使用正则表达式分隔输入的文本
' l( v2 g6 r, F. d2 A; R! |; acollocations : bool, default=True //是否包括两个词的搭配, B, u: H2 m/ V3 c* z) _3 n
colormap : string or matplotlib colormap, default=”viridis” //给每个单词随机分配颜色,若指定color_func,则忽略该方法。% J" Q4 U+ d+ h: }% q' y
fit_words(frequencies) //根据词频生成词云【frequencies,为字典类型】1 T* f/ `* k8 @8 y! P0 T  |7 c/ ]5 g# X
generate(text) //根据文本生成词云# L$ c( L2 B" M6 D
generate_from_frequencies(frequencies[, ...]) //根据词频生成词云8 U$ {" [4 b3 V( Q; `% u' p
generate_from_text(text) //根据文本生成词云
% B1 u& S" k$ X" C* _process_text(text) //将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
( l, L' A: q9 T; e3 f1 E; Vrecolor([random_state, color_func, colormap]) //对现有输出重新着色。重新上色会比重新生成整个词云快很多。
7 d/ |& ~2 O# @$ }) kto_array() //转化为 numpy array' N, \5 R! [1 N, h
to_file(filename) //输出到文件
/ C. s7 n7 i8 v5 J) f; O" y7 [& b7 x  i5 W! v  j
简要讲下几个会影响图像清晰问题的WordCloud的参数
mask:遮罩图,字的大小布局和颜色都会依据遮罩图生成。其实理论上这对字大小和清晰程度的影响不大,! u  V8 {! w* o: {% y# l
但是遮罩图色和背景色background_color如果易混淆,则可能是一个导致看起来不清晰的因素;
4 ^+ n4 D1 d0 K+ Q" l另外遮罩图自身各个颜色之间的对比不强烈,也可能使图看起来层次感不够。
  l+ R8 O+ }8 |9 m3 W7 D比如,一些图明度比较高,再加上背景白色,有可能导致字色太浅(背景色background_color又是白色)于是看起来不够“清晰”。
( [4 A* b8 l7 v, J: \background_color:背景色,默认黑。
  m7 ]4 T6 p3 ?3 s$ `3 c4 r这个本来其实也不怎么影响清晰度,但是,就像之前在mask中提到的,如果遮罩图像颜色过浅、背景设置白色,
7 v0 k# Z  j3 p* }3 S% p1 {可能导致字看起来“不清晰”。而实际上,我对一个浅色遮罩图分别用白、黑两种背景色后发现,' d. H. S- ?/ W" i" F( h8 Z
黑色背景的强烈对比之下会有若干很浅也很小的词浮现出来,而之前因背景色、字色过于相近而几乎无法用肉眼看出这些词。  T9 W5 j7 A! B; T' ~( |. M5 n! \) ~
mode:默认“RGB”。根据说明文档,如果想设置透明底色的云词图,那么可以设置background_color=None, mode="RGBA"/ V( C6 a0 l& a! M
但是!!!实际中我尝试设置透明背景色并没有成功过!
  Q3 f5 D9 N7 n. d  {& C2 E当我选取的遮罩图是白色底时,如果background_color设置为"white"或"black"时,生成的云词确实是对应的“白色”“黑色”;
& c  M* I; {- K2 H" `; Q但是按照上述参数设置透明色时,结果出来依然是白色。
- Z- ~7 ?+ K% H; y% f% @, n2 K当我选取的遮罩图是透明底时,那么不管我background_color设置为"white"或"black",还是None加上mode="RGBA",; D! l: c6 _. Z0 C5 \9 ]
结果都是把背景部分当做黑色图块,自动匹配黑色的字!——也就是并没有实现透明底的云词。. c  z5 k3 [& e
谁如果实现了透明底色的方案,欢迎给我留言。目前这个疑惑我打算先不研究了,放到以后再看。: G4 K, D: K6 m$ Y( l, ?+ Q
max_font_size:最大字号。源文件中也有讲到,图的生成会依据最大字号等因素去自动判断词的布局。
( ?8 K+ {3 p$ k2 A经测试,哪怕同一个图像,只要图本身尺寸不一样(比如我把一个300×300的图拉大到600×600再去当遮罩),那么同样的字号也是会有不同的效果。( j+ E. W. ~7 C" [' j7 J
原理想想也很自然,字号决定了字的尺寸,而图的尺寸变了以后,最大字相对于图的尺寸比例自然就变了。# F* A0 i6 @" @  j& a5 J9 h7 |
所以,需要根据期望显示的效果,去调整最大字号参数值。. Y; h: l" x; z% G  T/ k

: r( B% @  r% @1 [min_font_size:最小字号。不设置的情况下,默认是4。# M. r. y5 F8 k$ |
尝试了设置比4大的字号,例如8、10,结果就是原本小于设定值且大于4号的词都直接不显示了,其它内容和未设置该值时都一样。4 P3 c; `# [& q# \# G
2 c) _% I" m( h& Y! ~
relative_scaling:表示词频和云词图中字大小的关系参数,默认0.5。4 {* u  Y2 _/ j" }2 G6 o
为0时,表示只考虑词排序,而不考虑词频数;为1时,表示两倍词频的词也会用两倍字号显示。, Q+ Y: z, U0 {

' ?6 n  j7 l  L# D: g% Wscale:根据说明文档,当云词图很大的,加大该值会比使用更大的图更快,但值越高也会越慢(计算更复杂)。9 F0 V8 V! I- N
默认值是1。实际测试中,更大的值,确实输出图像看起来更精细(较小较浅的词会颜色更重,也感觉清楚,大的词差异不明显)。8 O8 T9 z3 G9 v4 W1 O
不过,可能由于我选的图不大、词也没有很多,所以差距并没有很大,缩小排列一下就基本上辨别不出多少差别了。5 o% X& E4 e. F, |8 E2 a

. x$ c! w9 c* A3 J) b7 a9 O* E! M7 B! z0 f- C. Y
新大榭Python学习社区培训、Excel业务指导、办公软件定制、网站建设;新大榭探索实验室欢迎您!http://lab.daxie.net.cn/
北仑单身女神专属群:181567400 北仑单身男神专属群:140788506  平台大数据筛选,勇敢为爱宣告,拒绝骚扰!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

新大榭七周年,感谢由您!

文字版|小黑屋|新大榭 ( 浙ICP备16018253号-1 )|点击这里给站长发消息|

GMT+8, 2025-5-15 00:52 , Processed in 0.088592 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表