0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

怎样使用Python创建词云

ss 来源:磐创AI 作者:磐创AI 2020-11-06 17:26 次阅读

介绍从开始从事数据可视化工作的那一天起,我就爱上它了,我总是喜欢从数据中获得有用的见解。在此之前,我只了解基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过每天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。

因此,出于好奇,最近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它非常有趣。之后,我尝试使用Tableau和Power BI中的少量数据来制作词云,在成功尝试之后,我想通过使用条形图,饼图和其他图表的代码来尝试使用它。词云是什么?定义:词云是一个简单但功能强大的可视化表示对象,用于文本处理,它以更大,更粗的字母和不同的颜色显示最常用的词,单词的大小越小,重要性就越小。

词云的用途

1.社交媒体上的热门标签(Instagram,Twitter):全世界的社交媒体都在寻找最新的趋势,因此,我们可以获取人们在其帖子中使用最多的标签来探索最新的趋势。

2.媒体中的热门话题:分析新闻报道,我们可以在头条新闻中找到关键字,并提取出前n个需求较高的主题,来获得所需的结果,即前n个热门媒体主题。

3.电子商务中的搜索词:在电子商务购物网站中,网站所有者可以制作被搜索次数最多的购物商品的词云,这样,他就可以了解在特定时期内哪些商品需求量最大。让我们开始使用Python来实现词云首先,我们需要在jupyter notebook中安装所有库。在python中,我们将安装一个内置库wordcloud。在Anaconda命令提示符下,输入以下代码:pip install wordcloud

如果你的anaconda环境支持conda,请输入:conda install wordcloud

这可以直接在notebook中实现,只需在代码的开头添加“!”即可。像这样:!pip install wordcloud

但现在我想生成拥有任何主题的维基百科文本的词云,因此,我将需要一个Wikipedia库来访问Wikipedia API,可以通过在anaconda命令提示符下安装Wikipedia来完成,如下所示:pip install wikipedia

现在我们还需要其他一些库,它们是numpy,matplotlib和pandas。截至目前,我们需要的库就安装好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

机器学习维基百科页面的输出:

上图是我们通过检索Wikipedia的机器学习页面获得的输出图像,我们还可以看到它可以向下滚动,这表示将检索整个页面。在这里,我们还可以通过摘要方法得到页面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

这里我们有句子的参数,因此我们可以用它来检索特定的行数。

输出5个句子让我们一起创建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.axis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用词是没有任何含义的单词,例如‘is’, ‘are’, ‘an’, ‘I’ 等。Wordcloud带有内置停用词库,该库将自动从文本中删除停用词。同时我们也可以通过stopwords.add()函数在python中添加停用词的选择。Wordcloud方法可以设置词云的宽度和高度,我将它们都设置为500,背景色设置为粉红色。如果不添加随机状态,则每次运行代码时,词云都会看起来不同,我们可以将其设置为任何int值。从上面的代码中,我们将获得这样的词云:

通过查看上图,我们可以看到机器学习是最常用的词,还有一些其他经常使用的词是模型,任务,训练和数据,因此,我们可以得出结论,机器学习是训练数据模型的任务。我们还可以在这里通过背景颜色方法更改背景颜色,并通过colormap方法更改字体颜色,还可以在背景颜色中添加颜色的哈希码,但是mapcolor带有内置的特定颜色。让我们通过使用哈希码将背景色更改为蓝绿色,将字体颜色更改为蓝色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.axis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在这里,我指定了ocean,如果我添加了一些错误的颜色图,jupyter将抛出一个值错误,并向我显示颜色图的可用选项,如下所示:

我们还可以使用PIL库在任何图像中实现词云。尾注在本文中,我们讨论了词云,词云的定义,应用领域以及使用python实现词云。参考链接:https://www.analyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87589
  • python
    +关注

    关注

    51

    文章

    4674

    浏览量

    83460
  • 数据可视化
    +关注

    关注

    0

    文章

    444

    浏览量

    10132
收藏 人收藏

    评论

    相关推荐

    鸿蒙应用/元服务开发实战-Serverless存储没法创建处理方式

    新账户,Serverless存储没法创建 ,没法进行下一步。 解决方式 请按照这个方式修改一下就能正常创建了,浏览器中打开控制台输入 window.top.cfpConfig.cloudStorageSwitch=‘off’
    发表于 02-19 11:21

    python中text的用法

    可以使用text(字符串)进行各种操作,例如创建、访问、修改、连接、比较和搜索等。下面将详细介绍Python中使用text的各种用法。 创建和访问文本: 在Python中,我们可以使用
    的头像 发表于 11-23 15:46 1223次阅读

    python循环创建变量并赋值

    循环是Python编程中非常重要的一个概念,它可以让我们轻松地重复执行某些代码块,从而简化编程过程并提高代码的效率。在循环中,我们经常需要创建变量并赋值,这是非常常见的操作。接下来,我将详尽地解释
    的头像 发表于 11-23 14:51 631次阅读

    python如何打开gui界面

    Python中打开GUI界面,可以使用多种库或框架,如Tkinter、PyQt、wxPython等。下面将详细介绍如何使用Tkinter创建一个GUI界面。在写文章时,建议参考以下提纲,将文章分成
    的头像 发表于 11-22 14:12 448次阅读

    python怎样运行代码

    Python是一种广泛使用的编程语言,用于开发各种类型的应用程序。它具有简单易学的语法和强大的功能,可以用于编写简单的脚本、开发桌面应用、构建Web应用、进行科学计算等多种用途。在本文中,我们将详细
    的头像 发表于 11-22 10:31 637次阅读

    python怎样让列表里的数相加

    Python是一种功能强大的编程语言,可以用于处理各种各样的数学运算和数据操作。在Python中,我们可以使用简单的代码将列表中的数字相加。 首先,我们需要创建一个包含数字的列表。在Pytho
    的头像 发表于 11-22 09:53 1043次阅读

    Python中如何表达复数

    是虚部。在Python中,可以使用j或J来表示虚部。 以下是关于Python中复数的详细介绍: 创建复数 要创建一个复数,可以直接使用复数的实部和虚部来赋值给一个变量。例如: z =
    的头像 发表于 11-21 16:50 1015次阅读

    python怎么创建二维数组

    如何创建二维数组在Python中是一个常见的问题。在Python中,我们可以使用嵌套的列表(list of lists)或者使用NumPy库来创建二维数组。在本文中,我们将详细介绍这两
    的头像 发表于 11-21 15:10 1352次阅读

    Python中元类的作用

    如何生成一个对象, 类本身也是对象 。 在你使用关键词** class **的时候,Python就会执行它,并创建一个对象。 >> > class ObjectCreator ( object
    的头像 发表于 11-02 11:18 233次阅读
    <b class='flag-5'>Python</b>中元类的作用

    python有什么用 如何用python创建数据库

    python有什么用 如何用python创建数据库 Python是一种高级编程语言,可以用于开发各种类型的应用程序和工具。它的广泛应用使它在编程领域中极为受欢迎。
    的头像 发表于 08-28 16:41 777次阅读

    【Milk-V Duo 开发板免费体验】Milk-V Duo 开发板使用阿里主机的python环境搭建

    阿里查看价格,价格也不算太贵。 操作系统选择ubuntu 20.04,几分钟之后,远程主机创建完成。 登录系统后,先进行系统更新,执行以下命令: sudo apt update &
    发表于 08-18 00:49

    python创建文件对象

    2.1. 创建文件对象 **open() 函数用于创建文件对象,基本语法格式如下:** open(文件名[,打开方式]) 注意: 如果只是文件名,代表在当前目录下的文件. 文件名可以录入全路径,比如
    的头像 发表于 06-21 17:19 1069次阅读
    <b class='flag-5'>python</b><b class='flag-5'>创建</b>文件对象

    用Flet+Python写个美观的登录程序

    本教程用Flet+Python创建了现代登录表单。可以让大家一窥Python在Flet的加持下能有怎样的发挥。其中的字段阴影、动画和状态控制……都使UI和UX更具吸引力。
    的头像 发表于 05-31 15:43 3856次阅读
    用Flet+<b class='flag-5'>Python</b>写个美观的登录程序

    Python写机器人上位机

    Python写GUI的插件比较多,常用的有Tkinter、pyqt5,本将使用pyqt5写机器人的上位机。Tkinter 是 Python的标准 GUI 库,是Python推荐使用的界面创建
    发表于 05-09 11:10 0次下载
    <b class='flag-5'>Python</b>写机器人上位机

    介绍Python中文件创建与写入的基本方法

    Python 文件写入和创建Python 开发中必须掌握的技能之一。在本文中,我们将介绍 Python 中文件创建与写入的基本方法
    的头像 发表于 04-27 09:22 2884次阅读