百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Python制作桑基图(我承认我低估了这个教程)

wptr33 2025-05-09 22:05 8 浏览

一个有趣的灵魂W


首先,什么是桑基图

桑基图(Sankey),主要还是音译的结果。


这是一幅别人文章里的图,大致的意思就是左边和右边之间的联系,最大的作用就是看着舒服,至于看的清不清楚我是真不知道。

然后,网上常见教程

网上最常用的是一个国人开发的库(pyecharts),开发者原话:

Bash
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,
得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。
当数据分析遇上数据可视化时,pyecharts 诞生了。

我承认我低估了它。主要遇见的问题后述。以下是网上常见的安装方式(附带了一些问题的解决方法)

2、准备工作

由于当时尝试时,单一方式一直保存不了,所以干脆两种方式全部安装。结果能够正常保存了。

两种方法一起准备,就是下载selenium与phantomjs。

2.1、安装snapshot-selenium & seleniumpip install seleniumpip install snapshot-selenium

2.2、安装snapshot-phantomjs & phantomjspip installsnapshot-phantomjs

Bash
下载地址:http://phantomjs.org/download.html

添加路径:

找到phantomjs文件下的bin文件夹,将其路径设为系统path路径(添加系统路径,好处就不说了,就很爽就是啦):



3、报错3.1、下载chromedriver下载完成后运行时报错

:'chromedriver_X64.exe' executable needs to be in PATH
查询相关资料后发现需要下载chromedriver,chromedriver下载地址。
需要下载对应chrome版本的chromedriver,ChromeDriver与Chrome版本

对应参照表

。或者直接在下载页面中查看notes.txt查看对应的版本。

查看对应版本

3.2、配置环境变量

将chromedriver.exe拷贝至谷歌浏览器目录(如 C:\Program Files\Google\Chrome\Application)

以及python根目录(C:\Python3.7)。

将谷歌浏览器环境变量添加到path

(C:\Users\HD003\AppData\Local\Google\Chrome\Application)。

至此,就可以解决 ‘chromedriver’ executable needs to be in PATH问题了。

你以为这就结束了吗?并没有!!!

问题来了,我的chrome浏览器的版本是:版本 83.0.4103.97(正式版本) (64 位)


上面有个chromedriver.exe的下载(一个淘宝的镜像,淘宝是万能的么?):


它并没有我这个chrome的版本,所以它会持续报错(我保证我下载的是83.0.4103.XX版本的)!

我想可能是32位和64位的问题吧(存疑)。。。

你以为到这里就结束了吗?我换了一个做桑基图的库(pysankey)

安装方式是通过pip安装:

pip install pysankey

这个库用的matplotlib画图,应该比较好上手。好了,安装好后,


试一试他们的测试代码吧:


import pandas as pd
from pysankey import sankey

pd.options.display.max_rows = 8
df = pd.read_csv(
    'pysankey/fruits.txt', sep=' ', names=['true', 'predicted']
)
colorDict = {
    'apple':'#f71b1b',
    'blueberry':'#1b7ef7',
    'banana':'#f3f71b',
    'lime':'#12e23f',
    'orange':'#f78c1b'
}
sankey(
    df['true'], df['predicted'], aspect=20, colorDict=colorDict,
    fontsize=12, figureName="fruit123"
)

emmmm图不是很好看,看样子代码有优化空间啊。。。好了,拜拜。


测试数据我放在网盘了,需要的关注公众号:一个有趣的灵魂W


回复关键词:sankey

回复关键词:sankey

回复关键词:sankey


最后,图长这样:



微信号:一个有趣的灵魂W

关注我们,了解更多

相关推荐

MySQL合集-innobackupex在线备份及恢复(全量和增量)

Xtrabackup是由percona开发的一个开源软件,它是innodb热备工具ibbackup(收费的商业软件)的一个开源替代品。Xtrabackup由个部分组成:xtrabackup和innob...

MySQL合集-单机容器化

MySQL单机容器化mkdir-p/opt/mysql/{data,etc}cpmy.cnf/opt/mysql/etc#dockersearchmysqldockerpullm...

MySQL合集-小版本升级指南

下载最新的mysqlwgethttps://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.38-linux-glibc2.12-x86_64.tar.gz...

Mysql 数据库运维方案

前言...

如果忘记了 WAMP 中本机数据库(MySQL)的密码,该怎么办?

如果忘记了WAMP中本机数据库(MySQL)的密码,可以通过以下步骤来重置:停止MySQL服务:打开WAMP,点击“停止所有服务”,或者右键点击WAMP图标,在菜单中选择“MySQL...

Linux服务器日常巡检脚本分享

Linux系统日常巡检脚本,巡检内容包含了,磁盘,...

在 SpringBoot 中设计一个订单号生成系统,原理,架构与实战

在SpringBoot中设计一个订单号生成系统,原理,架构与实战首先,我得考虑订单号的基本要求。通常订单号需要唯一性,不能重复,否则会出大问题。然后可能还要有一定的可读性,比如包含日期、时间或者业...

K8S官方java客户端之七:patch操作

欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;...

浅谈Kubernetes CRD和Operator的原理和使用方法

总结CRD的全称是CustomResourceDefinition,是Kubernetes为提高可扩展性,让开发者去自定义资源(如Deployment,StatefulSet等)的一种方法....

kubernetes实用操作:kubectl命令行工具使用全面总结

kubectl作为客户端CLI工具,可以让用户通过命令行对Kubernetes集群进行操作。本节对kubectl的子命令和用法进行详细说明。kubectl用法概述kubectl[command][...

ceph rbd块存储挂载及文件存储建立

cephrbd块存储挂载及文件存储建立一、rbd块存储挂载1创建一个OSDpool...

odps sql中常用的时间处理方法

1、获取当前时间selectgetdate();2、获取昨天(字符串格式)selectto_char(dateadd(getdate(),-1,'dd'),'yyyymmd...

每天一个 Python 库:datetime 模块全攻略,时间操作太丝滑!

在日常开发中,时间处理是绕不开的一块,比如:...

时序异常检测工具:ADTK

1adtk简介智能运维AIOps的数据基本上都是...

又一批长事务,P0故障谁来背锅?

最近几周,发生过多起因为事务问题引起的服务报错。现象为...