菜鸟笔记
提升您的技术认知

Seaborn的简述

Seaborn(seaborn是python中的一个可视化库,是对matplotlib进行二次封装而成,既然是基于matplotlib,所以seaborn的很多图表接口和参数设置与其很是接近)
导入库 import seaborn as sns

1、sns.stripplot分布散点图,其中有一个jitter参数表示散点图的各散点在回归模型中小幅度的分布;

2、sns.swarmplot分簇散点图;

3、sns.barplot()直方图;

4、sns.poinplot()点图;

5、sns.boxplot()盒图;

6、sns.set() 通用设置接口。set_style() 设置风格,darkgrid,whitegrid,dark,white,ticks;

7、sns.load_dataset(“”)调用数据集

8、sns.despine(offset=100) #offset表示图形到轴线的距离

9、set_context()环境设置专用接口,设置后全局绘图环境随之改变,绘图环境有notebook,paper,talk,poster;

10、seaborn风格多变的另一大特色就是支持个性化的颜色配置。颜色配置的方法有多种,常用方法包括以下两个:
color_palette,基于RGB原理设置颜色的接口,可接收一个调色板对象作为参数,同时可以设置颜色数量;hls_palette,基于Hue(色相)、Luminance(亮度)、Saturation(饱和度)原理设置颜色的接口,除了颜色数量参数外,另外3个重要参数即是hls

11、sns.palplot()将这些色块打印出来

12、sns.palplot(sns.color_palette(“hls”,n))——显示出n个不同颜色的色块
sns.palplot(sns.color_palette(“Paired”,2n))——显示出2n个不同颜色的色块,且这些颜色两两之间是相近的
sns.palplot(sns.color_palette(“color”))——由浅入深显示出同一颜色的色块
sns.palplot(sns.color_palette(“color_r”))——由深入浅显示出同一颜色的色块
sns.palplot(sns.color_palette(“cubehelix”,n))——显示出n个颜色呈线性变化的色块

13、sns.xkcd_rgb[]设置颜色

14、 观测两个变量之间的分布关系最好用散点图

15、kind='hex’可以通过颜色深浅将数据分布疏密情况表现出来

16、单变量分布(变量分布可用于表达一组数值的分布趋势,包括集中程度、离散程度等)
distplot 直方图
kdeplot 核密度估计图
rugplot 直译为地毯,绘图方式就是将数值出现的位置原原本本的以小柱状的方式添加在图表底部

17、多变量分布
jointplot是一个双变量分布图表接口。绘图结果主要有三部分:绘图主体用于表达两个变量对应的散点图分布,在其上侧和右侧分别体现2个变量的直方图分布,如第14,15点的图
pairplot 当变量数不止2个时,pairplot是查看各变量间分布关系的首选。它将变量的任意两两组合分布绘制成一个子图,对角线用直方图、而其余子图用相应变量分别作为x、y轴绘制散点图。显然,绘制结果中的上三角和下三角部分的子图是镜像的

18、回归分析
regplot() 绘图结果为散点图+回归直线即置信区间。另外,还可通过logistic参数设置是否启用逻辑回归;
Implot 也是用于绘制回归图表,但功能相比更为强大,除了增加hue参数支持分类回归外,还可添加row和col参数(二者均为FacetGrid中的常规参数,用于添加多子图的行和列)实现更多的分类回归关系。这里以seaborn中的小费数据集进行绘制;
residplot 提供了拟合后的残差分布图,相当于先执行lmplot中的回归拟合,而后将回归值与真实值相减结果作为绘图数据。直观来看,当残差结果随机分布于y=0上下较小的区间时,说明具有较好的回归效果

19、盒图,即矩阵图
(IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离 ·N=1.5IQR如果一个值>Q3+N或<Q1-N,则为离群点)
sns.heatmap() 热度图


(vmin,vmax为设置的最大,最小值)

20、clustermap 在heatmap的基础上,clustermap进一步挖掘各行数据间的相关性,并逐一按最小合并的原则进行聚类,给出了聚类后的热力图