首页> 关于我们 >新闻中心>技术分享>新闻详情

大数据分布可视化,就用这两款密度图!!!

2023-04-26

420900e16e6ba3a6d89a6d5dcef9a9b5.png

最近云平台又升级一款名为密度图的交互图表,交互效果实时预览,大大的节省绘图的时间。另外,还有一款图形更为丰富好看的组合密度图,也可以快速展示数据的分布特征,这款图表图形丰富、可调参数众多。让我们一起来预览下吧~~~



一、交互密度图

1.1 简介

密度图可以直观反映单变量数据的总体分布特征,能够更准确地反映数据的分布情况,因为它使用核密度估计方法来计算概率密度函数,避免了数据分组和数据单位等因素对分布信息的影响。

095ac82bd2fd16159210b5ce2d27ecb6.jpg

1.2 图表样式

交互密度图提供三种图表样式:分层、堆叠、百分比,我们可以根据绘图需求和数据类型来选择使用。

分层密度图:展示多组数据之间的比较和趋势变化。

堆叠密度图:展示将多组数据进行堆叠,形成一个整体。

百分比密度图:展示各部分占总体的百分比。


df2d5438ae8f6a514bc6d4eab763f748.jpg

1.3 参数设置

统计点数:统计点数越多,绘制出的密度曲线越接近数据真实的密度曲线。

b5b4a15a89884263f74666a30c6943b6.jpg

平滑度:平滑度会影响带宽大小,进而影响密度曲线的平滑程度和精确度。平滑度过大导致带宽过大,估计结果失真,当平滑度过小时,则会导致绘图尖锐,估计的结果不够平滑

0b6645973a04b9da7e1bc6b9c98212b4.jpg


二、组合密度图

2.1 简介

组合密度图是将多个数据的分布情况叠加在一起展示,形成一个综合类型的图表,方便快速了解数据的分布特征。

47d1757843dd957d34b635a4afbf169e.png

2.2 图表样式

组合密度图提供五种图表样式:核密度图、散点密度图、直方密度图、六边形密度图、回归密度图。

3ace5f3ec3f954dcc05a9b38d290eab1.jpg

2.3 以核密度图为例进行调整

主图轮廓数量:

对主图密度图,进行圈层的轮廓数量进行调整。

8eac64c5b50af492634659a6c8f859ff.jpg

主图带宽调整:

带宽大小:带宽调整的数值越小,绘图分布则越尖锐;反之则越平缓。

带宽矫正:可以对每个数据集的带宽进行矫正,以确保不同数据集之间的比较是准确的。

1f5000024518cee9c389af0f2c32b502.jpg

边图调整:

我们可以在边图设置里边,调整图表的颜色,并且可以选择是否填充颜色,以及控制图表颜色的透明度。

cfa2ecf1f7f865fe0c5c459aec0106a2.jpg