数据可视化技术包含以下几个基本概念:
①数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;
②数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;
③数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;
④数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。
数据可视化已经提出了许多方法,这些方法根据其可视化的原理不同可以划分为基于几何的技术、面向像素技术、基于图标的技术、基于层次的技术、基于图像的技术和分布式技术等等。
把数据转化成有效的可视化形式(任何种类的图表)是让数据发挥作用的。图表是可视化的中心。要达到合适的数据用合适的图表展示,我们需要掌握图表的特性,可视化图表按其特性可分为分布类、流程类、占比类、区间类、关联类、趋势类、时间类和地图类,可视化图表众多,常用的包括柱图、线图、条图、地图、雷达图、矩形树图、气泡图、饼图、环图、仪表盘等。
可视化的目的,是为了反映数据的数值、特征和模式,以更加直观、易于理解的方式,将数据背后的信息呈现给目标用户,辅助其作出正确的决策。但是通常,我们面对的数据是复杂的,数据所蕴含的信息是丰富的。如果在可视化图形中,将所有的信息不经过组织和筛选,全部机械的摆放出来,不仅会让整个页面显得特别臃肿和混乱,缺乏美感;而且模糊了重点,分散用户的注意力,降低用户单位时间获取信息的能力。
我们认识到了数据可视化的必要性,但缺乏数据可视化方面的技能,部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在展示沟通上力不从心。与此同时,对于可视化类型的选择,既不是纯粹美学,也不是完全个人化。一个不合适的方案,受众可能会觉得乏味或者费解,甚至可能造成和受众之间的信任壁垒。