品质协会(www.PinZhi.org)

 找回密码
 加入协会

QQ登录

只需一步,快速开始

查看: 24308|回复: 58

质量数据分析的四个基本原理

  [复制链接]

36

主题

24

回帖

15

精华

VIP会员

Rank: 6Rank: 6

积分
7745
品质币
7385
职位
1
发表于 2018-8-2 12:20:52 | 显示全部楼层 |阅读模式
我们见到过很多形式的数据分析工具,这些工具均是基于以下四个基本原理的,它们分别是:

数据的描述
数据的概率
数据的推断
数据的齐性(一致性)

数据的描述

- 给定一组数据,是否能用算术值,以某种有意义的方式概括这些数字中包含的信息?

统计值=数据+算术

我们来下面这个例子,图中的铲盘里有50颗珠子,其中11颗红色的,39颗白色的。

Red bead.JPG


数据的描述要做的就是将这些数据,用算术值的方式来表达出有价值的信息。

问题:就上图这个例子,我们该用什么算术值来描述数据?均值?中位数还是百分比?

数据的概率

- 给定一组已知的总体,从该总体中取样,我们能对样本做出什么判断?

下图是一个例子,已知那个巨大的碗里有1000颗黑珠子,4000颗白珠子混合在一起,我们就能根据概率推断出一次取出一颗黑球的概率为0.2(20%)。

wheeler2.jpg


质量管理中大量运用到概率理论,很多的控制及检验测试都是基于抽样,根据抽样的结果来推断总体的特征,这就是 - 数据的推断

数据的推断

- 对于一个未知的总体,我们从中抽样并了解了样本的所有信息,那么,我们能对总体做出什么推断?

同样,看下面这个例子,从一大堆珠子中抽取了50颗,其中黑珠子5颗,占10%。


wheeler3.jpg


根据样本的这些信息,我们能对总体做出什么推断?

这看上去像是概率问题的反向推理,其实是一个归纳过程,而我们知道归纳总是充满了不确定性。

我们能简单地推断总体样本中黑珠子也是占10%吗?

不是的,归纳推理无法保证100%的准确性,因此也就涉及到置信区间的概念。这个例子中,在90%的区间内,我们可以推断总体中黑珠子的占比应该在5.4%到20.5%的范围内。


数据的推断涉及到假设、置信区间和回归检验等领域。

数据的齐性(一致性)

- 给定一个已知的样本数据,我们是否能判断出样本里的数据是来自于一个总体还是多个总体?

wheeler4.jpg


正常情况下,从总体中不断抽样,各个样本的特征应该是相似的,一旦各个样本的数据缺乏一致性,这时我们应该知道,很可能是总体样本因为未知因素发生了变化。

怎么样来监控数据的一致性?最简单有效的工具就是过程行为图。

chart_process_beh.jpg

最后,数据分析的基本流程可以简单描述如下:

Chart.jpg


关注“质量优势”,关注原创质量文章
二维码 - 小.jpg
1. 问答、交流探讨的帖子,回帖时,请不要发纯表情等无价值回帖,无意义,太多了影响用户体验,经常这样账号会被扣分甚至禁号的;
2. 品质协会是个学习、交流分享的平台,所有资料和内容归作者和版权方所有,需要正版标准、资料的请去相关的官方网站等平台购买。
您需要登录后才可以回帖 登录 | 加入协会

本版积分规则

《品质协会规则》|品质币|手机版|品质B2B|联系我们|注册加入协会|品质协会(www.PinZhi.org) |网站地图

GMT+8, 2024-11-24 11:23 , Processed in 0.060766 second(s), 6 queries , Gzip On, Redis On.

Powered by 品质协会 © 2010-2024

品质人,让生活和环境变得更美好!!!

快速回复 返回顶部 返回列表