www.T1soft.com

 

首页 | 关于我们 | 软件产品与服务 | 解决方案 | 技术理论基础 | 成功案例和科研成果 | 动态和评述 | 联系我们 | 留言簿 

  

 

数据分析案例:收银员偷钱了吗
作者:梁雁/连婧/李婷/陈明慧/杨菲/刘敏 摘自:《网络》

 

  

  在收银员偷钱这个有趣的案例中,G女士提出了以下两个疑问:收银员何时开始偷钱;偷钱的数目仅限于500美元吗?我们针对这两个问题,用定性和定量相结合的方法,对其进行了深入地分析。

  一、 研究思想

  如果有人偷钱,就会导致:

  (1)顾客数量不变或上升的情况下,销售总额比正常情况下减少,从而每位顾客带来的平均收入减少;

  (2)钱箱差额总为正数。因为,若单纯是工作误差引起的,差额应该有正有负,总差额应趋向于零。只有在有人偷钱的情况下,小偷由于怕被发现,宁肯从钱箱中少拿钱,所以会造成差额为正。

  二、  研究方法

  (1)剔除因素影响。根据给定的数据,我们对每位顾客带来的平均收入、顾客数量和钱箱差额进行了处理,剔除了通货膨胀因素、季节因素,以及不规则变动,得到了以下要研究的数据:

 

实际收入

实际顾客数

实际差额

 

实际收入

实际顾客数

实际差额

1

 

 

 

27

0.691268

1527.938

0.746786

2

 

 

 

28

0.676261

1518.415

0.853451

3

0.866266

1220.97695

2.777526

29

0.655288

1480.937

1.478351

4

0.820484

1188.07461

3.335739

30

0.635197

1417.98

2.009659

5

0.76879

1204.51081

3.718375

31

0.630139

1386.59

1.946888

6

0.748138

1179.16383

4.343674

32

0.660115

1346.181

1.707925

7

0.694552

1147.13943

4.031099

33

0.699171

1296.001

1.004243

8

0.739867

1166.83982

3.807545

34

0.755643

1256.382

0.458422

9

0.793612

1152.03104

3.461321

35

0.793635

1241.855

0.927584

10

0.798969

1228.27175

2.348883

36

0.793407

1280.111

1.389503

11

0.822651

1344.7221

1.684743

37

0.787722

1313.093

1.42081

12

0.816959

1413.63701

1.476045

38

0.778589

1313.009

1.526893

13

0.805422

1464.24412

1.418157

39

0.772755

1300.893

1.140535

14

0.79957

1475.48307

1.270694

40

0.785051

1259.435

0.955637

15

0.790848

1485.0706

1.257109

41

0.799963

1220.347

1.420439

16

0.760561

1478.81909

1.630439

42

0.808943

1208.267

1.795599

17

0.721188

1462.52767

2.141445

43

0.811986

1200.357

2.07614

18

0.699874

1460.71743

2.352065

44

0.799976

1213.919

1.981788

19

0.687094

1444.2846

2.522811

45

0.781737

1246.832

1.736498

20

0.680918

1449.25822

2.448252

46

0.763817

1272.07

1.46082

21

0.684279

1484.52063

2.821461

47

0.745571

1303.425

1.009668

22

0.684416

1509.83664

4.776742

48

0.748135

1330.624

0.74661

23

0.681853

1512.44502

5.780873

49

0.760093

1338.792

0.585159

24

0.697234

1489.11103

5.411167

50

0.768677

1355.748

0.591132

25

0.706256

1494.31898

4.293607

51

 

 

 

26

0.694324

1527.23188

2.016506

52

 

 

 

  注:我们采用4项移动平均法剔除了不规则变动

  (2)分时段研究

  根据小偷的供词,他从17周开始偷钱,在32周被捕。故我们将整个研究时期分为以下三个时段:第一时段,1-16周;第二时段,17-32周;第三时段,33-52周。

 

  三、 分析结果

  我们用SPSS分析软件对数据进行了描述性统计分析.

                           图一

  由上面两个图对比可知,在第二时段,顾客数量明显高于第一和第三时段,但实际收入却明显低于这两个时段,而在这一时段正是小偷供认确实偷钱的阶段,同时也证明了我们的研究思路是正确的,即在有人偷钱的情况下,顾客数量不变或上升,每位顾客带来的平均收入却下降。反过来研究第一时段,从11周开始,顾客数量在不断上升的同时,每位顾客带来的平均收入却不断下降,证明了该小偷其实从11周就开始了偷窃行为。 我们假设整个商店只有一个小偷,那么在其被捕后的第三阶段,就不应该存在偷窃行为。

  为了进一步验证我们的结论,我们将11-16周和17-32周的数据进行t检验,为此我们先对总体1-52周的数据是否服从正态分布进行了k-s检验,其结果如下:

  One-Sample Kolmogorov-Smirnov Test

 

 

实际收入  

N

 

 

 

48  

 

Normal Parameters

 

 

Mean

.74723464  

 

  

 

 

Std. Deviation

.057243958  

 

Most Extreme Differences

 

 

Absolute

.129  

 

 

 

 

Positive

.129  

 

 

 

 

Negative

-.110  

 

Kolmogorov-Smirnov Z

 

 

 

.896  

 

Asymp. Sig. (2-tailed)

 

 

 

.398  

 

  a  Test distribution is Normal.

  b  Calculated from data.

  由上表可知,p=0.398〉0.05,故接收原假设,认为该总体分布符合正态分布。

  T-test:

   Group Statistics

 

时段2

N

Mean

Std. Deviation

Std. Error Mean  

 

实际收入

 

 

 

 

 

11-16zhou

6

.79933516

.022211617

.009067854  

 

 

 

 

 

 

 

 

17-32zhou

16

.68035644

.024513671

.006128418  

 

 

 

 

 

Levene's Test for Equality of Variances

 

t-test for Equality of Means

 

 

 

 

 

 

 

 

F

Sig.

t

df

Sig. (2-tailed)

Mean Difference

Std. Error Difference

95% Confidence Interval of the Difference