竞争情报 ---竞争情报方法论

如何控制市场调查中的样本误差:样本的处理

供稿人:徐宏宇  供稿时间:2016-4-27   关键字:市场调查  样本处理  缺失数据  

在实际的市场调查中,一些被选中的消费者始终拒绝回答某些问题,或者干脆就拒绝接受访问。这就是说,尽管调查设计者设计了相对完善的抽样框,调查实施者也尽最大的能力去获取完整的数据,但是不可避免仍然会出现一些缺失数据。

缺失数据按是否随机产生分为两类——随机缺失和非随机缺失。

(1) 随机缺失,表示缺失数据是随机发生的,发生缺失和变量自身或其他变量无关。这时可认为这些缺失值的分布和样本分布一样,因此缺失值可直接用均值替代或直接删除。

(2) 非随机缺失,表示缺失数据是非随机发生的,发生缺失和变量自身或其他变量有关。这时认为这些缺失值的分布和样本的分布不一样,因此不可以用均值替代或直接删除,必须代入一些适当的替代值。比如在询问被访者收入时,某些高收入的人由于担心等原因没有回答,或者很多年龄在某一年龄段的人没有回答。

在决定对缺失值做出删除还是替代的决定前,要对缺失的类型做判断。数据是否属于随机缺失的评估方法有两种,一种是定性分析,另一种是定量分析。定性分析主要看回答者和未回答者的分布情况;定量分析就是有很多种,但基本的思想都是判断两变量的分布是否一样,这里笔者选用卡方检验(x2)作为验证方法加以说明,卡方检验是一种假设检验方法,卡方值是每个格子实际频数与理论频数差值平方与理论频数之比的累计和,卡方值越大,说明实际频数与理论频数的差别越明显。

案例分析

下面的案例是按不同年龄段对收入是否提高的回答,这里定义X为是否回答,Y为年龄分布。

表1 各年龄段回答与否的人数

 

50以前

(y=1)

50后

(y=2)

60后

(y=3)

70后

(y=4)

80后

(y=5)

90后

(y=6)

回答(x=1)

5

32

67

16

15

8

未回答(x=2)

3

6

13

2

9

1

总人数

8

38

80

18

24

9

 

(1)      定性判断

绘制频次图,看X取1和2时Y的分布是否一致。从图2看出,回答与否在各种年龄段之间的分布除公务员类别外基本一致,但我们仍然无法判断这一差别是否显著,这就要用到定量方法判断。

图1 回答与否的年龄分布情况

 

(2)      定量判断

由于本例的最终目的是判断两列数据分布是否一致,此外由于两列数据的样本少、数据为频次,且方差不齐、分布也不是正态分布,因此采用x检验。利用表2的数据建立列联表, 1=回答、2=未回答,用1=50以前、2=50后、3=60后、4=70后、5=80后、6=90后,如表3。

表2 回答与年龄等级的交叉列联表

序号

是否回答

年龄分布

频数

1

1

1

5

2

1

2

32

3

1

3

67

4

1

4

16

5

1

5

15

6

1

6

8

7

2

1

3

8

2

2

6

9

2

3

13

10

2

4

2

11

2

5

9

12

2

6

1

本例采用SPSS软件的列联表功能,在SPSS的菜单中选择Data→Weight,打开Weight对话框,把“频数”加入到Frequency Variable文本框中,使频数变量成为权重变量。然后Analyze→Descriptive Statistics→Crosstabs,打开Crosstabs对话框,将“是否回答”加入行变量,将“年龄”加入列变量。输出结果为:P=0.118>0.05,不拒绝两变量分布一致的零假设(零假设认为两列变量分布一致),可认为两变量之间的分布存在一定关系,即认为分布一致。

图2 SPSS处理方法

 

表3  SPSS卡方检验(Chi-Square Tests)处理结果

 

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

8.777(a)

5

.118

Likelihood Ratio

7.859

5

.164

Linear-by-Linear Association

.308

1

.579

N of Valid Cases

177

 

 

分析结论:通过定性和定量分析,有无回答的两类人在职业等级上并没有差异,缺失值可直接用均值替代或删除,它们的存在并不影响结果。

参考文献:

1.         付凯. 询问法市场调研中的非抽样误差研究. 南京航天航空大学硕士论文,2005.3

2.         胡桂锬,罗琴. SPSS在市场调查统计分析中的应用. 市场研究,2006.12

3.         伯特西马斯,迪米特里斯等. 数据、模型与决策:管理科学基础. 北京:中信出版社,2004

 

 

 


万方数字化期刊中相关文章
中国工业机器人市场调查
作者:刘远红|
刊名:机器人技术与应用
年:2005
卷:
期:02
摘要:

注册成为正式用户,登陆后,获得更多阅读功能与服务!
转载本文需经本平台书面授权,并注明出处:上海情报服务平台www.istis.sh.cn
了解更多信息,请联系我们

§ 请为这篇文章打分(5分为最好)