北京fun88科技有限公司

永乐国际主页 > 互联网资讯 >

互联网资讯

 

中国互联网数据平台

发布时间:2020-12-31 11:52
 

  在实际统计过程中,样本结构与总体结构往往难以完全吻合,而不同类型的网民其互联网行为偏好也存在着差异。在这种情况下,要想较为准确地推断总体信息,提高估计的精度,就必须对样本结构进行加权调整。 样本加用样本的辅助变量,以及既有调查得到的总体辅助变量信息,给每一个样本赋予一个合适权重,使得加权后的样本结构尽可能接近总体结构,从而达到提高估计精度的目的。 在选择辅助变量时,应选择那些与研究变量有较高相关性的辅助变量,同时辅助变量的总体数据也应该是可以获得或估算的。中国互联网数据平台目前选用的辅助变量包括性别、年龄、学历、职业、月收入、地理等。

  记有限总体为U={1,…,k,…,N},S⊆U为抽取的一个样本,基于抽样设计的样本单元初始权数为dk=1/πk,其中πk是样本中第k个单元被抽中的概率。记由多个辅助变量构造的示性向量形式为(X1,X2,…,Xp),样本中第k个单元的示性向量为xk=(x1k,x2k,…,xpk),其中若样本k在第i类,则xik=1,否则xik=0。

  用X=∑UXk表示已知的辅助信息的总体总量,校准加权调整就是根据辅助信息X对dk进行校准得到样本权重wk,使得在满足校准方程∑Sxkwk=∑Uxk的约束条件下,dk与wk之间的距离最小。若使用距离函数G(x),其中x= wk/dk,则上述问题为:

  [1]金勇进,薛芳,侯志强.样本结构性偏差的校准加权调整方法[J].统计与决策,2007,(10):8~10

  [3]金勇进,王飞.校准调整估计量线性和指数距离函数的比较[J].统计与决策,2006,(1):6~7

  关于中国互联网数据平台使用的统计方法,我们真诚欢迎任何人提出或与我们讨论,从而帮助我们不断改进,相关可以发送至邮箱:。

文章来源:fun88