权重值
已知参与计算的各个feature,如何去确定每个feature的权重呢?本文将为大家介绍一种相对科学的办法,来处理这种多因子权重设置的问题。
这其实就是一个典型的小组投票的过程,通过在方阵行列元素的两两比较,最终可以生成一个判断矩阵。比如对于有A,B,C,D四个feature的判断矩阵如下图所示:
2. 一致性校验
所谓一致性校验是指在进行投票的时候的公平性和一致性。
比如你认为A比B重要,B比C重要,但是从最后的结果来看是C比A重要,这样即为不一致。
一致性校验是通过计算校验系数来实现的,通常用CR来表示,小于0.1即表示一致性校验通过。
CR包含一致性指标(CI)和随机一致性指标(RI)两部分,CR=CI/RI。
CI和RI是一个固定值,与矩阵的阶数有关。
剩下的是一个比较复杂的数学过程,简单介绍几个概念,计算过程大家可以百度一下即可。
下图是通过excel进行计算的:
完美解决!
说在最后
大家这里或许会有个疑问:
采用AHP的方法进行赋权,小组投票阶段是主观判断重要性的,所以是不是会带来误差?
会,一定会。
不过还是我之前说的,策略一定是建立在业务之上的,撇开业务谈策略都是伪策略。
采用AHP模型进行多因子赋权,
需要对该业务有足够的了解,更需要对该target下的多个feature有足够的了解,哪个对于target的贡献度是最大的。
比如对于一个商品,什么样的商品是用户喜欢的?用户喜欢的商品有哪些feature?每个feature对于用户喜欢的贡献程度是什么样的?这些都是需要业务经验参与的。
如果说科学的方法都有一个前提假设,那么AHP也有一个前提,就是先了解业务,再谈策略。
以上,希望能帮助到大家。
相关阅读
声明:本文来自于微信公众号蝙蝠侠IT(ID:batmanit),授权站长之家转载发布。在做SEO项目的时候,我们无法脱离与外链之间的关系,于是你总
【转】多因子策略探索(1)为什么要用聚宽以市场上知名的TB、文化等期货研究平台为代表,均采用了数据驱动的回测方式,不能按照复利回测(
淘宝店铺权重查询。作为一个淘宝卖家,关注自己的店铺权重,是十分重要的,因为这对自己的销量、流量等影响非常大,在不清楚的时候,就应该
Python---copy()、deepcopy()与赋值的区别
copy()与deepcopy()之间的主要区别是python对数据的存储方式。首先直接上结论:—–深复制,即将被复制对象完全再复制一遍作为独立的
如何让网站的权重有所提升,影响网站权重有几个因素,如果我们前期的准备工作没有做好的放在,对我们的权重提升是没有一点帮助的,那么如