刘雪庆:基于矩阵分解的不完全偏好值信息双边匹配决策论文

刘雪庆:基于矩阵分解的不完全偏好值信息双边匹配决策论文

摘要:针对匹配主体没有提供全部偏好值信息的双边匹配问题,提出了一种基于偏差矩阵分解技术解决不完全偏好值信息双边匹配问题的决策方法。给出了基于部分偏好值信息的双边匹配问题的描述,利用偏差矩阵分解技术,充分挖掘用户的潜在偏好,填充缺失偏好值,将匹配双方的不完全偏好值矩阵转化为完全偏好值矩阵并进一步转化为满意度矩阵。建立匹配优化模型并通过模拟退火算法求解,实验结果表明,该决策方法可行。

关键词:双边匹配;偏差矩阵分解;不完全偏好值;匹配优化模型

双边匹配问题是指有双方匹配集合,其中每一方的每一个匹配主体都对另一方感兴趣的匹配主体给出自身偏好。双边匹配问题广泛存在于我们的日常生活和经济生活中,例如适龄未婚青年的婚姻匹配[1]、风险投资公司与风险公司匹配[2,3]、求职员工与用人单位岗位的匹配[4]等。双边匹配问题最早起源于Gale等[5]对适龄男女婚姻和高校学生的稳定匹配问题的研究。此后,国内外学者对双边匹配理论及其应用场景进行了大量的研究。Roth[6]提出了Hospital-Resident算法,解决了医学院毕业生和实习医院的双边匹配问题;Klaus等[7]提出了DPC算法并分析了算法的特性,给出了在强偏好序下的双边匹配问题的一种解决方案;Chakraborty等[8]提出了稳定匹配存在的机制,当匹配双方给出不完全偏好信息时,已知一边主体互相依存时可以用该方法来处理;李铭洋等[9]提出了一种基于偏好信息的匹配方案,并将一步将双边匹配问题转化为赋权二分图最大权匹配问题;乐琦等[10]提出一种基于不完全得分信息的匹配策略,已知匹配双方给出部分偏好信息,考虑互相给出偏好信息的匹配双方之间可以进行匹配的双边匹配方法;赵晓冬等[11]考虑到动态匹配问题,采用综合多个时期的偏好信息进行匹配决策,能够解决只用一次偏好信息进行匹配的片面性,提高决策水平。大多数研究理论假设匹配主体给出全部偏好信息,通过对这些偏好信息进行计算得出偏好序。少数研究理论虽然考虑到主体没有给出全部偏好信息的匹配情况,但是在解决策略中却只将双方互相都有过评分的主体进行匹配,如果一方对另一方没有过评分或者双方之间都没有评分,导致匹配主体不能充分进行匹配,或部分匹配主体可能找不到匹配对象。实际的匹配问题中,尤其是匹配双方的数量都非常大的情况,匹配主体往往不能对所有匹配成员给出偏好信息;从匹配主体属性权重看,由于匹配主体都是直觉模糊的,因此匹配主体无法精确、客观地给出对匹配对象某一属性的权重;再者不同的匹配主体对匹配对象同一属性的要求也不一样,导致无法使用相同的属性权重来加权计算偏好值。这些情况可能导致匹配结果的不可信性,因此,需要充分利用匹配主体已经给出的确定偏好信息,并从这些偏好信息中挖掘出匹配主体的潜在偏好,避免给出不确定权重导致的匹配失信问题。鉴于此,本文提出了一种基于矩阵分解技术,解决匹配主体未给出完全偏好值的双边匹配决策方法。

1问题描述

在基于矩阵分解的双边匹配问题中,双方给出的评价信息都是对另一方的偏好值。设集合A={A1,A2,…,Am},m≥2表示甲方匹配主体,其中Ai为A中第i个匹配主体,i=1,2,…,m;集合B={B1,B2,…,Bn},n≥2表示乙方匹配主体,其中Bj为B中第j个匹配主体,j=1,2,…,n,不妨设m≤n;设R = [rij]m×n为甲方对乙方的不完全偏好值矩阵,其中rij表示Ai给出的关于Bj的偏好值,若甲方匹配主体没有给出该信息,则记rij=?;设T=[tji]n×m为乙方到甲方的不完全偏好值矩阵,其中tji表示Bj给出的关于Ai的偏好值,若乙方匹配主体没有给出该信息,则记tji=?。

“这里的工人没有抛弃特朗普,现在我给他执政的评价是B,如果他能让这里得以继续生产,那我会重新给他A的评价。”

本文所提出的决策方法是利用匹配双方给出的不完全偏好值矩阵R=[rij]m×n和T=[tji]n×m,通过建立一种匹配模型,使其在匹配模型获得近似最优解时,获得最优的匹配方案。

2双边匹配决策方法

2.1偏好值矩阵

由于不同匹配主体评分习惯不同,例如有的匹配主体非常乐观,习惯给出高的偏好值;而有的匹配主体非常苛刻,习惯给出低的偏好值,因此本文采用偏差矩阵分解技术[12]对缺失偏好值进行填充。

甲方主体对乙方主体的不完全偏好值矩阵R=[rij]m×n,设Rw表示R中所有已知的偏好值数据集,此时需要将甲方和乙方映射到相同隐向量空间。设f表示隐向量空间维数,P=[pik]m×f表示甲方隐特征矩阵,Q=[qkj]f×n表示乙方隐特征矩阵,其中f≪min(m,n)。对于已知偏好值rij,使用下式进行近似

泥巴很漂亮,不少人追求,都未遂。未遂的原因是泥巴都觉得他们不遂,要么上身不遂,要么下身不遂,泥巴看人注重精神。在她眼里,没有独特精神魅力的男人们都是不健全的。

[5] 亚里士多德“论灵魂”,《亚里士多德全集》卷三[M],北京:中国人民大学出版社,1997年,P251.

(1)

其中,rij为真实偏好值,为计算偏好值,μ表示Rw中的总体评分均值,bi为Ai对Bj评分的偏差,bj为Bj被Ai评分的偏差,为甲方对乙方评分的交互值,其中pik,qkj分别表示交互值中甲方评分及乙方被评分在隐特征k中的映射值。

模拟退火算法[15]被广泛应用在组合优化问题中,特别是旅行商(TSP)问题[16],考虑到双边匹配问题同样属于组合优化问题,因此使用该算法求解上节构建的匹配模型,得到匹配模型最优解。

(2)

其中,tji为真实偏好值,为计算偏好值,μ′表示Tw中的总体评分均值,为Bj对Ai评分的偏差,为Ai被Bj评分的偏差,为甲方对乙方评分的交互值,其中,

分别表示交互值中乙方评分及甲方被评分在隐特征l中的映射值。则甲方主体到乙方主体的全局损失函数可表示为

其中,αij表示主体Ai对主体Bj的满意度,βji表示主体Bj对主体Ai的满意度(i=1,2,…,m;j=1,2,…,n),ω(0≤ω≤1)称为调节参数,其取值由匹配决策者依据实际问题和想要获得的匹配结果而定。ω=0时,同时考虑满意度的和及满意度积的平方根,此时强调匹配一致性;ω=1时,只考虑双方满意度和,此时强调匹配互补性,由此可得双方组合满意度矩阵C = [cij]m×n。于是建立如下组合优化模型[14]

(3)

解决不完全偏好值双边匹配问题的具体步骤如下:

(4)

为了避免过度拟合,需要加入规范化因子对

的训练过程进行规范,设λ′是乙方规范化因数的常量。采用随机梯度下降法得到

的最优解。利用式(2)计算并填充偏好缺失值,即可得到乙方对甲方的完全偏好值矩阵T′=[tji]n×m。

2.2满意度矩阵

考虑到不同匹配主体评分习惯不同,需要将每个匹配主体的偏好值进行归一化处理;另外每个匹配主体都是个人理性的[13],即一方匹配主体对其感兴趣的对方个体满意度敏感性逐渐递减趋势,采用如下方法计算双方满意度。

设αij,βji分别表示甲方Ai对乙方Bj的满意度和乙方Bj对甲方Ai的满意度,则甲乙双方满意度

(5)

(6)

Step5利用模拟退火算法求解匹配优化模型,获得最优的匹配结果。

2.3匹配模型

匹配时需要考虑匹配对之间公平性和匹配结果的可行性,应使成功匹配主体间的偏好值尽量相同,避免偏好值差异比较大的个体进行匹配。拟采用如下方法计算双方组合满意度[14]

(7)

我还搞了蛮多次关于学习动力的主题班会,跟他们分析为什么要上好的大学,即使你无法自我创业成为马云、俞敏洪,但是你可以成为他们的同学,然后创业时成为他们的“开国功臣”;即使你无法成为富二代,但是你可能成为王思聪的同学,据说他爸王建林在他创业时给他五个亿……更高的平台,意味着更高层次的朋友圈子,意味着将来社会上更多的助力。

(8)

其中,xij=0或1;i=1,2,…,m;j=1,2,…,n;xij=1表示主体Ai与主体Bj匹配,而xij=0表示主体Ai与主体Bj不匹配。

2.4匹配模型的求解

对于乙方主体对甲方主体的不完全偏好值矩阵T=[tji]n×m,设Tw表示T中所有已知的偏好值数据集,此时需要将乙方和甲方映射到相同隐向量空间。设f′表示隐向量空间维数,表示乙方隐特征矩阵,表示甲方隐特征矩阵,其中f′≪min(m,n)。对于已知偏好值tji,近似为

其中,表示矩阵·中所有元素的平方和。为了避免过度拟合,需要加入规范化因子对bi,bj,P,Q的训练过程进行规范,设λ是甲方规范化因数的常量,通常情况下取值在0到100之间。采用随机梯度下降法得到bi,bj,P,Q的近似最优解。利用式(1)计算并填充偏好缺失值,得到甲方对乙方的完全偏好值矩阵R′=[rij]m×n。乙方主体到甲方主体的全局损失函数可以表示为

张清元如今高大硕实的身材,无疑是传承了他父亲的某些特点。张满春进沈府做帮工时,沈家大小姐沈小小刚满十五岁。不过,那时的张满春也才十七岁。张满春与沈小小第一次对眼,就让他心里一跳。沈小小娇艳饱满,脖颈白得像起了一层藕粉。张满春当时就想,自己要是能娶上这样的女人做老婆,也算是没有白变一回人。于是,张满春的眼睛在沈府里没事就找沈小小的背影。

Step1依据式(1)、(3)将甲方主体的不完全偏好值矩阵R = [rij]m×n转化为完全偏好值矩阵R′=[rij]m×n,依据式(2)、(4)将乙方主体的不完全偏好值矩阵T=[tji]n×m转化为完全偏好值矩阵T′=[tji]n×m;Step2依据式(5)将甲方主体的完全偏好值矩阵R′=[rij]m×n转化为满意度矩阵R″=[αij]m×n,依据式(6)将乙方匹配主体的完全偏好值矩阵T′=[tji]n×m转化为满意度矩阵T″=[βji]n×m;

(1)采用微生物分离法分解大豆油脂的底物浓度会对大豆油本身产生一定影响。在浓度为10%的发酵培养基中加入浓度为10%的天然大豆粉,配合浓度为10%的发酵培养基,将pH值调整到5,在120℃的水中灭菌30min,然后接种10%的菌种,在38℃的恒温摇床中培养菌种19h。最后采用发酵过程游离大豆油的含量来提高提油量,并将其作为大豆油脂底物浓度实验的重要评价指标[7]。

Step3依据式(7)求甲乙双方的组合满意度矩阵C=[cij]m×n;

Step4依据式(8)和上一步所得的组合满意度,构建匹配优化模型;

其中,max(rij)表示甲方每个主体对乙方所有主体偏好值的最大值,max(tji)表示乙方每个主体对甲方所有主体偏好值的最大值。将P′,Q′中的偏好值分别代入式(5)和(6)中即可得到甲方对乙方的满意度矩阵R″=[αij]m×n及乙方对甲方的满意度矩阵T″=[βji]n×m。

钱海燕呆立在那。医院里人来人往,每个人脸上的表情都是麻木的。那一刻,钱海燕的腿是软的,心是慌的,眼泪止都止不住。她不知道怎么进的电梯,怎么办理的住院手续。

这天,大福在网吧里玩了一宿游戏,亮天时觉得眼睛又酸又涨,有些不听使唤。他本打算趴在电脑桌上闭一会儿眼睛。没想到就睡着了。那个鹿脖子网管把他敲醒的时候,睁开眼睛已是下午三点。他从网吧里走出来,伸伸懒腰,胃肠里强烈抽搐让他想起已经一天一宿没有吃东西了。他抽抽鼻子,闻闻街对面烤鸭店里飘出来的香味儿,舔舔嘴唇,想象着烤鸭的美味香甜。

3模拟实验

某风险投资中介公司主要从事风险投资商及风险企业之间的中介匹配服务。现有10个风险投资商(A1,A2,…,A10)对其了解过的10个风险企业(B1,B2,…,B10)的评分情况及风险企业对风险投资商的评分情况。为了充分利用匹配双方给出的评分信息,促成双方的合理匹配,将其评分值视为偏好值,利用双方给出的不完全偏好值信息进行匹配决策。这里假设偏好值的取值范围为[0~10]之间的整数,其中0表示匹配主体非常不满意,10表示匹配主体非常满意。用R=[rij]10×10表示风险投资商给出的对风险企业的不完全偏好值矩阵,T=[tji]10×10表示风险企业给出对风险投资商的不完全偏好值矩阵。其中假设每一个匹配主体对另一方匹配主体都有过7个评分值,即数据的稀疏度为30%。设R和T分别为

运用上面提到偏差矩阵分解方法将不完全偏好值矩阵转化为完全偏好值矩阵

依据完全偏好值矩阵,以及上文给出的满意度计算公式,可得双方的满意度矩阵

考虑到匹配主体双方满意度的互补性和一致性,本案例中取ω=0.5,将双方的满意度矩阵R″、T″中的每个值分别代入到式(7)中得到双方组合满意度矩阵

将上面的组合满意度矩阵代入优化模型并用模拟退火算法求解,可得优化模型的最优解为8.098,对应的一个最优匹配方案为(A1,B5),(A2,B7),(A3,A10),(A4,B4),(A5,A9),(A6,A2),(A7,A3),(A8,A1),(A9,A8),(A10,A6)。

4结论

针对匹配主体没有给出全部偏好值的双边匹配问题,本文采用偏差矩阵分解技术填充缺失偏好值,解决了没有给出偏好值信息的匹配对之间的匹配决策问题和人为主观确定属性权重导致的匹配失信问题,给出了一种大数据背景下依赖不完全偏好值的双边匹配问题解决方案。通过具体算例证明了本文所提出的方法可以在匹配模型得到最大解时找到对应的匹配方案,具有实现的可行性。

参考文献

[1] Cechlárová K,Manlove D F.The exchange-stable marriage problem[J].Discrete Applied Mathematics,2005,152(1-3): 109-122.

[2] Sørensen M.How smart is smart money? A two-sided matching model of venture capital[J].The Journal of Finance,2007,62(6): 2725-2762.

[3] Elitzur R,Gavious A.A multi-period game theoretic model of venture capitalists and entrepreneurs[J].European Journal of Operational Research,2003,144(2): 440-453.

[4] Goodman S A,Svyantek D J.Person-organization fit and contextual performance: Do shared values matter[J].Journal of vocational behavior,1999,55(2): 254-275.

[5] Gale D,Shapley L S.College admissions and the stability of marriage[J].The American Mathematical Monthly,1962,69(1): 9-15.

[6] Roth A E.New physicians: a natural experiment in market organization[J].Science,1990,250(4987): 1524-1528.

[7] Klaus B,Klijn F.Paths to stability for matching markets with couples[J].Games and Economic Behavior,2007,58(1): 154-171.

[8] Chakraborty A,Citanna A,Ostrovsky M.Two-sided matching with interdependent values[J].Journal of Economic Theory,2010,145(1): 85-105.

[9] 李铭洋,樊治平,刘洋.一种基于偏好序信息的双边匹配方法[J].运筹与管理,2012,21(4):112-118.

[10] 乐琦.基于不完全得分信息的双边匹配决策方法[J].系统工程,2013,31(9): 79-83.

[11] 赵晓冬,臧誉琪,骆严严.考虑偏好信息的动态双边匹配决策方法[J].计算机工程与应用,2018(5): 258-264.

[12] Koren Y,Bell R,Volinsky C.Matrix factorization techniques for recommender systems[J].Computer,2009 (8): 30-37.

[13] Echenique F.What matchings can be stable? The testable implications of matching theory[J].Mathematics of operations Research,2008,33(3): 757-768.

[14] 王中兴,黄帅,刘芳.基于优化模型的双边匹配决策方法[J].数学的实践与认识,2014,44(24):177-183.

[15] Kirkpatrick S,Gelatt C D,Vecchi M P.Optimization by simulated annealing[J].science,1983,220(4598): 671-680.

[16] 胡银厚.求解TSP算法的研究与改进[D].郑州:郑州大学,2012.

DecisionMethodforTwo-sidedMatchingProblemwithIncompletePreferenceValuesBasedonMatrixFactorization

LIU Xue-qinga,WANG Ji-rongb,LI Juna

(a.College of Computer Science and Technology,b.College of Mechanical and Electronic Engineering,Qingdao University,Qingdao 266071,China)

Abstract: A decision method based on the biases matrix factorization is proposed to solve the two-sided matching problem with incomplete preference values.The two-sided matching problem with partial preference values information is described.The partial preference values matrix is transformed intothe complete preference values matrix using the biases matrix factorization,by fully mining the user′s potential preferences and filling in the missing preference values.The complete preference values matrix is then converted into complete satisfaction degrees matrix.A matching optimization model is constructed and the simulated annealing algorithm is used to solve the model.The feasibility of the proposed decision-making method is proved by an example.

Keywords:two-sided matching;biases matrix factorization;incomplete preference values;matching optimization model

中图分类号:C934

文献标志码:A

文章编号:1006-1037(2019)02-0067-06

doi:10.3969/j.issn.1006-1037.2019.02.12

收稿日期:2018-12-20

基金项目:省级研究生教育创新项目(批准号:SDYY10233)资助。

通讯作者:李军,男,博士,研究员,主要研究方向为计算机工程仿真,

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

刘雪庆:基于矩阵分解的不完全偏好值信息双边匹配决策论文
下载Doc文档

猜你喜欢