计算机应用   2017, Vol. 37 Issue (6): 1521-1526  DOI: 10.11772/j.issn.1001-9081.2017.06.1521
0

引用本文 

朱江, 巴少为, 杜清敏. 认知网络中基于博弈论的联合功率控制与速率分配算法[J]. 计算机应用, 2017, 37(6): 1521-1526.DOI: 10.11772/j.issn.1001-9081.2017.06.1521.
ZHU Jiang, BA Shaowei, DU Qingmin. Game-theoretic algorithm for joint power control and rate allocation in cognitive networks[J]. Journal of Computer Applications, 2017, 37(6): 1521-1526. DOI: 10.11772/j.issn.1001-9081.2017.06.1521.

基金项目

国家自然科学基金资助项目(61102062);重庆市科委自然科学基金资助项目(cstc2015jcyjA40050);教育部科学技术研究重点项目(212145);重庆市教委科学技术研究项目(KJ120530)

通信作者

巴少为(1991-), 女, 湖北天门人, 硕士研究生, 主要研究方向:认知无线电技术. E-mail:Kammybaba@163.com

作者简介

朱江(1977-), 男, 湖北荆州人, 副教授, 博士, 主要研究方向:通信理论与技术、信息安全技术;
杜清敏(1990-), 女, 河北石家庄人, 硕士研究生, 主要研究方向为:认知无线电技术

文章历史

收稿日期:2016-11-03
修回日期:2016-12-16
认知网络中基于博弈论的联合功率控制与速率分配算法
朱江, 巴少为, 杜清敏    
重庆邮电大学 重庆市移动通信重点实验室, 重庆 400065
摘要: 针对认知无线网络上行链路中的资源分配问题,提出了一种适应于多小区认知无线网络的基于功率控制与速率分配的博弈算法。为了更加合理地控制用户的功率和速率,减小各次用户间的干扰,首先,在效用函数中分别给功率和速率设置了不同的代价因子,使其能够更加合理地控制用户,避免用户过度增加发射功率。其次,从理论上证明了该算法纳什均衡的存在性、唯一性以及算法的收敛性。最后,为了解决发射功率和传输速率的最优化问题,给出了联合功率控制和速率分配的迭代更新算法流程图。理论分析及仿真结果表明,与同类博弈算法相比,在保证通信质量的前提下,所提算法可以使得用户以较小的发射功率获得较大的传输速率和较高的信干噪比(SINR),并且减小了用户间的干扰,提高了次用户系统容量。
关键词: 认知无线电    博弈论    多小区    功率控制    速率控制    
Game-theoretic algorithm for joint power control and rate allocation in cognitive networks
ZHU Jiang, BA Shaowei, DU Qingmin     
Chongqing Key Laboratory of Mobile Communications Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Abstract: Aiming at the resource allocation problem for the uplink in cognitive radio networks, a game-theoretic algorithm for joint power control and rate allocation adapted to multi-cell cognitive radio networks was proposed. To control user's power and rate more reasonably and reduce interference among Secondary Users (SUs), firstly, the different cost factors for power and rate were set respectively, so as to control user more reasonably and avoid user excessively increasing transmission power. Then, the existence and uniqueness of the Nash Equilibrium (NE) for the proposed algorithm were proved, the convergence demonstration of the proposed algorithm was given. Finally, for solving the optimization problem of the transmission power and transmission rate, the iterative updating flowchart of the proposed algorithm for the joint power control and rate allocation was presented. The theoretical analysis and simulation results show that, compared with the similar game algorithms, on the premise of guaranteeing the quality of communication, the proposed algorithm can make user acquire higher transmission rate and higher Signal to Interference plus Noise Ratio (SINR) at lower transmission power, reduce the interference among users, and improve the system capacity of SUs.
Key words: Cognitive Radio (CR)    game theory    multi-cell    power control    rate control    
0 引言

认知无线网络中,功率控制技术是解决主、次用户共存网络中的干扰问题的关键技术。近年来,博弈论被广泛地应用到功率控制的研究中。文献[1]是经典的分布式功率控制算法,该算法比较简单容易实现,但是该算法下的次用户的发射功率较大,导致用户间的干扰较大。文献[2]提出的K-G算法由于过于强调降低能量的消耗而使得自私用户付出的代价较大,部分次用户的信干噪比(Signal to Interference plus Noise Ratio, SINR)值达不到信干噪比阈值而影响通信质量。文献[3]在K-G算法的基础上将信道增益因子引入到效用函数中,提出了一种自适应的功率控制算法,有效地降低了用户的发射功率,并提高了收敛速度。文献[4]提出了基于斯坦克伯格博弈的功率控制算法,该算法考虑了宏基站的效益,但是其纳什均衡点不是唯一的。文献[5]提出了一种新的功率控制算法,将用户间的公平性纳入算法内,系统公平性得到一定的改善。文献[6]提出了一种新的非合作博弈模型下的功率控制算法。算法主要通过构造基于信干噪比(SINR)的正切型代价函数来减少迭代次数,从而提高收敛速度。文献[7]提出了一种有效的功率控制算法提高了收敛速率和系统容量。

以上文献都是在用户传输速率固定的前提下对功率进行优化的,只考虑了单个资源的优化情况。然而现代无线通信系统是支持多媒体业务的综合性平台,不同的媒体业务对传输速率和服务质量(Quality of Service, QoS)的需求不同,为了满足多业务的服务,不仅要对用户进行功率控制,还要对用户的传输速率进行控制。文献[8]提出了一种基于干扰管理的功率速率联合控制算法,加强了主用户在干扰控制中的主观能动性。文献[9]提出了一种基于分层博弈的联合功率速率控制算法,先设定一个关于速率的效用函数,求出达到均衡时的速率值,再将该速率值固定输入到功率控制层中,该模型减少了网络的功率消耗,提升了节点间的数据传输速率,但是这种分层的联合功率速率博弈模型不仅过程复杂而且过程不太合理。文献[10]研究了联合功率控制和频谱检测算法,达到了最大化系统吞吐量的效果。文献[11]分别为速率和功率设置了代价因子,但是功率和速率的代价因子相同,没有考虑到功率和速率的差异性,不够合理。文献[12]提出的联合控制算法采用了经典的效用函数,但是该模型中对于功率和速率的代价因子的设定过于简单,没有考虑对主用户的保护和公平性。文献[13]在代价函数中设计了基于传输速率公平性的惩罚因子, 同时还考虑了认知用户受到的干扰,但效用函数的设计过于简单,没有考虑到功率和速率的资源差异性。

本文在考虑到功率和速率资源差异的基础上分别为功率和速率设置了不同的代价因子,优化后的效用函数对博弈中自私用户的惩罚更为合理,并证明了该算法纳什均衡的存在性和唯一性。仿真结果表明,相对于文献[11]算法,本文算法下的次用户在不干扰主用户正常通信的前提下发射功率有所下降,次用户的传输速率有所提高,信干噪比也较大,提高了系统容量,获得了较好的性能。

1 功率速率联合控制系统模型

本章考虑的是主次用户共存的多小区网络中上行链路的资源分配问题。频谱共享认知网络模型如图 1所示。系统中共有N个主用户(Primary User, PU),M个次用户(Secondary User, SU),被授权的主用户与主用户基站(Base Station of Primary, BSP)通信,次用户与次用户基站通信,主次用户共享同一段频谱(带宽为W),主次用户间会产生相互干扰,次用户i到次用户基站的通信链路增益为hiS,第i个次用户到主用户基站的链路增益为gi,第i个主用户到次用户基站的链路增益为hiPS,相应的次用户i的信干噪比为:

${\gamma _i}^{\rm{S}} = \frac{W}{{{r_i}}}\frac{{{h_i}^{\rm{S}}{p_i}^{\rm{S}}}}{{\sum\limits_{j = 1,j \ne i}^M {{h_j}^{\rm{S}}{p_j}^{\rm{S}} + \sum\limits_{i \in N} {{h_i}^{{\rm{PS}}}} {p_i}^{\rm{P}} + {\delta ^2}} }};\quad i = 1,2, \cdots ,M$ (1)

式中:piSriS分别是次用户i的发射功率和传输速率;piP是主用户的发射功率;δ2是次用户基站的加性高斯白噪声。与文献[11]一样,本文将定义次用户i在其基站的归一化干扰噪声与其信道增益hi的比值Ii为:

${I_i} = \sum\limits_{i \ne j,j = 1}^M {\frac{{{h_j}^{\rm{S}}{p_j}^{\rm{S}}}}{{{h_i}^{\rm{S}}}}} + \sum\limits_{i \in {\rm{N}}} {\frac{{{h_i}^{{\rm{PS}}}{p_i}^{\rm{P}}}}{{{h_i}^{\rm{S}}}}} + \frac{{{\delta ^2}}}{{{h_i}^{\rm{S}}}}$ (2)

那么,第i个次用户的信干噪比重新定义为:

${\gamma _i} = \left( {W/{r_i}} \right) \cdot \left( {{p_i}^{\rm{S}}/{I_i}} \right)$ (3)

主用户受到的干扰功率为$\sum\limits_{i = 1}^M {{p_i}} {g_i}$,为了保证主用户的正常通信,次用户产生的干扰必须小于某个门限值Pth,即$\sum\limits_{i = 1}^M {p_i^{\rm{S}}} {g_i} \le {P_{{\rm{th}}}}$

基于图 1所示系统模型,本文将对功率控制和速率分配问题进行如下建模,定义次用户功率和速率联合控制博弈模型为G=〈M, {(Pi, Ri)}, {ui}〉。其中:M={1, 2, …, m}是参与博弈的次用户的集合;P=[p1, p2, …, pm]T表示包括所有次用户发射功率的向量;R=[r1, r2, …, rm]T表示所有次用户传输速率的向量;ui(pi, p-i, ri, r-i)表示次用户i的收益,在该博弈模型中它是功率和速率的联合效用函数,p-i=[p1, , p2, …, pi-1, pi+1, …, pn]T表示不包括pi在内的策略集合,r-i=[r1, , r2, …, ri-1, ri+1, …, rn]T表示不包括ri在内的策略集合。次用户的发射功率和传输速率都是有界的,即:pimin≤pipimaxriminririmax。在这个博弈模型中,每个次用户会试图选择合适的功率和传输速率使得自己的效益最大化,那么系统的目标函数可以表示为:

图 1 频谱共享认知网络模型 Figure 1 Spectrum sharing cognitive network model
$\max \left\{ {{u_i}({p_i},{r_i})} \right\}$ (4)

每一个用户在其速率功率的策略空间内最大化其效用。

通常认为,当以下三个条件均满足时,该效用函数是可行的:

1) 每个次用户可以得到较大的信干噪比;

2) 每个次用户得到较大的传输速率;

3) 当信道条件差或者干扰较大时,每个次用户通过增大发射功率或者减小数据传输速率来保证自身的通信质量。

为此,本文提出了一个分别为功率和速率设置了不同代价因子的效用函数:

${u_i} = \ln \left( {\alpha {p_i} + \beta {I_i}{r_i}} \right) - \frac{\lambda }{2}\frac{\alpha }{\beta }\frac{{{p_i}^2{g_i}}}{{{I_i}{P_{{\rm{th}}}}}} - \frac{\lambda }{2}\frac{\beta }{\alpha }\frac{{{I_i}{r_i}^2}}{{{r_i}^{tar}}}$ (5)

在式(5) 效用函数中,功率和速率的代价因子分别为pigi/Pthri/ritar,其中:Pth表示主用户所能承受的干扰门限; αβλ均是可变常数。式(5) 中:第一部分是次用户的收益;第二部分是对发射功率过大的用户的惩罚;第三部分是对传输速率过大的用户的惩罚。根据用户的发射功率以及传输速率来制定惩罚因子,可以进一步防止有些次用户出现自私的情况,比如随意增大自己的发射功率,让惩罚因子大的次用户受到的惩罚相对较大,而惩罚因子较小的次用户受到的惩罚相对较小,这样的效用函数可以控制好用户造成的干扰,保证系统速率分配的公平性。常数αβ是为了匹配功率和速率的数量级,是折中因子,它使式(5) 的三部分保持在同一个数量级; λ是代价因子;pigi/Pth代表功率的代价因子,其中Pth是主用户所能承受的干扰门限值,pigi/Pth主要是为了防止自私用户盲目地增加发射功率,对其他用户造成过大的干扰,当用户的发射功率过大时,此时pigi就会过大,由式(5) 可知该用户付出的代价显然也就变大;ri/ritar是信干噪比的代价因子,当该次用户的信干噪比较高时,用户支付的费用也越高,所以用户为了降低对自己的惩罚会降低发射功率,从而减小对其他用户的干扰。相反,如果用户i当前信干噪比的值很低,此时次级用户i的惩罚力度就小,由此可知该用户可以通过提高其发射功率来提高其SINR值以满足通信质量的要求。

1.1 纳什均衡的存在性和唯一性的证明

纳什均衡是一种使得每个网络用户对其他网络用户最优反应的策略组合,当没有用户单独行动而增加自身收益时,就达到纳什均衡。但是,在分布式网络中,每个认知用户都是自私的,都想通过最佳功率和速率水平来实现自身利益的最大化,这样就可能导致纳什均衡发射功率和速率可能不存在,或者纳什均衡点不唯一,所以在求解纳什均衡发射功率和速率时要证明纳什均衡的存在性和唯一性。

1.1.1 纳什均衡的存在性

根据文献[13-14]博弈论的相关知识可知,当博弈模型满足下面的两个条件时,那么这个博弈模型肯定存在纳什均衡:

1) 所有参与者的策略空间在欧几里得空间中是非空、闭的有界凸集。

2) ui是连续的拟凹函数。

对于本文博弈模型G=〈M, {(Pi, Ri)}, {ui}〉,其中:发射功率piminpipimax,传输速率riminririmax,显然满足第1) 个条件。下面将对第2) 个条件作证明。

式(5) 的效用函数对pi求偏导得:

$\frac{{\partial {u_i}}}{{\partial {p_i}}} = \frac{\alpha }{{\alpha {p_i} + \beta {I_i}{r_i}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}{p_i}$ (6)

对式(6) 再求pi的偏导:

$\frac{{{\partial ^2}{u_i}}}{{\partial {p_i}^2}} = \frac{{ - {\alpha ^2}}}{{{{(\alpha {p_i} + \beta {I_i}{r_i})}^2}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}$ (7)

由式(7) 可知$\frac{{{\partial ^2}{u_i}}}{{\partial p_i^2}} \le 0$,即在空间上ui是关于pi的连续拟凹函数。

同理:

$\frac{{{\partial ^2}{u_i}}}{{\partial {r_i}^2}} = \frac{{ - {\beta ^2}{I_i}^2}}{{{{(\alpha {p_i} + \beta {I_i}{r_i})}^2}}} - \frac{{\lambda \beta {I_i}}}{{\alpha {r_i}^{{\rm{tar}}}}}$ (8)

显然$\frac{{{\partial ^2}{u_i}}}{{\partial r_i^2}} \le 0$,因此在空间上ui是关于ri的连续拟凹函数。综上所述,该博弈模型存在纳什均衡。接下来将对纳什均衡的唯一性进行证明。

1.1.2 纳什均衡的唯一性

对于本文的博弈模型G=〈M, {(Pi, Ri)}, {ui}〉,因为piminpipimaxriminririmax,式(6) 是关于pi的严格单调递减函数,即:

$\left\{ {\begin{array}{*{20}{l}} {\frac{{\partial {u_i}}}{{\partial {p_i}}} > 0,} & {{p_i}^{\min } \le {p_i} \le {p_i}^{\max }}\\ {\frac{{\partial {u_i}}}{{\partial {p_i}}} = 0,} & {{p_i} = {p_i}^*}\\ {\frac{{\partial {u_i}}}{{\partial {p_i}}} < 0,} & {{p_i}^* < {p_i}^{\max }} \end{array}} \right.$ (9)

由式(9) 可知,显然在区间[pimin, pimax]上有且只有唯一的pi*使得$\frac{{\partial {u_i}}}{{\partial {p_i}}}$|pi=pi*=0,此时pi*的值是唯一的。同理:

$\left\{ {\begin{array}{*{20}{l}} {\frac{{\partial {u_i}}}{{\partial {r_i}}} > 0,} & {{r_i}^{\min } \le {r_i} \le {r_i}^{\max }}\\ {\frac{{\partial {u_i}}}{{\partial {r_i}}} = 0,} & {{r_i} = {r_i}^*}\\ {\frac{{\partial {u_i}}}{{\partial {r_i}}} < 0,} & {{r_i}^* < {r_i}^{\max }} \end{array}} \right.$ (10)

由式(10) 可知,显然在区间[rimin, rimax]上有且只有唯一的ri*使得$\frac{{\partial {u_i}}}{{\partial {r_i}}}$|ri=ri*=0,此时ri*的值是唯一的。综上所述,该博弈模型纳什均衡的唯一性得到了证明。

2 联合速率和功率更新算法 2.1 算法描述

由博弈论知识可知,任何一个用户单方面改变自身策略所得到的系统收益不会比在纳什均衡点的系统收益高。根据以上分析下面将给出联合速率和功率更新算法。

利用式(5) 描述的效用函数,功率最优解在$\frac{{\partial {u_i}}}{{\partial {p_i}}}$|pi=pi*=0得到,根据拉格朗日算法对效用函数求导得:

$\frac{{\partial {u_i}}}{{\partial {p_i}}} = \frac{\alpha }{{\alpha {p_i} + \beta {I_i}{r_i}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}{p_i} = 0$ (11)

同理,当$\frac{{\partial {u_i}}}{{\partial {r_i}}}$|ri=ri*=0时,即:

$\frac{{\partial {u_i}}}{{\partial {r_i}}} = \frac{{\beta {I_i}}}{{\alpha {p_i} + \beta {I_i}{r_i}}} - \frac{{\lambda \beta {I_i}}}{{\alpha {r_i}^{{\rm{tar}}}}}{r_i} = 0$ (12)

由式(12) 可以求得传输速率的最优解。综合式(11) ~(12) 整理可以得到:

$\left\{ {\begin{array}{*{20}{l}} {\lambda \alpha {g_i}{p_i}^2 + \lambda \beta {g_i}{I_i}{r_i}{p_i} - \beta {I_i}{P_{{\rm{th}}}} = 0}\\ {\lambda \beta {I_i}{r_i}^2 + \lambda \alpha {p_i}{r_i} - \alpha {r_i}^{{\rm{tar}}} = 0} \end{array}} \right.$ (13)

由式(13) 求解得:

${p_i} = \sqrt {\frac{{\beta {P_{{\rm{th}}}}^2{I_i}}}{{\alpha \lambda {g_i}({P_{{\rm{th}}}} + {r_i}^{{\rm{tar}}}{g_i})}}} $ (14)
${r_i} = \sqrt {\frac{{\alpha {g_i}{{({r_i}^{{\rm{tar}}})}^2}}}{{\lambda \beta {I_i}({P_{{\rm{th}}}} + {r_i}^{{\rm{tar}}}{g_i})}}} $ (15)

从式(14) ~(15) 可以看出,当次用户的信道状态很差或者信道增益比较小,或者其他用户对该次用户的干扰过大时,该次用户会增大发射功率或者减小它的传输速率。

根据式(14),本文给出了功率和速率的迭代公式:

$({p^{n + 1}},{r^{n + 1}}) = ({I^p}({p^n},{r^n}),{I^r}({p^n},{r^n}))$ (16)

其中:

$\left\{ {\begin{array}{*{20}{c}} {I_i^p(p,r) = \sqrt {\frac{{\beta {P_{{\rm{th}}}}^2{I_i}}}{{\alpha \lambda {g_i}({P_{{\rm{th}}}} + {g_i}{r_i}^{{\rm{tar}}})}}} }\\ {I_i^r(p,r) = \sqrt {\frac{{\alpha {g_i}{{({r_i}^{{\rm{tar}}})}^2}}}{{\beta \lambda {I_i}({P_{{\rm{th}}}} + {g_i}{r_i}^{{\rm{tar}}})}}} } \end{array}} \right.$ (17)

此外,当piminpipimax,该次用户的传输速率超过它的上限值或低于下限值时,也就是rimaxriririmin时,令rimax=riboundrimin=ribound,用ribound代替功率更新算法中的ri,得到:

$\lambda \alpha {g_i}{p_i}^2 + \lambda \beta {g_i}{I_i}r{{}_i^{{\rm{bound}}}}{p_i} - \beta {I_i}{P_{{\rm{th}}}} = 0$ (18)

求解式(18) 得:

$\mathop I\nolimits_i^{\rm{p}} (p) = \frac{{ - \lambda \beta {I_i}{g_i}{r_i}^{{\rm{bound}}} + \sqrt {{{(\alpha \beta {I_i}{g_i}{r_i}^{{\rm{bound}}})}^2} + 4\alpha \lambda \beta {g_i}{P_{{\rm{th}}}}{I_i}} }}{{2\alpha \lambda {g_i}}}$ (19)

综上所述,此时功率的更新公式为:

${p_i}^{n + 1} = \max \{ {P_i}^{\min },{\rm{min}}\{ {P_i}^{\max },{\rm{ }}I_i^p({p^n})\} \} $ (20)

同理,当riminririmax,而用户的发射功率超过了上限值,或者低于下限值时,也就是pimaxpipipimin时,令:pimax=piboundpimin=pibound,为了获得传输速率的更新公式,本文用pibound代替原式中的pi,此时:

$\lambda \beta {I_i}{r_i}^2 + \lambda \alpha {p_i}^{{\rm{bound}}}{r_i} - \alpha {r_i}^{{\rm{tar}}} = 0$ (21)

由式(21) 解得:

$\mathop I\nolimits_i^r (p) = \frac{{ - \lambda \alpha {p_i}^{{\rm{bound}}} + \sqrt {{{(\lambda \alpha {p_i}^{{\rm{bound}}})}^2} + 4\lambda \alpha \beta {I_i}{r_i}^{{\rm{tar}}}} }}{{2\lambda \beta {I_i}}}$ (22)

综上所述,此时速率的更新公式为:

${r_i}^{n + 1} = \max \{ {R_i}^{\min },{\rm{min}}\{ {R_i}^{\max },{\rm{ }}I_i^r({p^n})\} \} $ (23)

经过上面的分析,下面将给出分布式的联合功率控制和速率分配算法,该算法收敛到博弈G的纳什均衡点(ri, pi)。算法描述如下:

1) 置初始迭代次数t=0,k=1,并置初始功率p(0) =(p1(0), p2(0), …, pM(0))。

2) 在每次迭代tk时,根据式(16) 更新功率值和速率值:

a) 当piminpipimaxriminririmax时,pi(tk)=piri(tk)=ri

b) 当piminpipimaxrimaxriririmin时,令rik=rimaxrik=rimin,功率根据式(19) 更新;

c) 当riminririmaxpimaxpipipimin时,令pik=pimaxpik=pimin,速率根据式(22) 更新;

d) 当pimaxpipipiminrimaxriririmin时,此时令pik=pimaxpik=piminrik=rimaxrik=rimin

3) 当max(|pi(tk)-pi(tk-1)|+|ri(tk)-ri(tk-1)|)≤ξ成立,那么该算法结束。

4) 宣称得到纳什均衡。

5) 否则,置k=k+1, 返回第2) 步重新开始迭代过程,ξ是精度误差。

根据上面所述的功率速率联合控制公式,本文设计了功率和速率联合迭代算法。

2.2 算法收敛性的证明

功率迭代式可以记为:pk+1=φ(pk)。根据微分中值定理有:

$\begin{array}{l} {p^{k + 1}} - {p^*} = \varphi \left( {{p^k} - {p^*}} \right) = \varphi '\left( \xi \right)\left( {{p^k} - {p^*}} \right) = \\ \quad \quad \left( {\frac{\alpha }{{\alpha \xi + \beta {I_i}{r_i}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}\xi } \right)\left( {{p^k} - {p^*}} \right) \end{array}$ (24)
$\begin{array}{l} {p^{k + 1}} - {p^k} = \varphi \left( {{p^k} - {p^{k - 1}}} \right) = \varphi '\left( {\overline \xi } \right)\left( {{p^k} - {p^{k - 1}}} \right) = \\ \quad \quad \left( {\frac{\alpha }{{\alpha \overline \xi + \beta {I_i}{r_i}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}\overline \xi } \right)\left( {{p^k} - {p^{k - 1}}} \right) \end{array}$ (25)

存在常数0<L<1, 使得:

$\begin{array}{*{20}{l}} {\left| {\varphi \prime \left( p \right)} \right| = \left| {\frac{\alpha }{{\alpha {p_i} + \beta {I_i}{r_i}}} - \frac{{\lambda \alpha {g_i}}}{{\beta {I_i}{P_{{\rm{th}}}}}}{p_i}} \right| = }\\ {\quad \quad \quad \left| {\frac{{{I_i}{P_{{\rm{th}}}} - \lambda \alpha {p_i}^2{g_i}/\beta - \lambda {I_i}{r_i}{p_i}{g_i}}}{{{p_i}{g_i}{P_{{\rm{th}}}} + \beta {I_i}^2{r_i}{P_{{\rm{th}}}}/\alpha }}} \right| \le L} \end{array}$ (26)

结合微分中值定理得:

$\begin{array}{l} \{ |{p^{k + 1}} - {p^k}\left| { \le L} \right|{p^k} - {p^{k1}}|\} = \\ \quad \{ |{p^{k + 1}} - {p^*}\left| { \le L} \right|{p^k} - {p^*}|\} {\rm{ }} = \\ \quad L|{p^{k + 1}} - {p^*} - ({p^{k + 1}} - {p^k})| \le \\ \quad L|{p^{k + 1}} - {p^*}\left| { + L} \right|{p^{k + 1}} - {p^k}| \end{array}$ (27)

整理式(27) 得:

$\left( {1 - L} \right)\left| {{p^{k + 1}} - {p^k}} \right| \le L\left| {{p^{k + 1}} - {p^k}} \right|$ (28)

将(1-L)右移得:

$\left| {{p^{k + 1}} - {p^*}} \right| \le \frac{L}{{1 - L}}\left| {{p^{k + 1}} - {p^k}} \right|$ (29)

同理可知:

$\begin{array}{l} \left| {{p^k} - {p^*}} \right| \le \frac{L}{{1 - L}}\left| {{p^k} - {p^{k - 1}}} \right| \le \\ \quad \quad \frac{{{L^2}}}{{1 - L}}\left| {{p^{k - 1}} - {p^{k - 2}}} \right| \le \cdots \le \frac{{{L^k}}}{{1 - L}}\left| {{p^1} - {p^0}} \right| \end{array}$ (30)

由于0<L<1,$\mathop {\lim }\limits_{k \to \infty } $(pk-p*)=0,因此对于任意初值p0,迭代法pk+1=φ(pk)均收敛于p*,证毕。同理可证关于速率迭代算法的收敛性。

3 仿真及结果分析

为了验证本文算法的实用性和可行性,这里将考虑多个小区的仿真场景,并与文献[11]中已有的博弈方案性能进行比较,考虑了3个相邻的蜂窝小区,其中每个小区内的参数设定如下:小区内主、次用户的基站覆盖半径分别为R=1 000 m,r=300 m,3个小区内分别有5、7、9个次用户,为便于分析,假设3个小区内各自只有1个主用户,各用户分别随机分布在各自主、次基站的覆盖范围内,本文算法可以扩展到多个主用户共存的场景,主用户的发射功率固定为0.2 W,次用户发射功率piS∈[10-5, 1] W,发射速率riS∈[0.1, 96 000] b/s,主次用户共享带宽W*=106 Hz,次用户接收端的高斯白噪声为10-12W,主用户所能承受的干扰门限定义为噪声功率的10倍。即Pth=10-11W,将主用户到主用户基站的信道增益定义为hiP=A/dim,其中:dim是次用户i到其基站的距离,m是路径损耗指数,A表示基于阴影衰落的变化指数,本文中A=0.097,m=4。同理将次用户到次用户基站的信道增益定义为hiS,另外本文假设次用户i到主用户基站的信道增益hiSP在(0, hiS)范围内随机选择,主用户i到次用户基站的信道增益hiPS在(0, hiP)内随机选择。

图 2~4分别显示了3个小区内各次用户的发射功率、信干噪比、传输速率随迭代次数的增加逐步收敛的过程。从图 2可以看出,各个小区内次用户的功率和速率达到均衡后其值均在各自的策略空间内,其中距离次用户基站较近的用户由于信道条件较好,其发射功率更低,速率也更高,而小区1内用户数最少,用户间的彼此干扰也相对最小,小区3内用户最多,次用户彼此间干扰较大,其用户的发射功率也相对较大,小区1内的用户在较低发射功率的前提下就可以获得较大的信干噪比和较高的传输速率。同时由图 2可以看出,在迭代大概7到8次后算法达到收敛,收敛速度较快符合实时通信的要求。

图 2 不同小区次用户发射功率收敛曲线 Figure 2 Convergence curve of transmission power for secondary users in different cells
图 3 不同小区次用户信干噪比收敛曲线 Figure 3 Convergence curve of SINR for secondary users in different cells
图 4 不同小区次用户传输速率收敛曲线 Figure 4 Convergence curve of transmission rate for secondary users in different cells

下面将讨论文献[11]算法和本文算法的对比下次用户的发射功率、传输速率以及信干噪比的性能比较。为了与文献[11]算法比较性能,将两种算法下用户的基本参数设置成一样的,图 5~7是在小区1内本文算法与文献[11]算法下各次用户的性能结果对比。

图 5 不同算法次用户发射功率对比 Figure 5 Comparison of transmission power for secondary users with different algorithms
图 6 不同算法次用户SINR对比 Figure 6 Comparison of SINR for secondary users with different algorithms
图 7 不同算法次用户传输速率对比 Figure 7 Comparison of transmission rate for secondary users with different algorithms

图 5~7可以看出:两种方案下次用户的收敛速度相当,大概迭代7到8次后均能达到均衡。本文算法下次用户的发射功率要远低于文献[11]算法,且在该多小区环境下,文献[11]算法下3个次用户的信干噪比收敛到一个相近的值,这不能满足不同用户对信干噪比需求不同的状况。一般距离基站较近的用户由于信道条件较好,用户的发射功率较低,信干噪比也较高,而距离基站较远的用户信道条件相对较差因而发射功率较大,信干噪比也较小。本文算法下次用户的传输速率要高于文献[11]算法下次用户的传输速率,本文算法下的信干噪比值略低于文献[11]算法下次用户的信干噪比,但均远远满足通信的需求。相比文献[11]算法,本文算法下的次用户在较低的发射功率的前提下获得了较高的传输速率和相当的信干噪比值。这是因为本文算法分别为次用户的发射功率和传输速率设置了不同的代价因子,使得系统对于自私用户的惩罚更为合理,这样各次用户不会为了获得高的传输速率或信干噪比而盲目地提高自己的发射功率,减小了主用户受到的干扰。

图 8给出了在不同次用户个数下,两种博弈算法关于次用户吞吐量的比较。从图 8中可以看出,两种算法吞吐量性能都随着次用户数目的增多而提升,而本文算法的性能明显优于文献[11]算法,这是因为文献[11]算法下的次用户间干扰较大,明显降低了系统的QoS。

图 8 次用户吞吐量比较 Figure 8 Comparison of throughput for secondary users
4 结语

本文提出了一个联合功率和速率的分布式博弈算法,在效用函数中根据功率和速率的不同特性分别为二者设置了不同的代价惩罚因子,并结合实际情况在多小区认知无线网络进行了仿真和数值分析。通过仿真结果可以发现,相比文献[11]算法,本文所提算法在较低的发射功率下能获得较高的传输速率,且所获得的信干噪比值也较高,满足通信的需求,并且降低了对主用户的干扰,提高了系统的吞吐量,获得了较高的效用值。由于中断概率[15-16]和干扰门限对认知无线电网络中资源分配具有重要影响,在下一步的工作中,将考虑在干扰门限和中断概率等约束条件下,提出基于斯坦克尔伯格博弈[17]的资源分配算法。

参考文献
[1] GOODMAN D, MANDAYAM N. Power control for wireless data[J]. IEEE Personal Communications, 2000, 7(2): 48-54. doi: 10.1109/98.839331
[2] KOSKIE S, GAJIC Z. A Nash game algorithm for SIR-based power control in 3G wireless CDMA networks[J]. IEEE/ACM Transactions on Networking, 2005, 13(5): 1017-1026. doi: 10.1109/TNET.2005.857068
[3] 罗荣华, 杨震. 认知无线电系统中一种新的自适应功率控制算法[J]. 信号处理, 2010, 26(8): 1257-1262. ( LUO R H, YANG Z. A novel adaptive power control algorithm in cognitive radio system[J]. Signal Processing, 2010, 26(8): 1257-1262. )
[4] KANF X, ZHANG R, MOTANI M. Price-based resource allocation for spectrum-sharing femtocell networks:a Stackelberg game approach[J]. IEEE Journal on Selected Areas in Communications, 2012, 30(3): 538-549. doi: 10.1109/JSAC.2012.120404
[5] XIE X Z, YANG H L, VASILAKOS A V, et al. Fair power control using game theory with pricing scheme in cognitive radio networks[J]. Journal of Communications and Networks, 2014, 16(2): 183-192. doi: 10.1109/JCN.2014.000029
[6] YANG H L, XIE X Z, VASILAKOS A V. Stackelberg game based power control with outage probability constraints for cognitive radio networks[J/OL]. International Journal of Distributed Sensor Networks, 2015:Article ID 604915.[2016-10-09]. http://or.nsfc.gov.cn/bitstream/00001903-5/327951/1/1000013968317.pdf.
[7] TREUST M L, LASAULCE S. A repeated game formulation of energy-efficient decentralized power control[J]. IEEE Transactions on Wireless Communications, 2010, 9(9): 2860-2869. doi: 10.1109/TWC.2010.072610.091472
[8] 马良, 朱琦. 基于干扰管理的功率速率联合控制博弈方法[J]. 信号处理, 2012, 28(1): 26-32. ( MA L, ZHU Q. A game-theoretic joint rate and power control based on interference management[J]. Signal Processing, 2012, 28(1): 26-32. )
[9] 贺刚, 柏鹏, 彭卫东, 等. 数据链中基于动态博弈的联合功率与速率控制[J]. 西南交通大学学报, 2013, 48(3): 473-480. ( HE G, BAI P, PENG W D, et al. Joint rate and power control based on dynamic game theory in data link system[J]. Journal of Southwest Jiaotong University, 2013, 48(3): 473-480. )
[10] BAGAYOKO A, FIJALKOW I, TORTELIER P. Power control of spectrum-sharing in fading environment with partial channel state information[J]. IEEE Transactions on Signal Processing, 2011, 59(5): 2244-2256. doi: 10.1109/TSP.2011.2107905
[11] JAVAN M R, SHARAFAT A R. Efficient and distributed SINR-based joint resource allocation and base station assignment in wireless CDMA networks[J]. IEEE Transactions on Communications, 2011, 59(12): 3388-3399. doi: 10.1109/TCOMM.2011.111011.100589
[12] SHASHIKA MANOSHA K B, RAJATHEVA N. Joint power and rate control for spectrum underlay in cognitive radio networks with a novel pricing scheme[C]//Proceedings of the 2010 IEEE 72nd Vehicular Technology Conference Fall. Piscataway, NJ:IEEE, 2010:1-5.
[13] 余翔, 张小银. 非合作博弈下功率与速率联合控制算法研究[J]. 重庆邮电大学学报(自然科学版), 2016, 28(3): 349-353. ( YU X, ZHANG X Y. Non-cooperative game of joint power and rate control algorithm[J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2016, 28(3): 349-353. doi: 10.3979/j.issn.1673-825X.2016.03.011 )
[14] FUDENBERG D, TIROEL J. Game Theory[M]. Cambridge, MA: MIT Press, 1991 : 841 -846.
[15] YATES R D. A framework for uplink power control in cellular radio systems[J]. IEEE Journal on Selected Areas in Communications, 2006, 13(7): 1341-1347.
[16] 郭艳艳, 昌厚峰, 贾鹤萍. 基于公共DF中继的认知无线电中继选择和功率分配[J]. 测试技术学报, 2015, 29(2): 105-110. ( GUO Y Y, CHANG H F, JIA H P. Optimal relay selection and power allocation of cognitive networks based on public DF relay[J]. Journal of Test and Measurement Technology, 2015, 29(2): 105-110. )
[17] 李鹏, 朱宇. 一种异构网络中的斯坦克尔伯格功率控制方法[J]. 太赫兹科学与电子信息学报, 2013, 11(3): 368-376. ( LI P, ZHU Y. A Stackelberg approach on power control in heterogeneous networks[J]. Journal of Terahertz Science and Electronic Information Technology, 2013, 11(3): 368-376. )