工业工程  2019, Vol. 22Issue (3): 77-85.  DOI: 10.3969/j.issn.1007-7375.2019.03.010.
0

引用本文 

李陆, 代业明. 广告视角下智能小区实时定价博弈分析[J]. 工业工程, 2019, 22(3): 77-85. DOI: 10.3969/j.issn.1007-7375.2019.03.010.
LI Lu, DAI Yeming. Real-time Pricing Based on Game Theory in Smart Community from Advertisement Perspective[J]. Industrial Engineering Journal, 2019, 22(3): 77-85. DOI: 10.3969/j.issn.1007-7375.2019.03.010.

基金项目:

国家自然科学基金资助项目(11171221,71571108);中国博士后科学基金资助项目(2016M602104);青岛市博士后应用研究资助项目 (2016033)

作者简介:

李陆(1995-),男,山东省人,硕士研究生,主要研究方向为电网定价机制、博弈论及其应用。

通信作者

代业明(1975-),男,河南省人,副教授,博士,主要研究方向为电网定价机制、博弈论及其应用. E-mail: yemingdai@163.com

文章历史

收稿日期:2018-10-17
广告视角下智能小区实时定价博弈分析
李陆1, 代业明2     
青岛大学 1.数学与统计学院;
2. 商学院,山东 青岛 266071
摘要: 考虑连续时间内供电商对用户的争抢行为,将广告微分博弈引入智能电网系统中以刻画供电商之间的相互竞争,并建立多供电商多用户Stackelberg博弈模型研究智能电网实时定价问题。通过求解用户侧优化问题及供电商之间非合作微分博弈纳什均衡,最终获得供电商与用户之间Stackelberg博弈均衡,以此得到供电商广告竞争下的智能电网实时电价。数值仿真结果表明:采取广告行为供电商的最大支付随其广告成本和定价先增后减,而随用户规模扩大而递增;另外,随着单位广告成本的增加,供电商统一电价逐渐降低,带来用户效用提高,且拥有较低广告成本的供电商售电较多。
关键词: 智能电网    需求响应管理    实时电价    微分博弈    Stackelberg博弈    
Real-time Pricing Based on Game Theory in Smart Community from Advertisement Perspective
LI Lu1, DAI Yeming2     
1. School of Mathematics & Statistics;
2. School of Business, Qingdao University, Qingdao 266071, China
Abstract: Considering the competition behavior of electricity suppliers in continuous time slots, advertising differential game theory is introduced to depict the interaction among electricity suppliers. A Stackelberg game model with multiple leaders and multiple followers is formulated to study the real-time electricity pricing problem. By solving the optimal problem on user side and the non-cooperative differential Nash equilibrium among electricity suppliers, the Stackelberg game equilibrium between the suppliers and users is achieved. Finally, the real-time electricity price under the advertising competition of electricity suppliers is obtained. The results of numerical simulation show that the maximum payment of electricity suppliers taking advertising behavior increases first and then decreases with the increase of its advertising cost and price, but increases with the increase of user scale. In addition, with the increase of unit advertising cost, the uniform electricity price of electricity suppliers gradually decreases and the user’s utility is improved. Moreover, the electricity suppliers with lower advertising cost sell more electricity.
Key words: smart grid    demand response management    real-time pricing    differential game    Stackelberg game    

能源是制约现代社会工业发展的关键因素,作为电力系统重要组成部分及未来电网的重要表现形式,智能电网在解决能源短缺方面扮演着重要角色,是我国现阶段电网的研究重点之一[1]。需求响应[2-3](demand response,DR)是解决智能电网能源管理问题的主要手段之一,具体指用户在供电方价格调整或补偿等手段引导下改变其用电行为。电价作为DR机制的关键要素,受到国内外学者的广泛关注。对于电价的主要研究类型包括阶梯电价、关键峰荷电价、自适应电价和实时电价等,其中实时电价(realtime pricing,RTP)是未来最为理想的定价机制[4]。近年来,随着先进智能技术的发展,实时电价的真正实现已经在技术上有了可能。

国内外许多学者从不同视角对智能电网实时定价建模分析或设计求解算法。归结起来,RTP研究方法主要有基于经典优化理论的RTP研究与基于博弈理论的RTP研究。基于优化理论的RTP研究是智能电网RTP研究的主流,其主要表现为用户直接针对电价进行需求响应以达到调节电力负荷目的。如Samadi等[5]首次提出了基于社会福利最大化的多用户向单一供电商购买电力的智能电网实时定价机制,并使用新算法求解;Samimi等[6]构造一种综合效用函数仍以最大化社会福利为目的建立了实时交互定价机制;Zhu等[7]最近又将上述研究推广到多阶段情形,建立了多阶段最大化社会福利的实时定价机制。

基于博弈理论的RTP研究则立足于供、售电商与用户三者之间的合作与竞争,大致可分为以下方向。1) 从住宅用户家用电器与供电商之间的博弈入手,如Srinivasan等[8]依据博弈理论研究了住宅用户智能电网需求响应的动态定价策略;刘晓峰等[9]则将家用电器负荷分为三类,建立了用户、电网公司与负荷聚合商之间的分层调度博弈模型。2) 针对用户之间的博弈进行研究,如Ye与Hu[10]从综合博弈角度研究了博弈决策与分析对需求响应中价格要素的影响,此模型中用户只需与自己“邻居”进行交流便可得到纳什均衡,且在交流中不需要透露自己的能源消耗从而保护了隐私。3) 考虑到电力市场的层次结构,在供电商与用户之间建立Stackelberg博弈进行RTP研究,如Zhang等[11]将用户之间信息分享的智能电网需求响应问题用两层博弈的形式表示,在证明上述两个博弈均衡存在性后设计分布式算法进行求解;代业明等[12]则构建基于贝叶斯需求预测更新的一主多从Stackelberg博弈模型研究实时定价问题;在他们的另一个工作中又建立了研究住宅用户实时定价机制的多主多从Stackelberg博弈模型,并分别用演化博弈和非合作博弈刻画用户之间协调和供电商之间价格竞争,最后设计算法进行求解[13]

相比一般优化手段,应用博弈理论更贴近真实电力市场,但上述成果对局中人行为刻画多局限于离散情况。如果要描述局中人在连续时间内的状态变化,则需要微分博弈理论。微分博弈是在连续时间变化情形下描述冲突控制的数学模型[14],其思想被运用在智能电网的各个领域。如Srikantha等[15]利用微分博弈理论研究智能电网系统对网络攻击的缓解能力,并给出网络攻击下具有更强恢复力智能电网的可能性证明;Arai等[16]探索了分散式能源管理系统中信息公开情况下的微分博弈解。Forouzandehmehr等[17]则建立微分博弈模型描述水力发电厂与热电厂之间的竞争互动,以达到优化发电与电力存储目的。Zhu等[18]基于动态微分博弈理论构建分布式需求侧管理模型,并使用粘性价格模型描述价格变化及供电商之间的策略互动行为;他们也研究风险中性和风险敏感用户,采用随机微分博弈理论建立智能电网需求响应管理的大型人口博弈框架,给出闭环对称平均场纳什均衡[19]。在上述应用微分博弈的研究中,主要关注依然集中在用户对电价响应上,供电商则对用户电力负荷做出最优反应进行价格调整,至于供电商如何采取激励措施吸引用户未加考虑。实际上,供电商作为利益趋向的个体,在决策时考虑其行为的商业性是必要的,因此将广告销售这一商业活动行为引入智能电网需求响应合乎现实需要。

广告微分博弈是经典广告竞争研究的扩展,核心思想是从微分博弈所具有的“连续”及“博弈”视角出发,丰富传统广告竞争研究。与传统广告竞争研究不同,微分博弈理论背景为其增添了动态和竞争因素[20],使得局中人决策时不仅要考虑当前结果,更要考虑未来情形。

本文使用广告微分博弈描述供电商之间的非合作博弈行为,并构建Stackelberg博弈[21]模型描述供电商与用户之间的策略互动行为。其中从电厂购买电力并销售给用户的供电商作为领导者,向供电商购买电力并使用的用户作为跟随者。供电商垄断市场并以他们期望的价格销售电力,彼此之间同时存在争抢用户的广告微分博弈。

1 系统模型

考虑一个拥有N个供电商和M个用户的智能电网系统。 $N=\{1,2,\cdots,N\} $ 表示供电商集合, $M=\{1,2,\cdots, $ $M\} $ 表示用户集合,供电商向发电厂统一购买电力然后出售给用户。

假设一个供电周期长度是一天,被分为若干时段, ${{{G}}} = \{ 1,2,\cdots,g,\cdots,G\} $ 表示这些时段的集合,每个时段长度为 $T$ 。由于时段不同,用户对电力的需求以及供电商向用户出售电价不同。用户与供电商进行Stackelberg博弈,供电商作为领导者,用户作为跟随者[21]。供电商根据用户购买的电量确定电价,并以统一价格出售电力,而彼此间亦通过广告方式相互竞争。每个时段开始时,供电商将统一定价发送给用户,用户根据价格决定自己购买电量,然后供电商根据用户需求与统一定价确定自己的广告策略。在此之后,供电商相互争抢用户直到该时段结束。以下建立模型分析时段 $g$ 内用户与供电商的策略互动行为。

1.1 用户侧优化问题

考虑某一智能小区同类型家庭用户,设用户 $i$ ( $i \in {{{M}}}$ )在时段 $g$ 内向供电商 $j$ 购买电量为 $q_{j,g}^i$ ,供电商在时段 $g$ 内单位电价为 $p_g^{}$ ,将时段 $g$ 细分为 $n$ 个小时段 ${g_l^{}},l = 1,\cdots,n$ 。在小时段 ${g_l^{}}$ 内,同一个家庭用户只能选择一家供电商,故用 $q_{g,l}^i$ 表示用户 $i$ 在时段 ${g_l^{}}$ 内实际购买电量。显然在数值上 $q_{g,l}^i = q_{j,g,l}^i$ (此处表示用户 $i$ 在小时段 ${g_l^{}}$ 向某一特定供电商 $j$ 购买电量)。由于负荷限制, $q_{g,l}^i \in [q_{g,l\min }^i,q_{g,l\max }^i]$

由于供电商购买量有限,故设供电商 $j$ 在时段 ${g_l^{}}$ 内能采购最大电量为 $Q_{g,l}^j$ 。由于电价相同,未接受广告的用户选择每个供电商可能性相同。在时段开始时,用户数量可看作平均分配,每个供电商的用户数量相等,故有 $0 {\text{<}} Mq_{j,g,l}^i {\text{<}} NQ_{g,l}^j$ 。本文采用效用函数描述用户的用电行为,由文献[22-24]可知,用户的效用函数常取为二次函数形式从而得到用户社会福利函数如下。

$ \begin{split} \qquad &U_{g,l}^i = \omega _{g,l}^iq_{g,l}^i - \frac{{\alpha _{g,l}^i}}{2}{(q_{g,l}^i)^2} - {p_g}q_{g,l}^i,\\ &q_{g,l}^i {\text{≤}} \mathop {\min }\limits_j \{ \frac{N}{M}Q_{g,l}^j\}\text{。} \end{split} $

其中, $\omega _{g,l}^iq_{g,l}^i - \dfrac{{\alpha _{g,l}^i}}{2}{(q_{g,l}^i)^2}$ 表示用户 $i$ 购买电量对其产生的效用; ${p_g}q_{g,l}^i$ 表示购买电力花费; $\omega _{g,l}^i$ $\alpha _{g,l}^i$ 为用户 $i$ 的时变参数,随用户和大时段 $g$ 变化而变化。另外,本文旨在研究同一类型用户用电情况,也就是说,对于给定时段 $g$ ,代表用户特征的参数不会因为用户不同而不同,故 $\omega _{g,l}^i = {\omega _g},\alpha _{g,l}^i = {\alpha _g}$ 。于是,每个用户需要求解以下优化问题。

$\begin{split} \qquad & \mathop {\max }\limits_{q_{g,l}^i,i \in {\rm{\mathcal{M}}}} U_{g,l}^i = \omega _g^{}q_{g,l}^i - \frac{{\alpha _g^{}}}{2}{(q_{g,l}^i)^2} - p_g^{}q_{g,l}^i \text{。}\\ &{\rm{s.t}}.\;q_{g,l}^i {\text{≤}} \mathop {\min }\limits_j \left\{ \frac{N}{M}Q_{g,l}^j\right\} \text{。} \end{split} $

可得用户在 ${g_l^{}}$ 小时段最优购买量。显然,上述问题为凸规划问题[25]。不妨记上述优化问题的解为 ${{{q}}^*} = (q_{g,l}^*,q_{g,l}^*,\cdots,q_{g,l}^*)$ 。假设用户能购买到充足的电量,则由一阶最优性条件,有

$\qquad q_{g,l}^* = \frac{{{\omega _g} - {p_g}}}{{{\alpha _g}}}\text{。}$ (1)

由于技术进步,小时段 ${g_l^{}}$ 长度大大缩短,因此对于较长时段 $g$ 而言,小时段 ${g_l^{}}$ 可近似看作点时间 $t$ 。由式(1)可知,当 ${g_l^{}}$ 被看作点时间时,用户侧优化问题最优解即为 $q_{g,t}^* = q_{g,l}^* = \dfrac{{{\omega _g} - {p_g}}}{{{\alpha _g}}}$

1.2 供电商之间的非合作广告微分博弈

设供电商 $j$ 在时段 $g$ 内在电力批发市场购买电价为 $c_g^j$ $c_g^j$ 是供电商 $j$ 的时变参数,由前文统一购电及统一定价可知 $c_g^1 = c_g^2 = \cdots = c_g^N = {c_g}$ 。供电商 $j$ 在时段 $g$ 内销售电价记为 $p_g^j = {p_g}$ ,拥有用户数为 $s_g^j$ 。由于广告效果不会无限持续,故设 $s_{1,0}^j = s_{2,0}^j = \cdots = s_{g,0}^j$ ,即每个时段开始时,供电商 $j$ 的用户数量恢复到上个时段初始状态。

供电商会对其他供电商的用户采取广告方式进行拉拢,因此会产生一部分额外支出。需要指出的是,为了避免不正当竞争,本文研究供电商广告对用户影响仅限于消费行为因素,供电商并不通过折扣,赠券等直接或间接金钱手段拉拢用户,因此用户用电量不直接受此影响。这些广告行为给供电商带来了额外成本,从而影响电价并间接影响用户电力消费行为。本文中 $N$ 个供电商彼此实力相近,故供电商 $j$ 在时段 $g$ 内抢夺的用户数量由其余 $N - 1$ 名供电商平均承担。设时段 $g$ 开始时供电商 $j$ 的用户数量为 $s_{g,0}^j$

为了更详细刻画供电商之间互相争抢用户的行为,在将时段 $g$ 细分为 $n$ 个小时段后,每个小时段 ${g_l^{}}(1 {\text{≤}} l {\text{≤}} n)$ 内供电商 $j$ 的用户变化量为 $\Delta s_{{g_l}}^j = u_{{g_l}}^j - $ $ \displaystyle\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\dfrac{{u_{{g_l}}^k}}{{N - 1}}} $ 。这里 $u_{{g_l}}^j$ 表示小时段 ${g_l^{}}$ 内供电商 $j$ 拉拢其他供电商的用户数量, $\displaystyle\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\dfrac{{u_{{g_l}}^k}}{{N - 1}}} $ 表示在这一时段内其他供电商对供电商 $j$ 的用户拉拢数量。在小时段 ${g_l^{}}$ 开始时,所有供电商通过牺牲自身部分利润(广告手段)来将其他供电商的用户转变为自己的用户。在小时段 ${g_l^{}}$ 内部,用户受供电商广告影响,考虑并决定是否要更换供电商。在这一段时间内,所有供电商的用户数量不发生变化。小时段 ${g_l^{}}$ 结束后用户们的实际所属供电商发生变化,具体表现为选择新的供电商或维持原来供电商不变。虽然就国内当前零售侧放开经验看来,用户不会在每个时段更换供电商,但是在智能电网系统先进通信技术保障下,根据国外已有实际经验,用户在短时段内更换供电商是可行的[24]

由于技术进步,每个小时段长度大大缩短,因此对于较长时段 $g$ 而言,小时段 ${g_l^{}}$ 可视作点时间 $t$ 。在此前提下, ${g_l^{}}$ 时段供电商 $j$ 的用户变化数 $\Delta s_{{g_l}}^j$ 即为用户数量变化率 $\mathop {{s^j}({g_l})}\limits^ \bullet $ ,则供电商 $j$ 在时段 $g$ 内用户数量变化率为

$\qquad\mathop {{s^j}\left( {{g_l}} \right)}\limits^ \bullet = \mathop {s_g^j\left( t \right)}\limits^ \bullet = u_g^j\left( t \right) - \sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{u_g^k\left( t \right)}}{{N - 1}}} \text{。}$ (2)

式(2)表明在每个时段内,供电商 $j$ 通过广告手段拉拢其他供电商的用户,而供电商 $j$ 的用户也会被其他供电商以类似方式拉拢。设给定时段 $g$ 内供电商 $j$ 的广告支出为 $e_g^j$ 且具有凸性,不妨记为 $e_g^j = a_g^j{(u_g^j)^2}, $ ${\rm{ }}a_g^j {\text{>}} 0$ [26]。设 $J_g^j$ 表示供电商 $j$ 在给定时段 $g$ 内支付函数, $q_{g,t}^{}$ 表示单个用户用电量(由题设可知切换供电商并不影响用户每个时刻的用电量, $q_{g,t}^{}$ 表示将时段 ${g_l^{}}$ 看作点时间 $t$ 后用户在该时段最优购电量。由于用户负荷及效用参数在小时段 ${g_l^{}}$ 内不会变化,故在时段 $g$ 内用户购电量相等),则有

$\qquad J_g^j = \int_0^T {[(p_g^{} - c_g^{})s_g^j(t)q_{g,t}^{} - a_g^ju_g^j{{(t)}^2}]} {\rm d}t\text{。}$ (3)

鉴于微分博弈能够生动刻画用户数量这一状态实时变化特征,并且能够体现局中人间的相互作用,因此可以有效解决多目标动态决策问题。故本文采用微分博弈理论将供电商之间的非合作博弈转化为最优控制问题,供电商通过控制自己转化其他供电商的用户数来改变自身收益,同时其收益也被其他供电商控制所影响。

$ \quad\left\{ \begin{array}{l} \mathop {\max }\limits_{u_g^j,j \in {\rm{\mathcal{N}}}} J_g^j = \int_0^T {[(p_g^{} - c_g^{})s_g^j(t)q_{g,t}^{} - a_g^ju_g^j{{(t)}^2}]} {\rm d}t {\text{,}} \\ {\rm{s.t}}.\;\;\;\;\mathop {s_g^j(t)}\limits^ \bullet = u_g^j(t) - \sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{u_g^k(t)}}{{N - 1}},} u_g^j(t) {\text{≥}} 0{\text{,}} \\ s_g^j(0) = s_{g,0}^j{\text{。}} \\ \end{array} \right. $ (4)

命题1  供电商 $j$ 在给定时段 $g$ 内的最优控制为

$\qquad u_g^{j*} = \frac{{ - (p_g^{} - c_g^{})q_{g,t}^{}t + (p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^j}}\text{。}$ (5)

最大支付为

$\begin{split} &\qquad J_g^{j*} = \frac{{({p_g} - c_g^{})q_{g,t}^{}A_g^j{T^3}}}{3} + \frac{{({p_g} - c_g^{})q_{g,t}^{}B_g^j{T^2}}}{2}+ \\ & ({p_g} - c_g^{})q_{g,t}^{}C_g^jT - \frac{{{{({p_g} - c_g^{})}^2}q{{_{g,t}^{}}^2}{T^3}}}{{12a_g^j}}\text{。} \\[-12pt] \end{split} $ (6)

其中,

$\qquad\begin{split} &A_g^j = \dfrac{{ - (p_g^{} - c_g^{})q_{g,t}^{}}}{{4a_g^j}} + \dfrac{1}{{N - 1}}\displaystyle\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\dfrac{{(p_g^{} - c_g^{})q_{g,t}^{}}}{{4a_g^k}}}, \\ &B_g^j = \dfrac{{(p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^j}} - \dfrac{1}{{N - 1}}\displaystyle\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\dfrac{{(p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^k}}},\\ & C_g^j = s_{g,0}^j \text{。} \end{split} $

证明  对于给定时段 $g$ ,求解以下问题:

$\begin{split}\qquad & \mathop {{\rm{ }}\max }\limits_{{\rm{ }}u_g^j,j \in {\rm{\mathcal{N}}}} {\rm{ }}J_g^j = \int_0^T {[(p_g^{} - c_g^{})s_g^j(t)q_{g,t}^{} - a_g^ju_g^j{{(t)}^2}]} {\rm d}t \\ &{\rm s.t.}\;\;\mathop {s_g^j(t)}\limits^ \bullet = u_g^j(t) - \sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{u_g^k(t)}}{{N - 1}},} \;\;\;\;\; u_g^j(t) {\text{≥}} 0, \\ &s_g^j(0) = s_{g,0}^j{\text{。}} \end{split} $

运用Pontryagin最大化原理[26],令

$\begin{split} & H_g^j = (p_g^{} - c_g^{})s_g^j(t)q_{g,t}^{} - a_g^ju_g^j{(t)^2} + \lambda _g^j\Big[u_g^j(t) -\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{u_g^k}}{{N - 1}}} \Big] \text{。} \end{split} $

求解 $\dfrac{{\partial H_g^j}}{{\partial u_g^j}} = - 2a_g^ju_g^j + \lambda _g^j = 0$ ,可得 $u_g^{j*} = \dfrac{{\lambda _g^j}}{{2a_g^j}}$ 。故 $H_g^{j*} = (p_g^{} - c_g^{})s_g^jq_{g,t}^{} + \dfrac{{\lambda {{_g^j}^2}}}{{4a_g^j}} - \lambda _g^j\displaystyle\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\dfrac{{u_g^k}}{{N - 1}}} $ ,得到伴随方程: $\mathop {\lambda _g^j}\limits^g = - \dfrac{{\partial H_g^{j*}}}{{\partial s_g^j}} = - (p_g^{} - c_g^{})q_{g,t}^{}$

由支付函数知残值始终为零,故 $\lambda _g^j(T) = 0$ ,解得 $\lambda _g^j = - (p_g^{} - c_g^{})q_{g,t}^{}t + (p_g^{} - c_g^{})q_{g,t}^{}T$ 。因此

$\qquad u_h^{j*} = \frac{{ - (p_g^{} - c_g^{})q_{g,t}^{}t + (p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^j}},$
$\begin{split} &\qquad \mathop {s_g^j(t)}\limits^ \bullet = u_g^j(t) - \sum\limits_{k \in {\rm{\mathcal{N}}},{\rm{ }}k \ne j} {\frac{{u_g^k}}{{N - 1}}}= \\ & \frac{{ - (p_g^{} - c_g^{})q_{g,t}^{}t + (p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^j}}- \\ & \frac{1}{{N - 1}}\sum\limits_{k \in {\rm{\mathcal{N}}},{\rm{ }}k \ne j} {\frac{{ - (p_g^{} - c_g^{})q_{g,t}^{}t + (p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^k}}} , \end{split} $
$\begin{split} &\qquad s_g^{j*} = \dfrac{{ - (p_g^{} - c_g^{})q_{g,t}^{}{t^2} + 2[(p_g^{} - c_g^{})q_{g,t}^{}T]t}}{{4a_g^j}} - \\ & \dfrac{1}{{N - 1}}\sum\limits_{k \in {\rm{\mathcal{N}}},{\rm{ }}k \ne j} {\dfrac{{ - (p_g^{} - c_g^{})q_{g,t}^{}{t^2} + 2[(p_g^{} - c_g^{})q_{g,t}^{}T]t}}{{4a_g^k}}} + \\ & s_{g,0}^j{\text{。}} \end{split} $

$s_g^{j*} = A_g^j{t^2} + B_g^jt + C_g^j $ ,其中,

$A_g^j = \frac{{ - (p_g^{} - c_g^{})q_{g,t}^{}}}{{4a_g^j}} + \frac{1}{{N - 1}}\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{(p_g^{} - c_g^{})q_{g,t}^{}}}{{4a_g^k}}}, $
$ B_g^j = \frac{{(p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^j}} - \frac{1}{{N - 1}}\sum\limits_{k \in {\rm{\mathcal{N}}},k \ne j} {\frac{{(p_g^{} - c_g^{})q_{g,t}^{}T}}{{2a_g^k}}} , $
$ C_g^j = s_{g,0}^j\text{。} $

代入式(4),积分后可得最大化支付。

2 供电商与用户间Stackelberg博弈

根据题设, $N$ 个供电商彼此实力相近,他们统一从电力批发市场采购电力,并以相同电价向用户出售电量。由于彼此相近的实力,仅使某个供电商支付最大的价格作为统一定价难以实现,也必然会受到其他供电商反对,故本文假定使 $N$ 个供电商支付之和最大的电价作为统一定价。用户与供电商之间博弈关系如图1所示。在此博弈中,供电商作为领导者,用户作为跟随者。用户根据供电商电价决定采购量,供电商预测到这一点,因此在决策前需要考虑的参数 $q_{g,t}^{}$ 将不再是一个给定的常数而与 ${p_g}$ 相关。因此,将 $q_{g,t}^* = q_{g,l}^* = \dfrac{{{\omega _g} - {p_g}}}{{{\alpha _g}}}$ 代入1.2节中 $q_{g,t}^{}$ ,解决支付最大化问题后,即可得到Stackelberg博弈的均衡 $(q_{g,t}^*,p_g^*)$

图 1 用户与供电商之间的博弈结构 Fig. 1 Game structure between electricity suppliers and users

命题2  供电商与用户之间Stackelberg博弈的均衡如下。

对于给定时段 $g$ ,用户订购量为 $q_{g,t}^* = \dfrac{{{\omega _g} - p{{_g^*}_{}}}}{{{\alpha _g}}}$ 。且当 $ - \dfrac{{\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {E_g^j} }}{{2\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {D_g^j} }} \in \left[0,\dfrac{{{{({\omega _g} - {c_g})}^2}}}{{4{\alpha _g}}}\right]$ 时,供电商的统一定价为

$\qquad p_g^* = \frac{{({\omega _g} + c_g^{})}}{2} + \sqrt {\frac{{{{({\omega _g} - c_g^{})}^2}}}{4} + \frac{{{\alpha _g}\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {E_g^j} }}{{2\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {D_g^j} }}_{}^{}} {\text{。}}$ (7)

$ - \dfrac{{\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {E_g^j} }}{{2\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {D_g^j} }} \notin \left[0,\dfrac{{{{({\omega _g} - {c_g})}^2}}}{{4{\alpha _g}}}\right]$ 时,供电商的统一定价为

$ \quad\quad p_g^* = \frac{{{\omega _g} + {c_g}}}{2}\text{。} $ (8)

其中, $ \displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {D_g^j} = - \displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {\dfrac{1}{{12a_g^j}}} {T^3}$ $\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {E_g^j} = MT $

证明详见附录。

3 数值仿真与分析

在智能电网配置的高性能智能设备下,用户安装的智能仪表对价格及广告信息具有快速分析和传输能力。考虑一个由3个供电商和150名用户组成的智能电网系统。每个时段长度为3 h,供电商向电力市场购买的电力价格为0.3元/(kW·h),即 $N \;= \;3$ $T =$ 3, $c = 0.3$ 。另取用户效用参数及广告参数为 $\omega _g= 2.8$ $\alpha _g = 0.2$ [5] $a_g^j = 0.1$ ,则在给定时段 $g$ 内, $\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {D_g^j} \;=\; - 67.5,$ $\displaystyle\sum\limits_{j \in {{\mathcal{N}}}} {E_g^j} \;=\; 450,$ $- \dfrac{{\displaystyle\sum\limits_{j \in {{\mathcal{N}}}} {E_g^j} }}{{2\displaystyle\sum\limits_{j \in {{\mathcal{N}}}} {D_g^j} }} \;=\; 3.333\; \in $ $ [0,\dfrac{{{{({\omega _g} - {c_g})}^2}}}{{4{\alpha _g}}}]$ $\displaystyle\sum\limits_{j \in {\rm{\mathcal{N}}}} {J_g^{j*}} = 750$ 元,单一供电商最大支付为 $J_g^{j*} = 250$ 元,统一电价为 $p_g^* = 2.496$ 元/(kW·h), $q_{g,t}^*= $ 1.518 kW·h。

固定供电商2、3的广告参数,分析广告参数对供电商1最大支付影响,可得图2。由图2可知,当供电商2、3广告参数不变时,供电商1最大支付随其广告参数 $a_g^1$ 增加而先增后减,即随着单位广告成本增加( $a_g^1$ 增大意味着招揽每名顾客所需费用增加),供电商可以通过调节己方广告策略,减少拉拢的用户人数,以降低广告总成本从而保证效益。此时其最大支付保持增加。当广告成本增加到一定程度时,减少拉拢的用户人数所节约的支付已经无法填补增加的广告成本,于是最大支付开始减少。

图 2 供电商1最大支付与其广告参数的关系 Fig. 2 Influence of advertising parameter on maximization payoff of supplier 1

在原系统下固定其他参数,分析用户规模对供电商支付的影响,得到图3图3显示供电商最大支付随着用户规模增加而增加。在能够满足用户对电力需求的前提下,用户规模越大,各供电商能够拉拢的用户也就越多,收入自然会增大。

图 3 单一供电商最大支付与用户规模M的关系 Fig. 3 Influence of scale of user on the maximized payoff of single supplier

另外,在其他参数不变前提下,分别分析统一定价对用户效用及供电商支付的影响,得到图4

图4反映了随着统一定价增加,供电商支付先增后减。在价格到达一定程度之前,价格增加带来最大支付增加,然而过高价格会降低用户购买力,最终造成支付减少。另外,由图4可知,用户的最大效用与电价成反比。在其他参数不变情况下,随着电价增加,用户最大效用逐渐减少。用电给用户带来的满足感(看电视、上网等等)不变时,用电成本越高,用户效用越差,这与实际情况相吻合。

图 4 单一供电商支付及用户效用与电价的关系 Fig. 4 The relationship between single supplier payment and electricity price and the relationship between user utility and electricity price

在原系统下通过模拟均衡状态下24 h电价与用户购电量变化情况如图5所示。

图 5 24小时电价及用户最优消费电量变化情况 Fig. 5 The change of 24-hour electricity price and user's optimal electricity consumption

图5(a)反映了24 h内实时电价变化趋势,体现出的用电高峰与低谷与实际情况也符合,体现了模型合理性。图5(b)表明模型能够达到调节用电的效果。

接下来,为体现采取广告行为供电商的优势,考虑一个由2个供电商和300名用户组成的智能电网系统,每个时段长度为3 h,供电商向发电商购买的电力价格为0.3元/(kW·h),其中, $M = 300$ $N = 2$ $T = 3$ $c = 0.3$ 。另取用户效用参数为: $\omega _g^{} = 2.8$ $\alpha _g^{} =$ 0.2。在此情境下分析其中一名供电商(供电商2)不采取广告推广,而供电商1私下采取广告行为给二者支付带来的影响。设供电商1的广告参数为 $a_g^1$ ,由于供电商2不知道供电商1采取了广告行为,统一电价按照一般Stackelberg博弈计算。分析广告参数与两名供电商最大支付关系,得到图6

图 6 供电商1、2最大支付与供电商1的广告参数的关系 Fig. 6 Influence of supplier 1′s advertising factor on the maximization payoff of supplier 1, 2

图6可知,采取广告行为的供电商1最大支付严格大于不采取广告行为的供电商2,且随着广告参数增加,供电商2最大支付增加而供电商1最大支付减少。原因在于投放广告一方使得不投放广告一方用户大量流失,从而导致其支付减少,说明了实施广告行为可以给供电商带来更大收益。在单位广告成本较高时( $a_g^1$ 较大),一方面供电商1单位广告成本增加,最大支付减少;另一方面供电商1为减少支出,会减少拉拢用户的数量,从而减少供电商2的用户流失,以致供电商2支付增加。

另外,为表明同时采取广告行为的供电商所采用的广告参数影响,考虑一个由两个供电商和100名用户组成的智能电网系统,每个时段长度为3 h,供电商批发电价为0.3元/(kW·h)。其中, $M = 100$ $N = 2$ $T = 3$ $c = 0.3$ 。另取用户效用参数如下: $\omega _g^{} = $ $ 2.8$ $\alpha _g = 0.2$ 。分析广告参数变化对电价的影响,如图7所示。

图 7 供电商的广告参数对统一电价的影响及有无广告情况下的对比 Fig. 7 Influence of advertising parameters on the electricity price with and without advertising.

图7可知,不采取广告行为时的统一电价严格低于采取广告时情形,这意味着供电商将一部分广告成本转嫁到用户身上,导致了统一电价的增加。另外,当一个供电商的广告参数给定时,统一电价随另一供电商广告参数的增加而减少,表明随着广告竞争的愈加激烈(单位广告成本的增加),统一电价逐渐降低(但是始终高于无广告行为时的统一电价)。

4 结论

本文通过引入广告微分博弈刻画供电商之间的用户拉拢竞争并使用Stackelberg博弈描述供电商和用户之间的策略互动行为来研究智能电网多供电商多用户下的实时定价问题,通过求解最终得到供电商广告微分博弈的最优控制及Stackelberg博弈的最优实时定价。数值仿真发现采取广告行为供电商的最大支付受其广告成本参数的影响,且随广告成本参数增加先增后减。在其他条件不变时,随着用户规模的增加,单一供电商最大支付会增加,且供电商定价的增加会使自身支付先增再减。因此,供电商可通过扩大用户规模来增加收益。后续对比分析发现,采取广告行为供电商支付大于不采取广告行为的供电商支付,验证了广告行为对供电商最大支付的正向作用。另外也发现供电商采取广告活动时会将一部分广告成本以电价增量的形式转移到用户身上,并且随着单位广告成本的增加统一电价逐渐降低,相应带来用户效用提高,而在其他条件不变时拥有较低广告成本参数的供电商售出电量较多。

本文着重刻画供电商之间的博弈,对用户用电偏好行为着墨较少,进一步研究方向放在复杂化用户侧的非合作博弈以及更多形式的广告博弈等方面。在现实生活中,由于一些技术原因(比如信息交流的延迟与操作延迟),决策往往无法即时产生效果。为了更贴近现实,时滞微分博弈亦应被考虑纳入研究。

参考文献
[1]
ZHANG B, HAO Z, BO Z. New development in relay protection for smart grid[J]. Protection & Control of Modern Power Systems, 2016, 1(1): 121-127.
[2]
梁甜甜, 高赐威, 王蓓蓓. 智能电网下电力需求侧管理应用[J]. 电力自动化设备, 2012, 32(5): 81-85.
LIANG Tiantian, GAO Ciwei, WANG Beibei. Applications of demand side management in smart grid[J]. Electric Power Automation Equipment, 2012, 32(5): 81-85. DOI: 10.3969/j.issn.1006-6047.2012.05.015.
[3]
SIANO P. Demand response and smart grids—A survey[J]. Renewable & Sustainable Energy Reviews, 2014, 30(2): 461-478.
[4]
FARHANGI H. The path of the smart grid[J]. IEEE Power & Energy Magazine, 2009, 8(1): 18-28.
[5]
SAMADI P, MOHSENIAN-RAD A H, SCHOBER R, et al. Optimal real-time pricing algorithm based on utility maximization for smart grid[C]. IEEE International Conference on Smart Grid Communications. Oct 4-6, 2010, Gaithersburg, MD, USA: IEEE, 2010: 415-420.
[6]
SAMIMI A, NIKZAD M, MOHAMMADI M. Real-time electricity pricing of a comprehensive demand response model in smart grids[J]. International Transactions on Electrical Energy Systems, 2017, 27(3): 1-15.
[7]
ZHU H, GAO Y, HOU Y, et al. Multi-time slots real-time pricing strategy with power fluctuation caused by operating continuity of smart home appliances[J]. Engineering Applications of Artificial Intelligence, 2018, 71: 166-174. DOI: 10.1016/j.engappai.2018.02.010.
[8]
SRINIVASAN D, RAJGARHIA S, RADHAKRISHNAN B M, et al. Game-Theory based dynamic pricing strategies for demand side management in smart grids[J]. Energy, 2017, 126: 132-143. DOI: 10.1016/j.energy.2016.11.142.
[9]
刘晓峰, 高丙团, 罗京, 等. 基于非合作博弈的居民负荷分层调度模型[J]. 电力系统自动化, 2017, 41(14): 54-60.
LIU Xiaofeng, GAO Bingtuan, LUO Jing, et al. Non-cooperative game based hierarchical dispatch model of residential loads[J]. Automation of Electric Power Systems, 2017, 41(14): 54-60. DOI: 10.7500/AEPS20170104004.
[10]
YE M, HU G. Game design and analysis for price-based demand response: an aggregate game approach[J]. IEEE Transactions on Cybernetics, 2016, 47(3): 1-11.
[11]
ZHANG Z, DENG R, YUAN T, et al. Bi-level demand response game with information sharing among consumer[J]. Ifac Papersonline, 2016, 49(7): 663-668. DOI: 10.1016/j.ifacol.2016.07.252.
[12]
代业明, 高岩, 高红伟, 等. 具有电力需求预测更新的智能电网定价机制[J]. 电力系统自动化, 2018, 42(12): 58-63.
DAI Yeming, GAO Yan, GAO Hongwei, et al. Real-time pricing mechanism in smart grid with forecasting update of power demand[J]. Automation of Electric Power Systems, 2018, 42(12): 58-63. DOI: 10.7500/AEPS20170614008.
[13]
DAI Y, GAO Y, GAO H, et al. Real-time pricing scheme based on Stackelberg game in smart grid with multiple power suppliers[J]. Neurocomputing, 2017, 260: 149-156. DOI: 10.1016/j.neucom.2017.04.027.
[14]
高红伟. 动态合作博弈[M]. 北京: 科学出版社, 2009: 302-303.
[15]
SRIKANTHA P, KUNDUR D. A DER attack-mitigation differential game for smart grid security analysis[J]. IEEE Transactions on Smart Grid, 2017, 7(3): 1476-1485.
[16]
ARAI R, YAMAMOTO K, NISHIO T, et al. Differential game-theoretic analysis on information availability in decentralized demand-side energy management systems[J]. IEICE Transactions on Communications, 2014, 97(9): 1817-1825.
[17]
FOROUZANDEHMEHR N, HAN Z, ZHENG R. Stochastic dynamic game between hydropower plant and thermal power plant in smart grid networks[J]. IEEE Systems Journal, 2016, 10(1): 88-96. DOI: 10.1109/JSYST.2014.2317555.
[18]
ZHU Q, HAN Z, BASAR T. A differential game approach to distributed demand side management in smart grid[C]// IEEE International Conference on Communications. Ottawa, Canada: IEEE, 2012: 3345-3350.
[19]
ZHU Q, BASAR T. A multi-resolution large population game framework for smart grid demand response management[C]. Network Games, Control and Optimization (NetGCooP), 2011 5th International Conference on IEEE, Paris, France: IEEE, 2011: 1-8.
[20]
蔡希杰. 基于微分博弈模型的寡头企业广告策略研究[D]. 上海: 同济大学, 2007.
CAI Xijie. Study on advertising strategy of oligopoly based on differential game model[D]. Shanghai: Tongji University, 2007.
[21]
张维迎. 博弈论与信息经济学[M]. 上海: 格致出版社, 2012: 107-110.
[22]
代业明, 高岩. 基于智能电网需求侧管理的多零售商实时定价策略[J]. 中国电机工程学报, 2014, 34(25): 4244-4249.
DAI Yeming, GAO Yan. Real-time pricing strategy with multi-retailers based on demand-side management for the smart grid[J]. Proceedings of the CSEE, 2014, 34(25): 4244-4249.
[23]
DAI Y, GAO Y, GAO H, et al. A demand response approach considering retailer incentive mechanism based on Stackelberg game in smart grid with multi-retailers[J/OL]. (2018-03-06). https://doi.org/10.1002/etep.2590.
[24]
MAHARJAN S, ZHU Q, ZHANG Y, et al. Dependable demand response management in the smart grid: A Stackelberg game approach[J]. IEEE Transactions on Smart Grid, 2013, 4(1): 120-132. DOI: 10.1109/TSG.2012.2223766.
[25]
BOYD S VANDENBERGHE L. Convex optimization[M]. New York, NY, USA: Cambridge University Press, 2004: 136-138.
[26]
DOCKNER E J, JØRGENSEN S, LONG N V, et al. Differential games in economics and management science[M]. Cambridge; Cambridge University Press, 2000: 46-58.