第3章 基于Stackelberg博弈的功率控制抗干扰
在通信抗干扰中,为了应对干扰攻击,功率控制抗干扰属于一种常见的抗干扰方法,该方法通过调整用户发射功率的方式应对干扰攻击。对于功率控制抗干扰,当外部恶意干扰采用强干扰功率时,采用大功率进行硬抗强干扰。然而,在实际抗干扰场景中,当外部恶意干扰考虑到自身干扰代价以及恶意干扰的生存性时,常常采用小功率灵巧式干扰。此时,对于用户来说,在能够满足正常通信的前提下,应尽可能采用小功率进行通信。一方面是考虑功率代价因素;另一方面则是考虑用户防止被敌方干扰进行侦察和降低用户间互扰。针对功率控制抗干扰,已有一些相关的研究工作[24-25,88-93]。博弈论作为一种有效的数学工具可以很好地建模分析通信用户和干扰之间的对抗行为。其中,用户作为一类参与者追求有效的信息传输,而干扰作为另一类参与者干扰用户的正常通信。在众多的博弈模型中,Stackelberg博弈模型可用来建模分析博弈参与者之间的分层行为。当干扰具有智能性时,它能够学习用户的发射功率策略,从而实施有效的干扰。在这些场景中,用户和干扰之间的行为存在明显的分层特征,即用户先动而干扰后动。此时,可用Stackelberg博弈模型建模分析用户和干扰之间的分层行为。基于Stackelberg博弈的功率控制抗干扰已获得相关学者的关注,文献[24-25,88-93]研究了Stackelberg博弈功率控制抗干扰,但这些研究工作都假设用户和干扰在决策过程中双方能够获得完全的效用信息。然而,在实际通信抗干扰场景中,往往很难获得完全的信息。因此,研究不完全信息条件下的功率控制抗干扰具有一定的实际意义。
在上述研究背景下,本章内容聚焦不完全信息条件下的功率控制抗干扰。在分析过程中,本章利用 Stackelberg 博弈模型建模分析通信用户与干扰之间的行为。首先,将不完全信息条件下的抗干扰功率控制问题建模为一个贝叶斯 Stackelberg 博弈;其次,利用对偶优化理论进行分析求解,获得了该博弈的Stackelberg均衡,证明了Stackelberg均衡的存在性和唯一性,此外分析了观测误差对用户效用的影响;最后,针对目前实际的无线通信网络中大多采用离散功率策略的特点,如3GPP LTE网络、IS-95系统[104-106],而现有抗干扰Stackelberg功率控制博弈都假设为连续功率策略场景,研究了离散功率策略条件下的功率控制抗干扰方法。与连续策略相比,离散策略条件下的功率控制抗干扰面临新的挑战,现有的基于传统优化理论的方法不能直接使用。因此,在离散功率策略场景中,需要设计新的功率控制方法。本章借助于 Q学习理论[133],提出了一种分层功率控制算法(Hierarchical Power Control Algorithm,HPCA)。此外,考虑了观测误差和有限理性对用户性能的影响。