用于执行干扰白化操作的无线通信设备及其操作方法技术

技术编号:34383053 阅读:70 留言:0更新日期:2022-08-03 21:02
提供了一种用于执行干扰白化操作的无线通信设备及其操作方法。所述操作方法包括:获得所述无线通信设备的第一信道状态信息;从与所述干扰白化操作相关的多个模式中选择选定模式,所述选定模式对应于所述第一信道状态信息;根据所述选定模式来获得信道性能信息;以及基于所述第一信道状态信息、所述选定模式和所述信道性能信息来更新值函数期望值。所述信道性能信息来更新值函数期望值。所述信道性能信息来更新值函数期望值。

【技术实现步骤摘要】
用于执行干扰白化操作的无线通信设备及其操作方法
[0001]相关申请的交叉引用
[0002]本申请基于并要求2021年2月1日在韩国知识产权局提交的韩国专利申请No.10

2021

0014400的优先权,通过引用将其全文并入本文。


[0003]本专利技术的构思涉及无线通信设备,更具体地,涉及能够执行干扰白化操作的无线通信设备以及该无线通信设备的操作方法。

技术介绍

[0004]无线网络在有限的频带内重用频率以最大化或改善通信容量,并提高效率。例如,当无线通信设备在诸如正交频分多址(OFDMA)的环境中操作时,存在接收在基站之间交叠的信号的区域,这可能导致小区间干扰(ICI)。
[0005]在无线通信设备中,在没有关于相邻小区的特定信息的情况下,可能难以消除由于ICI引起的有色干扰。然而,无线通信设备可以通过执行干扰白化操作来有效地提高信号质量。

技术实现思路

[0006]本专利技术构思提供一种通过强化学习有效地执行干扰白化操作的无线通信设备。
[0007]根据本专利技术构思的一个方面,提供了一种执行干扰白化操作的无线通信设备的操作方法,包括:获得所述无线通信设备的第一信道状态信息;从与所述干扰白化操作相关的多个模式中选择选定模式,所述选定模式对应于所述第一信道状态信息;根据所述选定模式来获得信道性能信息;以及基于所述第一信道状态信息、所述选定模式和所述信道性能信息来更新值函数期望值。
[0008]根据本专利技术构思的一个方面,提供了一种执行干扰白化操作的无线通信设备的操作方法,包括:获得所述无线通信设备的目标信道状态信息;基于策略信息选择多个模式中的与所述目标信道状态信息相对应的目标模式,所述策略信息指定了与各个信道状态信息和各个值函数期望值相关联的所述多个模式中的每一个;以及根据所述目标模式来执行通信,其中,所述策略信息是根据针对所述多个模式中的每一个而获得的信道性能信息来确定的。
[0009]根据本专利技术构思的一个方面,提供了一种包括处理电路的无线通信设备,所述处理电路被配置为:获得第一信道状态信息;从与干扰白化操作相关的多个模式中选择选定模式,所述选定模式对应于所述第一信道状态信息;获得与所述选定模式相对应的信道性能信息;以及基于所述第一信道状态信息、所述选定模式和所述信道性能信息来更新值函数期望值。
附图说明
[0010]从以下结合附图的详细描述中,将更清楚地理解本专利技术构思的实施例,其中:
[0011]图1是示出根据本专利技术构思的实施例的无线通信设备的配置的框图;
[0012]图2是示出发生小区间干扰(ICI)的示例的图;
[0013]图3是示出根据本专利技术构思的实施例的由无线通信设备执行的更新值函数期望值的方法的流程图;
[0014]图4是示出根据本专利技术构思的实施例的由无线通信设备执行的选择多个模式之一的方法的流程图;
[0015]图5A和图5B是示出根据本专利技术构思的实施例的存储策略信息的表格的示意图;
[0016]图6是示出更新了值函数期望值的强化学习的实施例的图;
[0017]图7是示出基于从多个视点获得的即时奖励值来生成未来奖励值的示例的图;
[0018]图8是示出根据本专利技术构思的实施例的生成值函数期望值的方法的流程图;
[0019]图9是示出根据本专利技术构思的实施例的通过更新值函数期望值而改进的信道性能信息的曲线图;
[0020]图10是示出根据本专利技术构思的实施例的确定策略信息并基于所确定的策略信息确定目标模式的方法的流程图;
[0021]图11是示出根据本专利技术构思的实施例,确定最大(例如,最高)值函数期望值,并基于所确定的最大(例如,最高)值函数期望值确定是否更新策略信息的流程图;
[0022]图12是示出根据图1的实施例的由无线通信设备的组件执行的更新值函数期望值的方法的流程图;以及
[0023]图13是示出根据图1的实施例的由无线通信设备的组件执行的确定是否更新策略信息的方法的流程图。
具体实施方式
[0024]在下文中,将参考附图详细描述本专利技术构思的实施例。
[0025]图1是示出根据本专利技术构思的实施例的无线通信设备10的配置的框图。
[0026]参考图1,本专利技术构思的无线通信设备10可以包括神经处理单元(NPU)100、通信处理器200和/或存储设备300。NPU 100可以包括值函数期望值生成电路110和/或策略信息生成电路120。值函数期望值生成电路110可以基于无线通信设备10的信道状态信息和信道性能信息来生成值函数期望值。值函数期望值可以被称为根据信道状态和信道性能而获得的奖励值,并且可以包括即时奖励值和未来奖励值,信道状态和信道性能是根据是否执行干扰白化操作而确定的(如这里所使用的,即时奖励值可以指这样的值:该值所对应的时间在对应于未来奖励值的时间之前,并且不表示即时性或及时性的程度)。信道状态信息可以是指示当执行无线通信时通信状态是否良好的信息,并且可以是例如信噪比(SNR)。信道性能信息可以是指示可以通过信道传送的最大或最高数据量的信息,并且例如可以是信道容量或块差错率(BLER)。
[0027]NPU 100的策略信息生成电路120可以基于从值函数期望值生成电路110生成的或从存储设备300加载的值函数期望值来确定策略信息。例如,值函数期望值生成电路110可以生成与无线通信设备10在第一信道状态下针对多个模式中每一个执行操作的情况相对
应的多个值函数期望值,并且NPU 100可以选择多个值函数期望值中的任一个。例如,NPU 100可以从多个值函数期望值中选择具有最大值的值函数期望值作为任何一个值函数期望值。
[0028]在这点上,策略信息生成电路120可以将对应于所选择的任何一个值函数期望值的模式设置为与无线通信设备10在第一信道状态下应该执行的干扰白化相关的模式。策略信息生成电路120可以映射第一信道状态下的信道状态信息和设置的模式,以在其中模式被映射到每个信道状态信息的表中生成策略信息,但是本专利技术构思的实施例不限于此。例如,策略信息生成电路120可以针对每个信道状态信息将值函数期望值映射到多个模式,以生成策略信息。稍后将参考图5A和图5B详细描述由策略信息生成电路120生成的策略信息。
[0029]通信处理器200可以根据诸如正交频分复用(OFDM)、正交频分多址(OFDMA)、宽带码分多址(WCDMA)、高速分组接入+(HSPA+)等通信方法来处理要发送或接收的信号。此外,通信处理器200可以根据各种类型的通信方法(即,应用调制或解调基带信号的幅度和/或频率的技术的各种通信方法)来处理基带信号。
[0030]根据本专利技术构思的实施例的通信处理器200可以包括干扰白化处理器210、干扰白化控制器220和/或信道信息生成电路230。干扰白化处理器210可以基于从干扰白化控制器220输出的命令来确定是否执行干扰白化操作。当执行干扰白化操作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种执行干扰白化操作的无线通信设备的操作方法,所述操作方法包括:获得所述无线通信设备的第一信道状态信息;从与所述干扰白化操作相关的多个模式中选择选定模式,所述选定模式对应于所述第一信道状态信息;根据所述选定模式来获得信道性能信息;以及基于所述第一信道状态信息、所述选定模式和所述信道性能信息来更新值函数期望值。2.根据权利要求1所述的操作方法,其中,所述多个模式包括干扰白化启用模式和干扰白化停用模式。3.根据权利要求2所述的操作方法,其中,所述干扰白化启用模式是多个干扰白化启用模式之一,所述多个干扰白化启用模式中的每一个干扰白化启用模式对应于分配给干扰白化的资源块的不同数量。4.根据权利要求1所述的操作方法,其中,所述选择选定模式是基于关于所述第一信道状态信息的策略信息进行的。5.根据权利要求1所述的操作方法,其中所述选择选定模式包括:根据特定概率随机选择所述选定模式;以及根据所述特定概率的倒数,基于关于所述第一信道状态信息的策略信息来选择所述选定模式。6.根据权利要求5所述的操作方法,其中所述选择选定模式包括:基于获得的第一值函数期望值大于第二值函数期望值来改变所述策略信息,所述第一值函数期望值基于通过所述随机选择而获得的所述选定模式,所述第二值函数期望值基于基于所述策略信息而获得的所述选定模式。7.根据权利要求1所述的操作方法,其中,所述更新值函数期望值包括:生成与所述信道性能信息相对应的即时奖励值,所述信道性能信息与根据所述选定模式获得的第二信道状态信息相对应;以及基于所述即时奖励值和基于所述第二信道状态信息获得的未来奖励值来更新所述值函数期望值。8.根据权利要求7所述的操作方法,其中,基于所述即时奖励值和所述未来奖励值来更新所述值函数期望值包括:基于所述第二信道状态信息和与所述多个模式相对应的多个值函数期望值来确定所述未来奖励值。9.根据权利要求8所述的操作方法,其中,所述更新所述值函数期望值包括:通过基于学习率对更新期望值和先前期望值进行加权平均来生成更新值函数期望值,所述更新期望值是基于所述即时奖励值和所述未来奖励值生成的。10.根据权利要求9所述的操作方法,其中,所述生成更新值函数期望值包括:通过将所述即时奖励值与通过将所述未来奖励值乘以折扣率而获得的值相加来生成所述更新期望值。11.根据权利要求1所述的操作方法,其中,所述第一信道状态信息包括信号干扰噪声比,并且其中,所述信道性能信息包括信道容量与阈值之间的差值的绝对值。
12.根据权利要求1所述的操作方...

【专利技术属性】
技术研发人员:朴权烈姜焕民权大哲金炯钟金慧俊
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1