-
文中基于时空关联推理网络的抗干扰识别算法框架如图2所示。首先,构造训练样本数据集和测试集;其次,对训练样本的目标和干扰连通区域进行特征提取,构成的特征矢量记为:
${A_i} = \left\{ {{X_1},{X_2},{X_3}, \cdots ,{X_1}_7} \right\}$ ;然后,将得到初始网络在两个连续的时间片上展开,针对当前时刻的特征变量引入上一时刻的该特征作为其父节点,计算相邻时间片各变量之间条件分布,由此得到转移网络,建立完整的时空关联推理网络结构;最后,将特征矢量输入时空关联推理网络分类器,得到对应连通区域的识别结果。 -
为进行样本空间构建,首先进行战场态势想定,弹道中目标高度固定为6 km,目标速度固定为0.8 Ma,导弹发射距离设定为7 km,干扰弹投射距离将2000~7000 m以500 m为间隔平均划分为11种情况,水平进入角将−180°~180°以5°为间隔平均划分为73种角度,投射策略按需要划分为九种,具体如表1所示。
Total decoys Projection group number Group interval/s Number of decoys per group Decoys interval/s Maneuver 24 24 1 1 0.1 Without maneuver, turn left, jump 24 12 1 2 0.1 Without maneuver, turn left, jump 24 6 1 4 0.1 Without maneuver, turn left, jump Table 1. Interference projection strategy
根据以上态势想定,共仿真7206条弹道,将弹道全过程输出格式为256×256的单通道16位灰度图序列。提取导引头图像序列,分别进行目标和干扰区域标注,以此作为正、负样本构造如图3所示的数据集。
-
网络的节点对应一个随机变量,节点的取值既可以是连续的,也可以是离散的;有向弧代表了节点间的相互关系,两个变量之间存在依赖关系则用有向弧进行连接;节点的条件概率表用条件概率描述节点同其父节点的依赖关系的强弱。在文中,一个时间片包含17个特征节点,每个节点对应一个特征变量,其中包括长宽比、周长、能量、面积、圆形度、灰度均值、熵、傅里叶描述子分量1~10等特征。根据特征节点以及特征之间的关系、条件概率表,初始网络可以得到所有特征节点的联合概率分布。
基于构造的数据集,分别进行正、负样本图像特征提取,每一个样本
${A_i}$ 对应一组特征矢量${A_i} = \left\{ {{X_1},{X_2},{X_3}, \cdots ,{X_{17}}} \right\}$ ,形成以特征矢量为形式的正、负样本库${S_ + } = \left\{ {{A_1},{A_2},{A_3}, \cdots ,{A_P}} \right\}$ 和${S_ - } = \left\{ {{A_1},{A_2},{A_3}, \cdots ,{A_Q}} \right\}$ 。基于该样本库构建初始网络分类器的网络。首先,计算任意特征对之间的条件互信息,对所选取的17个特征节点两两进行条件互信息计算。条件互信息计算公式如下:
式中:
${x_i}$ 、$c$ 分别表示特征节点${X_i}$ 和类别节点$C$ 的取值其次,以所有特征节点为顶点构建完全无向图,并将条件互信息标记为特征节点之间弧的权重,依据条件互信息值,从大到小对两两特征之间弧排序。
最后,在选择的弧不能构成回路的约束下进行弧的筛选,选择任意一个特征节点作为起点,将弧转换为有向边,构成有向无环图。
文中17个特征构成的初始网络如图4所示。
-
一个动态贝叶斯网络[21]通常由初始网络和转移网络构成,将初始网络在两个连续的时间片上展开,针对当前时刻的特征变量引入上一时刻的该特征作为其父节点,计算相邻时间片各变量之间条件分布,由此得到转移网络。文中采用的时空关联推理网络结构如图5所示。
在时空关联推理网络中,特征变量有两种条件依赖性。第一种,每个时刻的
$ {X_i} $ 特征节点指向当前时刻$ {X_j} $ 节点的有向弧表示当前时刻不同特征节点之间的关系;第二种,连接$ t - 1 $ 时刻的$ {X_i} $ 特征节点和$ t $ 时刻$ {X_i} $ 节点的有向弧表示一个单独的特征节点随时间的发展情况。因此,构建的时空关联推理网络能够充分运用目标和干扰识别过程中的特征时变规律,利用特征变量之间的概率关系模拟特征的动态发展,并且形成一个符合特征时空约束下的推理演化模型。
-
前文的结构学习获得了特定域中每一特征变量间的相互约束关系,在此基础上需要完成参数学习过程。参数学习[22]是在给定网络结构的前提下获得相关变量之间的条件概率分布函数,表现为给定其父节点状态时该点取不同值的条件概率表,定量刻画了特征之间的依赖强度。
如果假设任意特征变量
${X_i}(0 \leqslant i \leqslant N)$ 有${r_i}$ 种取值情况,其父节点$Pa({X_i})$ 变量有${q_i}$ 种取值情况,则该特征变量的参数向量为$\theta = \{ {{\theta _{ijk}}| {i = 1,\cdots,N; j = 1,\cdots,{r_i};}} {{k = 1,\cdots,{q_i}}} \}$ ,注意$\sum\nolimits_j {{\theta _{ijk}}} = 1\forall i,k$ ,表示任意特征变量取值的概率和为1。将满足$p\left( {{X_i}\left| {Pa({X_i}) = k} \right.} \right)$ 的参数向量表示为${\theta _{i,k}} = \left\{ {{\theta _{ijk}}\left| {j = 1,\cdots,{r_i}} \right.} \right\}$ 。则要估计的参数为:参数学习主要通过样本数据统计来实现,该算法采用最大似然估计法。根据对数似然估计法可以得到:
式中:
$ {N_{ijk}} $ 代表满足$ {\theta _{ijk}} $ 的样本数量。在参数学习过程中,将时空关联推理网络看成是扩展的由时间变量联系在一起的两片初始网络组成,除了对每一片利用样本数据估计特征节点条件概率表,表2所示为其中面积特征节点的片内条件概率表,也需要估计特征节点两片之间的转移概率,表3所示为其中面积特征节点的转移概率表。
C=1 Y1 Y2 Y3 Y25 Z1 0 0 0 … 0 Z2 0.220 0 0.002 5 0 … 0 Z3 0.778 8 0.849 7 0.156 3 … 0 Z4 0.001 2 0.147 8 0.673 7 … 0 Z5 0 6.749 3e-05 0.168 2 … 0 … … … … … … Z29 0 0 0 … 0 C=0 Y1 Y2 Y3 Y25 Z1 0.475 9 0.039 0 0 … 0 Z2 0.392 0 0.479 5 0.047 3 … 0 Z3 0.129 3 0.328 3 0.401 9 … 0 Z4 0.002 9 0.105 2 0.384 1 … 0 Z5 0 0.048 0 0.070 3 … 0 … … … … … … Z29 0 0 0 … 0 Table 2. Time slice conditional probability table of area feature node
C=1 Y1 Y2 Y3 Y25 Z1 0 0 0 … 0 Z2 0 0 0.162 4 … 0 Z3 0 5.419 84-06 0.008 4 … 0 Z4 0 3.210 0e-05 0.041 3 … 0 Z5 0 0.975 6 0.945 9 … 0 … … … … … … Z29 0 0 0 … 0 C=0 Y1 Y2 Y3 Y25 Z1 0 0.006 7 0.007 3 … 0 Z2 0 0.004 3 0.042 8 … 0 Z3 0 4.022 5e-04 0.056 1 … 0 Z4 0 4.161 5e-04 0.027 1 … 0 Z5 0 0.027 3 0.051 8 … 0 … … … … … … Z29 0 0 0 … 0 注:片内概率表面积的父节点是周长;片间转移概率表面积的父节点是当前时刻的周长以及上一时刻的面积。面积特征节点的转移概率表是三维概率表,表3选取了当前时刻面积的第五个特征区间对应的父节点的转移概率表。 Table 3. Transition probability table of area feature node
-
时空关联推理网络满足齐次性假设,即
$ {B_ \to } $ 中的参数不随时间而发生变化,根据初始分布和相邻时间片之间的条件分布,可以将时空关联推理网络展开到第T个时间片。由于离散时空关联推理网络符合条件独立性假设,可得到时空关联推理网络初始时刻的概率分布为:
式中:将
$\left\{ {X_{t - 1}^1,X_{t - 1}^2, \cdots X_{{{t - 1}}}^m} \right\}$ 记为$X_{{{t - 1}}}^{1:m}$ ;$pa(X_{t - 1}^i)$ 表示$X_{t - 1}^i$ 的父节点集合。两个相邻时间片各变量之间的条件分布为:
式中:
$ X_t^i $ 为第$ t $ 个时间片上的第$ i $ 个节点;$ Pa(X_t^i) $ 为$ X_t^i $ 的父节点。第二个时间片中的每一个节点都有一个条件概率分布$P\left(X_t^{\text{i}}|Pa\left(X_t^i\right)\right)$ , t>0。节点$ X_t^i $ 的父节点$ Pa(X_t^i) $ 可以和$ X_t^i $ 在同一个时间片内,也可以在前一个时间片内。根据时空关联推理网络的齐次性假设,得到一个跨越多个时间片的联合概率分布:
式中:
$ T $ 为时空关联推理网络包含时间片个数;$ m $ 为一个时间片包含的节点数。时空关联推理网络的贝叶斯公式为:
式中:
$P\left(X_{1:T}^{1:m}|C\right)$ 表示测试数据与类别$ C $ 匹配的程度;$ P(C) $ 为类别$ C $ 的先验概率。对于一组特征值
$A_{1:2}^{1:17} = \left\{ X_1^1,X_1^2,X_1^3,\cdots ,X_2^{17}\right\}$ ,依据上节得到的每一个属性节点的片内条件概率表以及片间转移概率表,分别计算$ P(A_{1:2}^{1:17}|{C_i}) $ ,$ i = 1,2 $ 及每个类的先验概率$ P({C_i}) $ 。通过比较
$ P(A_{1:2}^{1:17}|C = 0) \cdot P(C = 0) $ 和$P\left(A_{1:2}^{1:17}|C = 1\right) \cdot P\left(C = 1\right)$ 得到对于样本$A_{1:2}^{1:17} = \{ X_1^1,X_1^2,X_1^3,...,X_2^{17}\} $ 的时空关联推理网络检测结果。若$P\left(A_{1:2}^{1:17}|C = 1\right) \cdot P(C = 1) > P\left(A_{1:2}^{1:17}|C = 0\right) \cdot P\left(C = 0\right)$ ,则该样本属于目标,反之则属于干扰。 -
综上所述,文中算法首先标记连通区域分割疑似目标区域,提取区域时空特征信息并采用动态贝叶斯推理网络识别目标,实现目标抗干扰识别。
网络训练步骤如下:
Input:training data set M
for i ← sizeof (M)
mi ←feature extraction (mi) mi ← data processing(mi)build dynamic Bayesian networks table of probability ← train DBN(M) End
Output:table of conditional probability
推理识别步骤如下:
Input:test data set X
for i ← sizeof (X)
xi ← image preprocessing(xi) r(j) ←labeling connected regions(xi) for j Aj ← feature extraction(rj) P (Target, Interference) ← Table (Aj) if P (Target) > P(Interference) then Aj is target else Aj is interference if (xi contain Target and Target is right) then Nright=Nright +1 else Nfalse=Nfalse +1 P (right) ← caculate (Nright, Nfalse) End
Output:Recognition rate P(right)
-
仿真测试数据集包括初始发射条件、目标机动、干扰投射策略三个维度的对抗条件参数,该实验所用图像数据集的对抗条件参数的量化共包含12个:
(1) 对抗态势有七个参数:目标高度、载机高度、目标速度、载机速度、水平进入角、发射距离、综合离轴角(可分解为水平离轴角、垂直离轴角);
(2) 目标机动有五种类型:无机动、左机动、右机动、跃升、俯冲;
(3) 红外干扰投放策略四个参数:总弹数、组数、弹间隔、组间隔。
因此,文中设置的仿真图像序列生成条件如下:
(1) 导弹发射距离为7000 m;
(2) 目标高度及载机高度均为6000 m;
(3) 红外点源干扰弹总数为24枚;
(4) 目标机动类型为无机动、左转、跃升;
(5) 组间隔为1.0 s,投弹组数分别为12、6;
(6) 水平进入角选取典型的±10°、±40°、±70°、±100°、±130°、±160°。
基于以上参数设置,使用红外仿真平台产生逼近实际空战对抗环境的仿真图像,数据的输出格式为256×256的单通道16位灰度图序列。
-
定义识别率如下:
式中:
${N_{right}}$ 表示正确识别的目标数;${N_{total}}$ 、${N_{false}}$ 分别表示总目标数和干扰被错判为目标的数量。用时空关联推理网络分类器对多种态势下的飞机和干扰进行识别,部分结果如图6所示,结果中,将飞机用红色矩形框标出,干扰用绿色矩形框标出。利用识别率公式计算图像序列的识别率以定量描述算法的识别性能,如表4所示。
Figure 6. Test chart of target recognition algorithm based on space-time correlation inference network
在该次实验中一共选取了25465张测试图片,采用基于时空关联推理网络的识别算法,最终统计结果为识别目标数为23937,虚警数为617,目标识别率为94%。
Launch distance/m Relative azimuth Type of maneuver Launch conditions TAN algorithm accuracy Algorithm accuracy of
this paperFiring interval Number of decoys launched Number of launch groups 7000 10° Turn left 0.4 2 24 90.73 93.29 7000 10° Jump 0.4 2 24 87.22 94.79 7000 10° Turn left 0.4 4 12 83.06 92.91 7000 10° Jump 0.4 4 12 88.18 93.93 7000 10° Turn left 0.7 2 24 93.95 92.54 7000 10° Jump 0.7 2 24 90.54 94.41 7000 10° Turn left 0.7 4 12 86.72 94.72 7000 10° Jump 0.7 4 12 91.54 94.83 7000 40° Turn left 0.4 2 24 89.22 93.13 7000 40° Jump 0.4 2 24 93.23 94.22 7000 40° Turn left 0.4 4 12 85.22 94.56 7000 40° Jump 0.4 4 12 93.48 95.05 7000 40° Turn left 0.7 2 24 91.92 93.87 7000 40° Jump 0.7 2 24 95.88 96.87 7000 40° Turn left 0.7 4 12 86.82 91.07 7000 40° Jump 0.7 4 12 96.13 95.16 7000 100° Turn left 0.4 2 24 85.51 92.32 7000 100° Jump 0.4 2 24 95.77 95.93 7000 100° Turn left 0.4 4 12 94.65 95.33 7000 100° Jump 0.4 4 12 95.32 96.55 7000 100° Turn left 0.7 2 24 85.92 92.54 7000 100° Jump 0.7 2 24 98.14 94.60 7000 100° Turn left 0.7 4 12 97.07 96.63 7000 100° Jump 0.7 4 12 97.75 94.81 7000 160° Turn left 0.4 2 24 92.50 95.15 7000 160° Jump 0.4 2 24 91.25 91.91 7000 160° Turn left 0.4 4 12 94.75 95.06 7000 160° Jump 0.4 4 12 92.00 93.72 7000 160° Turn left 0.7 2 24 95.04 96.01 7000 160° Jump 0.7 2 24 93.75 94.14 7000 160° Turn left 0.7 4 12 97.33 97.42 7000 160° Jump 0.7 4 12 94.57 95.57 Table 4. Airborne infrared target recognition algorithm test results of two algorithms
测试结果表明,在以上测试条件下,时空关联推理网络具备点源人工诱饵全程对抗能力,导弹的识别率达到94%。
Anti-interference recognition method of aerial infrared targets based on a spatio-temporal correlation inference network
doi: 10.3788/IRLA20210614
- Received Date: 2021-08-27
- Rev Recd Date: 2021-11-22
- Publish Date: 2022-08-05
-
Key words:
- infrared air-to-air missile /
- anti-interference /
- target recognition /
- space-time correlation /
- inference network
Abstract: The infrared anti-interference technique of missiles under the background of complex air combat is one of the core technologies of infrared air-to-air missiles. Aiming at the fact that traditional static Bayesian networks cannot express the dynamic relationship of feature variables in sequence images in time series, this paper proposes an anti-jamming recognition algorithm for a space-time correlation inference network that conforms to the process of human visual inference and recognition. First, the proposed space-time association reasoning network takes into account the feature space constraint relationship, introduces prior knowledge of the time constraints of feature variables, and establishes a target reasoning network recognition model that expresses the characteristic spatiotemporal relationship, thereby enhancing the stability of sequence image target recognition. Second, a sample set is built through simulation data, offline training and learning the space-time correlation inference network structure and feature jump probability parameters, to determine the probabilistic inference network to identify the offline model. Finally, based on the test data, the model is combined with the inference identification network model to perform probabilistic inference to achieve recognition and classification of targets. The experimental results show that the anti-jamming recognition rate based on the spatiotemporal correlation inference network reaches 94% under the condition of the interference of the infrared decoy, which is 3% higher than the static Bayesian network anti-jamming recognition algorithm, which effectively improves the stability of target recognition.