留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于循环神经网络的超短脉冲光纤放大器模型(特邀)

张逸文 蔡宇 苑莉薪 胡明列

张逸文, 蔡宇, 苑莉薪, 胡明列. 基于循环神经网络的超短脉冲光纤放大器模型(特邀)[J]. 红外与激光工程, 2022, 51(1): 20210857. doi: 10.3788/IRLA20210857
引用本文: 张逸文, 蔡宇, 苑莉薪, 胡明列. 基于循环神经网络的超短脉冲光纤放大器模型(特邀)[J]. 红外与激光工程, 2022, 51(1): 20210857. doi: 10.3788/IRLA20210857
Zhang Yiwen, Cai Yu, Yuan Lixin, Hu Minglie. Ultra-short pulse fiber amplifier model based on recurrent neural network (Invited)[J]. Infrared and Laser Engineering, 2022, 51(1): 20210857. doi: 10.3788/IRLA20210857
Citation: Zhang Yiwen, Cai Yu, Yuan Lixin, Hu Minglie. Ultra-short pulse fiber amplifier model based on recurrent neural network (Invited)[J]. Infrared and Laser Engineering, 2022, 51(1): 20210857. doi: 10.3788/IRLA20210857

基于循环神经网络的超短脉冲光纤放大器模型(特邀)

doi: 10.3788/IRLA20210857
基金项目: 国家自然科学基金(61827821)
详细信息
    作者简介:

    张逸文,男,硕士生,主要从事中红外光纤飞秒激光放大器方面的研究

    胡明列,男,教授,博士,主要从事飞秒激光技术方面的研究

  • 中图分类号: TN241

Ultra-short pulse fiber amplifier model based on recurrent neural network (Invited)

Funds: National Natural Science Foundation of China (61827821)
  • 摘要: 针对超短脉冲光纤放大器模型复杂,计算难度大等问题,提出了一种基于门控循环单元深度学习的脉冲演化预测方法。利用初始脉冲时域和频域信息,分别训练门控循环单元模型,成功地预测了掺铥光纤放大器中脉冲非线性压缩的过程,与数值计算和实验结果匹配。相比于求解非线性薛定谔方程和能级速率方程两个偏微分方程的方法具有更高的运算速度,有利于优化放大器参数,理解超短脉冲在增益光纤中的非线性动力学过程。
  • 图  1  光纤放大器的数值计算模型示意图

    Figure  1.  Schematic of numerical calculationsmodel of fiber amplifiers

    图  2  循环神经网络结构示意图

    Figure  2.  Schematic of the recurrent neural network architecture

    图  3  分别使用NLSE&RE和RNN计算的脉冲的演化过程。(a)时域演化;(b)频域演化;(c)脉冲宽度(蓝色线)和光谱宽度(红色线)

    Figure  3.  Evolution of pulses calculated using NLSE&RE and RNN respectively. (a) Time domain evolution; (b) Frequency domain evolution; (c) Pulse width (blue line) and spectral width (red line)

    图  4  分别使用NLSE&RE(红色虚线)和RNN(蓝色实线)计算的脉冲在不同传输距离的时域和频域结果

    Figure  4.  Time domain and frequency of pulses at different transmission distances calculated using NLSE&RE (red dotted line) and RNN (blue solid line) respectively

    图  5  分别使用NLSE&RE和RNN的计算时间与网格点数和运算步长的关系

    Figure  5.  Calculation time versus number of grid points and calculation steps by using NLSE&RE and RNN respectively

    图  6  实验结果与模拟结果的对比。(a)放大器功率;(b)输出脉冲时域;(c)输出脉冲光谱,其中GNLSE&RE计算结果为红色虚线,RNN预测结果为蓝色实线,实验结果为黑色实线

    Figure  6.  Comparison of experimental results with simulation results. (a) Amplifier power; (b) Time domain of output pulses; (c) Spectrum of output pulses, where GNLSE&RE calculated results are red dotted lines, RNN predicted results are blue solid lines and experimental results are black solid lines

    表  1  模拟中使用的参数

    Table  1.   Parameters used in the simulation

    ParametersValueSourceParametersValueSource
    ${\lambda _0}/ {{\text{nm}}} $ 1 975 Measured ${\lambda _{\text{p}}}/ {{\text{nm}}} $ 793 Measured
    ${\sigma _{\text{a} } } \left({ {\lambda _j} } \right)/ { { {\text{m} }^{\text{2} } } }$ Fitted Jackson[16] ${\sigma _{\text{a} } } \left( { {\lambda _{\text{p} } } } \right)/ { { {\text{m} }^{\text{2} } } }$ $6 \times {10^{ - 25}}$ Smith[20]
    ${\sigma _{\text{e} } } \left({ {\lambda _j} } \right)/ { { {\text{m} }^{\text{2} } } }$ Fitted Jackson[16] ${\sigma _{\text{e} } }\left( { {\lambda _{\text{p} } } } \right)/ { { {\text{m} }^{\text{2} } } }$ $5 \times {10^{ - 26}}$ Smith[20]
    ${N_{\text{d}}}/ {{{\text{m}}^{-3}}} $ $1.7 \times {10^{26}}$ NUFERN $V$ 3.02 NUFERN
    ${D_{ {\text{core} } } }/ { {\text{μ} }{\rm{m} } }$ 10 NUFERN ${D_{ {\text{clad} } } }/ { {\text{μ } } }{\rm{m} }$ 130 NUFERN
    ${A_{\rm{eff} } }/{ {\text{μ } }{ {\rm{m} }^{\text{2} } } }$ 72.7 Calculated[21] ${A_{\text{p} } }/ {\text{μ } } {\text{m} }^{\text{2} }$ $1.40 \times {10^4}$ Calculated[21]
    $ {\varGamma _{\text{s}}} $ 0.88 Calculated[21] $ {\varGamma _{\text{p}}} $ $5.6 \times {10^{ - 3}}$ Calculated[21]
    ${A_{30}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{31}}/ {{{\text{s}}^{{{ - 1}}}}} $ $7 \times {10^4}$ Jackson[16]
    ${A_{32}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{20}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0
    ${A_{21}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{10}}/ {{{\text{s}}^{{{ - 1}}}}} $ 3000 Jackson[16]
    ${k_{3011} }/ { { {\text{m} }^{\text{3} } } \cdot { {\text{s} }^{ { { - 1} } } } }$ $2 \times {10^{ - 22}}$ Smith[20] $ {k_{1130}}/ {{{\text{m}}^{\text{3}}} \cdot {{\text{s}}^{{{ - 1}}}}} $ $2 \times {10^{ - 23}}$ Smith[20]
    ${k_{2011} }/ { { {\text{m} }^{\text{3} } } \cdot { {\text{s} }^{ { { - 1} } } } } $ 0 $ {k_{1120}}/ {{{\text{m}}^{\text{3}}} \cdot {{\text{s}}^{{{ - 1}}}}} $ 0
    ${\alpha _{\text{s} } }/ { { {\text{m} }^{ { { - 1} } } }}$ $2.3 \times {10^{ - 3}}$ Jackson[16] ${\alpha _{_{\text{p} } } } / { { {\text{m} }^{ { { - 1} } } }}$ $1.2 \times {10^{ - 2}}$ Jackson[16]
    ${\beta _2}/ { {\text{p} }{ {\text{s} }^{\text{2} } }\cdot{\text{k} }{ {\text{m} }^{ { { - 1} } } } }$ −88 NUFERN ${\beta _3}/ { {\text{p} }{ {\text{s} }^{\text{3} } }\cdot{\text{k} }{ {\text{m} }^{ { { - 1} } } }}$ +0.28 NUFERN
    ${n_2}/ { { {\text{m} }^{\text{2} } }\cdot{ {\text{W} }^{ { { - 1} } } } }$ $2.3 \times {10^{ - 20}}$ Agrawal[18] $\gamma / { { {\text{m} }^{ - 1} }\cdot{ {\text{W} }^{ { { - 1} } } }}$ 0.0010 Calculated[18]
    下载: 导出CSV
  • [1] Wei Z, Hu X, Wang Y. Femtosecond-pulse fiber based amplification techniques and their applications [J]. IEEE Journal of Selected Topics in Quantum Electronics, 2014, 20(5): 512-524. doi:  10.1109/JSTQE.2014.2308396
    [2] Liu W, Schimpf D N, Eidam T, et al. Pre-chirp managed nonlinear amplification in fibers delivering 100 W, 60 fs pulses [J]. Optics Letters, 2015, 40(2): 151-154. doi:  10.1364/OL.40.000151
    [3] Fermann M E, Kruglov V I, Thomsen B C, et al. Self-similar propagation and amplification of parabolic pulses in optical fibers [J]. Physical Review Letters, 2000, 84(26): 6010-6013. doi:  10.1103/PhysRevLett.84.6010
    [4] Sidorenko P, Fu W, Wise F. Nonlinear ultrafast fiber amplifiers beyond the gain-narrowing limit [J]. Optica, 2019, 6(10): 1328-1333. doi:  10.1364/OPTICA.6.001328
    [5] Nomura Y, Fuji T. Generation of watt-class, sub-50 fs pulses through nonlinear spectral broadening within a thulium-doped fiber amplifier [J]. Optics Express, 2017, 25(12): 13691-13696. doi:  10.1364/OE.25.013691
    [6] Heuermann T, Gaida C, Gebhardt M, et al. Thulium-doped nonlinear fiber amplifier delivering 50 fs pulses at 20 W of average power [J]. Optics Letters, 2018, 43(18): 4441-4444. doi:  10.1364/OL.43.004441
    [7] Huang Q, Yu T, Zu J, et al. Theoretical modeling and simulation of Tm-doped double-clad fiber amplifier[C]//Optoelectronics and Microelectronics (ICOM), 2012.
    [8] Lindberg R, Zeil P, Malmstrom M, et al. Accurate modeling of high-repetition rate ultrashort pulse amplification in optical fibers [J]. Scientific Reports, 2016, 6(1): 34742. doi:  10.1038/srep34742
    [9] Winters D G, Kirchner M S, Backus S J, et al. Electronic initiation and optimization of nonlinear polarization evolution mode-locking in a fiber laser [J]. Optics Express, 2017, 25(26): 33216-33225. doi:  10.1364/OE.25.033216
    [10] Kokhanovskiy A, Ivanenko A, Kobtsev S, et al. Machine learning methods for control of fibre lasers with double gain nonlinear loop mirror [J]. Scientific Reports, 2019, 9(1): 2916. doi:  10.1038/s41598-019-39759-1
    [11] Pu G, Yi L, Zhang L, et al. Intelligent control of mode-locked femtosecond pulses by time-stretch-assisted real-time spectral analysis [J]. Light:Science Applications, 2020, 9(1): 13. doi:  10.1038/s41377-020-0251-x
    [12] Farfan C A, Epstein J, Turner D B. Femtosecond pulse compression using a neural-network algorithm [J]. Optics Letters, 2018, 43(20): 5166-5169. doi:  10.1364/OL.43.005166
    [13] Wetzel B, Kues M, Roztocki P, et al. Customizing supercontinuum generation via on-chip adaptive temporal pulse-splitting [J]. Nature Communications, 2018, 9(1): 4884. doi:  10.1038/s41467-018-07141-w
    [14] Finot C, Gukov I, Hammani K, et al. Nonlinear sculpturing of optical pulses with normally dispersive fiber-based devices [J]. Optical Fiber Technology, 2018, 45: 306-312. doi:  10.1016/j.yofte.2018.08.007
    [15] Salmela L, Tsipinakis N, Foi A, et al. Predicting ultrafast nonlinear dynamics in fibre optics with a recurrent neural network [J]. Nature Machine Intelligence, 2021, 3(4): 344-354. doi:  10.1038/s42256-021-00297-z
    [16] Jackson S D, King T A. Theoretical modeling of Tm-doped silica fiber lasers [J]. Journal of Lightwave Technology, 1999, 17(5): 948-956. doi:  10.1109/50.762916
    [17] Zhang H, Li C, Li Y, et al. Combined model of laser rate equation and Ginzburg-Landau equation for pulsed thulium-doped fiber laser[C]//Proc SPIE, 2018: 1081118.
    [18] Agrawal G P. Nonlinear Fiber Optics[M]. 6th ed. New York: Academic Press, 2019.
    [19] Rieznik A A, Heidt A M, Konig P G, et al. Optimum integration procedures for supercontinuum simulation [J]. IEEE Photonics Journal, 2012, 4(2): 552-560. doi:  10.1109/JPHOT.2012.2188281
    [20] Smith A V, Smith J J. Mode instability thresholds for Tm-doped fiber amplifiers pumped at 790 nm [J]. Optics Express, 2016, 24(2): 975-992. doi:  10.1364/OE.24.000975
    [21] Eichhorn M. Numerical modeling of Tm-doped double-clad fluoride fiber amplifiers [J]. IEEE Journal of Quantum Electronics, 2005, 41(12): 1574-1581. doi:  10.1109/JQE.2005.858469
  • [1] 赵丽娟, 吴雨静, 徐志钮.  高阶轨道角动量传输光纤设计及传输特性研究(内封底文章) . 红外与激光工程, 2024, 53(3): 20240007-1-20240007-13. doi: 10.3788/IRLA20240007
    [2] 白振旭, 郝鑫, 郑浩, 陈晖, 齐瑶瑶, 丁洁, 颜秉政, 崔璨, 王雨雷, 吕志伟.  高功率自由空间拉曼放大技术研究进展(特邀) . 红外与激光工程, 2023, 52(8): 20230337-1-20230337-13. doi: 10.3788/IRLA20230337
    [3] 王怡哲, 喻学昊, 刘墨林, 朱能伟, 游利兵, 方晓东.  低抖动准分子激光放大器光源的研究 . 红外与激光工程, 2023, 52(3): 20220468-1-20220468-7. doi: 10.3788/IRLA20220468
    [4] 罗霄, 张民, 蒋啸天, 宋裕琛, 张希萌, 王丹石.  物理信息神经网络驱动的光纤非线性建模 . 红外与激光工程, 2023, 52(12): 20230188-1-20230188-11. doi: 10.3788/IRLA20230188
    [5] 唐瑞鑫, 段存丽.  基于亚纳秒微片激光器的能量放大器的研究 . 红外与激光工程, 2022, 51(4): 20210200-1-20210200-5. doi: 10.3788/IRLA20210200
    [6] 刘云朋, 霍晓丽, 刘智超.  基于深度学习的光纤网络异常数据检测算法 . 红外与激光工程, 2021, 50(6): 20210029-1-20210029-6. doi: 10.3788/IRLA20210029
    [7] 杜鑫彪, 陈檬, 任俊杰, 高小强.  1 kHz高倍率亚纳秒全固态激光放大器研究 . 红外与激光工程, 2020, 49(3): 0305001-0305001-5. doi: 10.3788/IRLA202049.0305001
    [8] 佘雨来, 周德俭, 陈小勇.  超低损耗孔助光纤弯曲性能优化设计 . 红外与激光工程, 2019, 48(9): 918006-0918006(7). doi: 10.3788/IRLA201948.0918006
    [9] 苗效方, 吴鹏, 赵保银.  梳状大模场光纤结构的优化设计 . 红外与激光工程, 2019, 48(9): 918005-0918005(6). doi: 10.3788/IRLA201948.0918005
    [10] 颜凡江, 杨策, 陈檬, 桑思晗, 李梦龙, 蒙裴贝.  高重频高峰值功率窄线宽激光放大器 . 红外与激光工程, 2019, 48(2): 206002-0206002(5). doi: 10.3788/IRLA201948.0206002
    [11] 周宏强, 黄玲玲, 王涌天.  深度学习算法及其在光学的应用 . 红外与激光工程, 2019, 48(12): 1226004-1226004(20). doi: 10.3788/IRLA201948.1226004
    [12] 张会新, 冯丽爽.  双绞式受抑全内反射无源光纤液位传感系统设计 . 红外与激光工程, 2017, 46(12): 1217001-1217001(6). doi: 10.3788/IRLA201746.1217001
    [13] 李建中, 刘振清, 雷江波, 刘俊.  可实现多点测量的波分复用光纤氢气传感系统 . 红外与激光工程, 2016, 45(8): 822006-0822006(7). doi: 10.3788/IRLA201645.0822006
    [14] 李建中, 刘振清, 雷江波, 刘俊.  可实现多点测量的波分复用光纤氢气传感系统 . 红外与激光工程, 2016, 45(11): 1117003-1117003(8). doi: 10.3788/IRLA201645.1117003
    [15] 李卡, 谭中伟.  空间散射光到单模光纤的耦合 . 红外与激光工程, 2016, 45(1): 122005-0122005(7). doi: 10.3788/IRLA201645.0122005
    [16] 贺静波, 许江湖.  无色散光纤信道的非线性演化 . 红外与激光工程, 2016, 45(4): 422004-0422004(5). doi: 10.3788/IRLA201645.0422004
    [17] 张鑫, 刘源, 贺岩, 杨燕, 侯霞, 陈卫标.  人眼安全高重频窄脉宽单模全光纤激光器特性研究 . 红外与激光工程, 2015, 44(4): 1105-1109.
    [18] 华弋, 肖晓晟.  波长可调节全正色散掺镱锁模光纤激光器的放大特性 . 红外与激光工程, 2014, 43(12): 3924-3927.
    [19] 陈海云, 顾铮先, 陈鑫.  倾斜长周期光纤光栅薄膜传感器特性研究 . 红外与激光工程, 2013, 42(11): 3116-3121.
    [20] 王倩, 宋兴亮, 刘广义, 范元媛, 崔惠绒, 鲍洋, 周翊.  基于迈克尔逊腔光纤激光相干合成的输出特性 . 红外与激光工程, 2013, 42(1): 73-78.
  • 加载中
图(6) / 表(1)
计量
  • 文章访问数:  351
  • HTML全文浏览量:  99
  • PDF下载量:  66
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-11-25
  • 修回日期:  2021-12-20
  • 录用日期:  2021-12-27
  • 网络出版日期:  2022-02-10
  • 刊出日期:  2022-01-31

基于循环神经网络的超短脉冲光纤放大器模型(特邀)

doi: 10.3788/IRLA20210857
    作者简介:

    张逸文,男,硕士生,主要从事中红外光纤飞秒激光放大器方面的研究

    胡明列,男,教授,博士,主要从事飞秒激光技术方面的研究

基金项目:  国家自然科学基金(61827821)
  • 中图分类号: TN241

摘要: 针对超短脉冲光纤放大器模型复杂,计算难度大等问题,提出了一种基于门控循环单元深度学习的脉冲演化预测方法。利用初始脉冲时域和频域信息,分别训练门控循环单元模型,成功地预测了掺铥光纤放大器中脉冲非线性压缩的过程,与数值计算和实验结果匹配。相比于求解非线性薛定谔方程和能级速率方程两个偏微分方程的方法具有更高的运算速度,有利于优化放大器参数,理解超短脉冲在增益光纤中的非线性动力学过程。

English Abstract

    • 高功率超短脉冲光纤激光器具有高峰值功率、宽光谱范围、输出光束质量高等优点,在工业、国防和科学研究中被广泛应用[1]。非线性放大方法相比于啁啾脉冲放大方法有利于克服增益窄化效应,输出更窄的脉冲,已经被广泛应用于产生各波段的高功率超短脉冲[2-6]。虽然非线性放大器的结构设计相对简单,但是在这样的放大器中,脉冲的演化是由非线性、色散和增益之间的相互作用决定的,实现高性能的非线性放大需要对脉冲的初始参数,光纤长度等参量仔细调整,操作难度较大。采用数值模拟的方法可预测脉冲的演变过程,帮助实验搭建,也有助于研究光纤放大器中的非线性动力学过程。超短脉冲光纤放大器的数值模型需使用能级速率方程计算增益,再与广义非线性薛定谔方程结合求解色散和非线性作用[7-8]。这样的模型包含两个偏微分方程组,一般使用龙格库塔法求解,运算量巨大。对于反向泵浦或双向泵浦结构还需使用打靶法等迭代算法,运算量进一步提升。因此,通过数值计算寻找最佳参数,研究非线性放大机理会耗费大量时间,效率不高。

      近年来,机器学习被广泛应用于超短脉冲系统的构建和优化,大幅提升了计算效率。机器学习方法可以分析输出光束与一些参数的内在联系,在改变可调参数的同时监测激光输出,使用反馈环路来获得和维持所需的最佳工作状态。多数采用前馈神经网络或者进化算法计算,已经成功应用于优化锁模激光器的工作状态[9-11],控制非线性压缩[12],产生期望的光谱[13]以及获取特定的脉冲形状[14]等多个方向。然而,这样的方法只研究了某些特定参量对输出特性的影响,不易处理对初始参数特别敏感的问题,也不适合用于分析非线性动力学过程。利用循环神经网络结构(RNN)可以预测脉冲在光纤中复杂的非线性传播过程[15],增加了控制非线性系统的自由度,拓展了机器学习在超短脉冲领域的应用场景。文中将RNN应用于预测光纤放大器中的时域和频域演化,再现了光纤放大器中脉冲压缩的非线性过程。神经网络预测的脉冲时域和频域强度的演化过程,与数值计算结果一致,并且与实验结果吻合。这种方法绕开了求解两个偏微分方程组的复杂计算,具有更高的运算效率,可以应用于快速寻找非线性放大器的最佳参数,也可以用于研究不同类型的脉冲在非线性、色散和增益共同作用下的演化过程。

    • 利用神经网络预测脉冲演化过程主要包括三个步骤:数值计算得出多组不同初始脉冲在光纤放大器中的演化过程;利用数值计算结果对神经网络进行训练;利用训练后的模型对目标问题进行预测。

      首先需要利用数值方法求解超短脉冲光纤放大器中的脉冲演化过程,文中的方法是采用高重频条件下的稳态速率方程(RE)求解增益[16-17],再与广义非线性薛定谔方程(GNLSE)结合[18],求解增益、色散和非线性的相互作用,如图1所示。偏微分方程采用四阶龙格库塔方法求解,其中GNLSE在频域内进行求解[19]。类似的算法Lindberg在掺镱光纤激光器中得到了很好的结果[8]

      图  1  光纤放大器的数值计算模型示意图

      Figure 1.  Schematic of numerical calculationsmodel of fiber amplifiers

      图中${N_0}$${N_1}$${N_2}$${N_3}$分别对应于各能级的粒子密度。$P_{\text{p}}^ + $$P_{\text{p}}^ - $分别代表正向和反向泵浦功率。$P_{\text{s}}^{}$代表信号光功率,$P_{{\text{ASE}}}^{}$代表放大自发辐射功率,g为增益。

      利用上述方法求出不同脉宽和初始啁啾的种子脉冲在2 m双包层掺铥光纤放大器中的脉冲时域和频域演化过程。模拟中使用1024个光谱/时间网格点,时间窗口大小为10 ps,步长为0.1 cm (共计2 000步)。用于训练神经网络的数据包括信号脉冲光谱强度${P}_{\text{s}}({z},\omega )$和时域强度${P}_{\text{s}}({z},{t})$在放大器中的演化过程,以及泵浦光功率${P}_{\text{p}}{}^{\pm }({z})$在放大器中的变化过程。

      文中采用的GRU结构是长短时记忆网络的一种变体,属于RNN的一种,可以很好地处理序列信息,比传统长短时记忆网络少一个门,可以在计算过程中减少多个矩阵乘法,并保持相同的运算效果。在训练数据量很大的情况下GRU能节省很多时间。

      图2为所用神经网络结构,包含一个输入层,一个GRU层,两个全连接层和一个输出层。${{z}_0} \sim {{z}_0} + 9 {\rm{d}}{z}$的信号光和泵浦光强度数据作为一组用于输入预测下一位置${{z}_0} + 10 {\rm{d}}{z}$的脉冲强度信息以及泵浦光的变化,采用十组数据是基于运算速度和精度的综合考虑。输入数据首先进入GRU层,其运送方式可以表示为:

      图  2  循环神经网络结构示意图

      Figure 2.  Schematic of the recurrent neural network architecture

      $$ \begin{split} {{z}_t} = \sigma \left( {{W_{z}} \cdot \left[ {{h_{t - 1}},{x_t}} \right]} \right) \hfill \\ {r_t} = \sigma \left( {{W_r} \cdot \left[ {{h_{t - 1}},{x_t}} \right]} \right) \hfill \\ {{\tilde h}_t} = \tan h \left( {W \cdot \left[ {{r_t}\times{h_{t - 1}},{x_t}} \right]} \right) \hfill \\ {h_t} = \left( {1 - {{z}_t}} \right)\times{h_{t - 1}} + {{z}_t}\times{{\tilde h}_t} \hfill \end{split} $$ (1)

      式中:x为输入数据;W为节点权重矩阵;zt为更新门;rt为重置门;ht为输出状态。此处的t对应于输入序列数据的位置。两个全连接层的作用是进一步提高预测精度,采用relu函数作为激活函数。输出层的激活函数为Sigmoid函数,输出数据为下一位置的强度信息。训练得到的输出数据与数值计算得到的结果进行比较,利用反向传输算法更新GRU层和两个全连接层的节点权重来减小预测误差。利用不同的初始脉冲和泵浦功率产生1000组数据由于训练,提高神经网络的精确度与泛用性。

      全部训练完成后利用更新后的节点权重对脉冲演化过程进行预测,预测过程使用的数据未在训练过程中使用。训练中使用自适应学习率RMSprop optimizer优化器提高训练效率和dropout正则化方法防止过拟合。

    • 文中比较了分别基于NLSE&RE和RNN计算放大器中脉冲的时域和频域演化过程,如图3(a) 、(b)所示。其中泵浦功率为3 W,种子光为高斯脉冲,预啁啾管理采用2.2 m高非线性光纤UHNA4 ($ {\;\beta _2} = $+93 ps2/km)。为了体现脉冲宽度和光谱宽度的变化,脉冲演化采用归一化单位,光谱演化采用对数单位,图3(c)为脉冲宽度和光谱宽度的演化过程。初始脉冲带有正啁啾,掺铥光纤工作在2 μm波段,具有反常色散$( {\beta _2} = $−88 ps2/km),放大过程中正啁啾脉冲在反常色散中伴有压缩过程。脉冲一开始峰值功率较低,色散起主要作用,脉冲宽度变窄,光谱受到增益窄化作用略有变窄。随后,由于脉冲宽度的降低,以及增益的积累,脉冲的峰值功率迅速提高,自相位调制引起光谱展宽,同时脉冲也因掺铥光纤的反常色散被快速压缩。可以看出基于RNN的预测脉冲演化规律基本与计算一致,脉冲宽度和光谱宽度的变化也基本相同。为了给出更加直观的对比,文中对比了不同传输位置处的脉冲时域和频域结果,如图4所示,由此可以看出时域和光谱强度信息都得到了很好的预测。

      图  3  分别使用NLSE&RE和RNN计算的脉冲的演化过程。(a)时域演化;(b)频域演化;(c)脉冲宽度(蓝色线)和光谱宽度(红色线)

      Figure 3.  Evolution of pulses calculated using NLSE&RE and RNN respectively. (a) Time domain evolution; (b) Frequency domain evolution; (c) Pulse width (blue line) and spectral width (red line)

      图  4  分别使用NLSE&RE(红色虚线)和RNN(蓝色实线)计算的脉冲在不同传输距离的时域和频域结果

      Figure 4.  Time domain and frequency of pulses at different transmission distances calculated using NLSE&RE (red dotted line) and RNN (blue solid line) respectively

      接下来,文中对神经网络的运算速度进行研究。神经网络的计算量主要来自于矩阵相乘运算,相比于求解NLSE&RE时多次傅里叶变换和积分运算要小很多。数值求解不同的放大器结构时,保证精度所需网格点数和计算步长有所不同。研究孤子自频移或者放大器中的超连续谱产生等问题时,必需有足够的时域宽度和网格点数才能保证运算的准确;研究高功率脉冲时,运算过程中容易产生数值不稳定,必需使用更短的步长进行计算。采用RNN方法计算时,可以通过卷积采样和归一化处理的方法使用相同的网格点数和计算步长,网络结构保持不变,运算效率更高。图5为用两种算法运算100组不同初始脉冲的运算时间随网格点数和运算步长的变化曲线。由图可以,随着运算点数的提高,运算步长的减少,NLSE&RE的求解方法运算量显著提升,相比之下RNN的速度优势更加明显。此外,文中计算能级速率方程时,基于高重复频率近似对方程进行了简化,然而对于低重频光纤放大器,需要额外求解一个偏微分方程组,采用神经网络预测的方法绕开了复杂的偏微分方程求解,更加具有优势。

      图  5  分别使用NLSE&RE和RNN的计算时间与网格点数和运算步长的关系

      Figure 5.  Calculation time versus number of grid points and calculation steps by using NLSE&RE and RNN respectively

      基于神经网络的模型预测精度很大程度上取决于用于训练的数据的可靠性,为了进一步验证NLSE&RE数值模型的准确性,文中搭建了一套高重频掺铥光纤放大系统,由振荡器、光纤脉冲展宽器和掺铥光纤放大器组成。振荡器采用色散管理非线性偏振旋转锁模光纤激光器,其工作在101 MHz,输出功率约为18 mW。种子光中心波长为1 975 nm,3 dB带宽为28 nm,带有较少的负啁啾。光纤脉冲展宽器由6 m UHNA4组成,引入了二阶色散0.56 ps2,脉冲由于色散作用可展宽至3.6 ps。脉冲经过展宽之后进入掺铥光纤放大器中,放大器增益光纤采用双包层掺铥光纤,光纤采用正向包层泵浦的方式。数值模拟使用与实验相同的参数,采用的参数及其来源被列入表1,表中$ {\lambda _0} $为信号光中心波长,$ {\lambda _{\text{p}}} $为泵浦光中心波长,$V$为光纤的归一化频率,${D_{{\text{core}}}}$为光纤纤芯直径,${D_{{\text{clad}}}}$为光纤内包层直径,$ {A_{\text{p}}} $为泵浦包层面积,${n_2}$为非线性折射率。

      表 1  模拟中使用的参数

      Table 1.  Parameters used in the simulation

      ParametersValueSourceParametersValueSource
      ${\lambda _0}/ {{\text{nm}}} $ 1 975 Measured ${\lambda _{\text{p}}}/ {{\text{nm}}} $ 793 Measured
      ${\sigma _{\text{a} } } \left({ {\lambda _j} } \right)/ { { {\text{m} }^{\text{2} } } }$ Fitted Jackson[16] ${\sigma _{\text{a} } } \left( { {\lambda _{\text{p} } } } \right)/ { { {\text{m} }^{\text{2} } } }$ $6 \times {10^{ - 25}}$ Smith[20]
      ${\sigma _{\text{e} } } \left({ {\lambda _j} } \right)/ { { {\text{m} }^{\text{2} } } }$ Fitted Jackson[16] ${\sigma _{\text{e} } }\left( { {\lambda _{\text{p} } } } \right)/ { { {\text{m} }^{\text{2} } } }$ $5 \times {10^{ - 26}}$ Smith[20]
      ${N_{\text{d}}}/ {{{\text{m}}^{-3}}} $ $1.7 \times {10^{26}}$ NUFERN $V$ 3.02 NUFERN
      ${D_{ {\text{core} } } }/ { {\text{μ} }{\rm{m} } }$ 10 NUFERN ${D_{ {\text{clad} } } }/ { {\text{μ } } }{\rm{m} }$ 130 NUFERN
      ${A_{\rm{eff} } }/{ {\text{μ } }{ {\rm{m} }^{\text{2} } } }$ 72.7 Calculated[21] ${A_{\text{p} } }/ {\text{μ } } {\text{m} }^{\text{2} }$ $1.40 \times {10^4}$ Calculated[21]
      $ {\varGamma _{\text{s}}} $ 0.88 Calculated[21] $ {\varGamma _{\text{p}}} $ $5.6 \times {10^{ - 3}}$ Calculated[21]
      ${A_{30}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{31}}/ {{{\text{s}}^{{{ - 1}}}}} $ $7 \times {10^4}$ Jackson[16]
      ${A_{32}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{20}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0
      ${A_{21}}/ {{{\text{s}}^{{{ - 1}}}}} $ 0 ${A_{10}}/ {{{\text{s}}^{{{ - 1}}}}} $ 3000 Jackson[16]
      ${k_{3011} }/ { { {\text{m} }^{\text{3} } } \cdot { {\text{s} }^{ { { - 1} } } } }$ $2 \times {10^{ - 22}}$ Smith[20] $ {k_{1130}}/ {{{\text{m}}^{\text{3}}} \cdot {{\text{s}}^{{{ - 1}}}}} $ $2 \times {10^{ - 23}}$ Smith[20]
      ${k_{2011} }/ { { {\text{m} }^{\text{3} } } \cdot { {\text{s} }^{ { { - 1} } } } } $ 0 $ {k_{1120}}/ {{{\text{m}}^{\text{3}}} \cdot {{\text{s}}^{{{ - 1}}}}} $ 0
      ${\alpha _{\text{s} } }/ { { {\text{m} }^{ { { - 1} } } }}$ $2.3 \times {10^{ - 3}}$ Jackson[16] ${\alpha _{_{\text{p} } } } / { { {\text{m} }^{ { { - 1} } } }}$ $1.2 \times {10^{ - 2}}$ Jackson[16]
      ${\beta _2}/ { {\text{p} }{ {\text{s} }^{\text{2} } }\cdot{\text{k} }{ {\text{m} }^{ { { - 1} } } } }$ −88 NUFERN ${\beta _3}/ { {\text{p} }{ {\text{s} }^{\text{3} } }\cdot{\text{k} }{ {\text{m} }^{ { { - 1} } } }}$ +0.28 NUFERN
      ${n_2}/ { { {\text{m} }^{\text{2} } }\cdot{ {\text{W} }^{ { { - 1} } } } }$ $2.3 \times {10^{ - 20}}$ Agrawal[18] $\gamma / { { {\text{m} }^{ - 1} }\cdot{ {\text{W} }^{ { { - 1} } } }}$ 0.0010 Calculated[18]

      图6(a)对比了输出功率随泵浦功率的变化过程,数值计算斜率效率为0.22,与实验测得斜率效率0.20接近,图6(b)、(c)为输出脉冲和输出光谱的比较,输出脉冲是由实验测量自相关和光谱数据通过遗传算法还原得到,模拟结果与实验结果接近,误差主要来自于模拟中种子光参数、铥离子的发射截面和吸收截面与实验中的差异。

      图  6  实验结果与模拟结果的对比。(a)放大器功率;(b)输出脉冲时域;(c)输出脉冲光谱,其中GNLSE&RE计算结果为红色虚线,RNN预测结果为蓝色实线,实验结果为黑色实线

      Figure 6.  Comparison of experimental results with simulation results. (a) Amplifier power; (b) Time domain of output pulses; (c) Spectrum of output pulses, where GNLSE&RE calculated results are red dotted lines, RNN predicted results are blue solid lines and experimental results are black solid lines

    • 文中提出了一种基于门控循环单元的超短脉冲光纤放大器预测模型,拓展了深度学习方法在光纤放大器中的应用。利用门控循环单元对序列数据的处理能力,成功预测了超短脉冲在掺铥光纤放大器中的压缩过程,模型运算速度快、精度高。该模型可以用于优化超短脉冲光纤放大器参数,例如通过调整初始脉冲中心波长、脉冲宽度、啁啾量、掺杂光纤长度等参数实现最佳放大效果,也可以用于通过计算大量脉冲演化数据研究不同非线性放大的产生机制和破坏条件,以及预测新型非线性放大结构。文中只考虑了光谱和时域强度的演化,一方面是由于强度信息在实验中可以通过直接测量得到,另一方面是由于同时考虑强度和相位信息的神经网络运算点数加倍,需要使用更多的训练节点和训练深度,训练难度更大。此外,文中只对初始脉冲强度信息和泵浦功率大小进行了训练,更加全面的模型可以将光纤参数加入训练过程。

参考文献 (21)

目录

    /

    返回文章
    返回