上海光機所高功率激光物理聯合實驗室前沿部在利用深度強化學習實現激光種子源鎖模狀態搜索研究上取得重要進展,相關成果以“Deep reinforcement with spectrum series learning control for a mode-locked fiber laser”為題發表在Photonics Research。
針對高功率激光器光纖鎖模種子源穩定鎖模狀態搜索的問題,提出了一種算法,可有效搜索耗散孤子鎖模激光器(圖1)的鎖模狀態并完成不同運行狀態之間的切換(圖2)。該算法結合了時間序列深度強化學習和長短時記憶網絡。數值模擬表明,激光腔的動態特征可以從光譜序列中獲得,與傳統的進化搜索算法相比,該模型大大提高了鎖模搜索的效率。在實驗中,所提出的算法平均只用了690ms即可獲得穩定的鎖模狀態,搜索次數比傳統方法少一個數量級,也是目前報道搜索次數最少的方法(圖3)。在16°C–30°C溫度環境下,該方法平均只需18次搜索就可以獲得穩定的鎖模狀態,極大地提高了激光器在復雜環境下的適應能力。
該方法是無模型的,因此不僅可以用于鎖模狀態的搜索,還可以獲得特殊時間-光譜特性的鎖模動力學模式,在激光時空精確調控等方面有潛在應用前景,受到國內外同行的關注。
相關研究得到了中科院先導專項A類子課題的資助。
圖1 耗散孤子鎖模激光器
圖2 時間序列深度強化學習算法模型
圖3 隨機初始狀態鎖模搜索結果
轉載請注明出處。