馬可夫決策過程

出自維基百科,自由嘅百科全書
跳去導覽 跳去搵嘢

馬可夫決策過程Markov decision process)係一種離散時間隨機過程