国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

基于內在動(dòng)機的強化學(xué)習算法在兩輪機器人中的研究
DOI:
CSTR:
作者:
作者單位:

(河北聯(lián)合大學(xué) 電氣工程學(xué)院,河北 唐山 063009)

作者簡(jiǎn)介:

任紅格(1979-),女,河北石家莊人,副教授,博士,主要從事人工智能方向的研究。 [FQ)]

通訊作者:

中圖分類(lèi)號:

基金項目:

國家自然科學(xué)基金(61203343);河北省自然基金(E2014209106)。


Reseach on Reinforcement Learning Algorithm Based on Intrinsic Motivation for Two-wheeled Robot
Author:
Affiliation:

(College of Electrical Engineering,Hebei United University,Tangshan 063009,China)

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    針對兩輪自平衡機器人在學(xué)習過(guò)程中遇到的主動(dòng)性差和以往強化學(xué)習對單步學(xué)習效率低的問(wèn)題,受心理學(xué)中內在動(dòng)機理論的啟發(fā),提出一種基于內在動(dòng)機的強化學(xué)習算法;該算法利用內在動(dòng)機信號作為內部獎勵,模擬人類(lèi)心理認知機理并與外部信號一起作用于整個(gè)學(xué)習過(guò)程,提高了智能體的自學(xué)習能力,同時(shí)采用自組織神經(jīng)網(wǎng)絡(luò )進(jìn)行訓練,保證了算法的快速性;通過(guò)無(wú)擾動(dòng)和有擾動(dòng)兩種仿真實(shí)驗的對比,驗證了基于內在動(dòng)機的強化學(xué)習算法能夠使兩輪機器人在未知環(huán)境下通過(guò)自主學(xué)習最終達到平衡,且體現了該算法的魯棒性和可行性。

    Abstract:

    Aiming at the two-wheeled self-balancing robot in the learning process encountered less-initiative and reinforcement learning to step low learning efficiency in the past, inspired by the intrinsic motivation theory from the psychology, this paper proposes a reinforcement learning algorithm based on intrinsic motivation. This algorithm uses the intrinsic motivation signal as the internal reward,then simulats human psychological mechanism, and applies to the whole learning process with the external signal. That can improve the learning ability. At the same time, by using self-organizing neural network for training, which ensures the rapidity of the system. The undisturbed and disturbed simulation experiment results prove that the reinforcement learning algorithm based on intrinsic motivation can solve the problem of autonomous learning of two-wheeled robot balance control in an unknown environment, and reflects the effectiveness and robustness of the system. 

    參考文獻
    相似文獻
    引證文獻
引用本文

任紅格,向迎帆,李福進(jìn),劉偉民.基于內在動(dòng)機的強化學(xué)習算法在兩輪機器人中的研究計算機測量與控制[J].,2015,23(9):3185-3187, 3191.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2015-03-09
  • 最后修改日期:2015-04-15
  • 錄用日期:
  • 在線(xiàn)發(fā)布日期: 2015-10-08
  • 出版日期:
文章二維碼
大关县| 临洮县| 怀化市| 白朗县| 佛山市| 涿州市| 福贡县| 临西县| 莱州市| 海林市| 清水河县| 阿巴嘎旗| 绥芬河市| 十堰市| 新乐市| 乐山市| 屯昌县| 东阳市| 宣威市| 自贡市| 离岛区| 陇西县| 孝昌县| 乐安县| 日照市| 崇明县| 杂多县| 芜湖市| 宁南县| 新巴尔虎右旗| 淮滨县| 类乌齐县| 延寿县| 融水| 丰城市| 洪江市| 天门市| 灵石县| 夏邑县| 镇雄县| 泊头市|