亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子論文>模擬數(shù)字論文>強化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛

強化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛

2017-03-14 | pdf | 566KB | 次下載 | 1積分

資料介紹

強化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用_劉飛

  RoboCup 仿真比賽提供了一個完全分布式控制、實時異步多智能體的環(huán)境,通過這個平臺,可以測試各種理論、算法和 A- gent 體系結(jié)構(gòu),在實時異步、有噪聲的對抗環(huán)境下,研究多智能體之間的合作和對抗問題。仿真比賽在一個標準的計算機環(huán)境內(nèi)進行,采用 Client/Server 方式,參賽隊伍編寫各自的客戶端程序,模擬實際足球隊員進行比賽。在 RoboCup 足球機器人仿真中使用強化學(xué)習(xí)算法必須克服幾個問題,如:多維連續(xù)的狀態(tài)空間、噪聲的影響、多智能體以及需要實時的動作。在過去的一段時間內(nèi),機器學(xué)習(xí)已經(jīng)被應(yīng)用在 RoboCup 的許多的子任務(wù)中。本文提出了將 SARSA 算法應(yīng)用在多智能體(4V3)的帶球的任務(wù)中,經(jīng)過一段時間的學(xué)習(xí)之后, 取得了理想的效果。

強化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛

  強化學(xué)習(xí)也叫激勵學(xué)習(xí)、評價學(xué)習(xí),它是智能體不斷的試探和學(xué)習(xí)的過程,通過這種試探來使系統(tǒng)行為從環(huán)境中獲得的累積獎賞值最大。其基本的模型如圖 1 所示。在強化學(xué)習(xí)中,設(shè)計算法的原則就是把外界環(huán)境轉(zhuǎn)化為最大獎勵量的方式的動作。智能體并沒有被告訴要做什么或者采取哪個動作,而是通過看哪個動作得到了最多的獎勵來自己發(fā)現(xiàn)。智能體的動作的影響不只是立即得到的獎勵,而且還影響接下來的動作和最終的獎勵。在強化學(xué)習(xí)中,環(huán)境處于狀態(tài)集合 S 中的某一狀態(tài) s,Agent 選擇動作集合 A 中的一個動作 a, 動作 a 作用于環(huán)境后會接收到一個即時獎賞 r,若 r 大于 0,則智能體以后產(chǎn)生這個動作的趨勢就會加強;反之,智能體產(chǎn)生這個動作的趨勢就會減弱。在學(xué)習(xí)系統(tǒng)的控制行為與環(huán)境反饋的狀態(tài)及評價的反復(fù)的相互作用中,以學(xué)習(xí)的方式不斷修改從狀態(tài)到動作的映射策略,以達到優(yōu)化系統(tǒng)性能目的。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1PID控制算法學(xué)習(xí)筆記資料
  2. 3.43 MB   |  3次下載  |  2 積分
  3. 2匯聯(lián)芯橋代理_HL817_USB3.1 HUB控制器 提供樣品與設(shè)計資料
  4. 1.05 MB  |  1次下載  |  免費
  5. 3VLI威鋒代理-VL103-擴展塢PD3.0協(xié)議芯片,typeCPD充電輸出DP信號 替代VL102
  6. 1.18 MB  |  1次下載  |  免費
  7. 4一種抗輻射加固檢錯糾錯電路的設(shè)計
  8. 0.32 MB   |  次下載  |  2 積分
  9. 5NVS800校驗手操器操作說明書
  10. 0.54 MB   |  次下載  |  免費
  11. 6瑞芯微代理 RK628F Datasheet V1 HDMI轉(zhuǎn)MIPI/LVDS 視頻橋接芯片
  12. 1.29 MB  |  次下載  |  免費
  13. 78232A/8232B中文數(shù)據(jù)手冊
  14. 0.57 MB   |  次下載  |  2 積分
  15. 8SW5099規(guī)格書
  16. 1.37 MB   |  次下載  |  1 積分

本月

  1. 1如何看懂電子電路圖
  2. 12.88 MB   |  272次下載  |  免費
  3. 2PC5502負載均流控制電路數(shù)據(jù)手冊
  4. 1.63 MB   |  12次下載  |  免費
  5. 3RK3588數(shù)據(jù)手冊
  6. 2.24 MB   |  12次下載  |  免費
  7. 4ESP32開發(fā)板元件資料
  8. 0.03 MB   |  8次下載  |  免費
  9. 5OAH0428 V1.0英文規(guī)格書
  10. 5.86 MB   |  8次下載  |  免費
  11. 6PC1032 5.5V_3A高效率同步降壓轉(zhuǎn)換器數(shù)據(jù)手冊
  12. 0.76 MB   |  3次下載  |  免費
  13. 7臺達變頻器VFD-M使用手冊
  14. 2.51 MB   |  3次下載  |  免費
  15. 8PID控制算法學(xué)習(xí)筆記資料
  16. 3.43 MB   |  3次下載  |  2 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935132次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191414次下載  |  10 積分
  9. 5十天學(xué)會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183349次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81599次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73818次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65990次下載  |  10 積分