集思學(xué)院的「線上科研項(xiàng)目」深度強(qiáng)化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)研究,適合計(jì)算機(jī)科學(xué)、人工智能、數(shù)據(jù)科學(xué)、電子與計(jì)算機(jī)工程等專業(yè),軟件工程、自動(dòng)化等相關(guān)專業(yè)或者希望掌握強(qiáng)化學(xué)習(xí)的學(xué)生。
一、項(xiàng)目詳情
本課程讓學(xué)生通過項(xiàng)目了解如何開發(fā)基于強(qiáng)化學(xué)習(xí)的生產(chǎn)力軟件,在結(jié)束時(shí)提交項(xiàng)目個(gè)性化研究課題報(bào)告,進(jìn)行成果展示。
二、適合人群
大學(xué)生
計(jì)算機(jī)科學(xué)、人工智能、數(shù)據(jù)科學(xué)、電子與計(jì)算機(jī)工程等專業(yè),軟件工程、自動(dòng)化等相關(guān)專業(yè)或者希望掌握強(qiáng)化學(xué)習(xí)的學(xué)生;對(duì)人工智能、大數(shù)據(jù)以及交叉學(xué)科和方向感興趣的學(xué)生;學(xué)生需要具備微積分及線性代數(shù)基礎(chǔ),至少有一門編程語言的機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)經(jīng)歷。
三、項(xiàng)目大綱
強(qiáng)化學(xué)習(xí):項(xiàng)目將在本周聚焦遺傳算法和強(qiáng)化學(xué)習(xí)框架。Introduction to reinforcement learning
環(huán)境:強(qiáng)化學(xué)習(xí)由智能體和環(huán)境兩部分構(gòu)成。項(xiàng)目將在本周探討離策略、無模型強(qiáng)化學(xué)習(xí)算法Q-learning、行動(dòng)者-批評(píng)(actor-critic;AC)模型、馬爾可夫決策過程等。Environment
優(yōu)化:項(xiàng)目將在本周深入學(xué)習(xí)強(qiáng)化學(xué)習(xí)與優(yōu)化控制。Optimization
集成與控制Integration and Control
集成:項(xiàng)目將在本周進(jìn)一步探討圖神經(jīng)網(wǎng)絡(luò)(graph neural networks;GNN)、自動(dòng)機(jī)器學(xué)習(xí)(Auto ML)等。Integration
項(xiàng)目回顧與成果展示Program Review and Presentation
論文輔導(dǎo)Project Deliverables Tutoring
四、時(shí)間安排與收獲
7周在線小組科研學(xué)習(xí)+5周論文輔導(dǎo)學(xué)習(xí)共125課時(shí)
學(xué)術(shù)報(bào)告
*學(xué)員獲主導(dǎo)師Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級(jí)別索引國(guó)際會(huì)議全文投遞與發(fā)表(可用于申請(qǐng))
結(jié)業(yè)證書
成績(jī)單
集思學(xué)院是一家專業(yè)的背景提升平臺(tái),集思學(xué)院科研品牌Path Academics通過創(chuàng)新技術(shù)方法和高學(xué)術(shù)道德標(biāo)準(zhǔn),提供創(chuàng)新教育和跨學(xué)科研究項(xiàng)目,為全球大學(xué)生和優(yōu)秀高中生創(chuàng)造海外高校的教學(xué)環(huán)境。我們致力于通過實(shí)際科研學(xué)習(xí)和思考方式培養(yǎng)學(xué)生,并賦予他們能夠在下一階段學(xué)習(xí)中脫穎而出的能力。