【摘要】 針對“人工智能”課程實(shí)驗(yàn)中存在的各種問題,提出在實(shí)驗(yàn)教學(xué)中引入企業(yè)云服務(wù)平臺,支持實(shí)驗(yàn)實(shí)訓(xùn)等實(shí)踐教學(xué)環(huán)節(jié)的方法。在云平臺的支持下,可以實(shí)現(xiàn)大數(shù)據(jù)量、高運(yùn)算能力要求的AI算法實(shí)驗(yàn)。云端實(shí)驗(yàn)平臺的引入豐富了教學(xué)手段,解決了實(shí)驗(yàn)算力不足、實(shí)驗(yàn)數(shù)據(jù)存儲量不足、實(shí)驗(yàn)過程難以監(jiān)控,以及實(shí)驗(yàn)教學(xué)效果難以評價(jià)的問題。實(shí)驗(yàn)平臺的引入有助于激發(fā)學(xué)生的主觀能動(dòng)性和創(chuàng)新實(shí)踐能力。
劉麗玨; 陽春華; 陳白帆; 王雅琳; 高琰, 工業(yè)和信息化教育 發(fā)表時(shí)間:2021-10-22
【關(guān)鍵詞】人工智能;云實(shí)驗(yàn);ModelArts;AI平臺;交叉學(xué)科
0 引言
人工智能主要研究如何利用計(jì)算機(jī)和自動(dòng)機(jī)去模擬、延伸、創(chuàng)造和擴(kuò)展生物的智能,設(shè)計(jì)和建造具有擬人智能水平的智能系統(tǒng)[1],并把這類系統(tǒng)應(yīng)用到科學(xué)技術(shù)、國民經(jīng)濟(jì)、社會(huì)和人民生活的各領(lǐng)域。“人工智能”課程涉及認(rèn)知科學(xué)、計(jì)算機(jī)科學(xué)、控制論、生物信息學(xué)、數(shù)學(xué)、人工生命、腦科學(xué)、心理學(xué)、生理學(xué)和哲學(xué)等學(xué)科,是一門綜合性強(qiáng)、實(shí)踐性強(qiáng)、創(chuàng)新性強(qiáng)、應(yīng)用領(lǐng)域廣、多學(xué)科高度交叉的前沿課程[2]。
中南大學(xué)自動(dòng)化學(xué)院設(shè)有智能科學(xué)與技術(shù)專業(yè),擁有國家級教學(xué)團(tuán)隊(duì)——智能科學(xué)基礎(chǔ)系列課程教學(xué)團(tuán)隊(duì)。“人工智能”課程已開設(shè)30余年,是國家級精品課程、國家級資源共享課、新世紀(jì)網(wǎng)絡(luò)課程、國家級雙語教學(xué)示范課程、國家級精品視頻公開課、中南金課、中南大學(xué)開放式精品示范課堂。“人工智能”課程以人工智能和智能系統(tǒng)理論為指導(dǎo),以智能機(jī)器人、智能識別和智能信息處理系統(tǒng)為應(yīng)用背景,依托精品課程群,發(fā)揮了示范作用[3]。
1 “人工智能”課程教學(xué)中存在的問題
隨著新一代深度感知、高速傳輸、海量存儲和智能處理等技術(shù)的不斷發(fā)展與成熟[4],人工智能技術(shù)不再是紙上談兵的理論,這對課程的實(shí)踐環(huán)節(jié)提出了更高的要求。受學(xué)校實(shí)驗(yàn)室環(huán)境和設(shè)備的限制,綜合性、前沿性實(shí)驗(yàn)難以開展,主要表現(xiàn)在如下3個(gè)方面。
(1)實(shí)驗(yàn)內(nèi)容過于簡單,缺乏綜合性實(shí)驗(yàn)。課程實(shí)驗(yàn)往往只注重對知識點(diǎn)的強(qiáng)化,而忽略了其實(shí)際應(yīng)用場景。多數(shù)實(shí)驗(yàn)均為演示型、體驗(yàn)型實(shí)驗(yàn),無法真正讓學(xué)生領(lǐng)會(huì)到實(shí)際應(yīng)用中的問題并培養(yǎng)解決問題的能力。如神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)中,只能通過演示型實(shí)驗(yàn)讓學(xué)生了解網(wǎng)絡(luò)迭代優(yōu)化的過程,而對較重要的應(yīng)用場景——圖像識別的實(shí)驗(yàn)卻難以支撐。
(2)實(shí)驗(yàn)設(shè)備老舊,無法滿足新技術(shù)要求。學(xué)校的實(shí)驗(yàn)室設(shè)備仍然停留在單臺計(jì)算機(jī)的水平,且實(shí)驗(yàn)室的設(shè)備只能在學(xué)生實(shí)驗(yàn)期間使用,學(xué)生一旦離開則不能繼續(xù)運(yùn)行。與此相對應(yīng)的,是以機(jī)器學(xué)習(xí)、深度學(xué)習(xí)為代表的主要靠數(shù)據(jù)、算力和算法支撐的新一代人工智能技術(shù)實(shí)驗(yàn)需求,其中很多實(shí)驗(yàn)需要學(xué)生長時(shí)間自行訓(xùn)練和學(xué)習(xí)。老舊設(shè)備無法承載大數(shù)據(jù)存儲和高速運(yùn)算的需求,實(shí)驗(yàn)室管理辦法也沒有跟上新的需求。即便是進(jìn)行簡單的手寫數(shù)字識別實(shí)驗(yàn),1臺實(shí)驗(yàn)室的計(jì)算機(jī)完成1次實(shí)驗(yàn)訓(xùn)練也需要15~30分鐘。
(3)實(shí)驗(yàn)考核困難,難以定量分析。由于條件限制,以往的實(shí)驗(yàn)只能是驗(yàn)證性實(shí)驗(yàn),且由于單機(jī)的形式,實(shí)驗(yàn)數(shù)據(jù)、實(shí)驗(yàn)環(huán)境難以統(tǒng)一,使得評價(jià)指標(biāo)的計(jì)算基礎(chǔ)不一致,教師對學(xué)生實(shí)驗(yàn)環(huán)節(jié)的表現(xiàn)多半只能通過實(shí)驗(yàn)報(bào)告來評價(jià)。這里面摻雜了很多主觀因素。例如,對于回歸分析的實(shí)驗(yàn),每名學(xué)生1份數(shù)據(jù),每人的機(jī)器都有區(qū)別,導(dǎo)致最后只能從擬合程度來判斷實(shí)驗(yàn)效果,而無法對時(shí)間性能、空間性能進(jìn)行更全面的評價(jià)。且數(shù)據(jù)量受到單機(jī)存儲量限制,只能進(jìn)行小樣本實(shí)驗(yàn),無法再現(xiàn)實(shí)際工作中可能出現(xiàn)的問題。
2 云實(shí)驗(yàn)的引入與設(shè)計(jì)
在高校實(shí)驗(yàn)環(huán)境建設(shè)相對落后的同時(shí),很多科技企業(yè)開始布局人工智能領(lǐng)域[5],并且推出相應(yīng)的云端計(jì)算服務(wù)平臺。ModelArts是華為公司面向開發(fā)者提供的云端AI開發(fā)平臺,為機(jī)器學(xué)習(xí)與深度學(xué)習(xí)提供海量數(shù)據(jù)預(yù)處理及半自動(dòng)化標(biāo)注、大規(guī)模分布式訓(xùn)練、自動(dòng)化模型生成,及端— 邊—云模型按需部署能力,幫助快速創(chuàng)建和部署模型,管理全周期AI工作流。中南大學(xué)于2018年底申請教育部產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目,與華為公司達(dá)成協(xié)同育人協(xié)議,將ModelArts引入“人工智能”等相關(guān)課程的實(shí)驗(yàn)教學(xué)中,為課程實(shí)驗(yàn)提供云端算力支持。
2.1 ModelArts應(yīng)用背景
ModelArts是華為公司針對AI開發(fā)者面臨的一系列困難設(shè)計(jì)開發(fā)的一站式開發(fā)平臺,所謂 “一站式”是指AI開發(fā)的各環(huán)節(jié),包括數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型部署都可以在 ModelArts上完成。從技術(shù)上看,ModelArts底層支持各種異構(gòu)計(jì)算資源,開發(fā)者可以根據(jù)需要靈活選擇使用,而不需要考慮底層的技術(shù)。同時(shí), ModelArts支持Tensorflow、PyTorch等主流開源的AI開發(fā)框架,也支持開發(fā)者使用自研的算法框架。面向不同經(jīng)驗(yàn)的AI開發(fā)者,提供便捷易用的使用流程。例如,面向業(yè)務(wù)開發(fā)者,不需關(guān)注模型或編碼,可使用自動(dòng)學(xué)習(xí)流程快速構(gòu)建AI 應(yīng)用;面向AI初學(xué)者,不需關(guān)注模型開發(fā),使用預(yù)置算法構(gòu)建AI應(yīng)用;面向AI工程師,提供多種開發(fā)環(huán)境,多種操作流程和模式,方便開發(fā)者編碼擴(kuò)展,快速構(gòu)建模型及應(yīng)用。對不同層次使用者的支持,正好符合課程實(shí)驗(yàn)中不同需求何難度的實(shí)驗(yàn)要求,非常適合作為實(shí)踐教學(xué)平臺。 ModelArts中典型的AI算法訓(xùn)練和發(fā)布流程,如圖1所示。
ModelArts預(yù)置了大量已標(biāo)注數(shù)據(jù)集,可以支持目標(biāo)檢測、目標(biāo)識別等多種任務(wù),還支持用戶上傳自建的數(shù)據(jù)集,并提供了標(biāo)注工具;在算法開發(fā)過程中,Tensorflow、PyTorch等主流框架均已集成進(jìn)去,并有大量預(yù)置算法模型供使用者選擇使用,有利于快速實(shí)現(xiàn)課堂上介紹的各種框架和算法,便于學(xué)生對之建立起感性認(rèn)識;至于訓(xùn)練模型,平臺提供分布式集群進(jìn)行訓(xùn)練,遠(yuǎn)超老舊實(shí)驗(yàn)設(shè)備所能提供的計(jì)算資源,大大縮短了訓(xùn)練時(shí)間,另外零編程的自動(dòng)學(xué)習(xí)方式方便課堂演示實(shí)驗(yàn)效果,激發(fā)學(xué)生的學(xué)習(xí)興趣;訓(xùn)練后的模型可以很容易地進(jìn)行部署,提供預(yù)測推理功能,支持各類應(yīng)用。
2.2 課程實(shí)驗(yàn)安排
“人工智能”課程作為智能科學(xué)與技術(shù)專業(yè)的專業(yè)基礎(chǔ)課,在涉及機(jī)器學(xué)習(xí)部分的教學(xué)中主要關(guān)注學(xué)生的基本理論學(xué)習(xí)和應(yīng)用體會(huì)。學(xué)生在這部分學(xué)習(xí)中主要需要了解學(xué)習(xí)系統(tǒng)的構(gòu)建過程及可能遇到的各種問題,讓學(xué)生在實(shí)驗(yàn)過程中對技術(shù)的應(yīng)用先有整體認(rèn)識,以便在后續(xù)的“模式識別”“機(jī)器學(xué)習(xí)”等課程中更加關(guān)注具體的技術(shù)和方法。結(jié)合ModelArts功能和課程實(shí)際情況,課程實(shí)驗(yàn)內(nèi)容設(shè)計(jì)如下。
(1)回歸分析。①分析胚胎發(fā)育B超測量數(shù)據(jù),利用ModelArts開發(fā)環(huán)境中的Notebook自編代碼,建立合適的回歸模型,進(jìn)行胚胎發(fā)育情況的趨勢模型編寫,并對指定測試集的數(shù)據(jù)進(jìn)行預(yù)測;②前列腺癌預(yù)測,利用ModelArts開發(fā)環(huán)境中的Notebook自編代碼,對前列腺癌數(shù)據(jù)進(jìn)行回歸分析,統(tǒng)一測試集進(jìn)行測試。
(2)手寫數(shù)字識別。①利用ModelArts上的 Minist手寫數(shù)字集,訓(xùn)練和測試手寫數(shù)字識別; ②將回歸模型稍加修改,遷移到美國郵政編碼手寫數(shù)字集的數(shù)字識別上,檢測識別率并進(jìn)行改進(jìn)。
(3)找校徽。請學(xué)生搜集校園中各處出現(xiàn)的中南大學(xué)校徽圖片,統(tǒng)一形成數(shù)據(jù)集上傳ModelArts,利用平臺標(biāo)注工具為數(shù)據(jù)進(jìn)行標(biāo)注,仿照云平臺中的“找云寶”實(shí)驗(yàn),完成找校徽實(shí)驗(yàn)。實(shí)驗(yàn)的設(shè)計(jì)從易到難,先完成線上編程,再完成從數(shù)據(jù)到應(yīng)用的完整實(shí)驗(yàn)流程,讓學(xué)生在實(shí)踐過程中不斷提高解決問題的能力。實(shí)驗(yàn)以分組形式完成,每名學(xué)生均需完成所有實(shí)驗(yàn)內(nèi)容,但可取最好的實(shí)驗(yàn)結(jié)果作為本組的最后成績。實(shí)驗(yàn)完成后組織集體匯報(bào),學(xué)生以組為單位匯報(bào)實(shí)驗(yàn)內(nèi)容與結(jié)果,同時(shí)統(tǒng)計(jì)每組最終成績,公布排行榜。每名學(xué)生在每個(gè)實(shí)驗(yàn)部分的得分按照其個(gè)人在組內(nèi)排名和整組排名綜合計(jì)算。
3 云實(shí)驗(yàn)教學(xué)特色
(1)課堂教學(xué)手段更加豐富。以往受制于計(jì)算資源,課堂上的案例都只能給出過程描述和結(jié)果截圖,引入云端資源后,即便是在教室的機(jī)器上,也可以通過實(shí)操來向?qū)W生展示教學(xué)案例的實(shí)現(xiàn)過程,使其對其中的問題和解決辦法有更直觀的認(rèn)識。
(2)實(shí)驗(yàn)安排更加靈活。專業(yè)課的授課學(xué)生普遍較少,其中的實(shí)驗(yàn)學(xué)時(shí)就更少了。以往2學(xué)時(shí)實(shí)驗(yàn)的安排及集中在實(shí)驗(yàn)室進(jìn)行的方式都使得大規(guī)模綜合性實(shí)驗(yàn)難以開展。云實(shí)驗(yàn)的出現(xiàn),使學(xué)生可以不受空間和時(shí)間的限制,同時(shí)擴(kuò)大了實(shí)驗(yàn)內(nèi)容的范圍。
(3)學(xué)生學(xué)習(xí)更加主動(dòng)。隨著實(shí)驗(yàn)內(nèi)容綜合性、實(shí)用性的提高,學(xué)生完成實(shí)驗(yàn)的熱情也逐漸提高。演示型、體驗(yàn)型實(shí)驗(yàn)學(xué)生只能被動(dòng)參與,云實(shí)驗(yàn)由于只限定了輸入、輸出及基本辦法,具體的處理過程和方法細(xì)節(jié)都可以由學(xué)生設(shè)計(jì),臺可為培養(yǎng)大數(shù)據(jù)應(yīng)用型人才提供重要保障,滿足師生多元化與多終端的需求。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >