地區(qū)
英國
美國
中國香港
新加坡
澳大利亞
院校庫
學(xué)校庫
專業(yè)庫
排名庫
認(rèn)證查詢
英國選校
學(xué)員錄取
成功案例
錄取報(bào)告
本科戰(zhàn)績
南極星計(jì)劃
留學(xué)資訊
背景提升
背提項(xiàng)目
實(shí)習(xí)內(nèi)推
高頻競賽
背提免費(fèi)課
顧問團(tuán)隊(duì)
資料庫
關(guān)于我們
服務(wù)項(xiàng)目
指南動態(tài)
聯(lián)系我們
App下載
本科留學(xué)
留學(xué)考研雙保險(xiǎn)
2025 QS
英國留學(xué)選校查詢
登錄
GPA 81,我選擇“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”項(xiàng)目提升背景!
關(guān)注已取消
關(guān)注成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{ !collectStatus ? '+' : '' }}
{{!collectStatus ? '關(guān)注' : '已關(guān)注'}}
預(yù)約咨詢
GPA 81,我選擇“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”項(xiàng)目提升背景!
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學(xué) Journey
2022年10月24日
閱讀量:1941
<p style="text-align: justify;"><img style="width: 808px; height: 61px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1666599255621/1666599255621.png" width="808" height="61" /></p> <p style="text-align: justify;"><strong>學(xué)員背景</strong><br />W同學(xué)<br /><strong>本科背景</strong><br />南京理工大學(xué) 通信工程<br />GPA 81.2<br /><strong>背提項(xiàng)目</strong><br />指南者留學(xué)機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)<br />匯豐銀行外幣理財(cái)用戶購買意愿預(yù)測</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">01 契機(jī)背景</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我是一名大四的本科生,在大三升大四的暑假參加了指南者留學(xué)的機(jī)器學(xué)習(xí)背景提升項(xiàng)目,主要內(nèi)容是匯豐銀行外幣理財(cái)用戶購買意愿預(yù)測。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><strong>首先,我想談一談為什么選擇指南者的背景提升項(xiàng)目。</strong></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在大學(xué)前三年的學(xué)習(xí)中,作為電子信息類專業(yè)的學(xué)生,除了需要接觸大量的與電子學(xué)科相關(guān)理論,編程能力也是很重要的一部分,誰能夠?qū)⑵骷睦碚撝R與編程代碼相結(jié)合,誰就能在短時(shí)間內(nèi)實(shí)現(xiàn)器件功能的設(shè)計(jì),并且相較于一些傳統(tǒng)的電子設(shè)計(jì)軟件,通過編程設(shè)計(jì)出來的器件能夠更好的實(shí)現(xiàn)功能的多樣性和創(chuàng)新性。譬如在一個(gè)傳統(tǒng)芯片的設(shè)計(jì)中,可能添加一個(gè)功能就需要在版圖上進(jìn)行全部芯線的重新連接和繪制,但在數(shù)字化的芯片設(shè)計(jì)中只需要添加或修改其中的一部分代碼。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">其次,是為了個(gè)人能力的進(jìn)一步提升。在本科的學(xué)習(xí)過程中,我從未接觸過python這類語言,也未參與過機(jī)器學(xué)習(xí)相關(guān)的課程,但python無疑是當(dāng)下最熱門的計(jì)算機(jī)語言之一,“大數(shù)據(jù)分析+機(jī)器學(xué)習(xí)”的模式也無疑是當(dāng)下最熱門的項(xiàng)目之一。<strong>我希望能通過我的個(gè)人能力,對某類數(shù)據(jù)集實(shí)現(xiàn)從無到有、從復(fù)雜到簡單的分析過程,能夠從單一的數(shù)字中挖掘出有用的信息。</strong>這對我來說是一個(gè)全新的項(xiàng)目和挑戰(zhàn),而指南者的背提項(xiàng)目恰好給予了我這一機(jī)會。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最后一條是為了<strong>彌補(bǔ)自己在留學(xué)申請時(shí)科研項(xiàng)目上的空缺</strong>。在大學(xué)階段我雖然完成了不少實(shí)驗(yàn)和課程設(shè)計(jì),但所接觸的科研經(jīng)歷總體較少,而在院校申請時(shí)科研項(xiàng)目經(jīng)歷又是很被看重的一方面,因此這一機(jī)會成為了我背景提升的“救命稻草”。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">02 項(xiàng)目過程及收獲</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">主要的項(xiàng)目過程是首先通過老師的課程學(xué)習(xí)相關(guān)的基礎(chǔ)知識,譬如科研項(xiàng)目的一般流程、機(jī)器學(xué)習(xí)的項(xiàng)目簡介、Numpy庫、Matplotlib庫、Pandas庫、數(shù)據(jù)清洗的一般方法、回歸模型、分類模型、評價(jià)指標(biāo)等。每一次課程都會對應(yīng)著相關(guān)的作業(yè)(主要是對老師給的題目進(jìn)行編程并寫一份簡單的報(bào)告),之后老師會集中幾次作業(yè)的情況對我的作業(yè)進(jìn)行單獨(dú)講解,這個(gè)過程大約持續(xù)了3~4周。這些作業(yè)內(nèi)容幫助我很好地理解了課程的相關(guān)內(nèi)容,并進(jìn)一步加深了對python編程的理解。</p> <p style="text-align: justify;"><img style="width: 501px; height: 708px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phppPkePE.jpg" width="501" height="708" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">完成了上述課程的學(xué)習(xí)之后就進(jìn)入了具體的項(xiàng)目實(shí)戰(zhàn)。我的項(xiàng)目內(nèi)容主要是結(jié)合匯豐銀行以往的用戶購買外匯理財(cái)產(chǎn)品的數(shù)據(jù)以及用戶本身的信息(如住房情況、信貸狀況、家庭背景、工作信息等)來進(jìn)行有效特征的篩選,也就是從其中挑選出對購買理財(cái)產(chǎn)品影響因子較大的因素放入最終的模型,而無關(guān)的因素則可以刪去,并且通過用戶自身信息與過往金融行為來搭建購買意愿預(yù)測系統(tǒng),提高最終預(yù)測模型的效率。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先需要在數(shù)據(jù)預(yù)處理中進(jìn)行了缺失值填補(bǔ)、獨(dú)熱編碼等步驟,并進(jìn)行了樸素的過采樣處理保證數(shù)據(jù)集的平衡性。在數(shù)據(jù)處理的第一步我就碰到了問題,但我的指導(dǎo)老師梅老師一直對我的每次問題進(jìn)行了詳細(xì)的解答,為我省去了很多不必要的麻煩。<br /><img style="width: 705px; height: 564px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_php0YtJy9.jpg" width="705" height="564" /><img style="width: 711px; height: 358px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpiWsblT.jpg" width="711" height="358" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在進(jìn)行模型搭建之前先對數(shù)據(jù)進(jìn)行一定的清洗,畢竟在以后面對實(shí)際的數(shù)據(jù)集時(shí),不可能得到一個(gè)完完整整的數(shù)據(jù)庫,因此數(shù)據(jù)清洗是必要的,以某數(shù)據(jù)集為例統(tǒng)計(jì)可得到該數(shù)據(jù)集共有19439行損失,64列損失。查看每列數(shù)據(jù)的缺失值比例,其中部分結(jié)果如下:</p> <p style="text-align: justify;"><img style="width: 770px; height: 259px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpce4a2H.jpg" width="770" height="259" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">從中可以看出,該數(shù)據(jù)集中有大量的缺失值,出于下一步模型的需要因此不能進(jìn)行簡單的刪除,對此我使用Imputer進(jìn)行了缺失值填補(bǔ)等數(shù)據(jù)預(yù)處理步驟。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">同時(shí),在該數(shù)據(jù)集中有幾個(gè)特征是無序的分類特征。為了處理這一問題,我進(jìn)行了獨(dú)熱編碼等步驟,即為每一個(gè)無序分類特征的每一個(gè)可能的類別創(chuàng)建一個(gè)“虛擬”變量。經(jīng)過以上處理之后數(shù)據(jù)集就顯得有序了許多,于是就開始進(jìn)行下面的步驟。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在特征抽取步驟中,我使用了GBDT和PCA的方法進(jìn)行,兩種方法各有優(yōu)點(diǎn)和缺點(diǎn),我都進(jìn)行了嘗試并對相應(yīng)的結(jié)果進(jìn)行了對比。在本項(xiàng)目中的PCA降維中,可以繪制出n_components與cum_explained_variance_ratio對應(yīng)的圖像曲線如下,最終選擇n=20作為新生成的特征個(gè)數(shù)。<br /><img style="width: 663px; height: 403px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phphUBVKS.jpg" width="663" height="403" /></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最終結(jié)合了測試集上的指標(biāo)以及模型的運(yùn)算量大小等綜合因素,本項(xiàng)目采用PCA的特征抽取方法。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">在特征過濾中主要選擇了方差選擇法、遞歸特征消除法和基于懲罰項(xiàng)的特征選擇法,并對原理和結(jié)果進(jìn)行了說明。最后利用不同的機(jī)器學(xué)習(xí)算法分別進(jìn)行交叉驗(yàn)證和網(wǎng)格搜索確定模型的參數(shù)(如:n_estimators、max_depth等)并對該數(shù)據(jù)集進(jìn)行預(yù)測,例如隨機(jī)森林、邏輯回歸、stacking集成等,最后通過AUC和ROC等評價(jià)指標(biāo)的對比分析確定最佳模型,即隨機(jī)森林模型可以對銀行外幣理財(cái)用戶購買意愿起到比較好的預(yù)測效果。該系統(tǒng)還可以通過數(shù)據(jù)來對用戶的購買意愿進(jìn)行判斷,并且提供意愿排名,來更為精準(zhǔn)的找到意愿強(qiáng)烈的客戶提高產(chǎn)品的購買率。</p> <p style="text-align: justify;"><img style="width: 808px; height: 1143px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpfWE8NC.jpg" width="808" height="1143" /><img style="width: 808px; height: 1142px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpjnjsFK.jpg" width="808" height="1142" /><img style="width: 808px; height: 1142px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpGloUsz.jpg" width="808" height="1142" /></p> <p style="text-align: center;"><span class="h6">(我的最終報(bào)告部分展示)</span></p> <p style="text-align: center;"> </p> <p style="text-align: justify;"><span class="h1">03 收獲與感悟</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">最后我還想談一談我在這一過程中的收獲。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先是指南者的背景提升項(xiàng)目讓我更加<strong>清楚了自身的興趣和學(xué)習(xí)的意義</strong>,書本上的理論知識雖然是枯燥的但也是必備的,如何將這些理論知識運(yùn)用到實(shí)踐中去并取得真正有意義的成果才是最重要的,而成果是否有意義的重要衡量標(biāo)準(zhǔn)之一就是是否能解決實(shí)際問題,本次的背提項(xiàng)目讓我看到了知識與實(shí)踐融合的魅力。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">第二是<strong>讓我在留學(xué)申請中提升了自己的競爭力</strong>,對于科研小白的我來說,這無疑是我的申請簡歷中濃墨重彩的一筆,該項(xiàng)目不僅是對我個(gè)人能力的證明,也能夠幫助申請?jiān)盒5睦蠋焸冞M(jìn)一步了解我。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">第三是<strong>提高了我對新事物的接受能力</strong>,從接觸一門全新的編程語言到能夠最終完成該項(xiàng)目,這對我來說是一次挑戰(zhàn)也是一次飛躍,這讓我對接下來的學(xué)習(xí)生活更有自信。</p> <p style="text-align: justify;"><img style="width: 808px; height: 188px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1666599264914/1666599264914.png" width="808" height="188" /></p>
猜你喜歡
壓績點(diǎn)是壞文明
1604
死磕雅思沒用,有人不是那塊料
1499
海外名校1v1科研:基于深度學(xué)習(xí)的中國租房通脹預(yù)測|收獲一作論文與導(dǎo)師推薦信!
21665
背景提升學(xué)員|喜報(bào)!新國立、南洋理工、港大、港城、悉尼大學(xué)、曼大、華威、伊利諾伊香檳分校offer來了!
21699
對機(jī)器學(xué)習(xí)感興趣?不如先來實(shí)踐一下?。短厮估囕v故障自動檢測系統(tǒng)》
21610
曼大范教授1v1科研:溫和條件下CO2催化制甲醇:新型催化劑的研發(fā)|收獲一作論文與導(dǎo)師推薦信!
21522
預(yù)約咨詢
預(yù)約咨詢
七日熱點(diǎn)資訊
港大面試遭拒,但世界第二的帝國理工學(xué)院錄了我!211的我擺爛一年后,中了offer彩票,拿下IC錄?。?/div>
在紐約大學(xué)讀書,我被偷了兩次車,遇到了很多怪人,還被老師push著“明里卷”,但其實(shí)紐約也沒那么糟!
本科一般,低GPA還想讀英碩工科?
港碩的傳媒早已卷出天際。
爆了!2025考研正式落幕,無縫銜接留學(xué),港新英錄取率近40%,25fall輕松變道接offer?
現(xiàn)在的美國留學(xué),已經(jīng)不再是鄙視鏈的頂端。
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學(xué)App
預(yù)約咨詢
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
登錄
二維碼已過期
重新獲取
已掃碼
等待確認(rèn)登錄
請使用微信掃描二維碼登錄
現(xiàn)在來設(shè)置你的賬號吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是
多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱是
沒有查詢到相關(guān)的學(xué)校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關(guān)的專業(yè)
查詢中...
4. 您從哪里了解到指南者留學(xué)網(wǎng)站的
*
0/20
取消
上一步
下一步
復(fù)制
復(fù)制
您的會員等級不足,查看等級詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認(rèn)
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認(rèn)收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定