cda

全國校區

您的位置:首頁 > 大數據時代 > 如何成為數據科學家?數據科學業界大牛們傾囊相授

如何成為數據科學家?數據科學業界大牛們傾囊相授

2019-02-13

在大家的眼中,科學家的形象可能是一位表情嚴肅、著裝單一、不修邊幅、戴著一副厚重眼鏡且天庭飽滿,發際線無限上移的中老年理共男。但實際上,他們正式體面,幽默無比,可謂是集涵養和趣味于一身的真正撩妹達人!

那么現實中,你是否有見過真正的數據科學家呢?

數據科學家,一個大數據時代的新興稱號,被《哈佛商業評論》中被譽為“21世紀最性感的職業”,2015年,美國白宮首次設立數據科學家的崗位。

他們可能不發表學術論文,沒有科研項目,也沒有得過學術大獎,但在商業帝國里扮演著至關重要的角色。他們是技術驅動,沒日沒夜與數據打交道的匠人;他們是創意源泉,為業務出謀劃策的參謀者;他們是幕后之王,未雨綢繆糧草先行。

在國內,CDA以尋找數據科學家活動,匯聚了一批真正稱得上大佬的實戰派先鋒,無論是在商業領域摸爬滾打,還是在學術界科研探索,都碩果累累,名副其實。所謂前人栽樹后人乘涼,他們為數據科學做出了模范般的躬先表率。CDA也授予其“榮譽數據科學家”稱號。

榮譽數據科學家

九屠


曾就職于阿里巴巴·餓了么,集團首席數據架構師、P10科學家。負責餓了么、百度外賣的大數據技術統籌。

2014年加入百度,先后帶團隊建設為百度地圖6大Place場景做數據分析,后專注于百度外賣大數據生態從0開始孵化并最終完善。自主研發涉及到數據采集3大平臺、開放式ETL4件套、OLAP分析平臺、Adhoc、大數據分布式調度、數據集市、數據倉庫等,另外技術驅動數十個輔助業務分析角色的分析挖掘平臺。為大數據研發打造離線、實時數據整套解決方案,目前構建并推廣AI學習平臺系統;在AI和大數據技術創新層面,作為發明型專利第一發明人擁有44項發明。

李御璽

國立臺灣大學資訊工程博士,銘傳大學資訊工程學系教授,銘傳大學大數據研究中心主任,中華數據挖掘協會理事,中國人民大學數據挖掘中心顧問,IBM SPSS-China顧問,SAS-Taiwan顧問,CDA命題組負責人。在其相關研究領域已發表超過260篇以上的研究論文,同時也是國科會與教育部多個相關研究計劃的主持人。

服務過的客戶包括:中國工商局、中信銀行、臺新銀行、聯邦銀行、新光銀行、 第一銀行、永豐銀行、遠東銀行、美商大都會人壽、嘉義基督教醫院、臺灣微軟、航空公司如東方航空公司、中華航空公司、汽車行業如福特(Ford)汽車公司;政府行業如國稅局等。

趙衛東

東南大學博士,復旦大學博士后,主要負責本科生和各類研究生大數據核心技術和商務數據分析等課程的教學。商務智能被評為上海市精品課程,獲得2013年高等教育上海市教學成果獎二等獎。目前主要研究方向包括商務數據分析和大數據分析等。主持2項國家自然科學基金以及上海市浦江人才、企業合作課題等20多項項目。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內外刊物和學術會議發表論文90多篇。

出版著作《智能化的流程管理》、《數據挖掘實用案例分析》以及教材《商務智能(第四版)》、《機器學習》、譯作《商務智能 數據分析的管理視角(第四版)》、《人機共生——洞察和規避數據分析中的機遇與誤區》等10多部。獲得上海市2015年上海市科技進步二等獎。

付波

博士,電子科技大學副教授,2009年獲電子科技大學工學博士學位,2007-2008加拿大Univ. of Guelph的ARIS實驗室訪問學者。

多年從事模式識別、信號處理和機器學習相關工作,曾先后主持/參與國家自然科學基金、國家863及省市各項課題20余項。在包括IEEE Trans. IFS, SPL, Int. Jour. of PR, PRAI等國內外權威期刊、重要國際會議上發表論文30余篇,其中SCI檢索20余篇。合作參與編寫專著3部。獲國家授權發明專利7項,省市科技進步獎2項。曾擔任國家自然基金及多個期刊或會議的評審人和特約審稿人。目前,主要關注醫療健康大數據分析和產業化運用,近幾年主持或合作醫療及人工智能相關科研項目400余萬,并參與創辦了2家科技公司。

閻志濤

Talkingdata,研發副總裁,負責企業數據治理,數據平臺及客戶精準營銷等實務。

王學武

首席數據官。畢業于華中科技大學計算機專業。PRINCE2,PMP,CMMI評審員,IBM電子商務架構師,工信部項目管理工程師,工信部軟件設計師。

具有12年的項目管理與技術研發經驗,曾參與實施某航企多個核心的商業智能、數據倉庫項目;曾作為該企業工程過程管理組的Lead,負責推進CMMI L3評審工作。目前專注于大數據、機器學習、自然語言處理、人工智能等創新技術的研究和在行業的應用。

薛松

美國佛羅里達大學管理學與經濟學碩士,曾于美國微策略公司等多家企業擔任數據科學家,現任某初創公司數據科學總監。

設計并主持多項大數據與人工智能項目,項目內容涵蓋多源異構數據自動化采集、社交媒體輿情分析、多語言自然語言處理、圖數據庫集成與圖算法應用等領域。長期為全球500強客戶提供數據產品咨詢,搭建企業級大數據平臺與應用,在安全、交通、金融、媒體等行業的大數據項目管理方面有豐富經驗。

教學案例

以上的實戰派數據科學大佬們,也正式成為了CDA數據分析研究院榮譽科學家成員,共同參與制定CDA LEVEL 3數據科學家人才標準大綱及數據科學家精英培訓,將自身在大數據發展這幾年的實戰成果,以教學案例的形式傾囊相授。案例包括:

案例一

大數據指標模型治理與實踐

案例介紹:

大數據對業務數據ETL處理后,面臨在數據倉庫層面對業務詞庫定義、指標建模、元數據統一等問題;后期對外數據通過產品化和AdHoc方式交付數據,存在指標定義相同,但是語義理解存在較大偏差,如何進行指標模型的多口徑計算邏輯統一,避免繁瑣的人工維護和迭代,是本議題主張的部分;通過一處定義數據指標,多處交付統一的模型抽象、定義、訓練和交付整體實踐。

技能涉及:

元數據、大數據計算、ETL、數據建模、計算口徑、血緣關系、語義理解、統一模型。

案例二:

用戶畫像在O2O互聯網場景的實踐

案例介紹:

在外賣的物流場景下的調度是一個時空最優解的模型評估,模型的演進的過程中,都有重要的特征支持著變革,邊界非常清晰。模型演進對于畫像部分,是開始在配送服務精細化運營的落地步驟;畫像是為了滿足個體的真實差異而對個性化的支撐方式。分享圍繞互聯網企業在智能調度系統方向上從的逐步演進,畫像貫穿在整個生態當中,在大刀闊斧的業務版本演進同時,能夠細致入微的解決落地場景的實踐。

技能涉及:

用戶畫像、特征挖掘、模型評估、個性化推薦、時空最優

案例三

文本挖掘實戰

案例介紹:

文本分析(Text analysis)是文本挖掘、信息檢索的一個基本問題。它將文本中抽取出的特征詞進行量化,進而表示其文本信息。由于文本是由特定的人進行編撰的,文本的語義結構不可避免地會反映人的特定立場、觀點、價值和利益。通過大量數據的支撐,并結合文本內容的分析,可以推斷出文本編撰者的意圖和目的,以進行各種不同場景應用。

技能涉及:

分詞、詞性標注、命名實體標訂、情緒標訂、詞關聯分析、文件分類、文件摘要、文件聚類、文字云

案例四

生鮮智能補貨

案例介紹:

生鮮補貨在特定行業模式下的特點與面臨的問題,商業模式與智能補貨相結合中用到的智能算法,相關架構與業務效果,以及在系統的整個構建過程,生鮮智能補貨是一個跟、供應鏈、倉儲、物流、人員配送、促銷、商品展現、推薦、廣告、渠道運營等多系統協同的復雜系統,尤其生鮮類商品,保質期短,口味、消費者人群、地域分布等都與傳統電商商品具有很大的差異。目前生鮮電商面臨的最大問題就是運營成本難以下降,傳統電商運營生鮮面臨著保質期太短,對新鮮度的極高要求,冷鏈問題解,配送耗材損耗居高不下等問題。面對這樣的問題,可以從供給側通過智能補貨系統對商品進行預測控制,降低損耗,降低周轉期,提高庫容利用率。

更多業界成熟案例都會融入到CDA LEVEL 3數據科學家精英培訓中!

Lesson周期:

三個月,線上約20課時,線下50+課時(周末面授)

Lesson目標:

將數據分析師、數據工程師打造為數據科學家

2019年2月23日開學,限額30人喲,機不可失——http://www.mtztoa.tw/kecheng/53.html

完 謝謝觀看

分享
收藏

OK
今天的湖北十一选五开奖号码