持續(xù)學習有助于縮小數(shù)據(jù)科學技能差距
當討論2022年及以后最受歡迎的IT工作時,“數(shù)據(jù)科學家”經(jīng)常出現(xiàn)在許多列表的頂部。問題是,沒有足夠的具備適當技能的潛在數(shù)據(jù)科學家來滿足當前的需求。事實上,一2022年調(diào)查發(fā)現(xiàn)56%的受訪者認為數(shù)據(jù)科學人才或員工數(shù)量不足是企業(yè)成功采用數(shù)據(jù)科學的最大障礙之一。
為了克服這一障礙,組織應該考慮開發(fā)自己的數(shù)據(jù)科學持續(xù)學習計劃,以補充學校教授的內(nèi)容。此類項目有助于將初露頭角的數(shù)據(jù)科學家展示給專業(yè)人士,以及將數(shù)據(jù)模型帶入生活的過程。這些計劃還可以幫助這些個人了解他們在機器學習運營(MLOps)生命周期中的位置,同時幫助公司找到急需的人才。
需要數(shù)據(jù)科學家:“與他人合作愉快”
關(guān)鍵之一數(shù)據(jù)科學家的工作要求是能夠與其他人合作愉快。這聽起來可能令人驚訝,因為數(shù)據(jù)科學家的典型形象是與他們的模型隔離工作的人,但數(shù)據(jù)科學的實際建模部分實際上只是工作描述的一部分。
實際上,創(chuàng)建智能應用程序或模型是一個復雜的過程,涉及幾個步驟,包括:
- 理解應用程序背后的業(yè)務目標
- 為應用程序收集和準備數(shù)據(jù)
- 開發(fā)模型
- 部署模型
- 部署后監(jiān)控和管理模型
這些步驟中的每一步都由MLOps團隊的不同成員來處理,該團隊包括業(yè)務領(lǐng)導,數(shù)據(jù)工程師、開發(fā)人員和IT運營經(jīng)理。不同步驟的職責之間自然會有一些交叉。盡管如此,數(shù)據(jù)科學家以某種方式參與其中,并且必須定期與其他領(lǐng)導者互動,以部署他們的模型。因此,理想的數(shù)據(jù)科學家既要有商業(yè)頭腦,又要有技術(shù)專長,并且在與同行合作時能自如地處理模型。
為未來的數(shù)據(jù)科學家提供實踐機會
在教授這些“軟技能”方面,企業(yè)擁有獨特的優(yōu)勢。這是因為許多組織已經(jīng)有了MLOps團隊,或者正在構(gòu)建他們的MLOps能力。
這些團隊有效地提供內(nèi)置資源,幫助培養(yǎng)下一代數(shù)據(jù)科學家。組織可以邀請潛在的數(shù)據(jù)科學家(無論是來自公司內(nèi)部還是外部)來了解團隊如何工作、他們使用的工具、涉及的人物等等,并通過實際操作的持續(xù)學習計劃來教授他們。
在這些計劃中,潛在客戶可以與當前的數(shù)據(jù)科學家并肩工作,了解他們?nèi)绾闻c同事互動,并觀察這些互動帶來的微妙之處。他們可以問問題:把模型交給開發(fā)人員的最好方式是什么?運營經(jīng)理喜歡如何與數(shù)據(jù)科學家合作?我如何確保我的模型最終成為一個有用的、可部署的應用程序?
學習貿(mào)易工具
學生還可以獲得使用MLOps基礎(chǔ)工具的寶貴經(jīng)驗。這些可能包括Jupyter筆記本,Apache Spark,計算機編程語言,以及數(shù)據(jù)科學家中常見的其他技術(shù)。這將幫助他們更好地理解開發(fā)人員用來創(chuàng)建代碼和應用程序的技術(shù),以及數(shù)據(jù)工程師用來提取和轉(zhuǎn)換數(shù)據(jù)的解決方案。
雖然數(shù)據(jù)科學專業(yè)的學生不需要成為容器或最新的MLOps治理軟件等技術(shù)的專家,但了解誰使用了什么技術(shù)以及為什么使用會很有幫助。每一點額外的知識都會讓學生更好地理解團隊中的每個人是如何工作的,并幫助他們與團隊成員更緊密地合作,以便他們能夠更有效地交付模型。
對組織的好處
為數(shù)據(jù)科學家創(chuàng)造持續(xù)的學習體驗也有利于公司。例如,組織可以就自己獨特的流程培訓未來的數(shù)據(jù)科學家,并讓潛在的新員工適應他們的MLOps文化。如果學生表現(xiàn)出必要的能力,他們可能會考慮聘用他們,并加入他們的數(shù)據(jù)科學行列。由于他們的持續(xù)學習計劃,他們將有一名已經(jīng)接受過培訓并準備在第一天就投入工作的新員工。
至少,有持續(xù)學習項目的公司表明他們有興趣投資于他們的員工。僅僅這一點就可以成為一個不同的制造者,可以激發(fā)員工群,這將有望包括更多未來的數(shù)據(jù)科學家。