數(shù)據(jù)工程師和數(shù)據(jù)科學家有什么不同

2021-03-04    分類: 網(wǎng)站建設

我們最近在Reddit上做了問答活動。有個最常見的問題是數(shù)據(jù)科學家和數(shù)據(jù)工程師之間的區(qū)別。因此,我們想在這個主題上下寫一篇文章來深入探討下這個話題。

有許多數(shù)據(jù)專家的崗位聽起來沒多大區(qū)別,使用的工具也很類似,我們很難知道各類職位應該承擔什么樣的職責。此外,較小的公司可能會受限于他們聘請的數(shù)據(jù)工程師或數(shù)據(jù)科學家的人數(shù),這便意味著很多時候特定的任務和目標可能會開始混合。

上述使得明確區(qū)分這兩個角色變得更加困難。因此,我們想通過討論數(shù)據(jù)工程師和數(shù)據(jù)科學家所擁有的不同目標,思維模式,工具和背景來了解兩個職位的不同之處。

在我們討論差異之前,我們想做一個快速的引言。事實是,許多數(shù)據(jù)科學家和數(shù)據(jù)工程師將執(zhí)行其他技術角色的任務。數(shù)據(jù)科學家可能需要開發(fā)ETL,數(shù)據(jù)工程師可能需要開發(fā)API和前端。因此,我們在下面指出的區(qū)別只是為了弄清楚技術差異在哪里。

數(shù)據(jù)工程師和數(shù)據(jù)科學家有什么不同

目標

數(shù)據(jù)工程師的目標更側重于任務和開發(fā)。數(shù)據(jù)工程師構建自動化系統(tǒng)和模型數(shù)據(jù)結構,以允許有效地處理數(shù)據(jù)。這意味著數(shù)據(jù)工程師的目標是創(chuàng)建和開發(fā)表格和數(shù)據(jù)管道,以支持分析儀表板和其他數(shù)據(jù)客戶(如數(shù)據(jù)科學家、分析師和其他工程師)。它與大多數(shù)工程師相似。為了能夠執(zhí)行最終的任務,需要進行大量的設計、假設、限制和開發(fā)。每個設計和解決方案都有自己的一組限制,即使它們都可以執(zhí)行最終任務。

相比之下,數(shù)據(jù)科學家往往更關注問題。從這個意義上說,他們正在尋找降低成本/增加利潤、改善客戶體驗或業(yè)務效率的方法。這意味著他們需要問問題,然后回答問題(問問題,假設,然后得出結論)。所以他們需要問的問題比如,什么影響了病人的再入院,如果增加A vs. B,顧客會花更多錢嗎,有沒有更快的遞送包裹的路線?跳過剩下的過程。這里的目標是找到問題的答案。這可能是一個最終的結論或更多的問題。在整個過程中,數(shù)據(jù)科學家分析、收集支持,并可以得出問題的結論。

工具

這就是事情會變得混亂的地方。數(shù)據(jù)科學家和數(shù)據(jù)工程師通常都依賴于python和SQL。然而,這兩個技術角色使用這些技能的方式各不相同。同樣,這與心態(tài)的差異有關。Python是一種非常健壯的語言,它具有幫助管理操作任務和分析任務的庫。

數(shù)據(jù)科學家將使用panda和Scikit Learn這樣的庫,而數(shù)據(jù)工程師將使用python來管理管道。這就是像airflow和Luigi這樣的圖書館派上用場的地方。

類似地,數(shù)據(jù)科學家查詢將是特別關注的(例如,關注問題)。而數(shù)據(jù)工程師的查詢將集中于清理和轉換數(shù)據(jù)。

現(xiàn)在,數(shù)據(jù)專家還可以使用其他工具。這包括Tableau, Jupyter筆記本和其他一些。說到底,區(qū)別在于他們如何使用它們。

背景

現(xiàn)在,當談到數(shù)據(jù)工程師和數(shù)據(jù)科學家之間的差異時,另一個常見的問題是需要什么樣的背景。

數(shù)據(jù)工程和數(shù)據(jù)科學都需要對數(shù)據(jù)和編程有一定的了解。即使是有限的范圍。然而,有一些區(qū)別超出了編程。特別是數(shù)據(jù)科學家。由于數(shù)據(jù)科學家更像研究人員,擁有以研究為基礎的背景是一種優(yōu)勢。

這可能是在經(jīng)濟學、心理學、流行病學等領域。將研究背景、SQL、Python和良好的商業(yè)意識結合起來,您就擁有了一位數(shù)據(jù)科學家。這些并不是一成不變的。事實上,我們遇到了一位獲得多個學位的的數(shù)據(jù)科學家。大多數(shù)雇主更傾向于雇傭至少擁有碩士學位的數(shù)據(jù)科學家,他的專業(yè)是技術或數(shù)學。

數(shù)據(jù)工程職位通常不需要碩士學位。數(shù)據(jù)工程更多的是作為一名開發(fā)人員。這需要更多的實踐經(jīng)驗,而不是理論知識。所以獲得碩士學位并不能提供相同的價值。

一個例子

假設一家醫(yī)療保健公司的董事決定,他們想要弄清楚如何減少30天前再次入院的病人數(shù)量。從數(shù)據(jù)的角度來看,需要做幾件事。

數(shù)據(jù)科學家需要弄清楚是什么驅使病人重新入院。這是他們將試圖回答的問題。根據(jù)他們得出的結論,他們將與業(yè)務部門合作,制定度量指標 。這些指標是如何創(chuàng)建將由數(shù)據(jù)科學家得到答案。

數(shù)據(jù)科學家和數(shù)據(jù)工程師有很多不同之處。他們有不同的目標和背景,但這就是兩者共同利用的價值所在。數(shù)據(jù)工程師更多地關注工程健壯系統(tǒng),這一事實使得數(shù)據(jù)科學家能夠輕松地查詢數(shù)據(jù)并有效地分析數(shù)據(jù)。他們的合作伙伴關系使公司從數(shù)據(jù)中獲得價值。

當前標題:數(shù)據(jù)工程師和數(shù)據(jù)科學家有什么不同
標題來源:http://bm7419.com/news/104150.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營銷網(wǎng)站排名、面包屑導航商城網(wǎng)站、標簽優(yōu)化、靜態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

外貿網(wǎng)站建設