數據科學、大數據和物聯網正在以令人炫目的速度發展和演進,而商業界正以緩慢的速度將更多來自不同渠道的數據整合起來,并能從中洞察更多信息。本文是 Andrew Dipper 對數據科學行業2017年的展望,并列舉了四大重要趨勢。
大數據技術的崛起
在過去一年,我們已經見證了大數據技術驚人的成長,但隨著大數據技術在企業界中被廣泛接受,下一年留給大數據技術的預算會快速增加。大多數企業已經確認需要在業務的數據方向上進行改進,這轉而會需要更多的數據科學家來處理企業需要檢索的大量額外數據。
如果你在追求一份數據科學領域的職業,那么有關大數據和數據框架的知識是必備的。你可以特別注意一下以下幾個平臺:Apache Hadoop, HDFS, Hbase, Spark, Storm, Solr 和 Kafka。
數據科學從業資格的變化
雖然 Elon Musk認為機器學習正在“召喚惡魔”,但是它仍將繼續發展。Amazon, Facebook 和 Google都在最近幾年加入到了人工智能的競賽中。在2017年,越來越多的企業會招募最頂尖的機器學習數據科學家。
但同時,工作崗位的競爭也變得更加激烈。在越來越多的大學將 AI 列入課程要求的背景下,從2017年開始,機器學習會成為數據科學行業入門的必備條件。如果你想在競爭中取得先機,有不少的AI和機器學習的認證課程供你選擇。雖然有一些課程的價格達到1萬美元,不過在 Coursera 或者 edX 上也有為數不少免費或低價的培訓課程。
如果你擁有很強的科技和編程能力,也能夠幫助你在數據科學領域獲得一席之地,尤其是 R 和 Python 語言。同時,SAS 和 MATLAB 的經驗自然也是加分項。
而且,你需要能夠自如地使用關系型數據庫,所以SQL也是一項非常重要的技能。在2015年一項綜合了 3500 個 linkedin 招聘廣告的研究中,SQL被列為最重要的技能。另外,Hadoop, Python和 Java 也同樣流行。
物聯網和數據科學的融合
雖然存在一些關鍵的不同點,但是數據科學和物聯網經常被視為一個硬幣的兩面。數據科學家會更多地需要從設備中讀取實時數據,進行復雜的分析或以此作出決策。在這樣的背景下,這兩個行業在明年將會有更深的融合。
在現實世界中,這一切是怎么實現的? 想象一下這樣的情景:在不遠的將來,你不再需要鑰匙來打開你家的大門。當你走向大門的時候,它會感知到你并且自動為你打開門鎖。當你離開家的那一刻,智能家庭會關閉所有非必需的耗能設備,來為房主節省花費。
這樣的情景好像只能在星際迷航的“企業號”上才能見到,但是我們應該會在2017年就能看到雛形,因此,你需要確保你有足夠的技能參與到這樣的項目中去。
同 AI 一樣,為物聯網服務的數據科學會要求你可以自如地使用各種設備的 RIL(無線界面層),進行邊緣數據處理,數據處理和深度學習。
數據科學驅動的醫療保健行業
在改善流行病結果和預測病人行為方面,數據科學已經證明了它的價值。
在2015年,數據科學家幫助預測了西尼羅河病毒在美國的進一步爆發,準確率高達85%。
在2016年早些時候,一個科學家團隊開發了一套可以預測蝙蝠攜帶埃博拉病毒幾率的模型。
在這樣的背景下,2017年內我們可以期待數據科學在醫療保健行業方面取得長足的發展。
隨著電子醫療保健檔案應用的崛起,可以為我們所用的數據量已經達到了歷史最高水平。雖然大量的數據同時具有好處和不足,但在2017年,還有很多獲利機會留給那些嘗試解碼這些數據的科學家們。如果你正在尋求加入一個新興領域的話,數據科學是一個很好的機會。
筆者對未來醫療及物聯網都有涉獵和關注,我們也相信數據科學將會發揮重要的作用。而在 2017 年,我們又會迎來怎樣的新變化呢?
來源:雷鋒網