你擅长数学,能用Python编程,并且对某个行业很了解?如果你有这样的技能,你可能会成为一名数据科学家。然而,如果你成为一名数据科学家,你将拥有一个繁荣的生活——领英的最新投票结果显示,“统计分析和数据挖掘”是2014年最大的求职法宝。

根据美国招聘网站Glassdoor的一份报告,数据科学家的平均年薪为118,709美元,而程序员的平均年薪为64,537美元。麦肯锡的一项研究预测,到2018年,美国可能面临14万至19万名“具有深入分析能力的人才”的缺口,而“能够利用大数据分析做出有效决策的经理和分析师”的缺口将达到150万。

这个领域目前非常热门,纽约大学数据科学中心的课程负责人罗伊·劳兰斯说,现在可能已经达到了顶峰。“也许存在泡沫,”他说。"不管发生什么,一旦天气变得这么热,之后肯定会变冷。"然而,纽约大学希望在未来几年扩大数据科学课程的招生,将学生人数从40人增加到60人。新学年还将持续五个月,但是50%到75%的学生已经找到了理想的工作。

为什么这个领域变得如此热门?总部位于芝加哥的猎头公司伯特工程公司(Burt Engineering)的董事总经理琳达伯奇(Linda Burtch)表示,尽管谷歌(Weibo)、亚马逊(Amazon)、网飞和优步(Uber)等高科技公司都有自己的数据科学团队,但内曼马库斯(Neiman Marcus)、沃尔玛(Wal-Mart)、克洛克斯(Clorox)和盖普(Gap)等非高科技公司现在也需要使用这一领域的人才。“许多公司都在寻找数据科学家,”她说。

这些公司希望数据科学专业人员能够挖掘出新的信息来帮助公司增加收入和减少支出。IBM负责大数据业务的副总裁Anjul Bhambhri表示,航空航天制造商普惠公司现在可以预测飞机发动机何时需要维修,准确率达到97%,这有助于公司更有效地开展业务。

尽管本月IBM刚刚推出了基于云计算的沃森分析免费增值工具,但为了分析非结构化数据,数据科学家们通常不得不自己编写特殊的软件程序,这也是数据科学家必须掌握编程技能的原因之一。

学校教育

劳伦斯说,数据科学家需要具备三项基本技能:数学/统计学、计算机技能和特定业务领域的知识。纽约大学的数据科学中心希望招募至少具备其中一项技能的学生,然后训练他们掌握其他技能,这样当他们毕业时,他们就可以单独负责数据处理。“在学习过程中,他们必须做一些数据科学项目,要求他们使用这三种技能,”他说。

然而,如果你想成为一名数据科学专业的学生,你不必去上大学。从今年9月开始,一家名为Metis的公司开始在纽约举办为期12周的数据科学训练营,费用为1.4万美元。申请人数非常多,入学竞争非常激烈。梅蒂斯的联合创始人杰森·莫斯(Jason Moss)表示,大约一半的学生拥有硕士或博士学位。

第一次训练营于12月初结束。莫斯说,然而,几周之内,15名学生中就有6人获得了工作。

“我不认为训练营能取代大学教育,”莫斯说。“训练营可以为你尽快找到工作提供一条捷径,但大学的目的不是这个。但我不认为你必须上大学才能成为数据科学家,”他说。“有一种人天生好奇、勇敢、坚定,总想把事情解决掉。他们可以在这个领域做得很好。”

安摩尔·拉杰普罗希特是一位独立的数据科学家,他关注这两个问题。他说在这一行工作中最重要的品质是能够快速学习。“通用编程技能远比任何特定编程语言的专业知识更重要,”他说。“在当今时代,随着科技的飞速发展,语言将很快过时,新的语言将迅速普及。因此,学东西快的人比不同领域的专家更有前途。”

劳伦斯说,他认为训练营和在线课程可以在某些技能上为学习者提供很大帮助。但在其他方面,他们的作用相对有限。纽约大学数据科学课程的一个优势是你可以按照正确的顺序训练你的技能。"我们的教学顺序允许你通过全面的学习逐步掌握技能."他说。

数据科学家应该做什么?

Playstudios的数据科学家乔恩·格林伯格说:“在我的日常工作中,我需要管理一系列的控制面板。他们提供的信息可以让公司知道我们的业务进展如何。用户在做什么?”格林伯格现在是一名经理,所以他不像以前那样多编程了,但有时他仍然需要编程。一般来说,他从Apache Hadoop的内存中检索数据,在分析平台Revolution R上运行它,并对其进行一些可视化处理。“例如,我们可以从中了解一些用户如何与新功能交互,”他解释道。

格林伯格六年前获得了统计学硕士学位。他想在政府部门工作,但惊讶地发现公司非常需要数据科学家。“当时,数据科学领域并不像现在这样热门,”他说。现在,他每天都能接到猎头公司的电话或电子邮件。“这不仅仅发生在我身上,”他说。“所有数据科学家可能都是这样的。”

对格林伯格来说,一个好的工作机会只是一种奖励,因为他热爱这项业务。“我认为你必须有分析的头脑和好奇心来做数据科学工作,”他说。“你必须灵活、有创造力,并想出不同的方法来解决问题。”格林伯格说,这项工作的唯一缺点是需要花费大量时间来“清理”数据(去除不相关的结果)。“这部分任务不太吸引人。你必须花很多时间去做。”他说。

Rajpurohit说他花了大量精力清理数据和做研究。他说:“我花了很大一部分时间做研究,因为我经常遇到全新的问题,所以我需要研究特定领域的最新文献,或者找专家,听取他们在这方面的意见。”。

“尽管数据科学这个名字与艺术无关,但你需要把艺术和科学很好地结合起来。科学部分是显而易见的——数学、编程等。但是艺术部分同样重要——创造力,对背景有深刻的理解。将这两部分结合起来,你就会变得善于解决问题。”

然而,拉杰普罗希特也承认,数据科学并不像现在许多人认为的那样善良和迷人。这个领域确实变得越来越重要,有许多高薪的机会,但是数据科学家需要做的许多日常工作实际上很无聊。

你是数据科学家吗?

每天花大量时间编程,分析控制面板上的数据并获取相关信息。如果你对这种工作感兴趣,那么你可能适合这种工作。但是如果你只想得到高薪,那么你可能会觉得这样的生活很悲惨。你应该知道,真正适合这一行的人经常在业余时间编写程序和分析数据,他们这样做只是为了娱乐。

伯奇的数据科学招聘猎头亚当·弗罗格谈到了他最近遇到的一位候选人。这个人有博士学位,今年秋天将在电子艺术公司工作。“真正让他脱颖而出的是他在业余时间做这种事情的优势,而且这纯粹是为了好玩,”弗罗格说。他是多人在线游戏世界“坦克大战”的玩家,领导着一个玩家团队。所以他写了一个程序从游戏服务器上获取数据,然后分析这些数据来评估他的团队的表现。然后,他利用这些信息找出如何调整自己的策略,以及应该招募哪些类型的成员来提高团队的整体绩效。”

因此,如果你不喜欢数据本身,而是喜欢它能给你带来的高薪,那么你会发现很难和那些人竞争。但是岐伯说,每个人都应该学会热爱数据,即使这只是为了他们的职业前途。“十年之内,如果你不是一个大数据玩家,你就不会想被提升到‘首席XX官’的位置,”boch说。

但是你如何解释像史蒂夫·乔布斯和比尔·盖茨这样的事情呢?他们目光远大,没有陷入数据科学的细节。“那是30年前的事了,”岐伯说。“我说的是未来10年。”