如何成为一名更有“市场”的数据科学家?

发布时间:2019-09-10

标题也许有点奇怪,毕竟,在2019年,数据科学家已经是一个基于市场的行业。由于数据科学对当今的业务产生了巨大的影响,数据科学专家的需求正在增长。随着本文的发布,LinkedIn仅有144,527项数据科学工作。


但是,密切关注行业脉搏并了解最快,最有效的数据科学解决方案更为重要。为了帮助每个人,CV Compiler团队痴迷于数据,分析了2019年数据科学中的职位空缺数量和确定的就业趋势。


2019年更普及的数据科学技能


下图显示了2019年雇主能够掌握数据科学工程师所需的技能:




在此分析中,该团队审查了来自StackOverflow,AngelList和类似网站的300个Data Science职位空缺。某些术语可能在作业列表中重复多次。


注:本研究代表的是雇主的偏好,而不是数据科学工程师本身。


关键要点和数据科学趋势


显然,数据科学更多地是在于基础知识而不是框架和库,但仍有一些趋势和技术值得注意。


大数据


根据 2018年大数据分析市场研究,企业的大数据采用率从2015年的17%飙升至2018年的59%。因此,大数据工具的普及也在增长。如果不考虑Apache Spark和Hadoop的话,最受欢迎的是 MapReduce (36)和 Redshift (29)。


Hadoop


尽管Spark和云存储很受欢迎, 但Hadoop的时代还没有结束。因此,一些雇主仍然希望候选人熟悉 Apache Pig(30),HBase(32)和类似技术。 HDFS (20)也在调查中被提及。


实时数据处理


随着各种传感器、移动设备和物联网(18)的应用越来越多 ,越来越多的企业的目标是从实时数据处理中获得更多的见解。因此,像Apache Flink (21)这样的流分析平台在一些雇主中很受欢迎。


rawpixel.com在pexels上拍摄的照片


特征工程和超参数调整


准备数据和选择模型参数是任何数据科学家工作的关键部分。数据挖掘这个术语(128)在雇主中很流行。一些雇主也非常重视超参数调整(21)。但是作为一名数据科学家,您首先需要关注特性工程。选择模型的最佳功能是很重要的,因为它们在模型创建的早期阶段就决定了模型的成功。


数据可视化


处理数据并从中提取有价值的见解的能力至关重要。然而,数据可视化(55)对任何数据科学家同样重要。核心目的是以任何团队成员或客户可以理解的格式展示您的工作。至于数据可视化工具,雇主更喜欢Tableau(54)。


一般趋势


在调查中,诸如AWS(86)、Docker(36)和Kubernetes(24)等术语也经常出现。因此,软件开发行业的总趋势也适用于数据科学领域。


数据科学是一个快速增长和复杂的行业,其中一般知识和特定技术的经验是重要的。我希望本文将帮助您深入了解2019年所需的数据科学技能。


中安威士:保护核心数据,捍卫网络安全


来源:网络收集




上一条:网贷行业再迎监管风暴,这次中枪的是大数据风控 下一条:你的隐私被泄露了!大数据时代如何保护信息安全?