当前位置:网站首页>数据科学家是不是特有前途的职业?
数据科学家是不是特有前途的职业?
2022-06-23 03:51:00 【小袁ITSuper】
人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。
从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点AI技能的找个工作都不难,老板还天天担心你跑掉。
但是,数据科学家作为一种职业,长远一点看却未必很有前途。
为啥?
因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件。
比如这个,国内知名数据软件公司润乾出品的易明建模YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:

只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。
这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括google等大牌厂商都在加入这个阵营。
如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。
在实践这个易明建模软件的过程中发生过N回这种情况,程序写得很溜的IT专业同学,使用Python开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用Python开源包做的,大家用的是同一套基础东西。但是,只懂IT的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。
而易明建模中却固化了统计专家数十年的经验,这样只擅长IT技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?
结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。
未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。
打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。
这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?
那当然也不是。
像易明建模这样的自动化AI软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。
只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。
数据科学家这个职业很有前途,但仅限于下过苦功N年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。
易明智能建模资料
边栏推荐
猜你喜欢

在Pycharm中使用append()方法对列表添加元素时提示“This list creation could be rewritten as a list literal“的解决方法

PaddlePaddle模型服务化部署,重新启动pipeline后出现报错,trt报错

Static two position relay xjls-84/440/dc220v

PCB----理论与现实的桥梁

接收传来得文件并下载(简单用法)a标签

laravel 8.4 路由问题,结尾处是编辑器左侧对照表,小白可看懂

Examples of corpus data processing cases (part of speech encoding, part of speech restoration)

cadence中的焊盘和flash symbol

The paddepaddle model is deployed in a service-oriented manner. After restarting the pipeline, an error is reported, and the TRT error is reported

Please use the NLTK Downloader to obtain the resource
随机推荐
LabVIEW displays both hexadecimal and normal characters in the same table
McKinsey: in 2021, the investment in quantum computing market grew strongly and the talent gap expanded
Pads and flash symbols in cadence
电流继电器HDL-A/1-110VDC-1
在Pycharm中使用append()方法对列表添加元素时提示“This list creation could be rewritten as a list literal“的解决方法
AD9使用技巧拾遗
Tiktok x-bogus and_ Signature parameter analysis
Halcon知识:binocular_disparity 知识
cadence中的焊盘和flash symbol
Pta:6-73 function call
电流继电器JDL-1002A
Fundamentals of 3D mathematics [16] formulas for uniformly accelerated linear motion
Distance measure - cosine distance
Chrome调试技巧
OpenJudge NOI 1.13 51:古代密码
STL教程3-异常机制
openwrt目录结构
Gson typeadapter adapter
Pta:7-61 teacher student information management
golang使用mongo-driver操作——增(基础)