当前位置:网站首页>数据科学家是不是特有前途的职业?
数据科学家是不是特有前途的职业?
2022-06-23 03:51:00 【小袁ITSuper】
人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。
从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点AI技能的找个工作都不难,老板还天天担心你跑掉。
但是,数据科学家作为一种职业,长远一点看却未必很有前途。
为啥?
因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件。
比如这个,国内知名数据软件公司润乾出品的易明建模YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:

只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。
这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括google等大牌厂商都在加入这个阵营。
如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。
在实践这个易明建模软件的过程中发生过N回这种情况,程序写得很溜的IT专业同学,使用Python开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用Python开源包做的,大家用的是同一套基础东西。但是,只懂IT的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。
而易明建模中却固化了统计专家数十年的经验,这样只擅长IT技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?
结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。
未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。
打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。
这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?
那当然也不是。
像易明建模这样的自动化AI软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。
只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。
数据科学家这个职业很有前途,但仅限于下过苦功N年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。
易明智能建模资料
边栏推荐
- Pads and flash symbols in cadence
- Pta:6-33 student ranking table (destructor)
- win10下安装、运行MongoDB
- 在PCB板边走高频高速信号线的注意事项–高频高速信号设计基本原则
- Question bank and answers of 2022 hoisting machinery safety management examination
- altium designer 09丝印靠近焊盘显示绿色警告,如何阻止其报警?
- Static two position relay xjls-84/440/dc220v
- Permission Operation in dynamics 365 plug-in
- 2020:VL-BERT: Pre-training of generic visual-linguistic representation
- 积分商城的三种运营方向
猜你喜欢

LabVIEW displays both hexadecimal and normal characters in the same table

openwrt目录结构

不归零编码NRZ

重装Cadence16.3,失败与成功

Please use the NLTK Downloader to obtain the resource

20000 words + 20 pictures | details of nine data types and application scenarios of redis
Using editor How to handle MD uploading pictures?

如何让社交媒体成为跨境电商驱动力?这款独立站工具不能错过!

golang使用mongo-driver操作——增(基础)

Cocos学习日记2——脚本和属性
随机推荐
JVM调优简要思想及简单案例-为什么需要JVM调优?
mysql json
1183. 电力
CAN总线基础知识
应急响应-hw复习
notepad++ 查找替换之分组替换保留
Cocos learning diary 1 - node
Abnova酸性磷酸酶(小麦胚芽)说明书
The paddepaddle model is deployed in a service-oriented manner. After restarting the pipeline, an error is reported, and the TRT error is reported
Non return to zero code NRZ
#17生成器的函数声明与调用
free( )的一个理解(《C Primer Plus》的一个错误)
欢迎使用CSDN-markdown编辑器
独立站聊天机器人有哪些类型?如何快速创建属于自己的免费聊天机器人?只需3秒钟就能搞定!
Current relay jdl-1002a
Please use the NLTK Downloader to obtain the resource
FreeModBus解析1
Altium designer 09 screen printing displays a green warning near the pad. How to prevent it from alarming?
zk 有一个节点报 It is probably not running且日志无明显报错
32单片机一个变量多个.c里使用