最近旁观了几个AI码农的面试

slowaction
slowaction 2020-03-17 字数 421

首先说明我不懂什么自然语言处理和人工智能

我是传统码农跟着去面试打酱油

面了6个做相关方向的

我提了个问题类似如何找出论坛某板块的十大热点话题

大家可以理解为找出水木特快的热点

几乎所有人都和我说他用个什么什么模型,然后跑一段就有结果

其中一个做金融信息推荐的几乎不理解任何金融知识

我问他最近几天他的模型跑出来的推荐和人工筛选的有多大区别

他说他不知道,也没人做人工筛选

跑出来什么是什么

外行问一句,这方向都这么玩么?

还是我碰到的都是水货

ITExpress IT业界特快
7 个Like
190 个回复
feed
鳄鱼 2020-03-17

别听他们说的那么玄乎

其实就是框架搭建好了,调节几个参数是关键

这行做应用层门槛挺低的

不建议长期做

【 在 slowaction (slowaction) 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

Hihere
Hihere 2020-03-17

关键字提取,编码,匹配?

【 在 slowaction 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

molar
molar,嗯。molar,哦?molar,噢! 2020-03-17

这是普遍情况,算法部门属于中后台部门,做模型的人普遍对业务了解少,程度的区别。

而有业务感觉的人,一般来说会喜欢“往前走”,这就形成了一个负反馈。再一个因素,

是各厂的算法部门大多年头不长,算法人员也是这些年才补充进去的,一般行业经验

少。。。

【 在 slowaction (slowaction) 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

oldwatch
一条叫java的鱼◎城内风光独好 2020-03-17

调包侠日常

【 在 slowaction (slowaction) 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

szu
深圳大学 2020-03-17
slowaction
slowaction 2020-03-17

我去,他们不管输出的么

感觉模型输出什么是什么,不关他的事

连最基本的对业务的思考都没有

不谈任何业务,纯算法

【 在 molar (molar,嗯。molar,哦?molar,噢!) 的大作中提到: 】

: 这是普遍情况,算法部门属于中后台部门,做模型的人普遍对业务了解少,程度的区别。

: 而有业务感觉的人,一般来说会喜欢“往前走”,这就形成了一个负反馈。再一个因素,

: 是各厂的算法部门大多年头不长,算法人员也是这些年才补充进去的,一般行业经验

: ...................

molar
molar,嗯。molar,哦?molar,噢! 2020-03-17

其实研发里面这样的同学也不少吧?对于业务自身的逻辑不是太了解,产品咋说的就咋开发,有时候一句两句没嘱咐到或者说差了,两周后再找发现完全不是那么回事儿。。。

这个东西其实属于工种/部门/职能之间沟通机制有问题。如果业务、产品和研发各自是单独的部门,这问题更严重(当然,反过来,如果业务产品研发组成小单元来干活儿,会有其他问题)。

说回算法,俺理解,只不过算法部门有时候这问题更典型吧。因为算法这东西,对于许多职场上的人来说,算个新东西,本身理解起来又有门槛儿,所以业务沟通起来往往挺费劲的。反过来,做算法的人也一样,跟业务方定义好0/1,按自己理解加工些特征,然后就开整了。。。NLP和CV目的性更强些,但也更垂直

【 在 slowaction 的大作中提到: 】

: 我去,他们不管输出的么

: 感觉模型输出什么是什么,不关他的事

: 连最基本的对业务的思考都没有

: 不谈任何业务,纯算法

guestking
2020-03-17

其实研发要么就非常懂业务,要么就完全不懂

懂一半这种就很麻烦,怕是天天都得跟产品吵架

【 在 molar (molar,嗯。molar,哦?molar,噢!) 的大作中提到: 】

: 其实研发里面这样的同学也不少吧?对于业务自身的逻辑不是太了解,产品咋说的就咋开发,有时候一句两句没嘱咐到或者说差了,两周后再找发现完全不是那么回事儿。。。

: 这个东西其实属于工种/部门/职能之间沟通机制有问题。如果业务、产品和研发各自是单独的部门,这问题更严重(当然,反过来,如果业务产品研发组成小单元来干活儿,会有其他问题)。

: 说回算法,俺理解,只不过算法部门有时候这问题更典型吧。因为算法这东西,对于许多职场上的人来说,算个新东西,本身理解起来又有门槛儿,所以业务沟通起来往往挺费劲的。反过来,做算法的人也一样,跟业务方定义好0/1,按自己理解加工些特征,然后就开整了。。。NLP和

: ...................

molar
molar,嗯。molar,哦?molar,噢! 2020-03-17

嗯,产品和研发斗法简直是日常项目。。。

【 在 guestking 的大作中提到: 】

: 其实研发要么就非常懂业务,要么就完全不懂

: 懂一半这种就很麻烦,怕是天天都得跟产品吵架

hgoldfish
老鱼 2020-03-17

现在这种能要到多少钱?

【 在 slowaction (slowaction) 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

slowaction
slowaction 2020-03-17

对方开价2万到5万

问题是我们不会招进来

我们的业务是有答案的,

比如特快10大,我们很清楚我想得到个什么输出

他们这套不用管特快是什么,上来就跑模型的思路

能输出我想要的东西?有这么牛?

我有点不信

【 在 hgoldfish 的大作中提到: 】

: 现在这种能要到多少钱?

hgoldfish
老鱼 2020-03-17

月薪两万,很便宜啊。。五万一年也不过六十万。

深度学习的模型确实是那样,调调参,各种模型都试一遍。没法解释模型的输出。算法本身可以解释,但模型输出不好解释。

AI 领域还有很多其它方法。水木十大算法很简单,根据阅读量、发贴ID等少数参数弄个线性公式排个序就行了。如果你的题目是找出水木最漂亮的十个贵妇,最激进的十个小将,隐藏最深的十大高官,这才需要真的 AI 算法。

【 在 slowaction (slowaction) 的大作中提到: 】

: 对方开价2万到5万

: 问题是我们不会招进来

: 我们的业务是有答案的,

: ...................

createsoft
createsoft 2020-03-17

特快热点看浏览量回帖量就可以,还要个屁模型

【 在 slowaction 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

LiYong
一帆风顺 2020-03-17

标准答案是什么

【 在 slowaction (slowaction) 的大作中提到: 】

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: ...................

slowaction
slowaction 2020-03-17

特快帖子很容易变成两个人问候对方父母,回帖量多没有用

并且一件事会分成好多个话题

这个要合并

【 在 createsoft 的大作中提到: 】

: 特快热点看浏览量回帖量就可以,还要个屁模型

slowaction
slowaction 2020-03-17

澳洲女可能开了20个帖子

这是一个热点而已

【 在 hgoldfish 的大作中提到: 】

: 月薪两万,很便宜啊。。五万一年也不过六十万。

: 深度学习的模型确实是那样,调调参,各种模型都试一遍。没法解释模型的输出。算法本身可以解释,但模型输出不好解释。

: AI 领域还有很多其它方法。水木十大算法很简单,根据阅读量、发贴ID等少数参数弄个线性公式排个序就行了。如果你的题目是找出水木最漂亮的十个贵妇,最激进的十个小将,隐藏最深的十大高官,这才需要真的 AI 算法。

: ...................

ITQueen
空指针 2020-03-17

这个sql就可以做了

select count(distinct(uid)) from topic where xxx group by subjectId;

数据大的话 mapreduce

做什么模型

【 在 slowaction (slowaction) 的大作中提到: 】

: 标  题: 最近旁观了几个AI码农的面试

: 发信站: 水木社区 (Tue Mar 17 10:18:46 2020), 站内

: 首先说明我不懂什么自然语言处理和人工智能

: 我是传统码农跟着去面试打酱油

: 面了6个做相关方向的

: 我提了个问题类似如何找出论坛某板块的十大热点话题

: 大家可以理解为找出水木特快的热点

: 几乎所有人都和我说他用个什么什么模型,然后跑一段就有结果

: 其中一个做金融信息推荐的几乎不理解任何金融知识

: 我问他最近几天他的模型跑出来的推荐和人工筛选的有多大区别

: 他说他不知道,也没人做人工筛选

: 跑出来什么是什么

: 外行问一句,这方向都这么玩么?

: 还是我碰到的都是水货

: --

slowaction
slowaction 2020-03-17

你这也是不管业务逻辑的做法

可能那个帖子标题是“细小”,然后几十贴才拼出全貌

可能一件事开了好多个帖子

你总结出个“细小”,这明显不是业务部门要的

【 在 ITQueen (空指针) 的大作中提到: 】

: 这个sql就可以做了

: select count(distinct(uid)) from topic where xxx group by subjectId;

: 数据大的话 mapreduce

: ...................

ITQueen
空指针 2020-03-17

那就是keyword了

【 在 slowaction (slowaction) 的大作中提到: 】

: 你这也是不管业务逻辑的做法

: 可能那个帖子标题是“细小”,然后几十贴才拼出全貌

: 可能一件事开了好多个帖子

: ...................