当前位置:首页> 歌单 >一群媒体人的“低俗考验”把头条灵犬逼成了这样…

一群媒体人的“低俗考验”把头条灵犬逼成了这样…

2023-05-10 14:56:27

 昨天,今日头条上线了一只“灵犬”。

 

光看剪影logo小今都被晃了一下,差点以为是更新了什么萌宠板块。但仔细一看,这哪是什么萌宠啊,明明是个智能监测员嘛。

 

“灵犬”的全称是反低俗助手,是不是听着有点不明觉厉?来来,小今来给你科普一下。

 

事实上这是一款使用人工智能技术识别低俗信息的小程序,背后是一套反复训练的反低俗算法模型。对于输入的内容,“灵犬”会先进行提取、分词和语义识别,然后根据算法规则,输出对应的分数、评级和结论。

 

对于像小今这样的编辑来说呢,最简单的理解是可以在发布前检测一下标题的健康度,以此作为内容是否会得到有效推荐的参考还是不错的。

 

小今也是稍微“调戏”了一下“灵犬”,先替大家测试一下嘛~


 

这种绝对低俗的字眼,“灵犬”还是很靠谱的,一秒识破~咱们继续啊,来个稍微模糊隐晦点的。


 

呐,上当了吧~看来“灵犬”还需要多多锻炼啊,估计它此时内心是酱紫的…


 

可别说是小今欺负“小动物”,说到这测试还是媒体人玩的最6,角度全面又刁钻,来来小今带你们围观一下~


1号人:刺猬公社记者

 

Q:最开始并不清楚这个东西是做什么的,辨识度不高。

 

灵犬:让我重新自我介绍下,我是一款鉴定低俗信息的小程序,脱胎于今日头条反低俗算法模型。给我一段文字或文章链接,我就能帮你检测它的健康指数。你可以把我看作是一个简便的低俗信息检测工具。


2号人:中国青年网编辑

 

Q:带图片和视频的链接,检测效果都不太好。

 

灵犬:目前使用我检测带图片、视频的链接,确实会有误差。因为图片、视频提取需要较长的时间,返回结果较慢,考虑到工具的即时性,暂时还不支持检测。


3号人:


Q:输入文字,为什么必须超过10个字才能检测?

 

灵犬:如果你给一个人的爱越多,她对你的好感就会越强烈。对于像我这种机器呢,你给我的上下文、语境这些信息越充分,我判断的准确度就会越高。为了让我更敏锐,有充分的信息做出准确判断,请多给我一些字,最好是一段链接。


4号人:新浪记者


Q:不太清楚背后的算法机制,如何判断一段文字或网址链接是低俗?

 

灵犬:算法模型处理低俗内容的一般路径,是“收集数据-标注样本-训练模型”。我的母体,就是一个使用人工智能技术反复训练的反低俗模型。对于你输入的文字或链接,我会先进行提取、分词和语义识别,然后根据设定的规则,输出对应的分数、评级和结论。


5号人:阿里巴巴程序员

 

Q:“灵犬”与头条审核机制有何不同?

 

灵犬:如果我是一条犬,头条审核机制就是一支工作犬部队。换句话说,我只是头条审核机制中反低俗部分的一个简化版本。在内容审核方面,今日头条目前投入了4000多人专业审核团队,是国内最大的审核团队,并搭建色情、低俗、标题党、虚假信息、低质模型180多个,结合人工、技术手段,有效提升了内容审核的效率和准确度。


6号人:浙报传媒编辑


Q:希望在建模的时候,能考虑优质文章的来源对于健康度指数的影响。

 

灵犬:谢谢你的意见。在最新版本的我,已经对于权威媒体报道的内容,予以算法推荐倾斜。


7号人:新浪记者

 

Q:我测了“你饿不饿我下面给你吃”,这个有51%的健康概念,但我觉得挺中性的呀。

 

灵犬:不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性。色情信息很直接,低俗信息偏隐晦,对于像我这种机器就更难了。今日头条的做法是,把低俗的标准分为两个层次:几乎所有人看来都会一致同意的标准底线,和因人而异的主观判断。我认为你这个测试标题,是一个因人而异的话题,仁者见仁智者见智。


8号人:四川大学副教授


Q:我测了标题党“你永不知道云飞在2017年唱这歌有多好听,花500000万也买不到”,结果是健康概率99%,可以获得算法推荐。

 

灵犬:我的母体是今日头条反低俗算法模型,所以对于标题党识别不太准确,就像你很难用温度计去测一杯水的深度。仅仅从反低俗角度而言,我认为这个标题并不低俗。但在实际审核过程中,今日头条有专门的技术模型和专业的内容审核编辑,做打击标题党工作,他们做得比我更专业。


9号人:


Q:我测“驿外断桥边,寂寞开无主”,健康概率只有12%。

 

灵犬:这是因为此前的我认为“寂寞”有低俗的嫌疑。这是我的缺陷。程序员已经通过人工策略纠正了。如果你现在测类似的内容,会得到较高的健康概率。最新版本的我,对于诗词类内容,也予以了算法推荐倾斜。


10号人:清华大学教授


Q:“今天有152年不遇的蓝月亮”(健康概率83%)和“今晚有152年不遇的蓝月亮”(健康概率71%),一字之差,健康概率差12%?

 

灵犬:一个字的改变,确实会影响我对事物的认知和判断。对于很多短文本、没有上下文的语句,我的判断不如人类那么准确。这也是为什么在今日头条实际审核工作中,需要庞大的内容审核编辑团队。算法仍有缺陷,我们希望借助更多人的力量,完善算法模型,更好地服务社会。

 

看到那么多“”,小今都心疼“灵犬”了,我们还小嘛 ,得给我们成长的机会啊是不是。


不过小今想先提一个建议,既然是“灵犬”就要有萌宠的意识嘛,来回来去就只是


“需要引入人工判断”

“可以获得算法推荐”

“不应获得算法推荐”


三句话,也太无趣了,如果可以换成更生动形象个性化的表达,说不定使用率会更高呢。


 

还没试过的同学可以点击「阅读原文」体验一下哦,看看你有没有优化的小建议可以分享呢~



请输入标题

「抖音青年的蛇精病一生」

「您好,请问店里有抖音同款吗?

头条号公告秒懂解读,重粉丝!重粉丝!重粉丝!


友情链接