2000人来审核内容，今日头条招的是数据勤杂工？_F11

分享到

2000人来审核内容，今日头条招的是数据勤杂工？

区块链专栏 来源：雷锋网作者：1讯站发布时间：2018-01-07 20:56:27 人浏览

摘要

文/陈匿今日头条的跨年并不是在兴奋与喜悦中度过。12 月 29 日，北京市互联网信息办公室针对今日头条持续传播色情低俗信息、违规提供互联网新闻信息服务等问题，责令其立即停止违法违规行为。这是官方在抛出算法有没有价值观、机器有没有温度等系列命题之

文/陈匿

　　今日头条的跨年并不是在兴奋与喜悦中度过。12 月 29 日，北京市互联网信息办公室针对今日头条“持续传播色情低俗信息、违规提供互联网新闻信息服务”等问题，责令其“立即停止违法违规行为”。

　　这是官方在抛出“算法有没有价值观”、“机器有没有温度”等系列命题之后的最后一次“强干预”。虽然，今日头条的平均用户停留时长已比肩 Facebook、微信等黑洞级应用，但其 “琳琅满目”的信息呈现与用户的期待依然有不小的落差。如头条所倡导的“算法没有价值观”，用脚投票的用户也没有价值观，只有好恶。

　　在六个“重危”频道被整顿 24 小时并将“新时代”这一“价值观频道”设为默认后，今日头条的开年第一件大新闻是：在天津招聘 2，000 名内容审核编辑岗位，加强内容审核。该职位要求热爱新闻，关心时事，具有良好的政治敏感度和鉴别力，要求本科及以上学历，党员优先。而此前今日头条的审核团队已逾千人规模。

　　其中的被动式应战意味显而易见，透露出的一个重要的信息就是：包括今日头条在内的个性化推荐引擎的算法在性能调优、千人千面这件事上貌似失效了。大家都看到了脏的东西，只是内容不一样而已。于是，我们不由得去思索一个问题：这些个性化资讯提供商真的是黑灯工厂吗？在“下一代搜索引擎”面前，人与机器的关系是怎样的？

　　我们先从即将为今日头条工作的 2，000 名“内容审核编辑”入手，猜猜看他们的工作是什么。落点在编辑，核心却在审核，甚至是在数据标注。毕竟一个号称没有编辑的推荐系统怎么可能需要 2，000 多名编辑？审核的含义就显而易见了，头条号的内容（数据）能不能分发、发出去的能不能展示、怎么展示，被迫务实的今日头条需要紧急解决的就是减少“低俗色情”内容了，机器不行人来凑。

　　今日头条已经越来越离不开繁重的人力劳动了，这家“高举高打、向 BAT 全面开战、作战半径越来越长”的小巨头正在通过更多的、更底层的人力劳动来夯实地基，完善数据标注和分类，弥补低水平人工智能的缺陷。当然，需要这么做的不仅仅是今日头条，还有整个人工智能领域。

　　人工智能的核心是机器学习，它涉及了算法、统计、概率等多学科，那些看似简单甚至笨拙的语音反馈、图像搜索和个性化内容推荐，都基于无数繁复单调的人力劳动。就像苹果公司带动的智能手机产业链一样，人工智能这一辉煌的朝阳产业，依然离不开三四线城市的劳动力、在校大学生以及大量社会兼职人员的工作，今日头条此次在天津释放的 2，000 个审核编辑名额正是瞄准了这一群体。

　　人力劳动与人工智能的关系最直观的体现正是由今日头条所掀起的新闻客户端“个性化推荐革命”了，在此类产品中，内容的多级分类、垃圾内容的清洗及过滤、用户行为画像都涉及复杂的机器学习，而需要人工标注数据去喂养机器的可以是分词、关键词，也可以是文章分类、文章中图文的比例。如果将一整套算法比作一个健全的有机系统，每一个维度的数据都是构建这套系统的神经元，它们或多或少会影响用户展现层，可谓是差之毫厘谬以千里。

　　那么，那些你喜欢的、你不喜欢的内容是如何从数百万级的内容库里被选择推荐到你的信息流里？我通过与几位个性化算法工程师、今日头条的前产品经理和从事这个“内容审核编辑”工作运营人员聊天，了解到了密集的人力劳动是如何喂养机器智能的。

　　分词标注：理解你的兴趣之前，先理解汉字的意义

　　众所周知，英文是以词为单位的，词和词之间靠空格隔开，而中文是以汉字为单位，把中文的汉字序列切分成有意义的词，就是中文分词。中文自然语言处理（Natural Language Processing）中，分词是必不可少的一个过程。

　　个性化推荐引擎，最重要的就是把有意义的信息前置，其核心是相关度排序。分词准确与否直接影响排序，影响你的信息流列表里是否都是你个人感兴趣的东西。

您可能感兴趣的文章 :

珀科技出席人民大会堂“中国区块链企业峰会”学习

原文链接 :

Tag : 学习(8)

投资元宇宙：是风口还是虎口？

中新网北京9月20日电（刘欢）元宇宙是近两年来的新兴概念，虚拟社交、数字藏品、VR游戏被认为将是下一代互联网的元宇宙，究竟是风口还
陈醋月饼、臭鳜鱼月饼、区块链月饼，总有一款

我们扒了下今年的奇葩月饼，梳理了一份独家（不正经）的2022奇葩月饼名单，看完还是忍不住说一句：离了个大谱。综编｜胡楠楠吴莹头
这家公司加班签约

股权高比例质押、资金紧张，要靠热点和概念撑
比特币，凝望深渊，深渊也凝望你

作者万喆为经济学家，澎湃新闻特约评论员比特币暴跌，受损者众多近日，比特币暴跌，6月19日，比特币两度失守18000美元关口，当天最低
iPod之父：元宇宙就是浪费时间和精力

编译/VR陀螺最近，许多科技圈的高管都分享了他们对元宇宙的观点，这其中也包括了iPod 之父Tony Fadell ，他在接受外媒采访时表达了自己对
190亿美元！马斯克超越贝索斯首次登顶福布斯全

澎湃新闻记者李潇潇当地时间4月5日，美国《福布斯》杂志官网公布了2022年亿万富豪榜榜，美国太空探索技术公司创始人、特斯拉首席执行
元宇宙社交大洗牌：未来已来，腾讯未至

火热的元宇宙概念下，社交入口一片喧嚣。今年1月，一款名为啫喱的社交App走红，上线仅20多天，就超过微信、QQ，登顶苹果应用商店免费
OPPO做投资，大厂的新故事

文/五行来源：节点财经（ID:jiedian2018) 提起国产手机，OPPO总是绕不过去的存在，它的营销战绩和线下渠道能力，都让人印象深刻。在手机行
虚拟货币：“财富神话”还是“韭菜收割机”？

作者：唐燕飞小心！你信奉的财富神话可能真的只是神话，而你或许正成为被盯上的待收割的韭菜！去年以来，比特币的暴涨带动了整个虚
比特币血崩之后，那批还没放弃的人怎么样了？

文/陈邓新编辑/许伟来源：锌刻度（ID:znkedu）全球金融市场剧烈动荡，比特币也未能独善其身。 3 月 12 日，比特币价格血崩，最低跌破3