衡阳日报电子版衡阳日报数字报衡阳日报在线阅读衡阳日报新闻衡阳日报网_衡阳日报社官网

　　日前，微软宣布拟裁撤近80名外包编辑，由AI编辑负责接下来的MSN网站的新闻抓取、排版和配图等工作。但没想到，刚到岗没多久，AI编辑就“翻车”了，而且犯了一个非常低级的错误。AI编辑在寻找配图的时候，把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。

　　针对此次微软AI的配图错误事件，Jade也在社交媒体上表达了不满：“正常区分两个不同肤色的人有那么难吗？”为何一向以高识别率著称的AI，这次却“翻车”了？

　　解决脸盲问题

　　需要不断扩大学习范围

　　人脸识别技术是目前AI领域公认的比较成熟的技术，圈内人士也热衷像刷分一样把人脸识别准确率屡屡刷出新高，最高的号称准确率可达99.9%。人脸识别技术有如此辉煌的战绩，为何此次AI编辑还会脸盲呢？

　　“人脸识别技术的工作原理，主要是比对五官比例以及面部特征。”天津大学智能与计算学部教授韩亚洪解释，简单说，就是基于人脸图像的大数据，先对看到的人脸图像进行预处理，提取面部各个方面的特征，并通过分层多次提取，寻找对于识别个体人脸最有效的特征表达。

　　人脸识别技术这些年已经发生了重大的变化，传统的人脸识别方法已经被基于卷积神经网络的深度学习方法替代。深度学习方法的主要优势是它们可通过大规模数据集进行训练，从而学习到这些数据的最佳特征。

　　“虽然可以使用大规模数据集进行训练，但是目前99.9%的准确率，基本上是在一些基准的数据集上测试的结果。这个数据集肯定是有范围的，如果收集的数据是在数据集分布的范围内，便可获得比较高的准确率。”韩亚洪说。

　　据了解，目前号称人脸识别准确率达到99%以上的，很多指的都是和全世界最权威的人脸数据库LFW（Labeled Faces in the Wild）进行比对测试的成绩。LFW可以被认作一个考查深度学习系统人脸识别能力的题库。它从互联网上提取6000张不同朝向、表情和光照环境的人脸照片作为考题，可以让任何系统在里面“跑分”。“跑分”过程是LFW给出一对照片，询问测试系统两张照片是不是同一个人，系统给出yes或no的答案。

　　“解决特定的脸盲问题并不难，其实就是重新针对任务，收集这项任务领域内的人脸图像，在原有算法模型上训练，或者重新设计新的算法模型进行训练，都会提高人脸识别率，以满足实际应用的需求。”韩亚洪说，但是超出了特定任务，AI的“脸盲症”就会复发。目前并没有哪个通用的模型算法可以解决所有的任务，但是AI可以通过不断地调整，大量的学习，从而提高人脸识别的准确性。

　　深度神经网络模型是进阶的必要条件

　　“目前针对新闻文档的分析和处理任务，AI编辑做起来相对得心应手。”韩亚洪介绍，具体地说，比如在一篇很长的报道中，让AI编辑把重点摘出来，这是没有问题的。现在是多媒体时代，大量的新闻报道会涉及图片和视频，AI编辑可以将图片或者视频自动提取出来，再从大篇幅的文字报道中，选取与之相匹配的文字说明，这个工作AI是可以比较准确地做到的。

　　“解决特定领域的问题，AI大多时候还是没问题的，但是要实现通用，就比较难了。”韩亚洪强调，实现这些功能需要用到自然语言处理、模式识别、图像视频理解等领域的技术。

　　要培养一名AI编辑，首先需要收集大量的新闻报道和图片视频，再根据收集到的数据设计一个针对这个任务的深度神经网络模型，网络模型里会有很多参数，然后通过数据把参数训练出来，它就具备了最初设定的各种编辑能力了。在使用过程中，随着AI编辑学习了更多的新闻，它的业务能力和性能也将不断提升。

　　“不过目前的新闻生产对于AI编辑来说还很困难。”韩亚洪说，要让AI学会写新闻，必须要针对某个特定新闻主题，进行大量资料搜集和模型训练。目前AI技术只能在风格相对固定、词汇量使用范围较小的领域完成文本生成，比如天气预报等内容，AI可以很好地输出相关报道和消息。但要生成人类创作的那种有创新要求、情感描述丰富的文章，AI编辑的能力仍有待进一步提升。

　　协作将使新闻生产更加高效

　　“有趣的是，AI犯的错误大多是我们意想不到的低级错误，但在某些方面又强悍到让人类望尘莫及。”韩亚洪举例说，像给文章分类这种工作，人类编辑要进行大量阅读，重复性劳动耗时耗力，速度非常慢。但这项工作AI编辑做起来就非常简单了，通过文字—文档的主题建模，AI可以比较准确地对文章按主题进行分类。另外，对于可以使用模板的短新闻，比如天气预报、证券信息等，AI编辑可以准确迅速地将各种数字或者专有名词嵌套到模板中，从而完成一定的文档生成任务。

　　美联社曾使用AI系统自动编发企业财报。AI系统对数据进行自动抓取，将其嵌套在美联社预先设定的新闻模板中，几秒钟就能完成一篇150—300字的短消息，该系统每季度能产出约4000篇新闻，与之相比，美联社的人工编辑们每季度只能完成400篇。

　　做这些特定的工作，AI编辑比人类厉害的地方不仅在于速度，准确率也可圈可点。“像分类或者是嵌套模板写短消息这类的工作，因为任务明确，AI的准确率还是非常高的，很少出现错别字或者数据错误。”韩亚洪介绍。

　　在运用大数据分析预测爆款方面，AI编辑可能比人类单纯从经验出发显得更“科学”。2015年，《纽约时报》使用AI机器人对社交平台中的文章进行筛选和分析，预测哪部分内容适合推广。凡是由它自动推荐的文章的点击量都大大增加，甚至达到了普通文章的38倍。

　　“但在AI编辑的世界中，只有知道和不知道两种状态，因此处理的内容一旦超纲，它们就会立刻犯很多低级到可笑的错误。”韩亚洪说，像这次AI编辑把非裔的Leigh跟阿拉伯裔的Jade弄混了的这样的错误，对于人类来说，即使没见过Leigh ，但根据常识，也不会把非洲裔和阿拉伯裔弄混。

　　“目前阶段的编辑工作完全依赖AI是不现实的，让AI成为人类编辑的帮手似乎更切实可行。”韩亚洪说。美联社预测，AI介入媒体行业能够帮助新闻工作者释放20%左右的时间，让后者可以将这部分时间更多地投入到内容创作方面，简单的事实核查与调研方面的工作交给AI，有利于提高新闻质量。

　　“未来，人类应该把AI编辑当作合作伙伴，双方协同起来，使工作更加高效有质量。”韩亚洪说，人类不应该觉得AI是来“抢饭碗”的，而应该为有AI这样的合作伙伴而感到幸运。

　　相关链接：机器人能取代人类记者吗？

　　外媒称，有关微软公司本月开始用人工智能取代自家新闻网站部分编辑人员的新闻，一度成为网络上的关注热点。但专家认为，人工智能技术目前尚未发展到能够取代人类记者的水平。

　　据《俄罗斯报》网站6月28日报道，人工智能替代编辑人员的事实本身并非神奇创举：世界上的许多媒体早已开始使用电脑程序来创作新闻，普通读者甚至无法察觉到这一点。《纽约时报》报道称，彭博社新闻中约有三分之一的内容是由自动化技术创作的。新闻写作机器人能帮助人类同事分析财务报表并根据重要事实和数据快速生成新闻。与人类记者不同的是，“机器记者”在撰写财经新闻时永远不会有任何抱怨。《纽约时报》称，人工智能正在帮助彭博社开展与路透社的竞争。

　　报道指出，机器人在体育转播中也大显身手。美联社让人工智能学会了“评论”棒球比赛。《华盛顿邮报》的“机器记者”从2016年起就开始参与奥运会和美国总统选举的报道。

　　澳大利亚版《卫报》从2019年开始使用“机器记者”创作文章：人工智能分析大量数据并在其基础上创建文本模板。新华社的人工智能合成主播则能够进行夜间新闻直播。

　　报道认为，毫无疑问，“机器记者”也有出错的时候。微软的人工智能新闻编辑开工不到10天就出了大洋相，但最终为“机器记者”行为负责的还是人类。

　　今年5月，脸书被迫下线了自己的聊天机器人，原因是它发表了侮辱用户的“言论”。2016年，微软决定用机器人发布公司推特。如果说它最初发布的是类似“所有人都很棒”的推文，那么几天后它便学会了骂人并开始写下“我恨你们所有人”之类的文字。当然，微软很快就让这位“博主”下岗了。

　　报道称，人工智能技术目前尚未发展到能够取代人类记者的水平。“机器记者”可以学会完成特定任务，如生成财务报表、改写新闻、进行互联网体育转播、根据事先确定的模板报道重大事件或朗读文本，但至少目前它们还写不出高质量的分析文章。专家们一致认为，“机器记者”要具备这种能力至少还需要30年时间。据新华网

	第A01版：版面一
	第A02版：版面二
	第A03版：版面三
	第A04版：版面四
	第A05版：版面五
	第A06版：版面六
	第A07版：版面七
	第A08版：版面八
	第A09版：版面九
	第A10版：版面十
	第A11版：版面十一
	第A12版：版面十二
	第A13版：版面十三
	第A14版：版面十四
	第A15版：版面十五
	第A16版：版面十六