人工智能刚刚开始工作 并“推翻”了培训一个合格的人工
2020-07-01 14:54:00来源:科技日报
目前,完全依靠人工智能进行编辑工作是不现实的。让人工智能成为人类编辑的助手似乎更可行。通过合作,双方将使工作更有效率和质量。
几天前,微软宣布计划在6月底取消近80名外包编辑,人工智能编辑将负责MSN网站的新闻采集、排版和制图。然而,我没想到人工智能编辑在到达后不久就“推翻”并犯了一个非常低级的错误。人工智能编辑在寻找照片时,混淆了非裔美国歌手利和阿拉伯裔美国歌手杰德。
在回应微软人工智能的错误图片时,杰德也在社交媒体上表达了不满:“区分两个不同肤色的人有这么难吗?”为什么一直以高识别率著称的人工智能这次会翻身呢?
解决脸盲问题需要不断扩大学习范围
人脸识别技术是目前人工智能领域公认的一项成熟技术,业内人士渴望将人脸识别的准确率提高到一个新的高度,最高可达99.9%。人脸识别技术有如此辉煌的记录,为什么这个人工智能编辑仍然是面盲?
"人脸识别技术的工作原理主要是比较面部特征和面部特征的比例."天津大学智能与计算系教授韩亚红解释说,简单地说,基于人脸图像的大数据,我们首先对我们看到的人脸图像进行预处理,提取人脸的各个方面的特征,并通过多次提取找到最有效的用于识别个人人脸的特征表达。
近年来,人脸识别技术发生了巨大的变化,传统的人脸识别方法已经被基于卷积神经网络的深度学习方法所取代。深度学习方法的主要优势在于,它们可以通过大规模数据集进行训练,从而学习这些数据的最佳特征。
“虽然大规模数据集可以用于训练,但目前99.9%的准确率基本上是在一些基准数据集上测试的结果。该数据集必须有一个范围。如果收集的数据在数据集的分布范围内,就可以获得相对较高的准确率。”韩亚鸿说道。
众所周知,人脸识别的准确率在99%以上,其中很多都是参考了世界上最权威的人脸数据库LFW(标注在野外的人脸)的对比测试结果。LFW可以作为一个题库来检验深度学习系统的人脸识别能力。它从互联网上抽取6000张不同方向、表情和光照环境的人脸照片作为试题,可以让任何系统在其中“运行评分”。在“运行点”的过程中,LFW给出了一对照片,询问测试系统这两张照片是否是同一个人,系统给出是或否的答案。
“解决特定的面部失明问题并不难。事实上,它是重新确定任务的目标,收集该任务区域中的人脸图像,在原始算法模型上进行训练,或者重新设计新的算法模型进行训练,这将提高人脸识别。速率,以满足实际应用的需要。”韩亚红说,但除了具体的任务,人工智能的“脸盲”还会复发。目前还没有通用的模型算法可以解决所有的任务,但是人工智能可以通过不断的调整和学习来提高人脸识别的准确率。
深度神经网络模型是进阶的必要条件
"目前,人工智能编辑对于新闻文档的分析和处理是比较方便的."韩亚红介绍,具体来说,比如说,在一篇长篇报道中,让艾编辑挑出重点,这是没问题的。现在是多媒体时代,大量的新闻报道将涉及图片和视频。人工智能编辑器可以自动提取图片或视频,然后从大规模文本报告中选择匹配的文本描述。人工智能可以准确地完成这项工作。
“要解决特定领域的问题,大部分时间人工智能仍然没有问题,但要实现普遍性就更难了。”韩亚红强调,要实现这些功能,需要自然语言处理、模式识别、图像和视频理解等领域的技术。
要培养一名人工智能编辑,我们需要收集大量的新闻报道、图片和视频,然后根据收集到的数据为这项任务设计一个深层神经网络模型。网络模型中会有很多参数,然后通过数据对这些参数进行训练,首先会设置各种编辑能力。在使用过程中,随着人工智能编辑了解到更多的新闻,其业务能力和性能将不断提高。
"但是目前的新闻制作对人工智能编辑来说仍然非常困难."韩亚红说,为了让人工智能学会写新闻,有必要收集大量的数据,为特定的新闻主题训练模型。目前,人工智能技术只能在相对固定的风格和小词汇量的领域中完成文本生成,如天气预报,人工智能能很好地输出相关的报告和消息。然而,为了生成人类创造的具有创新需求和丰富情感描述的文章,人工智能的编辑能力需要进一步提高。
协作将使新闻生产更加高效
“有趣的是,人工智能犯的大多数错误都是我们意想不到的低级错误,但在某些方面,它们是如此强大,以至于人类无法与之匹敌。”比如韩亚红说,在文章分类的工作中,人工编辑要读很多,重复性的工作费时费力,速度也很慢。然而,人工智能编辑非常简单,人工智能可以通过文本文档的主题建模来准确地按主题对文章进行分类。此外,对于短新闻,可以使用模板,如天气预报,证券信息等。人工智能编辑器可以准确、快速地将各种数字或专有名词嵌套到模板中,从而完成特定的文档生成任务。
美联社使用人工智能系统自动编制和分发公司财务报告。人工智能系统自动抓取数据,将其嵌入美联社预设的新闻模板,并能在几秒钟内完成150-300字的短消息。该系统每季度可以产生大约4000篇新闻文章,而美联社的人工编辑每季度只能完成400篇新闻文章。
做这些具体的任务,人工智能编辑不仅在速度上,而且在惊人的准确性上比人类更强大。“像排序或嵌套模板一样编写短消息,因为任务很明确,人工智能的准确性仍然很高,而且几乎没有打字错误或数据错误。”韩亚红介绍道。
人工智能编辑在使用大数据分析预测爆炸方面可能比人类更“科学”。2015年,《纽约时报》使用人工智能机器人来筛选和分析社交平台上的文章,并预测哪些内容适合推广。它自动推荐的文章点击量大大增加,甚至达到普通文章的38倍。
“但在人工智能编辑的世界里,只有两种状态:知道和不知道,所以一旦处理的内容是超一流的,他们就会立即犯许多低级到可笑的错误。”韩亚红说,对于人类来说,即使他们杰德从未见过利,根据常识,他们也不会混淆非裔美国人和阿拉伯裔美国人。
“在现阶段完全依靠人工智能进行编辑工作是不现实的。让人工智能成为人工编辑的助手似乎更实际。”韩亚鸿说道。美联社预测,人工智能在媒体行业的参与可以帮助记者释放大约20%的时间,这样记者可以将更多的时间用于内容创作,简单的事实核查和研究工作将移交给人工智能,这有利于提高新闻质量。
“在未来,人类应该把人工智能编辑作为合作伙伴,双方将共同努力,使他们的工作更有效率和质量。”韩亚红说,人类不应该觉得人工智能是来“抢饭碗”的,而应该为有一个像人工智能这样的伙伴而感到幸运。