当前位置:首页> 原创动态 >新闻视频剪到瘫?媒体人该尝试下人脸识别技术了

新闻视频剪到瘫?媒体人该尝试下人脸识别技术了

2023-05-10 14:56:27

编者按:近日,BBC新闻实验室(BBC News Labs)探索出了人脸识别技术在新闻界应用的可能性,借此技术减轻新闻视频编辑和制作人的工作负担。本文详细解读了这款名为FaceRec的人脸识别视频剪辑工具的各项功能组件,让你脑洞大开。

 

作者:BBC News Labs’ AI Researcher Fionntán O’Donnell

BBC News Labs’ Software Engineer Remi Oduyemi

来源:BBC News Labs

 

近期BBC内部正在研发一款名为FaceRec的人脸识别工具。BBC新闻实验室(BBC News Labs)随即想到:这项技术是否可以用来协助我们新闻编辑室同事的工作呢?

 

于是,BBC新闻实验室设计出了在网页上运行的人脸识别产品样品,帮助编辑和制作人识别原始新闻视频中的重要人物。实验室还进行了内部的用户调研,探究未来项目中应用图像识别技术的可能性。

 

前期调研


新闻实验室首先研究了视频记者的工作流程,询问他们认为人脸识别技术能怎样辅助他们的工作。实验室了解到,制作人和视频编辑在制作新闻时通常会以镜头(shot)为单位。他们会在BBC的媒体素材管理库里搜索所需要的镜头,许多镜头都是典型的新闻镜头,比如:


· 建筑(如财经新闻中出现的金丝雀码头)

·

· 人物行走(此时会有画外音介绍相关采访对象)

· 两三个名人在一起(如特朗普总统和特蕾莎·梅并肩行走)

 

样品设计

 

实验室研发的样品有多个组件,旨在减轻视频剪辑这项工作的负担。样品工具利用FaceRec处理原始视频得到的数据来突出视频中最重要的人物,并提示这些人物可能是谁。


A screenshot of our full prototype

(样品工具截屏;图源:Medium)

 

组件包括:

· 视频处理任务列表

· 人脸识别框

· 直方图,显示检测到的人脸的密度梯度

· 时间轴,显示检测到人物的姓名

· 轨迹窗口

 

下面为大家一一详解各组件。

 

任务列表

 

 (任务列表;图源:Medium)


通过任务列表,视频编辑能轻松监控上传视频的实时状态。文件上传后,编辑就可以使用页面下方的视频播放器和人脸识别工具。列表中的任务名和素材库中的文件名一一对应,方便编辑快速定位所需视频。

 

人脸识别框

 

FaceRec处理后的数据包含人脸的图像坐标。用这一坐标数据就可以生成人脸识别框,让编辑在播放视频时能更容易地追踪人物。

 

直方图

 

(直方图,图源:Medium)


直方图里的每个矩形代表视频每帧图像中的人数。直方图是可交互的,编辑可以点击矩形来到对应的某帧图像。这样一来,编辑就能根据所需镜头里人数的多少从素材视频中快速定位。

 

举例来说,编辑要是想剪一个包含英国皇室全体成员的镜头,可以点击识别出多张面孔的时间点。编辑还可以通过直方图找到空镜头,比如议员开会前的议会大厦镜头。

 

时间轴

 

(时间轴;图源:Medium)

 

时间轴显示了识别出的人物的姓名,没能识别出来的人标为“未知”。用户可以点击时间轴的任意一点,找到包含特定人物的镜头。

 

轨迹窗口

 

轨迹窗口包含三个可折叠面板:

人物面板

时间轨面板

剪切面板


(轨迹窗口;图源:Medium)

 

人物面板显示了视频中识别出的人物的小头像。编辑可以选择一个或多个人物,找到所选人物出现的镜头。时间轨面板起到提示作用,让用户能跳至所选人物出现的某一特定时间点。

 

剪切面板只显示出现所选人物的连续镜头。编辑在制作纪念性视频时可能会用上这个功能。

 

测试结论

 

在进行了为期六周的测试后,实验室发现了FaceRec的局限之处,比如识别准确度还不够高,在一些镜头中难以识别出人物,产品还不够成熟等。

 

从用户调研中我们还发现了产品其他可能的用途。BBC实验室团队未来可能会依据这些调研结果创建新的研发项目。

 

比如:


自动化制作律表


“律表”是一个业内名词,指的是包含视频每个镜头具体描述的元数据文件。律表上通常会有镜头类型(如:特写、中镜头)、时间戳以及连续镜头的拍摄内容。

 

新闻机构经常能给制作人内容详细的律表。但BBC记者因为时间有限,常常不能提供详细的律表。利用人脸识别和其他图像分析工具,我们也许可以自动化制作律表,协助编辑和制作人找到他们需要的镜头素材。

 

快速定位受访对象


有些活动参与人数众多,很难从众多镜头中找到受访对象。面部识别工具能缩短找到相关人物镜头的时间。

 

人物提示

 

很多制作人都担心FaceRec会把人认错。如果BBC播放的是特蕾莎·梅的访问,而屏幕上显示的是默克尔的名字,这种错误肯定是不能容忍的。因为不能保证百分百的准确率,所以面部识别不会应用于在直播里自动标记显示人物姓名。

 

不过我们可以推出自动人脸提示功能,提示关键帧中出现的可能是哪些人物。这种功能可以添加一个选项按钮,这样就可以快速标记更多镜头中的人物,而不用把所有人名手打到系统里。这样的功能可以协调元数据内容规模和AI工具安全性之间的矛盾。

 

结语


虽然BBC新闻实验室为他们在六周内制作出的技术样品感到骄傲,但他们也充分认识到人脸识别技术面临的诸多挑战:准确识别、重建模型、每天处理上千个视频的巨大任务量,以及充足的经费支持等。因此,一项重要的任务就是找到可以接手FaceRec研发工作的团队。

 

不过,BBC新闻实验室存在的意义就是解决新想法、新用户、伟大技术和软件发展之间的摩擦。实验室很期待找到人脸识别技术以及其他AI技术的未来发展方向,为BBC新闻制作工作提供更多便捷。

 

(编译:刘天睿)


点击阅读原文,查看英文原文

友情链接