作者 | 徐常亮
来源 | 视听界
相比于拥有数百年历史的媒体行业,人工智能是一个崭新的概念。这项复杂的技术基于一个简单的理念:让机器来认知世界,通过人类难以企及的计算能力来解决问题和完成复杂的工作。2011年,Google首先提出了谷歌大脑的概念,一年后他们就做出了一个标志性的成果:让计算机可以识别猫脸。这个项目利用互联网数据来训练,更多地是在打造一种底层平台。这意味着人工智能第一个阶段的开端:让机器来认知世界。
2016年以来,发源于互联网行业的人工智能,却开始向互联网以外的行业延伸,触达传统行业,甚至在一些特定领域引起了颠覆性的革新和质变。谷歌旗下的Deepmind研发的AlphaGo在围棋这一细分领域击败了人类棋手,让普罗大众开始认识和了解人工智能这一概念。几乎同一时间段,阿里云推出了城市大脑,让人工智能开始应对交通和城市管理的问题。人工智能第二个阶段的探索开始了:让人工智能来解决问题和完成工作。
而媒体大脑是媒体与人工智能融合的产物。从报纸到广播、电视,再到互联网和智能手机,技术一直是驱动媒体变革和发展的力量之源,而现在无疑又到了一个媒体需要变革的时代,有一系列的问题亟待解决:新闻核心生产力靠什么技术?影响力靠什么提升?未来的新闻资源在哪里?下一代媒体到底长什么样?
2017年12月26日在成都举行的第五届中国新兴媒体产业融合发展大会上,.shuwen.com)和第一条MGC(Machine Generated Content,机器生产内容)视频新闻,向海内外媒体提供2410(智能媒体生产平台)、采蜜、新闻分发、版权监测、人脸核查、用户画像、智能会话、语音合成等8个模块的服务,探索人工智能时代媒介形态和传播方式的未来。
2018年1月,:“今年,,升级“现场云”资源聚合平台,利用“媒体大脑”平台的智能采集、用户分析、图像识别、语音合成等功能,推进在策划、采集、编辑、加工、分发、反馈等全流程应用,探索智能化编辑部的标准和范式,抢占融合发展制高点。”
在今年期间,,呈现如工作报告中关键词、高频词的趋势变化等,背后已经是一条智能化新闻生产流水线:由记者和编辑来定义产品设计模型,然后让机器批量生产内容。
媒体大脑MGC新闻
负责媒体大脑研发和落地的就是新华智云,我们的slogan是:“凭计算之力,求数据洞察,赋万物为媒,迎智能时代。”媒体大脑实际上是新华智云对这条slogan的实践,它的核心要素就包含在这四句话中:计算、数据、万物、智能。计算联结数据,智能赋予万物。
数据计算合
孤立的数据无法产生价值,大数据对“量”这一指标的需求是空前的,数据的联结靠的是计算。媒体行业百十年来累积下了巨量的数据资源,是有待挖掘的宝地和矿藏。
互联网公司内有这样一种思维:“一切业务数据化,一切数据业务化。”这很像“从群众中来,到群众中去”的工作方法,只不过需要提炼和系统化的对象变成了一项项具体的业务。媒体同样是业务的一种,而人工智能的快速发展,则让媒体看到了这一工作方法的现实可行途径。
业务数据化,首先要做到的是让线下数据走向线上,让过去的数据产生价值。在机器识别猫这一过程中,人工智能首先得到了几百万帧的静态视频资料;AlphaGo在刚刚起步时,同样搜罗了巨量的人类棋谱来学习。这都是让既有的信息记录,真正变成人工智能管理下的数据资源。通过强大的计算力,人工智能就可以在图片间、棋谱间找到关联,进而得到“识别猫”“下围棋”等具体的能力。
数据业务化,则是为人工智能的工作找到一个出口,并进一步接收反馈。AlphaGo通过自我对弈和与人类高手的较量,不断调整自己的棋路以及对胜负的预期,最终获得了人类难以企及的棋力;而城市大脑则根据城市摄像头数据对红绿灯的放行策略进行优化调整,具体的调整结果又会反馈到城市大脑中,成为进一步完善调整策略的重要参考。过往成功的人工智能案例在这一步上所做的,是让数据的使用和反馈成为一个闭环,而这也是媒体和人工智能融合过程中的一条必经之路。
新闻记录的是历史,沉淀的是数据。路透社流传着一句话,“在新闻成为新闻之前,都在路透社存着”,而在新华智云看来,“Before it’s news,it’s data;After it’s news,it’s data”。也就是说新闻即数据,数据即新闻。媒体大脑的第一项工作,就是去建立一个全球最大的新闻资讯库,这包括了文字、图片、音频和视频等各种媒介形式,也包括了主流媒体和自媒体乃至UGC(User Generated Content,用户生产内容)等各类信息来源。搜罗信息仅仅是一个开端,如何让信息结构化、标签化才是“一切业务数据化”的关键,而这个过程中必不可少的就是算力。随着云计算业务的发展,媒体大脑可以调用的计算资源在近几年间得到了巨幅提升,这对媒体而言是前所未有的一次机遇,也是媒体大脑得以成立和发展的重要基础。
而在收集反馈、形成闭环方面上,人工智能的发展早已走在了前面。随着互联网和智能手机的快速普及,新闻受众对于信息的反馈早已不再是慢悠悠的“读编往来”,人工智能的一个小分支——推荐算法,近几年来已经形成了一种行之有效的商业模式。对于媒体来说,收集受众的反馈本该比过去任何一个时代更简单。但在实际工作中,很多媒体却受限于工作思路或媒介形式,缺乏相应的信息沟通渠道。而汇总了全媒体信息和数据的媒体大脑,提供的正是这样一种一站式的解决方案。它收集的反馈一方面使媒体受惠,另一方面还能为人工智能的自我进化提供数据支持,让媒体和人工智能间达到互利共赢的效果,这也是媒体和人工智能融合的价值和意义所在。
智能万物苏
人工智能并不独立存在,它需要依托于作为“物”的计算机和智能设备才可以工作。而反过来说,人工智能也可以赋能给各种各样的设备,让它们具有感知世界、向世界发声的能力——这是人类能力的延伸。随着人工智能的发展,我们也将目睹一个万物为媒的进化过程。
2410(智能生产平台)
媒体大脑2410(智能媒体生产平台)目前运用人工智能技术、大数据技术、物联网技术、云计算技术,由MGC覆盖突发事件、程序性报道、舆情报道。其生产过程是:首先通过摄像头、传感器、无人机等方式获取视频和数据,然后经由图像识别、视频识别等技术让机器进行内容理解和新闻价值判断,选取报道角度,将新理解的内容与已有知识图谱进行关联,对语义进行检索,并配合接入天气、交通、地理等数据,经过视频编辑、语音合成、数据可视化等一系列过程,最终生成一条富媒体内容(文字、视频、图谱、音频、可视化)这条素材和线索,可以在不同的平台上展示,或在移动端、或在智能音箱等。由于人工智能的牵线搭桥,万物成为了广义上媒体的一部分。
,与广为人知的UGC形成了对应。在新闻领域,MGC和UGC的共性是在第一时间、从第一现场搜集第一手的新闻素材,但MGC的潜力显然更胜一筹:它的感知设备是可复制的,将来覆盖的时间、空间和信息收集的类别都将远超于人类。机器收集的素材也不存在主观判断问题,它是一个更加真实、全面,也更加结构化、数据化的新闻资源。MGC今后的产量将是UGC的3倍或者三次方以上,借助机器,人们可以更高效地生产专业内容。
在可预见的未来内,MGC的发展将与智能设备的发展紧密联系在一起,信息渠道的多寡决定了MGC的覆盖面和进步速度。这包括了行车记录仪、无人机、智能家居等各类摄像和传感设备,以智能音箱、智能电视为代表的各类信息输出设备,还包括潜在的VR(Virtual Reality,虚拟现实)/AR(Augmented Reality,增强现实)设备,甚至是未来可能无所不包的机器人。人工智能将全面赋能给这些设备,并从中获取自己成长所需的养分。
人机协同 未来可期
在人工智能领域,有一个长久以来被争论的问题:人工智能是否会取代人类?具体到媒体领域,人工智能有没有可能取代记者、编辑?MGC新闻是否会替代人类的报道?2013年时,牛津大学的Carl Benedikt Frey和Michael A. Osborne发表了一篇论文,对702种职业被人工智能取代的可能性做出了分析。具体到记者这个职业上,论文中认为人工智能可以取而代之的概率只有11%。两位学者提到了难以被人工智能取代职业的三个特征:帮助和关切他人、思考和创意内容、社交和谈判能力。截至2017年末,这篇论文已经被引用超过1500次。
可以看到,媒体人在日常工作中,恰恰对这三个特征都有一定程度的需求,而这其实就对应着我们评价新闻报道时常说的有温度、有态度、有深度。如果新闻欠缺了这些要素,那它确实可能被机器所取代,但这显然不应成为媒体人对自己的要求。人工智能的发展和MGC新闻的出现,其实为媒体人展示的是另一条路径:让机器做机器擅长的事情,让机器去成为人类的千里眼、顺风耳,让机器去承担低价值的重复、枯燥的劳动,而内容工作者将由此得到生产力上的解放。
媒体大脑赋能的记者工作场景模拟
过去和现在的记者都需要花费巨量的时间在搜集、整理新闻相关的资料和素材上,这件事未来就可以让机器来做,而且很可能比人类做的更加有条理、有效率;以往记者收集自己作品的反馈费时费力,在未来这同样可以由机器代劳。媒体与人工智能的融合会在整个新闻生产流程中提高效率,而节约出来的时间就可以让记者去做更有价值、更有观点、更有温度的深度报道。媒体大脑所推动的,正是这样一次新闻生产流程的重塑,进而改变媒体由内到外的整体生态环境。
未来优秀的媒体人不必是人工智能专家,但他/她一定知道怎样利用人工智能来更好地为自己的工作服务。媒体大脑和MGC视频新闻的出现,不是要取代记者和编辑,而是在更高层面上,把人与物的延伸连接起来,更快、更准、更智能地获得新闻线索和新闻素材,赋能记者和编辑,帮助媒体提高生产力。在媒体和人工智能的融合之路上,媒体大脑将与媒体携手前行。
(徐常亮:新华智云联席CEO,阿里巴巴大数据平台ODPS(即MaxCompute)、机器学习平台PAI创始人)
(全文见《视听界》2018年5月刊)
视听界
微信:jsbc-shitingjie
“全国广播影视十佳学术期刊”
“致力于对策研究”的办刊定位
研究广电改革与发展的热点难点
邮发代号28-320,全年定价108元
发行部电话:025-83287968
编辑部电话:025-83287966
投稿邮箱:shitingjie@sina.cn