保利威视访谈 | 视频行业:生之困境中的异军突起

我们总是高估新技术的短期价值而低估它的长期价值。然而,有些重大的事情确实发生了,我们已跨过临界点。——by 凯文.凯利(KK)

我们总是高估新技术的短期价值而低估它的长期价值。然而,有些重大的事情确实发生了,我们已跨过临界点。——by 凯文.凯利(KK)

01

生存困境

有一个行业,有着冰火两重天的境遇,热闹非凡的同时却举步维艰。

这个行业就是视频直播行业。这个行业已成汪洋红海,竞争惨烈。即使情况较好的大平台也面临着主播成本过高、流量带宽成本过高、内容监管困难、平台运维困难、政策监管趋严难题……以往在其背后闷声赚钱的设备供应商和CDN供应商等也都遭遇了疯狂的压价,整个产业看似热闹非凡,实则不知明日几何。近期艾瑞发布的报告中指出,由于版权、自制内容成本不断攀升等原因,作为主要营收来源的广告贴片带来的收入不足以支撑视频产业链的盈利,导致大多数视频网站仍旧处于亏损局面。

视频直播盈利之路,蜀道之难。

02

异军突起

有一家长期专注互联网视频领域的技术研发和运营公司,叫做保利威视。这家公司神奇的地方在于,从创建的半年之后就开始盈利了。短短三年,已成功搭建集云点播、云直播于一体的云视频服务平台……宛若亚马逊湍急的互联网竞争河流下,他们是怎么样生长出了自己的生存技能?

保利威视通过B端客户覆盖了2亿多终端用户。主要有三类典型用户类型。第一类,传统教育机构.以线下为主,像新东方、全通等教育机构,以及北京大学、北京师范大学等院校,线上教学时大量使用保利威视的技术。第二类,纯线上教育机构,这类企业领头羊像邢帅教育;第三类,一些知名企业。比如西门子、平安银行、顺丰、链家等,链家用保利威视技术实现视频看房;西门子则是有关于家电使用方法。通过视频直观的方式告诉用户如何处理,节省企业客户的成本。

董事长兼创始人谢晓昉认为传统视频公司之所以不盈利,问题在于这些平台所播放的大量的个人视频缺乏价值和营养。企业级的视频是企业精心制作的,希望去得到保护去交易的视频。所以它本身携带了巨大的价值。在价值传递过程中,保利威视为它提供体验好的视频服务。保利威视业务的增长还来自于一个重要的方向——海外。香港、欧洲这些传统发达地区或国家,传统教育非常发达,但在互联网应用技术上是比较薄弱的,正好需要保利威视的技术去帮助他们实现在线化。

世上有两种技术:期待中的和意想不到的。而保利威视,做的就是一般人并不了解的,期待中的视频解构分析。

03

安全隐患

移动互联网的发展使得移动学习成为一个非常主流的方式。但现在移动视频盗版属于非常严重的重灾区,大家实现快速上线的同时往往忽略了安全性。比较而言,PC端相对严密一点,但移动端极大的漏洞给了盗版者以机会。

保利威视在运营了大概半年左右,做过一次客户分析,注意到80%的客户是教育机构。根由就是当时保利威视推出了视频播放功能的关键帧错序加密技术,也就是现在的playSafe的版权保护体系,非常多的教育机构是冲着这个技术来的。目前这个技术已经从1.0版本发展到了VRM5.0版本,不仅是能做到文件级的加密,还能做到碎片化、动态加密。谢晓昉个人的从业经验也是助力加分项,对于高并发或视频流畅大平台,具有非常丰富的经验。

谢晓昉透露,不管高校还是教育机构,只要是对自己的知识产权看重,就会倾向性的选择他们。这个自信来自于保利威视经常和其他品牌的安全性进行PK,同样的课件放在网上,如果能把视频盗版下来就算成功,但竞争对手基本都失败了。

这里需要单独介绍一下保利威视在移动视频版权保护有独到的技术:当SDK运行在iOS或Android手机内存当中,解密、加密完全是在内存里进行。在任何文件系统以及没有加密协议当中传输时,不会把明文数据暴露在文件系统和非加密通信网络协议当中。保利威视研究过,中国Top20网校和视频App,或多或少都存在大大小小的问题,在安全角度看来都是非常容易被盗版的。但经过保利威视处理之后,就不再会出现被盗版的情况发生。

还有,直播是生产课件非常重要的方式。直播完成之后课程就那么扔掉了,对资源是一种浪费。现在直播平台借助保利威视的录播系统、加密系统,直播完的课程马上转入到录播系统,这是非常非常多的直播系统做不到的。

04

虚拟现实

Facebook 创始人扎克伯格认为,媒体的重心从文字开始,逐渐过渡到图片,然后进阶到影视,最终拓展到虚拟现实。每前进一步,内容的维度就更加丰富。

如今火遍天的VR技术,被保利威视主要应用于两个教学领域:

厨师培训。可以让学员感觉到第一视角是它的大师傅怎么样布局配料、炒菜时的感觉是什么,让学员对高手的感受有具体的了解。

医学手术培训。这是医疗手术培训的痛点,手术室是相对比较狭小或要求没有人打扰的环境,不可能找个人去看怎么样做手术。主刀医生戴着全景摄像头设备,让远程学员体验到当时的场面,而且不会干扰手术的进行。

传统的视频,即使高清1080P的视频,视频传输量相对VR来说小很多,基本是1/4。医疗场景是个刚性需求,而医学要求非常清晰的高精度画面。VR数据流量大、造成的码率过大是现在遇到的一个问题。在私有网这个问题并不明显,但在公有网如何快速实现高清、远程、身临其境的VR医疗教学现在还是一个巨大的技术挑战。

谢晓昉认为保利威视的技术其实是连接器,用来连接内容制造者以及VR播放者的解决方案。内容制造者生产各种各样的视频,企业、教育机构;保利威视让设备厂家以及内容生产商通过他们的云视频实现在线VR视频播放,相当于是个VR视频在线播放连接器。

05

拆解视频

一般来说,所谓智能首先在识别,识别各种各样的信号。最初级的识别是语音识别,更难的是图像识别,最难的是视频识别。

众所周知,视频数据是用非结构化的,我们可以理解为视频是“一坨存在”。那你可能要问,视频是一个完整结构,为什么在保利威视眼里,视频数据是可以被分解的?

谢晓昉表示分拆的核心就在于音频识别引擎。文字化之后可以被检索,且能和视频内容进行关联。识别率第一依赖算法,第二依赖于训练库的大小。机器学习,某一个领域文件越多,识别的机会越多,识别率越高。保利威视有2700万个视频,分布在不同的教育类别里,比如建筑师培训,医学考证培训,公务员培训…这些知识库的积累量很多,通过他们的算法可以让视频播放之后,进行音频识别。第二,训练。识别完之后不是单纯形成内容,而是内容和时间戳是关联起来,这样可以让机构快速定位知识点,把这些知识点通过数据方式进行结构分类、多维度分类。

还有声纹识别,和语音识别在一起。比如在特朗普的音频里,知道他的语音识别特征,会在几十万或上百万视频里找到那个人的声音。相当于在深度学习和人工智能领域,视频数据结构化以后,进行大数据挖掘。还不是很明白?想象当你想找一个人,通过摄像头的截取图像就能识别人脸。原理就是把人脸数据变成可以被快速被检索出来字符型数据。而声纹从根本意义上和人脸识别原理是一样的,只是处理的是音频数据。目前,保利威视和中大的博士团队进行的合作中,从音频识别,到图像识别,再到视频识别,还有VCR光学识别,都已经有比较大的进步,声纹识别已经比较成熟。

06

深挖数据

保利威视现在有细分的归类数据库:一是行为数据,二是视频内容数据(结构化数据)。

行为数据,保利威视作为基础视频的云服务提供商,会向B端用户输出播放器,B端用户播放视频会产生很多操作,比如手机的停留、暂停、拖拽、反复观看,这些都是行为数据,每一条都会记录到后台非关系型数据库里。每天有超过1亿数据存在我们后台。这些数据能对学员的行为进行分析,如果视频某一段学生不停观看视频,说明这个视频要么太难懂要么老师没有讲清楚。还有课件视频的完成率,比如一个10分钟的视频有80%的人看完了80%的内容,或者一个视频80%的人看完了50%的内容,那么很明显,这个视频的质量是有差异的。通过这些数据的对比,能够分析出课件的质量、知识点的难度,以及其他教学指标。

由于云识别而产生大量结构化的视频内容的数据。虽然这些资源资产属于用户,但依旧可以使得保利威视能够帮助用户,在这么大的库里让他们识别数据更精确。

任何的人工智能都是通过大量的基础数据来进行算法或程序的深度学习之后,才能产生所谓的智能。算法永远只是一方面,数据才是最重要的。

很多行业、很多产品,当他们刚刚问世的时候,都是非常幼稚、非常简陋的。但是技术就是在我们不以为然当中以一种指数级的速度在往前发展。一旦技术让我们刮目相看,让人们觉得已经很成熟甚至近乎完美的时候,不仅仅表示现有的产品成熟,而且表明它正在以更高的速度往前发展。它真的会带来我们今天还不能清晰想象的一种文明的巨变。

技术随时会突破,但资源的积累在短时间内无法形成的,这正是保利威视的优势。

更多内容请关注作者微信公众账号“yangjunjun420”