快手科技多媒体内容了解部李岩 AI技术贯通于快手的产品骨髓之中

“AI技术贯通于整个快手产品的骨髓之中,经过AI技术启动多维赋能,让更多人无时机被环球看见,也能看到更宽广的环球。”5月25日,在2019环球人工智能技术大会(2019GAITC)上,快手科技多媒体内容了解部担任人李岩如是示意。

大会在南京举行,李岩在“人工智能与媒体融合前沿论坛”作了演讲。李岩作为快手科技的代表,讲述了快手如何用AI技术去赋能每一个个别用户,让每一团体的记载方式更丰盛、幽默、高品质。

李岩说,快手在AI技术上的深耕,降落了短视频的创作门槛,经常使用户尽或许地凑近专业水准。而无了解内容、了解用户中成功视频和用户的精准婚配,让每位用户取得更大的展现空间,同时看到了更大的环球。

他以为,经过短视频成功的记载,让人与人以及人与环球衔接起来,是很无心义的,从全体来看,优化了网民之间的信赖。

以下为演讲内容实录(有删节):

十分快乐无时机引见在快手这样一个短视频社区,AI是如何运行的,详细会发生什么样好玩的AI运行。

我的分享分为三局部。第一局部便捷引见一下快手;第二局部引见AI技术如何协助用户优化视频创作品质,降落创作门槛;第三局部引见AI技术如何了解视频,了解用户,并做好散发。

快手是什么

快手把自己定位成个别人记载生存和分享生存的社区型产品,经过短视频、照片以及直播的方式,协助人们记载自己的生存,使每一团体都无时机被环球看到,也能看到更宽广的环球。

快手在2011年降生,往年成立8周年,目前DAU已到达2亿。2011年,GIF快手是做动图的工具,2013年移动互联网兴起,咱们看到了短视频的关键影响和作用,2013年7月,工具型产品转型为短视频社区。转型短视频社区之后,快手的数据成功了指数级增长,2年1月,快手日活用户超越1000万,截止到如今,快手的日活曾经抵达2亿。在中国的互联网市场,日活2亿量级的APP十分少。仰仗数亿用户几年的积攒,如今有超越100亿条短视频记载在咱们的社区里,并以每天新增1500万条短视频的速度参与,4年前这个数字只要几十万。

在快手里,用户记载了大千环球里的方方面面,在这里咱们可以看到很多种实在有力气的生存,有些画面是咱们在群众媒体看不到的。比如这个视频,鸭绿江的放排人在运输木材,把平地上的木材顺着水流运到山下,这种新鲜的水运方式曾经很少被人通晓,在快手这群人被数百万人关注到。还有这个视频,这是市区工地上的“水鬼”,这个职业很小众,但一二线市区的每一座高楼大厦都须要他们,在用建高楼大厦打地基的时刻,须要用电钻挖几十米的深坑,电钻头掉了须要他们潜到几十米深的混浊泥水中,把电钻恢恢复位。

个别用户记载的生存,涵盖的内容逾越了之前的记者或许专业人士记载、调研的范围。有数亿人在快手记载自己的生存,这里有当代的百工图,有环球各地的旷野习俗,还有用户记载的各式各样的游览生存,也有清华、人大等高校传授解说常识启动常识流传,这些画面汇集起来就是一幅咱们当代生存的清明上河图。

AI协助用户用更低老本创作出更高水平的视频

接上去,我重点讲一下AI技术如何协助这款短视频产品做得更好。我宿愿协助各位媒体的好友们了解到,AI技术其实是贯通于快手的产品骨髓之中,运行在视频消费、视频了解、用户了解到视频介绍的整个环节。

视频创作环节,咱们宿愿每团体都能成为自己生存的导演,用手机去记载生存,而且生成相对较高品质的视频。如何协助每团体成为自己的导演呢?在视频创作环节快手宽泛运行了AI技术,用科技去赋能个别用户,使他们尽或许凑近专业制造视频的水准。

咱们宿愿让用户用更低的老本创作出更高水平的视频,这就须要让AI助力于内容消费。

比如,快手之前上线的一款魔法表情叫“快手光阴机”,用户可以在几十秒钟内看到自己风貌变老的环节。一团体拍自己的视频是很有趣的,咱们宿愿用户能够体验到自己变老的样子。

又比如,把AR技术运行在用户拍摄视频的环节,给事实生存的画面参与一些虚构的元素,这属于增强事实,使虚构环球和事实环球更好的互动,使人们在记载自己生存的时刻有更多的离奇的体验。

再比如,咱们会运用图像相关的算法,协助用户去改过拍摄中发生疑问的视频,比如脏镜头造成的视频画面含糊,光线疑问造成的画面暗淡及画面偏色的疑问。

这些玩法和配置的面前是快手对前沿AI技术的开发,触及人体姿态预计、手势识别、背景宰割等多个技术模块。这些都是快手致力将记载方式变得愈加幽默的新尝试。

这里有一个应战,上述技术都要在手机本地实时地启动计算与渲染。快手领有数亿用户,用户的手机机型千差万别的,这要求咱们的算法必定在一切的机型上都能流利运转,这对咱们AI才干的要求是十分高的,十分消耗计算资源。为了处置这个疑问快手自研了YCNN深度推理学习引擎,处置了AI技术运转受限于用户设施计算量的疑问。

音频方面,咱们也做了十分多的上班。比如之前专业的人在创作视频时,编辑字幕是十分痛苦的事件。如今咱们经过语音识别技术,可以帮视频制造者智能参与、编辑字幕,而且还可以以各种各样的方式展现字幕,借助AI的技术极大地降落了生成字幕的老本。

在短视频场景里音乐起了十分关键的作用。据统计,快手的视频中,有60%-80%的视频用背景音乐烘托气氛。如何选用失当的音乐表白心境,其实是不容易事件。让用户尽量贴合音乐的节拍创作举措,关于用户的要求也是十分高的,具有很强乐感的人其实十分少。

为了降落用户创作视频时选用音乐的门槛,咱们开发了智能配乐及AI生成音乐的技术。智能配乐可以依据视频画面及用户画像为用户介绍适宜视频画面,并被用户青睐的背景音乐供用户选用。AI生成音乐经过AI的剖析算法,可以感知到视频画面中人的举措,而后让生成的音乐节拍婚配人的举措,这样是极大地降落了用户创作视频时选用音乐的门槛,让大家更情愿创作自己的视频。

用AI了解视频,了解用户,做好散发

下面分享的是AI技术如何降落人工创作短视频的门槛,使个别用户都可以创作出品质还不错的短视频。用户创作并上行到咱们的社区后,咱们又做了哪些事件更好的散发这些视频呢?

了解视频其实十分复杂,对人脸纬度的解析、场景类的解析、音乐类的解析等等,这些都是从单个角度启动建模,其实视频须要多模态的解析。咱们须要做到让机器高效的判别用户上行的视频是不是合乎规定的,判别视频内容是不是原创的,以及要做到把视频精准的婚配给对他感兴味的用户。

咱们让机器能够协助咱们治理好上行的海量视频,同时帮咱们做好视频的介绍,而且介绍给用户的视频是能激起用户兴味的。这里还触及用户了解,指的是让机器了解咱们的用户,其中包含了解用户在社会学上的特色,以及用户的兴味,包含他的短期兴味喜好以及中常年兴味喜好,以及海量的能够代表用户特色的更小的向量。

在视频的散发上,快手上有一个十分无心思的现象,咱们不宿愿头部的视频内容占据太多的曝光,咱们用经济学上的基尼系数控制平台上用户之间的“贫富差距”。互联网上的留意力资源是十分贵重的资源,咱们宿愿这种贵重的资源也能分给个别人,而不是像聚光灯一样汇集在大批的头部用户身上。所以咱们设计了快手的介绍机制,无论是明星还是个别人在快手都是一样的。快手注重消费者的利益,注重长尾视频内容的散发。咱们宿愿留意力资源可以朝阳光一样撒给一切消费视频的用户,这样个别人就无时机被更多人关注,能够感遭到被关注被认可的幸福感。

经过短视频成功的记载,让人与人以及人与环球衔接起来。咱们以为,建设这种衔接是十分无心义的事件。咱们每团体的心坎深处都是寂寞的,都宿愿经过衔接去取得关注、认可,并且能结交好友。因此,快手用户之间的相关会粘性更高,更稳如泰山。从全体来看,这可以优化网民之间的信赖。

我当天的分享就是这些,谢谢大家。

您可能还会对下面的文章感兴趣: