来源@视觉中国
大脑极体
成为中国的YouTube,这估计是每个国内视频网站都曾经幻想过的目标。
现在,就全球市场规模和营收规模而言,YouTube已经成为巨头。然而,在中国,很难找到一个视频网站能与YouTube的实力相匹敌,甚至有类似的模式。
差异是如何产生的,成了一个可以写成商业专著的话题。这次我们关注的是一个更细致的产品技术问题,即YouTube上已经实现的自动字幕功能,为什么没有出现在国内主流视频网站上?
据报道,2017年初,以UGC起家的YouTube已经为10亿部视频提供自动字幕服务,用户日播放量超过1500万次。目前已经支持全球10种语言的自动字幕,以及包括简体中文在内的上百种语言的机器翻译。
那么这个自动字幕功能为什么不被我们国内的视频网站“抄袭”呢?
也许你的第一反应会是技术原因。是的,不是全部。毕竟近年来国内的自动语言识别技术早已成熟,在视频网站的应用可能不成问题。
“不是为了它,不是为了它。”如果孟还活着,他可能会说这句话。但是原因是什么呢?恐怕还是要继续提问。最后我们其实想问问这些国内视频网站的新老玩家:
这么“甜”的技术要不要学?
自动字幕:从Goodness到Business
YouTube的自动字幕功能是谷歌的工程师在2009年开发的,也就是谷歌收购YouTube的三年后。
该功能的初衷是通过将视频声音转换成文字字幕,为世界各地的听障用户提供便利。开发这个功能的软件工程师Ken Helenstein也是一个聋哑人。
众所周知,YouTube是从用户的UGC视频内容起家的,至今仍是全球最大的UGC视频网站。目前月用户访问量可达18亿,用户每分钟上传视频400小时,时间还在增长。
同时也意味着有大量上传的UGC视频没有主动添加字幕。这对听力正常的用户没有任何影响,但对于听力受损的人来说,相当于缺少了极其重要的音频信息。
自动字幕的加入在一定程度上帮助听障用户获得更多的信息渠道。
目前,谷歌和YouTube团队正在利用机器学习为自动字幕添加声音信息,从而更大程度地丰富音频内容的表达。增加声音字幕,如铃声、狗叫声、敲门声等,也是一种技术上的改进,提高聋哑人或听障人士的观看体验。
这种基于社会责任和用户公平体验的技术也带来了额外的营销价值。
随着自动字幕可以识别的语言的增加和自动翻译的加入,这项技术已经成为全世界用户都可以受益的功能。比如大量高质量的英文配乐知识分享视频,可以自动添加英文字幕,然后转换成其他语言,供非英语用户观看和学习。显然,这对YouTube的全球化起到了积极的推动作用。
在每天几千万次的自动字幕使用中,难免会出现一些语音识别的错误。然而,随着YouTube社区中的用户对自动字幕信息进行评论和编辑,这些信息将再次进入机器学习过程,从而帮助自动字幕系统提高其准确性。同时,自动字幕和机器翻译准确率的提升,促进了内容推荐的准确率,进一步增加了用户的粘性和使用时间。
一项有助于提升用户体验的AI技术,在用户海量数据的帮助下变得更加强大,证明了“技术换好处”可以带来更多意想不到的好处。
当然,这里有一个遗憾。如果你有机会使用YouTube的简体中文自动翻译功能,你可能无法理解翻译的中文真正的意思。
第一,有可能视频中的汉语口语的音频内容确实很难翻译;其次,由于你知道的原因,自动翻译的数据模型并没有得到有效的训练。
那么,如此独特的市场缺口,如此巨大的应用规模,如此现成的技术条件,为什么没有一家国内视频网站主动使用呢?
00-1010在你想回答“为什么国内一些主要视频网站没有采用自动字幕”这个小问题之前,你需要回答“为什么他们没有继续发展UGC的内容模式,而是转向影视剧版权购买的模式”?
十几年前,中国还不是UGC的沃土。相比美国家庭掀起的家庭视频、生活视频的生产消费浪潮,当时国人对优秀影视作品的需求更加强烈。UGC内容并没有取得更好的商业变现方式,坚持UGC作为“土豆网”的定位已经为时过早。
出局的元老级玩家。
而影视剧作品是不缺少优质的人工字幕翻译的。在国家严格把控版权问题之前,在这些视频网站上,大量的海外电视剧电影被以“用户上传”的名义免费播放。同时,提供国外影视剧翻译的字幕组的出现,也让视频网站们可以以极低的成本获得优质、准确的字幕。
2010年之后,随着爱奇艺、腾讯视频的出现,优酷土豆合并后又被阿里收购为标志的BAT巨头入场,视频网站们彻底进入了以PGC影视剧内容生态为主的“版权”烧钱争夺战。这时的巨头们已经开始向往Netflix的自制会员付费模式了。
UGC内容当中的字幕添加问题,从商业价值上也就再也没有进入这些网站的决策范围了。
再者,中国自身市场的数亿的用户红利,使得当时的视频网站们在争夺存量市场都有些自顾不暇,自然也没有动过“出海”的念头。没有出海需求,也就没有海外用户。而统一的中文语言环境并不需要对中文音频进行多语种的翻译。即使随着机器学习、自然语言处理技术的出现,也没有视频大厂们想要费力去应用。
对于长期处在烧钱亏损状态的玩家们,照顾听障者等弱势人群的观看体验,看来也没有进入到他们的产品目标当中。毕竟主流的影视剧视频资源和PCG内容资源都已经使用了人工添加的字幕。边缘化的UGC内容和特殊的少数用户群,似乎并不需要投入过多精力。
从以上种种的原因看来,动力不足,正是这些视频大厂们不愿玩转“自动字幕”的最好解释。而无所作为并不代表他们未来也不需要这项技术。
在当前人口红利消失、用户增加趋缓的情况下,出海成为近两年来几大视频网站玩家们的集体行动。除了将国内优秀的影视剧内容对外输出外,吸引海外用户制作分享大量的优质UGC内容,成为产品海外市场本地化发展的必由之路。
而从YouTube的启示来看,增加这一自动字幕以及自动语言翻译功能,将会对UGC内容生态带来非常积极的正面作用。
十年来,狂飙突进中落下的功课,是不是该补一补了?
破解出海困境,自动字幕可助一臂之力
当前,以海外版抖音TikTok为代表的短视频应用出海方兴未艾,而国内以腾讯、爱奇艺为代表的长视频网站巨头也已经开启出海模式。当前,主要扎堆进入东南亚市场。
TikTok这类更具兴趣属性和娱乐表演属性的短视频应用,沉浸式的算法推荐也同样在海外取得了极大的成功;带版权的背景音乐、炸裂特效和简单方便的字幕特效和傻瓜式的剪辑手法,使得海外年轻人们的接受和制作门槛更低。TikTok很快在日韩、美国以及东南亚等国家快速流行起来。
相比之下,依靠精品内容出海的视频网站则显得进展缓慢,需要步步为营,稳扎稳打。
我国视频网站的出海时间不长,但已经经历了三个阶段。先是经历了海外优质内容的引入;然后再复制这一模式加强自身版权内容的对外输出。而在去年,则开始主导搭建海外的自有媒体平台,并开始与海外各个国家的主流媒体、运营商等达成长期战略合作。
华语内容的输出成为本次出海的重点,但是想要在海外市场真正取得成功,那必然还是要吸引本地化的视频内容。据调查,海外视频用户更会为带有本地文化印记和本土语言的视频内容进行付费。因此,鼓励海外本地的UGC内容的制作和分享,培养和建成规模化和规范化的本地内容生态,才能最终留存住本地化用户,形成长期使用习惯。
除了进行一定的原创内容补贴,或者参照YouTube的广告分成模式外,降低UGC制作的使用门槛,提升海外用户的观影体验,也是更为根本的解决方案。
这时候,基于语音识别和机器翻译的能力,增加自动字幕以及自动翻译的功能,可以更好地帮助制作者完成字幕的添加工作,同时帮助大量用户快速翻译其他国家的视频内容。
一、通过加入对视频内容的自动字幕的加入,可以吸引海外用户更愿意主动创作本土内容,增进海外用户对本土内容的观看和消费。
二、通过引入多语种之间的字幕翻译,来提升和优化海外用户的内容推荐体系,从而形成丰富的海外生态,从而提高视频内容的国际化推广的力度。
当然,自动字幕和自动翻译功能的实现还受到语料资料的限制,国内的视频网站们除了自身所熟悉的中文视频外,还要对东南亚各国的音视频的语音进行大量地采集和训练。
出海难题无数条,起码这一技术可以作为在出海中打拼的“腾爱们”必须要补上的一门基础课,而视频内容的本地化UGC可以成为下一轮出海重点发力的新尝试。
欲戴王冠,必承其重。众所周知,YouTube在全球获得的巨大流量,来自于YouTube的强大的技术能力、广告营销体系以及谷歌的软硬件支持……从今天YouTube的成功去倒推原因,我们会列出一串长长的清单。在这份清单的一行里,我们注意到了出于社会责任而添加的一项小小的功能,而这一功能却带来每天上千万人的使用。
对于国内的视频网站来说,这确实是值得学习的一个经验。即使一开始并没有特别紧要的应用场景,也没有明显的商业利益,但是可以通过技术,特别是AI技术,来大规模地、以无限降低边际成本的方式,来改善用户体验,那一定是值得去尝试的。
而现在,国内视频网站、短视频已经处在扬帆出海的风口,语音识别以及机器翻译的技术也现成可用,而全球文化多元化交流的需求也正在井喷。出海的这些玩家们想要抓住这场新的全球UGC内容爆发的红利,自动字幕技术大有可为。