说“小心,眼前的这个男人很XX”也不过分,现在我们去哪里都逃不过上面的声音。 虽然努力模仿人的节奏语调,但通过耳朵马上就能知道解说电影的不是人,而是AI。 输入复印件,自动合成语音,AI是目前短视频量产的标准配置。 除了语音外,视频也是AI的主攻方向。 首先,AI作品话题的播放次数达到了1亿7000万次,#AI作品的播放次数达到了11亿8000万次。 并且,在文本生成视频中,AI的内容生成能力进一步提高。 荟、谷歌最近陆续发布了AI生成的短视频,百家号、TikTok等内容平台也同样押注AI,并更新了相关创作支持功能。 国庆期间《人民日报》官方账号发布AI绘画版《我的祖国》 MV,网友开心。
从语音到静止画,再到视频,AIGC (人工智能生成内容)全面渗透到了短视频中。 考虑到AI的进化速度,昨天还是只言片语,但是今天可以随意生成现实世界中不存在的动画,所以很自然就会有担心。 镜头交给AI,创作者去哪里,平台如何应对? AI对短视频的“入侵”,牵涉到应该讨论的一系列问题。
爱看、不可小觑的AIGC到2022年,中国短视频用户将达到9.62亿,占全部网民的91.5%。 在这样一个短视频的大盘子里,AI生成的内容的大众基础怎么样? 视频平台最近兴起的内容可以作为参考。 选择大家熟知的歌曲,根据歌词让AI生成画面,组合后就是AI导演的MV。 例如《漠河舞厅》《孤勇者》《杀死那个石家庄人》《波西米亚狂想曲》0055-790000等,可以找到相关的AI绘图视频。 而且,这类视频的关注度也相当高。 以B站的《杀死那个石家庄人》相关视频为例,画面由名为“Midjourney”的AI绘制程序制作,于9月30日发表,10天内播放量达到103.4万,点赞量达到4.4万。 观看视频后,网友“奶酪”评价说:“学了五六年美术,画比输入词条几十秒钟就出来的画好。” 然后,在好奇心的驱使下,奶酪开始在各个平台上搜索相关内容。 切换到AI的视角感受算法模型对世界的感知,其实是AIGC受到广泛关注的直接原因。 AI制作的静止影像已经爆发到这一步,如果升级到更短的视频,对用户的吸引力可想而知。 从静到动,从二维到三维的升级是AIGC的发展趋势,元和谷歌最近的动作是风向标,两者相继发表了文本生成视频的最新研究成果。
根据谷歌发布的样张,AI不仅能够理解文字,生成骑马、冲咖啡等高精细的视频,还能根据文字故事用图像表现出2分钟以上的长照片。 基于AI已初步具备制作短视频的能力这一事实,有业内人士表示:“随着AI对短视频的‘入侵’日益加深,短视频平台的内容池中出现了传统的UGC (专业”评论说。 Gartner相关报告也表明,预计到2023年20%的内容将由生成式AI创建。 2025年,生成性AI创造的数据占所有已生产数据的10%,目前该比例不到1%。
为了创作者,AI和人类在同一个竞技中在同一个路线上争夺用户的注意力,出现AI和创作者之间的竞争关系。 元、谷歌的AI模型生成视频的新闻一出,“抢工作”的发言就变得热烈起来。
其实,AI和人类之间的爱恨纠缠并不是什么新鲜的话题。 聚焦创作领域,不久前网友刚进行大讨论,国外艺术博览会就为AI绘画作品颁发头奖,这引起了全体人类艺术家的不服。 在深圳运营MCN机构的彭磊表示,公司经营着多个短视频平台账号,“对AI的反感可以理解,但AI来抢工作,短视频行业变天的说法是不成立的。 这种非黑即白的认知有很高的概率是错误的,以前也验证过。 ”例如,在短视频火爆之前,文字媒体时代,AI技术被引入文章写作,市场也曾一度悲观地预测文字工作者将被取代。 事实证明担心是多馀的。 “短视频行业无法绕过AI,字幕、配音今后也会长期共存。 大家使用技术的目的是为了提高效率,但部分功能便利的代价是影响作品整体的外观。 例如,AI永远都在模仿人类。 对于对作品有要求的创作者来说,一般避免AI配音。 那是因为与人类的差距很明显,工业化的痕迹太重了,”彭磊说。 另一位解说电影的博主说:“按需使用,AI配音的优势在于快速进行大量复制,以量取胜。 真正优秀的作品,几乎不允许用那台机器的声线读自己精心写下的复制品,以质取胜。 因此,“AI技术降低了内容生产的门槛,降低了下限。 上限仍然依靠人类创作者。 ”这是AIGC固有的极限,AI作画、AI生成视频也很难绕开。 例如,以AI作画为例,在欣赏多幅画后,奶酪发现:“AI作画乍一看令人惊叹,但非常容易导致审美疲劳,看多了都会觉得每一幅画都在重复。” 在专家的解释中,之所以会有上述感觉,理由很简单,因为所有的AI作画都是按照模型计算的,都是基于人类创作的画风、技巧之上的。 而且,机器只是表层的理解,不能参与深层的意义。 就是常说的“没有灵魂”。 因此,AIGC新鲜度的轮廓消失,观众的视线焦点回到内容本身,重新审视AI制作、AI生成动画。 那个时候谈论“逃避吃”的话,可能会得到不同的答案。
从创作支撑到原创生成,挑战平台机遇和行业新技术的出现,不仅直接影响用户、创作者群体,平台方作为舞台的搭建者,自然也十分关注。 第一阶段是“辅助手段阶段”,AIGC辅助人类内容生产的第二阶段是“合作阶段”,AIGC以虚实共存的虚拟人形态出现,形成人与人共生的局面; 第三阶段是“原创阶段”,AIGC独立完成内容创作。 参照李彦宏描述的AIGC三个发展阶段,从目前的内容平台布局来看,无论是图文还是短视频平台,其服务能力往往停留在第一阶段,运用AI相关技术,创作者可以更加高效例如嘀嘀打车官方剪辑软件提供的语音识别字幕、图文生成语音等,B站官方剪辑软件必切后推出的智能钥匙等AI功能。 有业内人士进一步表示:“拍摄短视频时使用的漫画风、迪士尼风、老化等特效滤镜也与AI技术相结合。 但是,这些还没有达到独立生成视频的水平,介于创作支持和原创生成之间,与ZAO的改头换面APP一样,是通过生成系统网络进行的。 ’随着AIGC技术的发展,内容平台的服务能力将迎来升级。
以创作者对图文视频的需求为例,剪切映射为其提供了“图文”功能,输入文字,软件能智能匹配图片素材,添加字幕、解说、音乐,自动生成视频。 百家号等内容平台也提供相关解决方案。 身处创作第一线的彭磊表示:“从目前的视频来看,工作时间将一部视频的制作缩短到分级是肯定的,但成片效果并不理想。 简单地从素材库中选择图、选择视频来实现。 有着同样的体验。 经常出现的问题是,即使是原本完整的一个句子,如果中途有停顿,系统也有可能从前后文中寻找完全不相关的两个素材并进行组合。 ”能用的技术才是好技术,目前的内容平台服务能力还有很大的进步空间,AIGC技术的发展正是解决之道。 另一方面,AIGC的大规模上线将会给平台的内容生态带来新的管理课题。 到目前为止,AI技术在短视频领域的滥用已经有了很多前车之鉴。 其理由是,AIGC有——这个非常显著的特征。 典型地,市面上有很多开放的AI换脸工具,创作者可以通过使用软件加工视频内容,轻松开花。 此前嘀嘀打车涉嫌使用AI变脸变身俄罗斯美女,吸粉近200万后被平台屏蔽。 站在B站上AI变脸是创作者安排鬼畜生活的最常用手段,平台会在相关视频下方给出警醒提示。 现在,最先进的AI作品、AI生成视频,其无中生有的特性无疑增加了内容伪造的风险。 国外流行的文本绘制程序Stable Diffusion不过滤生成内容,因此用户可以生成各种图像,为欺诈、侵犯他人肖像画、盗版等提供可乘之机。 对于嘀嘀打车、快手、B站等平台来说,如何加强这种视频的“无害化处理”,显然比改变AI的面貌更不容易。 这意味着在成功使用新技术之前,平台不可避免地会经历阵痛期。
AIGC的明天,不仅是短视频,有人期待技术能为自己所用,也有人担心会被AIGC夺走工作。 更有甚者,有人预言短视频会变天……在实际爆炸之前,一切都还是未知数。 但是,确认了AIGC向内容领域的渗透还在继续,AIGC产业将迅速扩大。 如果继续放宽AIGC概念,除了AI创作、AI生成视频等内容生产外,虚拟数字人也往往被业界视为AIGC的另一核心载体。 考虑到虚拟数字人的极高热度,AIGC的发展空间更值得肯定。
目前,短视频平台上的虚拟人团队正在不断扩大,形象各异的他们已经在短视频创作者群体中占有一席之地。 数据显示,平台上相关视频播放总量已过亿。 关于虚拟人的另一个客观事实表明,短视频只是其应用场景之一。 VC数千亿的投资,由阿里、百度、字节、华为等科技互联网公司联手,以更高的概率瞄准虚拟人短视频以外的广阔天地。 从点和面上看,AIGC已经全面渗透到短视频中,但其未来的应用价值还不止于此。 纵观整个AI领域,AIGC涵盖的生成性AI技术被认定为AI领域过去10年来最有前景的进展。 当然,对于以尖端技术为代表的未知,大家在期待的同时也伴随着本能的恐惧。 几百年前火车问世,引擎轰鸣引领人类社会进入高速时代,而拉火车的闹剧几年前5G商用时,5G辐射过大的质疑不绝于耳,如今国内三大运营商的5G套餐用户近10亿。 另外,去方兴未艾的AIGC,各方不同的态度实际上是有道理的。 作为员工和创作者,彭磊对AI生成视频和AIGC市场持乐观态度,“最直观的是,AI生成视频可以从根本上解决创作者的素材困扰。 如果找不到合适的素材,直接通过程序生成,平台开放版权归属,甚至无需考虑版权纠纷,完全不考虑被置于当前的创作环境中。 ”恐怕,反复期待和恐惧,在瞄准尖端的同时慎重对待技术,可能是讨论AIGC在短视频产业中的影响的基本立场。
本文由熊出墨,请注意。 文:彬彬,转载请联系原作者取得许可