没骗你,我的小猫真能后空翻

没骗你,我的小猫真能后空翻

思念他 2025-03-10 科技报 20 次浏览 0个评论

原创 人大新闻系 RUC新闻坊

奶萌猫猫在线摇花手,院子里不知名的花树落英缤纷,贾宝玉和林黛玉扭打在一处,关羽和悟空紧紧相拥……

当你震惊或沉醉于这些光怪陆离的画面时,角落里“视频疑似AI生成”的提示能否拉回你的思绪?

从音色、人脸克隆,到魔改影视作品、一键生成动画特效和写实影片,AI生成视频的形式不断丰富,制作门槛也越来越低。

用AI生成视频,真的只需要一段文字、一张图片就能搞定吗?成品到底能不能以“假”乱“真”?技术不断迭代升级,原有的鉴别方式还依然有效吗?

Mr.

一只猫咪正在后空翻

没骗你,我的小猫真能后空翻

Mr.

五只克隆的小猫在画面中跳舞

没骗你,我的小猫真能后空翻

用AI生成视频,成本真有那么低?

AI视频生成平台往往把“积分”作为“货币”,每次创作都需要消耗一定的“积分”。部分软件会赠送用户一定量的免费积分,只要生成次数不超过限度,就可以免费生成视频。

如果想要额外的“积分”,就需要花钱购买“会员”。会员根据等级不同享有数量不等的额外积分,能够使用更先进的模型和运动镜头、高画质、对口型等进阶功能。同时,会员还能够购买更多积分用于创作。

按照会员购买积分的价格折算,花不到2块钱就能让AI生成一段视频。但这并不是全部成本。

没骗你,我的小猫真能后空翻

从时长来看,AI单次可生成的视频时长有限,最常见的是5秒左右。就职于中国外文局AI视界工作室的谭佳庆向RUC新闻坊表示,虽然AI工具性能始终在进步,但想要一次性生成1分钟左右的画面仍然很难,其稳定性、连贯性和画面质量都难以保证。

而性能表现最好的单次生成时长5秒左右的视频,其中“能用的也就是3秒”。想要完成一条1分钟视频,需要用20余个片段进行拼接。

能否得到满意的视频片段,取决于“提示词”的质量,以及“运气”。

无论是文生视频,还是根据图片生成视频,一般都需要用户撰写“提示词”描述需求,指导AI进行创作。能否写出准确且可被AI理解的提示词很大程度上影响视频生成效果。市面上的各大软件也常常通过智能扩写、提供参考案例和详细的写作指南等,辅助用户撰写提示词,或干脆开发AI智能体帮助用户更准确地“翻译”创作需求。

没骗你,我的小猫真能后空翻

某AI生成视频软件提供给用户的提示词写作指南

与其他AI生成内容一样,AI生成视频的逻辑在本质上是基于模型训练数据和算法的随机采样,有许多不可控因素。在同一套提示词下进行多次视频生成,选取其中效果最好的版本,这一过程被AI生成视频用户称为“抽卡”。谭佳庆也表示,为了获得一段满意的视频,“抽卡”少则一两次,多则20次。“抽卡”俨然成为AI生成视频创作中必不可少的环节之一。

因为较高的提示词技巧门槛和无法避免的生成随机性,用户往往需要多次调整才能最终得到理想的视频素材,消耗的时间和精力成本远比想象中要大。但对于专业创作者而言,AI生成视频仍然是更经济的选择。

目前市面上常见的AI视频生成平台按照积分计价。谭佳庆给RUC新闻坊算了一笔账,他使用的视频生成引擎,生成一个5秒的高质量片段消耗20个积分,而每个积分的成本不到0.1元,而且“买的越多,优惠越多,成本就越低”。

即使按照每个视频片段有效时长3秒,抽卡20次计算,一条1分钟的视频制作成本也不到1000元,而在传统拍摄方式下,预算能达到10000-20000元。

同时为了增强AI生成视频的可控性,谭佳庆还会采取“首尾帧控制”的方式,即先生成每段视频的首帧尾帧图片,再以此为基准要求AI生成视频,从而大大提高“抽卡”的准确率。

没骗你,我的小猫真能后空翻

生成&合成,AI生成视频越来越“深藏不露”?

从2024年年初Sora发布以来,AI生成视频模型也在不断迭代升级,在视频质量、创作自由度、风格模式等多个方面都有显著进步。最直观的感受是,在一些场景中,我们越来越难以一眼分辨视频是否由AI生成。

我们总结了几种普通人能够辨别AI生成视频的常见方法。在画面上,AI生成视频往往清晰度较低,有着不真实的质感。涉及到复杂的运动或场景切换时,则容易出现违背物理规律、动作僵硬不连贯、主体特征无法保持稳定等问题。

没骗你,我的小猫真能后空翻

根据AI生成视频失真的问题,我们针对性地生成了一些视频,你是否能根据鉴别方法逐一识别出其中的漏洞呢?

没骗你,我的小猫真能后空翻

测试方法:生成“暴风雪中的雪山与热带雨林的交界处,雪花带有树叶的叶脉细节。”

模糊或失真问题

没骗你,我的小猫真能后空翻

生成“一只猫用尾巴卷起咖啡杯倒水,水柱在空中静止”

场景与文本描述不符

没骗你,我的小猫真能后空翻

生成“一名穿高跟鞋的女子在冰面上后空翻三周半,平稳落地后继续跳芭蕾舞,背景是燃烧的篝火。”

运动僵硬

没骗你,我的小猫真能后空翻

测试方法:生成“一个人说绕口令,同时比划手语。”

动作口型不匹配

没骗你,我的小猫真能后空翻

测试方法:生成“唐代街巷市民生活的景象”。

与历史不符

以上视频均有意聚焦于AI生成视频的“能力薄弱点”,其中漏洞大多能够一眼辨认。但在另外一些场景中,AI生成视频已越来越难加以分辨。

谭佳庆从2022年开始投入AI生成视频生产工作,“每半年引擎都会有翻天覆地的变化”。对于远景、空镜、风景、山水,甚至一些小动物的的动作视频,他觉得越来越“无法分辨AI生成视频和实拍视频了”。

在腾讯 AI Lab 与中科大联合发布的一项测评中,研究人员使用700多套提示词和图片,对13个主流AI视频生成模型的生成效果进行了测试,展示了AI在不同场景中的差异化表现。

视频来源 https://ailab-cvc.github.io/VideoGen-Eval/index.html

除了全部画面由AI生成以外,AI还以声音克隆、人脸克隆、数字人生成等方式,更隐秘地介入视频生产之中,“深度合成”视频越来越多。

深度合成,指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术。随着模型性能的进步,深度合成视频清晰度更高、表情和光影更加自然,所需的训练数据和训练时间也大大缩短。

如某视频剪辑软件提供的数字人定制和声音克隆服务,最少只需要10秒的个人视频和50字左右的音频文件,就能完成克隆。

没骗你,我的小猫真能后空翻没骗你,我的小猫真能后空翻

某视频制作平台中的数字人克隆及声音克隆功能界面

以下分别是小编的原声音频和AI克隆后的声音,你能分辨出哪个是AI生成的吗?

目前人脸和声音克隆的效果也受到克隆素材质量、时长等的影响。工作中经常使用声音克隆制作视频旁白的小贾告诉RUC新闻坊,在他的使用体验中,节奏稍快,相对积极高昂的声音模拟效果更好,忧郁缓慢的则效果欠佳。

为了提高声音适配度,他还请同一位配音老师提供了多份不同特点的语音进行克隆,再根据视频特征选取合适的音色生成配音。

没骗你,我的小猫真能后空翻

小贾视频软件中保留的多种不同克隆音色

深度合成VS深度伪造,我们如何坚守真与假的边界?

目前,受限于技术能力和制作者水平,深度合成视频往往仍带有一些肉眼可识别的漏洞,如神情不自然、重复且僵硬的动作、场景撕裂或有拼接感等。仔细辨别,我们尚能够对这类AI生成视频加以区分。

即便如此,盗用他人形象和音色诈骗老年人、克隆明星直播带货等骗局却已不少见。利用技术手段,操纵合成虚假内容,深度合成走偏一步,便走上了“深度伪造”(deepfake)的歧路。

识别,往往是“反诈”的基础性步骤。但随着技术不断发展,人眼对deepfake内容的辨别能力也正在受到挑战。

也有一些用AI识别AI,“用魔法打败魔法”的方法。

比如重构对比法,基于扩散模型的反向过程,对每一帧视频进行重构并分析差异。AI生成的视频帧是从相似的统计分布中采样生成的,在重构过程中会表现得极为相似,依据这一标准即可完成识别。

还有基于深度学习的检测模型,通过学习比对大量真实视频和AI生成视频,提取特征,得到鉴别标准。

但通过AI鉴别deepfake也不是万能的。高昂的训练成本使得技术普及面临难题,而视频生成技术的不断进步也可能直接导致现有模型失效。

如果有外力加持,识别难度或许也能降低。但AI生成视频狂飙突进,相关的审查机制则稍显滞后。

国内针对AI生成合成内容的识别规范相对较少。2024年9月发布的《标识办法》中提到,可能导致与自然人人身属性相关的混淆或误认内容需要进行显式标记。而其他AI内容则由服务技术提供者在文件元数据中设置隐式标识,为平台方、其他相关监管主体进行溯源追责等提供保障。

目前该《办法》仍为征求意见稿。

没骗你,我的小猫真能后空翻

技术的演进带来想象力和创造力的爆发,那些让人拍案叫绝的创意与始料未及的伤害共同构成了新技术的图景,也重新塑造着我们的生活。

以何种态度对待AI视频,不同的人在不同场景下或许会给出不同的答案。但识别并被明确告知AI的参与,则是每个人都应该享有的权利。

参考资料:

[1]赵广立.(2024).这几个“瑕疵”让你识破AI视频.中国科学报.

[2]殷叶玲,屠淑敏.(2024).看世界|“AI大揭秘”之如何判断视频是否由AI生成.图书馆研究和工作

编译自

https://lifehacker.com/tech/how-to-know-if-the-video-youre-watching-was-made-with-ai?_gl=1*rb5qfh*_up*MQ..*_ga*MTc1ODY4ODE1MC4xNzMyMDcyMTIx*_ga_7E851STSQZ*MTczMjA4NDM3OC4yLjAuMTczMjA4NDM3OC4wLjAuMA..

数据收集:杭明溪、王睿歆、陈奕菲、禹琳

采访:张家煊

AI视频制作:张家煊、禹琳

可视化:杭明溪、禹琳、张家煊

文案:陈奕菲、王睿歆

美编:张家煊

统筹:张家煊 陈奕菲

原标题:《没骗你,我的小猫真能后空翻》

阅读原文

转载请注明来自小白菜,本文标题:《没骗你,我的小猫真能后空翻》

每一天,每一秒,你所做的决定都会改变你的人生!