查看: 23756|回复: 45

【新手必看】DeepFaceLab基础使用教程

[复制链接]

3754

积分

66

帖子

1132

符石

管理员

Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

积分
3754

最佳新人隐藏大神灌水之王

发表于 2023-7-12 22:29:45 | 显示全部楼层 |阅读模式
软件使用的大概流程是:

  • 将视频转换成图片
  • 从图片中提取出人脸
  • 用人脸中包含的特征训练成模型
  • 用训练好的模型替换目标视频(同样需要切成图片并提取出人脸)换脸
  • 把换好脸的图片合成视频!


教程结束,谢谢大家~~~



emmm~~开个玩笑




以下是包哥绘制的deepfacelab基本原理及流程:

换脸原理_01.jpg
换脸原理_02.jpg
换脸原理_03.jpg
换脸原理_04.jpg

人了基本原理和流程之后,,给大家讲解DeepFaceLab新手入门教程。


原文应该是tony写的,别人抄来抄去找不到原出处了。。。

新手小白一文看懂!总共7个操作步骤,请大家耐心看完!

常见的DeepFaceLab有三种软件包

1.DeepFaceLab官方英文原版

2.DeepFaceLab中文汉化版

3.DeepFaceLab图形界面汉化版

PS:对于新手可以直接使用中文汉化版和图形界面汉化版!特别是图形界面汉化版和正常使用软件差不多

不过建议不管下载那种版本都看完本文,入门之后再挑选自己喜欢的版本!

----

官方英文版对于大部分国人不太友好,本篇主要讲解DFL中文汉化版(无UI版本)的使用教程:


解压打开看汉化版的会看到这个目录:

teach-01.png

不输入就是上面这种结果。然后你点1,2,3,4每个步骤都点不动。因为不看英文或者大意,犯这个错误的也不少。

teach-02.png

正确的打开方式是这样的。里面会有_internal和workplace文件夹。前者放的是源代码和软件相关的内容,后者是工作目录,上一篇有讲过。除此之外还有一堆.bat结尾的文件。可以把这些称为脚本或者批处理文件。里面是一行行的DOS命令。

批处理文件打开方式和EXE一模一样,双击打开!每一个批处理文件都干一件事情,我们要做的就是按一定的顺序点击这些文件,就能完成换脸。是不是挺简单?

执行步骤

DFL换脸的思路是,想将视频转换成图,从图片中提取人脸,从人脸中学习特征。然后应用模型,先对图片进行换脸,然后把图片合成视频,同时带上原视频的音轨。

具体来说可以分为如下几步:

  • 源视频转图片
  • 目标视频转图片
  • 提取源头像
  • 提取目标头像
  • 训练模型
  • 应用模型
  • 合成视频

批处理文件步骤如下:

  • 源视频转图片 extract images from video data_src.bat
  • 目标视频转图片 extract images from video data_dst FULL FPS.bat
  • 提取源头像 data_src faceset extract.bat
  • 目标头像提取 data_dst faceset extract.bat
  • 训练轻量级模型 train Quick96.bat/SAE/AMP
  • 应用轻量级模型 merge Quick96.bat /SAE/AMP
  • 合成 MP4 视频 merged to mp4.bat

杂七杂八交代清楚了就可以开始操作,本文会将每一个步骤截图说明。但是为了控制文章的体型,以操作为主。一些常见错误或者参数详解,会在后续文章中完成。关于操作,这里做一个重点提示:遇事不决按回车!

1:源视频转图片

teach-03.png

跳出黑色窗口,输入10回车,然后输入jpg回车,就会自动开始将视频分解为图片。

FPS:视频有一个指标叫帧率,常见有24,30,60等,代表一秒钟有几张。第一个参数输入10指的是一秒钟只取10张;不输入直接回车,默认帧率是30就取30张。因为很多影视剧画面相对固定,没必要全部取,否则后面会浪费大量提取时间,而且模型训练压力也会加大。

Format:  图片格式,主要是jpg和png。png是无损格式,但是JPG能在保证画质的情况下减少巨量的空间。所以如果不是要求特别变态,一般都用jpg。这样可以减少空间,节省时间

teach-04.png

正常情况下,这个步骤执行非常快,出现“搞定/done” 的字样就是执行完成了。完成后,workplace/data_src下面就会出现很多图片,这就是从视频里分解出来的图片。文件名一般为0000x.jpg,其实这里面命名可以随意,没有强制要求。这里还有一个aligned的文件夹,是为后面步骤准备的。

2:目标视频转图片

双击批处理文件目标视频转图片 extract images from video data_dst FULL FPS.bat

teach-05.png

和上面的步骤类似,这次处理的是dst视频。因为dst必须一帧不落,所以没有FPS选项,只有图片格式这一个选项。

teach-06.png

处理完后的图片保存在workspace/data_dst里面。

3:提取源头像

双击批处理文件提取源头像 data_src faceset extract.bat

teach-07.png

这一步的作用是提取源素材图片中的人脸。这里有六个参数,一般只需一路回车即可。第一次使用需要缓存GPU内核,需要稍微等一等。开始提取后底部有显示进度,当进度到100%,会显示图片数量和提取到的人脸数量,并出现“搞定!!!” 就证明已经出来成功并且处理完成。

teach-08.png

处理完成后,头像保存在data_src/aligned下面。

不少人在这个环节会遇到问题。

常见问题是:

  • 驱动不够新,去官网下载更新到最新版本即可。
  • 软件不够新,deepfaker.xyz 上获取新版
  • 显卡软件不匹配, A卡用Directx12,不要用rtx3000版。

提取完之后,如果src素材比较复杂,就需要做一些筛选。这个筛选可以写一篇很长的文章。这里简要说一下。主要是把一些不需要的素材删除:

  • 很模糊的可以直接删除
  • 不是目标人物的可以直接删除
  • 图片残缺的删除
  • 脸部有遮挡的删除
  • 脸部光照差异特别大的删除
  • …..

4:提取目标头像

双击批处理文件目标头像提取 data_dst faceset extract.bat

teach-09.png

这一步的作用是提取目标素材图片中的人脸。和上一步非常类似,这里就是少了一个“保存调试图片”的参数。其实也不是少了,而是默认就执行了。

teach-10.png

提取的头像保存在data_dst/aligned的文件夹里。

提取完之后也要对素材进行一个筛选。

把不是目标人物的素材删掉,把头像旋转的图片删掉。一般来说文件名后缀_1的都可以删掉。dst的删除核心原则是要换的人脸留下,不要换的统统删掉。

teach-11.png

这些图标保存在aligned_debug里面

teach-12.png

大概其中一张图片,可以看到人脸上有三种颜色的线框。

teach-13.png

红色就是头像截取的区域,蓝色是面部区域,绿色是人脸轮廓,以及五官定位的点。其实就是人脸的landmark。通过debug你可以直观的看到人脸识别算法识别了哪些区域,有没有识别正确。

5:训练模型

双击批处理文件 训练轻量级模型 train Quick96.bat

teach-14.png

这一步是训练模型,所有步骤中最重要,最难,也是最耗时间的部分。目前新版本中主要包含三类模型,分别是Quick96,SAEHD,AMP 。

我把Quick96翻译为轻量级模型,优点是所需配置低,显存低,速度快,操作简单。缺点是不能自定义,像素比较低,合成效果差一些。

这个模型很简单,所以也非常适合拿来入门。所以本文就用这个来举例。SAEHD和AMP模型和模型训练的知识会另起一篇文章来介绍。

teach-15.png

Quick96使用非常简单,双击批处理文件后,选择执行设备即可,这里一般都是选显卡,直接回车即可。设备选择完成之后,程序就会自动加载素材,并显示模型的参数,底部会有跳动的数字,然后会跳出一个预览窗口。

先来说说底部的数字,总共五列,分别代表:模型保存时间,迭代次数,单次迭代时间,源损失,目标损失。迭代次数是越多越好,损失是越低越好,零就是无损了嘛~不过,不可能达到!

下面来说说预览窗口

teach-16.png

预览窗口包含操作提示、loss曲线,人脸区域。人脸区域总共五列。第一列是src,第三列是dst。第二,四,五列为算法生成列,刚开始是纯色,啥头像都没有。随着训练的进行,会慢慢出现轮廓,鼻子,眼睛,然后慢慢变清晰。

训练的过程就是等待这几列变清晰的过程,最后一列就是换脸后的效果。

这一个步骤并不会自动结束,需要自己判断,然后手动结束。可以通过损失值和预览图来进行判断。一般来说损失值(loss)值到了0.1x就差不多了。但是素材质量和数量不一样,会影响这个指标的变化速度。比如素材特别少,这个值降的特别快,特别低。图片不是很清晰,这个值也降的特别快,特别低。反过来,图片质量高,数量多,这个就很难降低。但是这样情况下训练出来的模型更好。

teach-17.png

相比数字而已,通过预览图来判断就更加直观了。只要观察第二列是否无限接近第一列,第四列是否无限接近第三列。第五列的表情是否无限接近第四列。所有列的图片是否都足够清晰。如果答案是“Yes” ,那么按回车或者直接关闭窗口,进入下一步。

teach-18.png

正常情况下模型会过几十分钟保存一次,也可以手动按S直接保存。关闭后,可以重新点击批处理文件继续训练,不用担心丢失进度。当然,要防止意外关机和重启,可能会损坏模型。

6:应用模型

双击批处理文件 应用轻量级模型 merge Quick96.bat

teach-19.png

这个步骤要做的是将图片进行换脸。应用Quick96模型也很简单。启动直接按回车选中或者输入对应的数字选中上一步已经训练好的模型。然后软件就会加载模型并显示模型参数。

然后需要配置两个参数:

一个是是否启用交互模式,直接回车,默认启用。

一个是线程数量,输入小于等于8的数字,回车。注意,如果你核心特别多,默认回车会报错的!

稍等一会儿会弹出帮助界面。

teach-20.png

这个界面并没有任何功能上的用处,只是显示了这个环节可以使用的快捷键。每个快捷键旁边都有中文注释,可以看个大概,具体的参数含义我会在后面的文章中做一个详细的介绍。

点击这个界面,确保输入法为英文,按下键盘上的Tab,就可以进入合成预览界面

teach-21.png

进来后,默认情况下都会有人皮面具的感觉,这是正常现象。因为我们参数还没有调整!就这个素材来说,只要调整W/S,E/D 快捷键即可。调整后的效果如下:

teach-22.png

黑色窗口会显示所有的合成参数,并且显示进度条,等100%完成之后,手动关闭窗口即可。

teach-23.png

此时,在data_dst下面已经多了两个文件,一个是merged,一个是merged_mask

teach-24.png

进入merged可以看到很多图,这些图片中的人脸已经完全换脸。

teach-25.png

进入merged_mask可以看到一些黑色的图片,中间有一个白色的区域。这些文件是为了方便后期制作。我们单纯使用DFL的不用太关心。

7:合成视频

双击批处理文件 合成 MP4 视频 merged to mp4.bat

teach-26.png

这个步骤是将已经换好脸的图片转换成视频,并且会自动读取源视频的配置信息,包括帧率,音轨这些。这个环节只有一个输出码率的参数,常规来说3就够了。

除了合成mp4之外,还可以合成无损视频,AVI ,MOV等格式,便于后期处理。

teach-27.png
执行完成后,workspace下面多了两个文件,分别是result.mp4 和 result_mask.mp4 。前者就是我们需要的最终视频,后者是遮罩视频,供后期使用。

teach-28.png
双击打开视频,就可以看到最终效果啦。

步骤其实不难,细节很多。有些是可以直接照搬别人经验的。有些需要自己不断摸索。这并不是什么傻瓜软件,要做出好的效果肯定是要花时间研究。就像即便送你PS,PR,你没有一定的学习积累不可能做出酷炫的效果。但是我可以保证,市面上几乎所有神乎其技的换脸视频都是基于DFL,有些可能专门准备了道具场景并使用了后期制作。


Zhatv换脸论坛免责声明
全站默认解压密码:zhatv.cn
【Zhatv】论坛里的文章仅代表作者本人的观点,与本网站立场无关。
所有文章、内容、信息、资料,都不保证其准确性、完整性、有效性、时效性,请依据情况自身做出判断。
因阅读本站内容而被误导等其他因素所造成的损失责任自负,【Zhatv】不承担任何责任。

54

积分

3

帖子

30

符石

筑基丹师

Rank: 2Rank: 2

积分
54
发表于 2023-9-11 13:53:25 | 显示全部楼层
一个视频画面里要换多个人物的脸,是不是要依次换脸,换完一个再换另一个
回复

使用道具 举报

3328

积分

190

帖子

538

符石

渡劫丹师

Rank: 6Rank: 6

积分
3328
发表于 2023-10-17 07:36:03 | 显示全部楼层
这论坛是包哥的?
回复

使用道具 举报

1万

积分

372

帖子

8529

符石

玉皇大帝

Rank: 16Rank: 16Rank: 16Rank: 16

积分
13589

灌水之王论坛元老咸鱼勋章

发表于 2023-10-17 12:48:46 | 显示全部楼层
july 发表于 2023-10-17 07:36
这论坛是包哥的?

汇集了包哥跟tony的好像
通用直播丹代练

QQ:1453174
回复

使用道具 举报

3328

积分

190

帖子

538

符石

渡劫丹师

Rank: 6Rank: 6

积分
3328
发表于 2023-10-18 08:15:06 | 显示全部楼层
五折 发表于 2023-10-17 12:48
汇集了包哥跟tony的好像

tony大佬在里面,哪个是他?
回复

使用道具 举报

298

积分

6

帖子

85

符石

金丹师

Rank: 3Rank: 3Rank: 3

积分
298
发表于 2023-11-4 15:01:13 | 显示全部楼层
raspberry 发表于 2023-9-11 13:53
一个视频画面里要换多个人物的脸,是不是要依次换脸,换完一个再换另一个 ...

新人同问!
回复

使用道具 举报

1328

积分

73

帖子

319

符石

化神丹师

Rank: 5

积分
1328
发表于 2023-11-9 19:07:04 | 显示全部楼层
好棒啊,感谢分享!太强大了!
回复

使用道具 举报

39

积分

1

帖子

36

符石

练气丹师

Rank: 1

积分
39
发表于 2023-11-27 14:50:19 | 显示全部楼层
002224.jpg
dst 视频中有转场动画 人物淡出效果   自动提取识别不出来  软件自带的那个手动标记很难用  选取不到人物脸型    大佬们都是怎么解决的
回复

使用道具 举报

3754

积分

66

帖子

1132

符石

管理员

Rank: 9Rank: 9Rank: 9Rank: 9Rank: 9

积分
3754

最佳新人隐藏大神灌水之王

 楼主| 发表于 2023-11-27 16:14:14 | 显示全部楼层
Md112 发表于 2023-11-27 14:50
dst 视频中有转场动画 人物淡出效果   自动提取识别不出来  软件自带的那个手动标记很难用  选取不到人物 ...

通常情况下,我们会把这种片段直接丢弃
回复

使用道具 举报

1342

积分

39

帖子

243

符石

化神丹师

Rank: 5

积分
1342
发表于 2023-12-16 11:08:37 | 显示全部楼层
感谢科普                  
回复

使用道具 举报

小黑屋|ZhaTV ( 滇ICP备15003127号-4 ) |网站地图

GMT+8, 2024-11-21 18:19

Powered by Zhatv.cn

© 2022-2023

快速回复 返回顶部 返回列表