|
你是懂直播的,最容易出现误解的就是这些问题
碰到很多客户,都反映说有人1000块、3天就能给他练一个直播丹。一般我就不回了。
直播用的模型,最大的问题并不是相似度(没真正用过DFL直播的压根不知道这个问题哈哈哈),而是因为直播环境、设备、动作、遮挡等等带来的一些列穿帮问题。
所以炼丹只是一半,剩下的一半是直播谁被、环境搭建的问题。
这就导致一个直播丹,炼丹需要根据直播情况来,直播操作又要根据丹的情况来。
展开说就是,如果直播时候没有转荣视频采集设备比如pocket3或是摄像头相机之类,还没有认真调整光照,就直接224、256、288、320、352、384这些分辨率里面选、训练时候暗光素材给足、直播室只能中景。
还有遮挡问题,dfl的原理就决定了一旦嘴巴、鼻子、眼睛被遮挡,面部识别就靠盲猜无法推理,当软件对五官位置状态的识别出错了,模型推理生成的就会跟着出错,光线原因、妆容原因下有时候面部颜色跟手一样的话,遮挡面部也会出现识别错误把手识别为面部皮肤,就出现了凭空消失术,这时候更多只能靠直播时候来注意规避。
以上这些东西,只有真正用DFL换脸直播过的人才知道。我发现很多人动不动就哎呀Liae不像、哎呀这个吃东西穿帮了,哎呀你这大角度不行。你特么的真拿100%相似度明星换去直播是觉得抖音检测不出来还是想吃官司?你特么直播就直播吃饭就吃饭,吃播你老老实实自己改构架。你特么直播踏踏实实坐好,你咋不抱怨玛莎拉蒂不正站着开哈哈哈哈哈。还有B站那几个割韭菜的,对练几个迭代各种给你展示,结果换个DST人立马原形毕露。
这里不讨论换着玩或是假装仿妆那种专业的,一般人没有团队支持做不了,主要就是颜值不够、或是想用“某地某某某”比如葫芦岛吴奇隆这种噱头直播的,要的就是似是而非。还一种就是主播本身颜值不够的,懂的都懂。
跟@voyage探讨下:
之所以用了直播录屏演示,就是为了贴近实操。用剪辑的视频或者短视频看不出真实效果。现在直播一般都是1080*1920的分辨率,这里只用的720*1280,还压缩成4000MHz,其实已经很低了。
至于实操用的直播设备那是丰俭由人,那种手机连虚拟摄像头的我基本都不纳入考虑,现在一个普通的高清头也就1000上下,这点成本都不出也就不用考虑换脸直播了。一般标配都是电脑+摄像头+2-3盏补光灯,live换完udp推流过去直播的,损失不大。
基础模型的话,走来走去、唱唱跳跳、吃播之类都不行。
分辨率上,坐着不动中景远景带货的224-288之间足够,中景256-320足够,近景一半不涉及带货了大都是娱乐,384-448之间,益阳市丰俭由人。除了分辨率大家还容易忽略其他参数,原则就是分辨率小的话ae、ed、dd之类都要调高不然本身脸就需要放大,编解码再低就完全看不清了。我参考了30多个换脸直播的,从224到416都有,出现面部细节缺失的基本都是训练不足,没有明显的风变绿不足导致画面不好的痕迹。
事实上最多的问题出现在遮罩边缘穿帮和下牙模糊上,但问题不大,甚至偶尔因为遮挡导致变形都能用一句美颜效果就搪塞过去了,只有我们炼丹佬才回去注意这些细节哈哈哈哈哈 |
评分
-
查看全部评分
|