电脑配置最低要求(绿幕数字人):cpu i5-10代 显卡:N卡 2060
电脑配置最低要求(摄像头实时捕获):cpu i5-10代 显卡:N卡 3060
注:数字人不自带语音!!!如需语音软件需要配套购买(如果自己有语音软件也可以用)
下载方式
通过网盘分享的文件:星辰语音-数字人本地版
链接: https://pan.baidu.com/s/1dm-FYBFFX1YOOFWxbFXGBg?pwd=b2ng 提取码: b2ng
–来自百度网盘超级会员v4的分享
数字人实机效果展示
使用教程
2.摄像头实时捕获基础步骤
- 下载安装nvidia broadcast https://www.nvidia.com/en-sg/geforce/broadcasting/broadcast-app/
- 设置 nvidia broadcast 的输出画为 1280×720 (尽量一直打开画面预览,避免摄像头关闭)
- 数字人中选择 nvidia broadcast 摄像头
- 设置音频设备
开始直播
2.1 摄像头实时捕获视频教程
1.形象克隆
公模主要给大家测试使用,直播时还是要自己去克隆形象!!!
实在没有的,可以淘宝搜索数字人形象购买,价格也不贵
形象克隆录制教程
形象录制质量极大程度上影响克隆成功率与直播间效果,请务必认真阅读此文档!
一、拍摄前准备
准备脚本
建议结合自己的直播场景制定一份约10分钟的讲稿。
主播熟悉拍摄规范
按上面的脚本进行直播,整体动作要连贯,包括模拟讲品、滑手机看弹幕互动、看大屏数据和手卡等直播间常用的动作交替自然呈现,每个脚本一镜到底,讲错没关系,继续讲就可以了。整体要求:
❇️面部。保持自然的微笑放松状态,可以做正常直播时的盯着摄像机讲品、滑动手机看弹幕互动、抬头回答问题、侧头看大屏数据等常用动作。注意:低头或者侧头幅度小一点,以此时抬眼还能看到摄像机为上限;
❇️头部。盯着摄像机说话时头部可以缓慢微动。避免高频率或者随着讲话上下点头、左右摇头;
❇️眼睛。自然灵动,眨眼看其他地方,避免一直睁着眼睛盯着摄像机;
❇️手部。手不要超过肩膀和挡住脸部,不要做有明确手势含义的动作,比如伸手指比数字、举手指向某个方向等,可以双手抱着、合掌等无意义的手势动作,动作通用;
❇️嘴巴。尽量张开并露出牙齿,就像大声讲话时那样,语速比正常直播慢一点,避免有抿嘴、舔嘴唇、撇嘴等的小动作。不说话时要闭嘴,不要咧着嘴。
❇️身体。可以前后左右微动,换坐姿、向前探身都是可以的。
二、拍摄时工作
❇️场地
带绿幕的摄影棚
最好有提词器,或者主播能自由发挥讲品
❇️妆容
为凸显说话时的唇动效果,女性最好涂抹口红;
发型扎起来或者散发都可以,但避免空气刘海、乱发到脸上、爆炸式发型等发丝乱飘的发型,影响抠图。
❇️服饰
选择合适的服饰。修身的纯色T-shirt或者套装,穿出得体和大方,不穿高领上衣,避免绿色和接近绿色的衣服,避免特殊图案的衣服;
不要佩戴耳环和耳钉,及反光的项链,不要带眼镜和美瞳等。
❇️道具
手机、手机支架或者商品
三、录制拍摄(1-10分钟)
第一步:开始保持一段不说话的端庄状态的静默状态5秒钟(不露牙齿、表情自然);
第二步:主播选择一种风格的直播表演,约1-10分钟;
拍摄注意:手不要超过肩膀和挡住脸部,动作通用,碎发整理整齐;
拍摄时,人物的脸部大小在画面中的占比不能大于2/5(建议露出小腿以上或者整个形象),避免后续不能正常使用,可以在拍摄时优先让人物在画面的占比小一些, 在后期导出视频时再调整画面大小。
错误案例:
正确案例:
四、拍摄后处理
拍摄后务必用剪映将视频处理为 MP4格式、25fps、720*1280
用苹果手机拍摄的默认为 MOV格式视频,需要转换为MP4,否则将克隆失败
视频后处理转换推荐用剪映,不建议使用其他软件或自己通过代码转换
拍摄时推荐使用4K和30FPS,可用其他参数来保证拍摄质量,所有拍摄视频都需用剪映再做一次后处理
![图片[4]-星辰数字人教程(月卡) | 平头哥科技网-平头哥科技网](https://www.ptgkj.com/wp-content/uploads/2025/10/%E6%9C%AA%E5%91%BD%E5%90%8D_%E5%89%AF%E6%9C%AC.png)
















- 最新
- 最热
只看作者