格发软件

首页

许可优化

产品

解决方案

服务支持

关于

在线咨询

申请试用

QR-code-company

155-2731-8020

QR-code-self

许可优化

CAD设计软件
CAE仿真软件
PLM产品周期软件
Adobe全家桶

产品

projectHover_1

许可分析

实现专业软件许可精细化管理

projectHover_2

AI分析

让数据分析更简单，决策更智能

projectHover_3

许可调配

合理管控调配许可资源

终端软件管理

终端软件管理和合规性管理共同保障终端安全

多角度管控软件使用权限，保证软件安全性

实用、强大的资产台账管理工具

行业分类

船舶行业

船舶行业

船舶行业

网络行业

网络行业

网络行业

半导体行业

半导体行业

半导体行业

半导体行业

医疗行业

医疗行业

医疗行业

军工行业

军工行业

军工行业

服务支持

服务保障

服务保障

服务保障

软件文章

软件文章

软件文章

产品教程

产品教程

产品教程

技术文档

技术文档

技术文档

关于

关于我们

关于我们

关于我们

试用产品

试用产品

试用产品

合作伙伴

合作伙伴

合作伙伴

品牌标志

品牌标志

品牌标志

apextopmenu

许可优化

许可优化

产品

解决方案

解决方案

服务支持

服务支持

关于

软件

Autocad

二维三维设计绘图软件

Solidworks

三维机械设计建模软件

jiantou

CATIA

高端三维设计制造软件

jiantou

NXUG

集成设计仿真制造平台

jiantou

Alias

曲面造型工业设计软件

jiantou

Altium Designer

Altium Designer

电子电路设计EDA工具

jiantou

Cadence

芯片系统设计EDA平台

jiantou

Matlab

科学计算仿真编程软件

jiantou

Eplan

电气工程设计管理软件

jiantou

NAPA

船舶设计分析软件

jiantou

Ansys

工程仿真分析软件

jiantou

Hyperworks

多学科CAE平台

jiantou

Adams

多体动力学仿真软件

jiantou

Abaqus

有限元分析软件

jiantou

Masta

轴系零部件强度校核软件

jiantou

Hypermill

数控加工编程CAM软件

jiantou

Ansa

有限元前处理软件

jiantou

StarCCM+

流体仿真分析软件

jiantou

Autoform

冲压成形仿真软件

jiantou

ls-dyna

显式动力学仿真软件

jiantou

3DEXPERIENCE

达索协同设计平台

jiantou

Teamcenter

产品生命周期管理软件

jiantou

Windchill

产品数据管理软件

jiantou

Systemweaver

系统工程协作平台

jiantou

Photoshop

图像处理设计软件

jiantou

Illustrator

矢量图形设计软件

jiantou

产品

许可分析

实现专业软件许可精细化管理

jiantou

AI分析

智能分析许可数据，提升使用效率

jiantou

许可调配

合理管控调配许可资源

jiantou

终端软件管理

终端软件管理

终端软件管理和合规性管理共同保障终端安全

jiantou

软件商店

多角度管控软件使用权限，保证软件安全性

jiantou

资产台账

实用、强大的资产台账管理工具

jiantou

解决方案

解决方案

汽车行业

jiantou

船舶行业

jiantou

网络行业

jiantou

半导体行业

半导体行业

jiantou

医疗行业

jiantou

军工行业

jiantou

服务支持

服务支持

服务保障

jiantou

软件文章

jiantou

产品教程

jiantou

技术文档

jiantou

关于

关于我们

jiantou

试用产品

jiantou

合作伙伴

jiantou

品牌标志

jiantou

当前位置：服务支持 > 软件文章 > 论文阅读：Audio-Driven Emotional Video Portraits（音频驱动的情绪化视频肖像）

论文阅读：Audio-Driven Emotional Video Portraits（音频驱动的情绪化视频肖像）

阅读数 600

点赞 0

copyright

article_banner

任务简介

通过将声音分解为与持续时间无关的情绪空间和与持续时间相关的内容空间可以都得到动态的2d landmark

然后作者提出了 Target-Adaptive Face Synthesis technique（目标自适应人脸合成技术）可以缩小推断的landmark和目标视频的自然头部姿态之间的gap

为了实现交叉重建训练，应该提供相同内容， 相同长度的不同情绪的成对句子，但是现实场景中是不可能的，为此使用Dynamic Time Warping (DTW) 帮助使用对齐的不等长 语料库 形成伪训练对。

方法

整体框架

在这里插入图片描述

首先从音频信号中提取分离的内容和情感信息。是通过DTW算法生成的伪训练对，然后用交叉重构损失来学习解耦。

算法的第二部分是目标自适应人脸合成，它将从音频中推断的landmark适配到目标视频中。具体是设计了一种3D-Aware Keypoint Alignment算法，在三维空间中旋转landmarks，从而使landmarks能够适应各种姿势和运动。最后通过edge合成图片

可以把最后的edge变成cycle形式的

交叉重构解耦-数据处理

从音频信号中提取两个独立的潜在音频空间：i）与持续时间无关的空间情感编码；ii）与持续时间相关的空间，它对音频的语音内容进行编码。

但是这样的训练对比较难得，所以需要首先构建伪训练对。然后再进行交叉重构。

免责声明：本文系网络转载或改编，未找到原创作者，版权归原作者所有。如涉及版权，请联系删

返回上级列表

，获取更多内容

使用OpenCV简化面部地标检测（Face Landmark Detection）

Python+OpenCV：调用视频识别手势实现电脑音量调节

相关文章

DynaVINS论文阅读笔记：动态视觉惯性导航系统

Android音频优化：POP音软件与技巧

动态范围规划（DRC）Dynamic Range Control心得（四）：音频/图像处理

JS用ffmpeg和sharp，音视频和图片轻松搞定！

Premiere Pro视频剪辑许可砍冗余，两款订阅优化方案哪个狠

ESP32CAM_OV2640摄像头驱动：读ID完整时序详解

浪潮肖雪：以平台化思维，驱动工业互联网发展

AudioSlicer与audiolad音频处理软件

高性能DSP音频芯片：汽车音响的革新力量

你见过会动的BOM结构吗？ | 操作视频

音频提取软件精选合集

人脸检测之MTCNN算法：论文阅读及源码解析

人脸超分辨率论文阅读汇总（经典与最新）

IP分享｜制作外国名著中文译本音频的许可要求

学习如何导入3D建模视频教程：CAD视频教程！

Android Framework音频子系统（08）：PlaybackThread处理混音数据的完整流程

Workbench12.0视频教程进阶

Workbench入门视频教程

AutoCAD视频教程全集

DU562音频处理芯片：车载娱乐音响解决方案

技术文档

DynaVINS论文阅读笔记：动态视觉惯性导航系统

Android音频优化：POP音软件与技巧

动态范围规划（DRC）Dynamic Range Control心得（四）：音频/图像处理

JS用ffmpeg和sharp，音视频和图片轻松搞定！

Premiere Pro视频剪辑许可砍冗余，两款订阅优化方案哪个狠

ESP32CAM_OV2640摄像头驱动：读ID完整时序详解

浪潮肖雪：以平台化思维，驱动工业互联网发展

AudioSlicer与audiolad音频处理软件

高性能DSP音频芯片：汽车音响的革新力量

你见过会动的BOM结构吗？ | 操作视频

音频提取软件精选合集

人脸检测之MTCNN算法：论文阅读及源码解析

人脸超分辨率论文阅读汇总（经典与最新）

IP分享｜制作外国名著中文译本音频的许可要求

学习如何导入3D建模视频教程：CAD视频教程！

推荐好文

许可授权技术的创新突破：行业领先者的研发投入

软件许可证采购策略：从需求分析到供应商评估

许可证管理解决方案：专业研发团队的品质保证

许可采购中的常见陷阱与规避方法

服务到家：贴心的许可管理服务助力企业高效运营

高效使用软件授权：许可使用数优化的科学方法

gotoDetail

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

电子邮件：tanzw@gofarlic.com

links

友情链接

格发

发现

终端软件管理

方案

半导体行业

服务

关于

© gofarlic.com 武汉格发信息技术有限公司 - 鄂ICP备18026411号-1 - 鄂公网安备42011302000881号

隐私声明 | 使用条款 | 网站地图

联系我们

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

邮件：tanzw@gofarlic.com

发现

终端软件管理

方案

半导体行业

服务

关于

隐私声明 | 使用条款

Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利

鲁ICP备14018425号-1 鄂公网安备42011302000881号

遇到许可问题？该如何解决！？

评估许可证实际采购量？

不清楚软件许可证使用数据？

收到软件厂商律师函!?

想要少购买点许可证，节省费用？

收到软件厂商侵权通告!?

有正版license，但许可证不够用，需要新购？

联系方式

board-phone

155-2731-8020

close1

预留信息，一起解决您的问题

* 姓名：

* 手机：

* 公司名称：

姓名不为空

姓名不为空

手机不正确

手机不正确

公司不为空

公司不为空