灵动人像LivePortrait

7个月前发布 6 00

灵动人像LivePortrait是阿里云推出的一个数字人视频生成工具。这个工具只需要一张肖像照片和一段文字或音频,就可以生成一段开口说话的数字人视频。它可应用于视频直播、聊天机器人、企业营销等多种场景。

收录时间:
2024-11-28
灵动人像LivePortrait灵动人像LivePortrait

灵动人像LivePortrait是阿里云推出的一个数字人视频生成工具这个工具只需要一张肖像照片和一段文字或音频,就可以生成一段开口说话的数字人视频。它可应用于视频直播、聊天机器人、企业营销等多种场景。

LivePortrait工具由运动模块和生成模块组成,采用了阿里云自研的口型预测算法,以提高口型的准确度。同时,它还通过眼神主动控制技术增加了自然运动,使得生成的结果更接近真人效果。此外,该工具还提供了轻量模型选择,帮助用户更快速地生成视频。

功能特点

灵动人像LivePortrait的主要功能特点包括:

  • 照片转视频:用户可以上传一张肖像照片和一段文字或音频,LivePortrait能够生成一段视频,让照片中的人物仿佛开口说话。
  • 多种声音选择:提供28种不同的声音选项,用户可以根据需要选择合适的声音为视频配音。
  • 口型预测算法:采用阿里云自研的口型预测算法,提高口型与音频的同步准确度。
  • 眼神控制技术:通过眼神主动控制技术增加自然运动,使得生成的视频更接近真人效果。
  • 应用场景广泛:可应用于视频直播、聊天机器人、企业营销等多种场景。

灵动人像LivePortrait的数字人视频生成教程

  1. 访问魔搭社区:首先,您需要访问魔搭社区的灵动人像LivePortrait页面。
  2. 上传肖像照片:在应用界面中上传您想要让其说话的肖像照片。
  3. 选择文本或音频:您可以选择文本驱动(100字以内)或音频驱动来激活照片中的人物。
  4. 声音选择:提供28种不同的声音选项,您可以根据需要为视频选择合适的声音。
  5. 唇齿修复:如果生成的唇齿不清晰,您可以选择开启唇齿修复功能。
  6. 设置眨眼频率:您还可以设置眨眼频率,范围在0-4之间,0代表不眨眼。
  7. 生成视频:设置完成后,上传的图片就可以像视频一样进行播报。

数据统计

相关导航

SadTalker

SadTalker

SadTalker 是由西安交通大学(西交大)开源的项目。它是一个用于生成风格化的单图说话人脸动画的工具,可以根据输入的图片和音频生成对应音频口型的视频。用户可以给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴、眨眼、移动头部等。它可以从音频中生成3DMM的3D运动系数(头部姿势、表情),并隐式调制一种新颖的3D感知面部渲染,用于生成说话的头部运动视频。
AI Studios

AI Studios

AI Studios 提供了一个基于AI数字人的文本生成视频的平台。用户可以输入或上传文本、PPT文件,快速生成逼真的AI视频。这个平台支持多种语言和场景,还可以选择不同的背景音乐和AI数字人,以及编辑字幕和配音。AI Studios可以用于制作培训视频、营销视频、解说视频、新闻视频等各种场景。此外,它还提供了超过80种语言的文本转语音服务和100多种逼真的AI声音,以及500多种视频模板,以满足不同的视频制作需求。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...