使用开源模型克隆你的声音 [译]

作者 Fei Yang 发表于 2023/12/07 3 分钟阅读

真实声音克隆（RVC）是一种声音转换模型，能将任何输入声音转换成目标声音。以下是使用该技术的一个示例：摩根·弗里曼扮演汉尼拔·莱克特。

在本文中，我们将展示如何在 Replicate 上创建你自己的 RVC 声音模型。我们将创建数据集，调整模型，然后使用 Replicate 制作一些示例。

步骤概览

你可以使用 Replicate 的网页界面或使用你选择的编程语言的 Replicate API 来运行这些模型。我们提供 JavaScript、Python 以及 Go、Swift 和 Elixir 等语言的官方客户端库。

我们还创建了一个包含本指南所需所有代码的 Google Colab 笔记本。

使用 zsxkib/create-rvc-dataset 模型从 YouTube 视频 URL 自动生成数据集。运行模型将执行以下操作：

需要提供的信息：

使用 replicate/train-rvc-model 模型训练 RVC 模型。开始训练时需要提供：

使用 zsxkib/realistic-voice-cloning 模型运行已调整的 RVC 模型。上传起始音频文件或通过 API 传入 URL。配置参数以调整输出，例如：

此时，你应该已经拥有了自己声音的可重用克隆。你可以用它来创建新的音频文件、睡前故事，甚至是歌曲。

原文作者：@zsxkib @fofr
原文链接：https://replicate.com/blog/how-to-tune-a-realistic-voice-clone

教程

声音克隆 Replicate

本文由作者按照 CC BY 4.0 进行授权