最近 ,个开搞定告Meta 宣告并开源了多个 AI 模子 ,源库好比 Llama 系列模子、种种分割所有的文本 SAM 模子。这些模子增长了开源社区的到音钻研妨碍。如今,频天Meta 又开源了一个可能天生种种音频的个开搞定告 PyTorch 库 ——AudioCraft,并果真了其技术细节 。源库 ![]()
AudioCraft 可能基于用户输入的文本天生高品质、高保真的文本音频 。咱们先来听一下天生下场 。到音 AudioCraft 可能天生一些事实场景中的频天声音,好比输入文本 prompt:「Whistling with wind blowing(风咆哮而过)」 还能天生有旋律的个开搞定告音乐 ,好比输入文本 prompt:「Pop dance track with catchy melodies,源库 tropical percussions, and upbeat rhythms, perfect for the beach(盛行舞曲 ,具备朗朗上口的种种旋律 |