AI新工具

blog-thum
AudioLCM

AudioLCM利用潜在一致性模型高效生成高质量文本到音频内容。

read more
blog-thum
Seed-TTS

Seed-TTS是字节跳动推出的高质量多功能语音生成模型家族,几乎可生成与人类语音无异的声音。

read more
blog-thum
MiniCPM-V

MiniCPM-V是一系列可在手机上高效部署的多模态大模型,具备强大的图像和文本处理能力。

read more
blog-thum
Stable Audio Open

Stable Audio Open是一个开源的文本到音频生成模型,可生成长达47秒的音频样本和音效。

read more