AI新工具

blog-thum
Look Once to Hear

系统“看一眼即可听”通过注视目标说话者几秒钟来实现嘈杂环境中的目标语音听取。

read more
blog-thum
AnyNode

AnyNode是一个利用LLM进行输入处理并生成任意类型输出的ComfyUI节点。

read more
blog-thum
ChatTTS

ChatTTS 是专为对话场景设计的文本到语音模型,支持中文和英文生成。

read more
blog-thum
llama3v

llama3v模型通过结合Llama3 8B和siglip-so400m,实现了图像-文本生成的顶级性能。

read more
blog-thum
Wasper

Wasper是一款隐私优先的开源工具,集写作、绘画和规划于一体。

read more