2026年04月04日全球AI前沿动态

同步开源自研LongCat-AudioDiT端到端语音克隆模型(1B/3.5B双版本,MIT协议),首创在波形潜空间直接进行扩散建模(Wav-VAE+扩散Transformer),抛弃梅尔谱中间表示...
3周前
160