🌭【AIGC每日新闻】
Mikhail Parakhin在推特上的评论
🍔【今日份Sora相关论文分享】
Scalable Diffusion Models with Transformers
摘要:
我们探索了一类基于Transformer架构的新扩散模型。我们训练了图像的潜在扩散模型,用在潜在块上操作的Transformer替换了常用的U-Net骨干网络。我们通过前向传播复杂度(以Gflops衡量)来分析我们的扩散Transformer(DiTs)的可扩展性。我们发现,通过增加Transformer的深度/宽度或增加输入标记的数量,Gflops更高的DiTs通常具有更低的FID(Fréchet Inception Distance)。除了具有良好的可扩展性特性外,我们最大的DiT-XL/2模型在条件性ImageNet 512×512和256×256基准测试中超越了所有先前的扩散模型,后者达到了2.27的最先进的FID。
论文链接:https://arxiv.org/abs/2212.09748
武汉格发信息技术有限公司,格发许可优化管理系统可以帮你评估贵公司软件许可的真实需求,再低成本合规性管理软件许可,帮助贵司提高软件投资回报率,为软件采购、使用提供科学决策依据。支持的软件有: CAD,CAE,PDM,PLM,Catia,Ugnx, AutoCAD, Pro/E, Solidworks ,Hyperworks, Protel,CAXA,OpenWorks LandMark,MATLAB,Enovia,Winchill,TeamCenter,MathCAD,Ansys, Abaqus,ls-dyna, Fluent, MSC,Bentley,License,UG,ug,catia,Dassault Systèmes,AutoDesk,Altair,autocad,PTC,SolidWorks,Ansys,Siemens PLM Software,Paradigm,Mathworks,Borland,AVEVA,ESRI,hP,Solibri,Progman,Leica,Cadence,IBM,SIMULIA,Citrix,Sybase,Schlumberger,MSC Products...