首页>TAG列表
一分钟搞定恣意数量视图到3D场景重建 谷歌重磅颁布CAT3D

一分钟搞定恣意数量视图到3D场景重建 谷歌重磅颁布CAT3D

论文链接,https,arxiv.org,pdf,2405.10314名目链接,https,cat3d.github.io,3D重建的提高使得高品质的3D捕捉成为或者,但须要用户搜集数百到数千张图像来...

入门必读!多模态大言语模型的演化全回忆! 图像生成 编辑 视觉定位 了解

入门必读!多模态大言语模型的演化全回忆! 图像生成 编辑 视觉定位 了解

文章链接,https,arxiv.org,abs,2402.12451衔接文本和视觉模态在生成式AI中起着至关关键的作用,遭到大言语模型,本文简称LLM,成功的启示,人们正在努力于开发多模态大言语模型...

曾爆火的 InstantID又有了新玩法 已开源 格调化图像生成

曾爆火的 InstantID又有了新玩法 已开源 格调化图像生成

格调化图像生成,也常称为格调迁徙,其指标是生成与参考图像格调分歧的图像,此前基于diffusion的方法,比如LoRA,理论须要批量的同格调数据启动训练,不可迁徙到新的格调中,或许基于inversio...

自回归可以战败分散模型吗 在图像生成畛域

自回归可以战败分散模型吗 在图像生成畛域

图像生成畛域,有这么几种方法,Flow,Based、GAN,Based、VAE,Pixel,CNN系列、分散模型自回归,更早期的是基于自编码器的图像生成,各种Auto,Encoder模型,以及影响很大...

初次逾越分散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

初次逾越分散模型和非自回归Transformer模型!字节开源RAR 自回归生成最新SOTA!

文章链接,https,arxiv.org,pdf,2411.00776名目链接,https,yucornetto.github.io,projects,rar.html代码&,模型链接,http...

​颜水成团队新作 AI手机迎来严重技术停顿!Meissonic 让移动成像技术飞跃

​颜水成团队新作 AI手机迎来严重技术停顿!Meissonic 让移动成像技术飞跃

文章链接,https,arxiv.org,pdf,2410.08261模型链接,https,huggingface.co,MeissonFlow,Meissonic在线Demo链接,https,hug...