首页>TAG列表
Mistral 谷歌&amp 具有空间看法的文本 AI颁布TIPS

Mistral 谷歌&amp 具有空间看法的文本 AI颁布TIPS

文章链接,https,arxiv.org,pdf,2410.16512亮点直击具有空间看法的文本图像预训练,TIPS是一种通用的图像,文本编码器模型,可无成效于密集和全局了解,用于纯视觉或视觉言语义务...

打破共性化图像生成局限!MagicTailor 组件可控共性化图像生成翻新框架!

打破共性化图像生成局限!MagicTailor 组件可控共性化图像生成翻新框架!

文章链接,https,arxiv.org,pdf,2410.13370名目链接,https,correr,zhou.github.io,MagicTailor亮点直击总结速览处置的疑问传统的文本到图像...

一致多模态大模型!PUMA 条件生成和了解 多粒度战略笑傲生成 修复 编辑 着色

一致多模态大模型!PUMA 条件生成和了解 多粒度战略笑傲生成 修复 编辑 着色

文章链接,https,arxiv.org,pdf,2410.13861名目链接,https,github.com,rongyaofang,PUMA总结速览处置的疑问,现有的多模态大模型,MLLMs,在...

大规模视觉指令数据集 图像编辑多义务一扫而空!PromptFix 罗切斯特大学&amp 微软 新型分散模型&amp

大规模视觉指令数据集 图像编辑多义务一扫而空!PromptFix 罗切斯特大学&amp 微软 新型分散模型&amp

文章链接,https,arxiv.org,pdf,2405.16785名目链接,https,www.yongshengyu.com,PromptFix,Page总结速览处置的疑问,现有分散模型在处置自...

港理工&amp OPPO&amp AI联结颁布分歧且高效的3D场景编辑方法 Stability

港理工&amp OPPO&amp AI联结颁布分歧且高效的3D场景编辑方法 Stability

文章链接,https,arxiv.org,pdf,2406.17396名目链接,https,lslrh.github.io,syncnoise.github.io,当天和大家一同窗习港理工、OPPO和...

​无需低廉标注!大幅优化SDXL和SD3

​无需低廉标注!大幅优化SDXL和SD3

文章链接,https,arxiv.org,pdf,2410.18013亮点直击总结速览处置的疑问传统的间接偏好优化,DPO,方法依赖少量人工标注的数据集来对文本生成图像,T2I,模型启动对齐,但这种方...