一个模型通吃八大视觉任务,一句话生成图像视频
发布时间:2021-11-30 16:13:27 所属栏目:传媒 来源:互联网
导读:女娲女娲,神通广大,正如其名,一句话生成视频只是这个模型的技能之一。 除此之外,一句话生成图片,草图生成图像、视频,图像补全,视频预测,图像编辑、视频编辑 一共八种视觉任务,它其实全部都能搞定。 完全是一位不折不扣的全能型选手。 它,就是由微软
|
“女娲女娲,神通广大”,正如其名,一句话生成视频只是这个模型的技能之一。 除此之外,一句话生成图片,草图生成图像、视频,图像补全,视频预测,图像编辑、视频编辑—— 一共八种视觉任务,它其实全部都能搞定。 完全是一位不折不扣的“全能型选手”。 它,就是由微软亚研院和北大联合打造的一个多模态预训练模型,在首届微软峰会上亮相。 目前,在推特上已“小有热度”。 (编辑:ASP站长) 【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。 |
相关内容
未处理完善
-
无相关信息
最新更新


