一个模型通吃八大视觉任务，一句话生成图像视频

发布时间：2021-11-30 16:13:27 所属栏目：传媒来源：互联网

导读：女娲女娲，神通广大，正如其名，一句话生成视频只是这个模型的技能之一。除此之外，一句话生成图片，草图生成图像、视频，图像补全，视频预测，图像编辑、视频编辑一共八种视觉任务，它其实全部都能搞定。完全是一位不折不扣的全能型选手。它，就是由微软

“女娲女娲，神通广大”，正如其名，一句话生成视频只是这个模型的技能之一。

除此之外，一句话生成图片，草图生成图像、视频，图像补全，视频预测，图像编辑、视频编辑——

一共八种视觉任务，它其实全部都能搞定。

完全是一位不折不扣的“全能型选手”。

它，就是由微软亚研院和北大联合打造的一个多模态预训练模型，在首届微软峰会上亮相。

目前，在推特上已“小有热度”。

（编辑：ASP站长）

【免责声明】本站内容转载自互联网，其相关言论仅代表作者个人观点绝非权威，不代表本站立场。如您发现内容存在版权问题，请提交相关链接至邮箱：bqsm@foxmail.com，我们将及时予以处理。

一个不错的有关mysql和	多功能吸尘器买哪种品
首发649元！Redmi 10A	迷你吸尘器怎样迷你吸