据外媒报道,阿里巴巴推出了用于多媒体生态系统的全新人工智能模型Wan2.7 Image和Wan2.7-Video。该模型旨在简化内容制作过程。

Wan2.7 Image旨在克服迄今为止不太一致的人工智能视觉挑战。该模型通过深度个性化功能实现专业图像制作,可以设置面部结构到最小的细节。

该模型的另一个主要功能是精确的色彩调色板控制。此外,该模型支持12种不同语言中的3000个字符的文本渲染,以满足复杂内容的需求。

Alibaba 还提供了一个点击编辑功能,可以帮助用户准确地调整图像元素到像素级别。用户还可以利用多达九个参考图像来加快故事板或建筑设计。

接下来,阿里巴巴推出了Wan2.7-Video,它可以将文本、图像和音频转换为1080p质量的视频。有了这个模型,用户可以真实地设置摄像头的运动和角色的情绪表达。

该视频模型能够在单个长叙述中保持多达五个不同角色的视觉和声音身份的一致性。在该模型中,有一个视频延续功能,以确保场景之间的平滑和自然过渡。

所有这些最新模型都与Qwen App集成,并通过阿里云模型工作室提供大规模使用。据信,这两种模型将推动内容行业参与者的创造力。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+