当前位置:e世博官方动态 > 新闻动态 >

腾讯混元生图模型2.0大更新!语音输入,毫秒级出图!

2025-06-24 新闻动态 86

今天上午十一点腾讯混元图像 2.0 全新发布,此次最大的新功能叫【实时生图】,可以实现毫秒级出图。业内首个实时生成模型,毫秒级响应生成高精度图像,重新定义智能创作边界。

图片

网址:https://hunyuan.tencent.com/我申请后,很快也通过了混元实时生图的内测资格。

图片

语音录入,言出法随这个版本有一个最大的便捷性是居然可以语音录入指令!你想到了什么天马行空的 prompts可以立即说给它听!言出法随,法随图成!可以支持英文输入,包括英文文本、英文语音。由于底层模型是英文基底,所以英文输入的prompts出的图像或许质量会更高。

图片

实时生图,毫秒级响应目前市面上的生图模型,一般都是手动输入,然后等待四张图片加载,一般来说,快的也需要 10 秒左右,混元图像 3.0 出图速率确实很快,基本控制在 1秒以下,实时更新,不用等待!不过加了参考图,时间慢个零点几秒。感知不强。实时绘画板在实时绘画板上,只用了五笔画了一个超级简陋的雪人简笔画,立马生成了一个写实的雪人,并且可以任意修改简笔画,生图模型实时出新图。画了一只小鸡简笔画,后面给它加了一个蝴蝶结、又加了一个把背带裤,模型都实时对应生图出来了,最后,加个篮球吧,写上篮球,只画了一个圆,图像立马也生成出来了,并且可以拖动圆的位置,篮球位置也随之更改。这个功能也拯救了像我这样的绘画手残党,把自己的手稿给绘制了精美的成品图片。我画的巨龙,生图效果如下:

图片

改成动漫风格,生图效果立马跟上了,还是挺不错的吧。

图片

实时画板也可以上传图片参考,好像没限制上传数量,我上传了 11 张依然没提示达上限。

图片

不足之处整体看下来,图像还是有较重的 AI 味,尤其是写实人像上。我试了几个复杂的提示词,很多描述没有在图像上体现出来,语意理解能力还有待提高。光线、氛围比较昏暗,没有很好结合主体配上合适的光线和氛围感。人物模型默认是西方人脸型居多。UI 方面,实时绘画板,默认的布局能否不要让提示词面板遮住画板,画图和看出图效果都不方面,要移动或者缩放,这个阻碍在看发布会直播的时候也体现出来了。【实时文生图】页面都没有遮挡,为什么绘画板遮挡呢。当然,这些不是本期更新的的重点事项,也希望后期能更好完善这些不足之处,希望越来越好,我愿意多做case评测帮助改进。有还可以的案例

图片

图片

也有失败的案例

图片

图片

大家可以去官网试一下,期待你发掘出更好玩的技巧,分享出来。

OK以上内容就是本篇分享腾讯混元图像 2.0 的新功能,配合案例图片,希望能让你理解得更透彻,祝你摸鱼愉快~

如果对你有所帮助,关注我,随手点赞,在看,分享三连吧~你的支持是我的原动力,我会继续给你分享更多AI知识。我是胡克,一个正在努力成长的设计师,下期还想看什么内容,评论区告诉我~

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。
标签:
相关推荐
标签列表