腾讯混元生图模型2.0大更新！语音输入，毫秒级出图！

2025-06-24 新闻动态 86

今天上午十一点腾讯混元图像 2.0 全新发布，此次最大的新功能叫【实时生图】，可以实现毫秒级出图。业内首个实时生成模型，毫秒级响应生成高精度图像，重新定义智能创作边界。

图片

网址：https://hunyuan.tencent.com/我申请后，很快也通过了混元实时生图的内测资格。

图片

语音录入，言出法随这个版本有一个最大的便捷性是居然可以语音录入指令！你想到了什么天马行空的 prompts可以立即说给它听！言出法随，法随图成！可以支持英文输入，包括英文文本、英文语音。由于底层模型是英文基底，所以英文输入的prompts出的图像或许质量会更高。

图片

实时生图，毫秒级响应目前市面上的生图模型，一般都是手动输入，然后等待四张图片加载，一般来说，快的也需要 10 秒左右，混元图像 3.0 出图速率确实很快，基本控制在 1秒以下，实时更新，不用等待！不过加了参考图，时间慢个零点几秒。感知不强。实时绘画板在实时绘画板上，只用了五笔画了一个超级简陋的雪人简笔画，立马生成了一个写实的雪人，并且可以任意修改简笔画，生图模型实时出新图。画了一只小鸡简笔画，后面给它加了一个蝴蝶结、又加了一个把背带裤，模型都实时对应生图出来了，最后，加个篮球吧，写上篮球，只画了一个圆，图像立马也生成出来了，并且可以拖动圆的位置，篮球位置也随之更改。这个功能也拯救了像我这样的绘画手残党，把自己的手稿给绘制了精美的成品图片。我画的巨龙，生图效果如下：

图片

改成动漫风格，生图效果立马跟上了，还是挺不错的吧。

图片

实时画板也可以上传图片参考，好像没限制上传数量，我上传了 11 张依然没提示达上限。

图片

不足之处整体看下来，图像还是有较重的 AI 味，尤其是写实人像上。我试了几个复杂的提示词，很多描述没有在图像上体现出来，语意理解能力还有待提高。光线、氛围比较昏暗，没有很好结合主体配上合适的光线和氛围感。人物模型默认是西方人脸型居多。UI 方面，实时绘画板，默认的布局能否不要让提示词面板遮住画板，画图和看出图效果都不方面，要移动或者缩放，这个阻碍在看发布会直播的时候也体现出来了。【实时文生图】页面都没有遮挡，为什么绘画板遮挡呢。当然，这些不是本期更新的的重点事项，也希望后期能更好完善这些不足之处，希望越来越好，我愿意多做case评测帮助改进。有还可以的案例

图片

也有失败的案例

图片

大家可以去官网试一下，期待你发掘出更好玩的技巧，分享出来。

OK以上内容就是本篇分享腾讯混元图像 2.0 的新功能，配合案例图片，希望能让你理解得更透彻，祝你摸鱼愉快～

如果对你有所帮助，关注我，随手点赞，在看，分享三连吧～你的支持是我的原动力，我会继续给你分享更多AI知识。我是胡克，一个正在努力成长的设计师，下期还想看什么内容，评论区告诉我～

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。

标签：

上一篇：苹果将推出20周年纪念版手机国产机皇跌至白菜价网友后悔买早了

下一篇：韩国前总统尹锡悦再次被捕

腾讯混元生图模型2.0大更新！语音输入，毫秒级出图！

韩国前总统尹锡悦再次被

特朗普将首次军援乌克兰

跟着赛事去旅行｜邛崃市

婴儿支撑垫和哺乳枕出口

Win 11更新致硬盘问题持续