字节跳动智能 AI 助手豆包升级:文生图与图片理解功能齐上线

文生图能力升级

12 月 5 日消息,字节跳动旗下智能 AI 助手豆包现已升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如 “一张带有‘IT 之家’的图”,即可生成带有指定文字的图片。目前该功能已经在豆包 App 开启测试,即梦也已小范围测试。

强化汉字生成能力

豆包大模型团队相关负责人表示,豆包文生图模型通过打通 LLM 和 DIT 构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。豆包网页及电脑版也将在近期上线该能力。

图片理解功能上线

同样在本月初,豆包还上线了图片理解功能,豆包 App 及豆包 PC 新增照片及相机按钮,上传图片后可识别图片内容。豆包的 “图片理解” 功能可识别图片中包含的元素和基本特征。据悉,用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。

总结

字节跳动的智能 AI 助手豆包在文生图和图片理解功能方面取得了显著进展。通过打通 LLM 和 DIT 构架,豆包大幅提升了汉字生成能力,用户可以更加便捷地生成带有指定文字的图片。同时,图片理解功能的上线,使用户能够识别和查询图片中的元素和特征,为日常使用带来了更多便利。豆包网页及电脑版的功能上线也将进一步扩展用户的使用场景和体验。