可灵AI上线数字人神器:一张图、一段话,真人感爆棚

在2025年9月18日,快手旗下的可灵AI推出了一项令人瞩目的新功能:用户仅需上传一张角色图片,输入一段文字或音频,即可生成高质量的数字人视频,最长可达1分钟,支持1080p分辨率和48帧每秒的流畅播放。 


🤖 一张图,一段话,数字人来报道

想象一下,你只需上传一张角色图片,输入一段文字或音频,便能生成一个栩栩如生的数字人视频,进行产品讲解、新闻播报或在线教育等多种场景应用。 这项技术的背后,是可灵AI在多模态理解和视频生成模型方面的深度融合,确保了数字人表现的自然流畅。 


🎭 不仅会“对嘴”,还懂“演技”

与传统的数字人技术不同,可灵AI的数字人不仅能够精准同步口型,还能根据输入的提示词调整表情和肢体语言,实现“有灵魂的表演”。 例如,在表达愤怒情绪时,数字人能够展现出紧锁的眉头和紧抿的嘴唇,生动地传达内心的情感。 


💰 价格亲民,人人可用

为了让更多用户体验到这项技术,可灵AI将数字人视频的价格压低至每秒0.12元人民币。 这意味着,即使是中小企业或个人创作者,也能以低成本制作高质量的数字人内容,降低了行业的创作门槛。 


🌐 多语言支持,全球通用

可灵AI的数字人支持中、英、日、韩等多种语言,适用于广告、电商、娱乐、教育等多个领域。 无论是面向国内市场还是国际用户,都能提供优质的数字人服务,满足不同语言环境下的需求。 


🧪 技术背后:多模态理解与视频生成模型的深度融合

可灵AI的数字人技术依托于多模态理解大模型与视频生成模型的深度融合,通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,实现了语音与唇形的精准同步。 此外,采用关键帧控制的架构,模型先构建高层次叙事骨架,再并行生成多个片段的数字人视频,可在保持身份一致的前提下,实现一定长度视频生成。 


🎬 未来展望:数字人技术的广泛应用

随着数字人技术的不断发展,预计将在更多领域得到应用。 例如,在在线教育中,数字人可以作为虚拟教师进行授课;在电商直播中,数字人可以作为主播进行产品推荐;在广告制作中,数字人可以作为代言人进行宣传。 可灵AI的数字人技术为这些应用场景提供了技术支持,推动了数字人技术的普及和发展。


总之,可灵AI的数字人功能不仅在技术上取得了突破,也在价格和应用场景上做出了创新,为数字内容创作者和企业提供了更广阔的创作空间。