可灵AI上线数字人神器：一张图、一段话，真人感爆棚

在2025年9月18日，快手旗下的可灵AI推出了一项令人瞩目的新功能：用户仅需上传一张角色图片，输入一段文字或音频，即可生成高质量的数字人视频，最长可达1分钟，支持1080p分辨率和48帧每秒的流畅播放。

🤖 一张图，一段话，数字人来报道

想象一下，你只需上传一张角色图片，输入一段文字或音频，便能生成一个栩栩如生的数字人视频，进行产品讲解、新闻播报或在线教育等多种场景应用。这项技术的背后，是可灵AI在多模态理解和视频生成模型方面的深度融合，确保了数字人表现的自然流畅。

🎭 不仅会“对嘴”，还懂“演技”

与传统的数字人技术不同，可灵AI的数字人不仅能够精准同步口型，还能根据输入的提示词调整表情和肢体语言，实现“有灵魂的表演”。例如，在表达愤怒情绪时，数字人能够展现出紧锁的眉头和紧抿的嘴唇，生动地传达内心的情感。

💰 价格亲民，人人可用

为了让更多用户体验到这项技术，可灵AI将数字人视频的价格压低至每秒0.12元人民币。这意味着，即使是中小企业或个人创作者，也能以低成本制作高质量的数字人内容，降低了行业的创作门槛。

🌐 多语言支持，全球通用

可灵AI的数字人支持中、英、日、韩等多种语言，适用于广告、电商、娱乐、教育等多个领域。无论是面向国内市场还是国际用户，都能提供优质的数字人服务，满足不同语言环境下的需求。

🧪 技术背后：多模态理解与视频生成模型的深度融合

可灵AI的数字人技术依托于多模态理解大模型与视频生成模型的深度融合，通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理，实现了语音与唇形的精准同步。此外，采用关键帧控制的架构，模型先构建高层次叙事骨架，再并行生成多个片段的数字人视频，可在保持身份一致的前提下，实现一定长度视频生成。

🎬 未来展望：数字人技术的广泛应用

随着数字人技术的不断发展，预计将在更多领域得到应用。例如，在在线教育中，数字人可以作为虚拟教师进行授课；在电商直播中，数字人可以作为主播进行产品推荐；在广告制作中，数字人可以作为代言人进行宣传。可灵AI的数字人技术为这些应用场景提供了技术支持，推动了数字人技术的普及和发展。

总之，可灵AI的数字人功能不仅在技术上取得了突破，也在价格和应用场景上做出了创新，为数字内容创作者和企业提供了更广阔的创作空间。