讯飞智作首发超拟人数字人，让数字人赋能更多场景成为可能

在降低数字人定制门槛的道路上，讯飞智作按下了加速键。2024年10月24日，讯飞智作首发超拟人数字人，仅需一张照片就能实现数字人定制。此次超拟人数字人嵌入至讯飞智作小程序上，无需打开电脑登录，在人人拥有手机的年代，再次降低用户路径，让每人拥有自己的超拟人数字人成为可能。

作为科大讯飞旗下一款AIGC内容生产平台，讯飞智作自诞生以来就一直为用户提供“AI配音”“数字人视频播报”“声音定制”“形象定制”等服务，致力于提高各种场景下音视频内容生产效率。而此次首发超拟人数字人，更是讯飞智作在AI领域的进一步跃升。

基于大模型的多模态交互技术的创新与升级，讯飞智作首发超拟人数字人让个性化数字人的打造有了更多选择。数字人定制不再是调用提前录制模版资源的“预制菜”，而是由一张照片就能驱动的新突破。

在此次技术提升下，一张照片驱动数字人不仅没有让超拟人数字人表现力降低，反而借助情感贯穿的多模态交互能力，提升其表情与肢体的表现能力。大模型的多模态交互技术统一了文本、语音和表情，实现跨模态的语义一致性。也就是说，超拟人数字人的情感表达更加真实连贯，数字人的口唇不仅能够高度同步，表情和动作上也会随之变化表现，更贴近真人的情感表达。

于此同时，超拟人数字人还与此前的“一句话声音复刻”功能做了有机结合。借助大模型语音合成技术，用户在定制专属的超拟人数字人声音时仅需根据提示朗读文本，讯飞智作便会快速学习你的音色、韵律以及说话习惯，短短几秒钟便能复刻出其高质量的专属音频。不仅如此，讯飞智作还实现了跨语种复刻的能力。

讯飞智作小程序“声音复刻”功能页面

在当下大模型竞争的白热化阶段，讯飞智作选择将视角转向注重真实场景落地的技术优化。超拟人数字人这一技术的实现，让数字人普及N种场景成为可能，成为促进千行百业智能化转型的重要动力。

在传统的教培场景下，数字人定制多服务于教师职能。如大学老师借助数字人定制服务让每个人都拥有自己的云课堂，定制2D高仿真的虚拟数字人再通过合成课件PPT、素材、场景、视频完善课程教学。而此次超拟人数字人进一步提升教师应用场景的便捷性，无需录制长段的绿幕视频，仅需一张照片，讯飞智作便可自动生成属于教师的超拟人数字人。除了大学教师，在中小学教育场景下，利用超拟人数字人来进行赛课无疑也是一种高效且吸引的手段。

在自媒体场景下，超拟人数字人的应用前景尤为广阔。通过一张照片即可生成超拟人数字人，让口播博主不再困顿于视频场景的繁琐布置、口播录制反复修改等问题。仅需一张优质的照片，输入想要表达的文案，即可生成优质的出镜视频。