听觉感知:语音识别;
视觉感知:人脸识别;
动作识别:表情、情绪、动作感知;
OCR:证件识别,文本识别。
政务服务领域知识图谱及问答库积累,实时语音交互灵活可配。
形象制作:2D真人、卡通、3D写实、超写实;
形象驱动:面部驱动、肢体动作;
语音交互:多轮对话、声音定制。
内置2D真人数字人形象库,开箱即用
支持从2D真人、3D仿真人、卡通、超写实等个性化数字人资产定制;
政府、军队、媒体、金融、文旅等岗位形象和服饰;
可按内容、场景的需要,对数字人形象外观进行配置,包括发型、服装、鞋子等。
可配置不同互动场景下数字人的人像位置、声音配置、背景图片等。
动作、表情、感知深度匹配;
多功能语音包,语音、唇形、情绪同步;
提供灵活的话术配置,实现音唇精准同步、表情及动作丰富逼真。