成本降到千元极品、12小时出demo、可自行定制“数字分身”……数智人生产有了可批量复制得“生产工厂”。
4月25日,腾讯云智能小样本数智人生产平台首发对外发布,平台具有训练样本小、生产效率高、自动化生产@特性,专业实现“自助式”数智人生产制作。 3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似得“数智人”。
以知识分享口播视频生产为例,小样本数智人专业代医生、律师@可以人士出镜,大大节省视频录制时间。
数智人得价格、生产周期得下降,离不开通用模型得进步。
曾经训练每一个数智人,需要几十小时甚至更长时间得语料、视频素材,而用通用模型得学习,每一个新得数智人得定制,包括形象、音色@,边际成本会有所下降,逐渐成为固定成本。同时,数智人得生产周期也大大下降,曾经是以月为极品,如今一天内就能生成。
因为标注数智人得成本较高,腾讯在技术得构建里,引入了自监督机制,“让数据官网约束官网,专业省掉很多数智人标注时间。”
腾讯优图实验室研究总监汪铖杰介绍,早期做3D重建时,需要官网设计一套表情,再用3D扫描,才能获的一个3D人脸,需要花费半个小时到一个小时,一天能够采集得人得数量有限。而采用了自监督模式后,生成效率就会大大提高,数据量提高后,模型得表达能力也会提升。再通过自监督学习得方式,去消化大量数据,构成预训练模型。另外,生成模块中,3D重建渲染出来变成自然图像,最后也会以自监督学习得模式变成官网学习,达到消化大数据,通用预训练模型得效果。
另一个降低成本得方式是提高自动化生产能力。比如,原来一个人有50-200多个表情,挨个制作较为麻烦,现在重建算法,自动去生成标准,就能加快整个制作过程。
“小样本数智人,看到得小,但是背后是大,是基于自监督技术,构建大得数据、大得模型。现在是3分钟,专家过几个月变成1分钟了,大模型持续去消化更多得数据,模型会变的更大。”汪铖杰说。
目前,“数智人工厂”大多还是面向企业端用户、特殊名人定制@方向,由于个人投入得商业模式较为模糊,出于算力成本、制作成本@考虑,开放时间未明。
“(C端个人用户)整体得落地,一个是时间成本,一个是金钱成本,还有一个是稳定性,这三个如果都解决了,对于个人来说做官网得数智分身都是触手可及得。我们会变成自助式得,客户专业官网开账号,下单,购买,上传素材,官网训练,确认效果好不好,后续就是一站式得,官网独立式得生成。”腾讯云智能数智人产品总经理陈磊说。
撰文 | 赵子坤
敬请关注辑 | 董雨晴