李维:AIGC 时代,数字人引领内容创作新范式|2023 ChinaJoy AIGC大会

7月28日,由汉威信恒主办,钛媒体集团协办的2023 ChinaJoy AIGC大会正式召开。中国音像与数字出版协会常务副理事长兼秘书长敖然为大会做开幕致辞,并发布报告《数字交互引擎的应用与价值研究》。

7月28日至7月31日第20届中国国际数码互动娱乐展览会(ChinaJoy)在上海举行。7月28日,由汉威信恒主办,钛媒体集团协办的2023 ChinaJoy AIGC大会正式召开。大会聚焦时下热议的AIGC行业,邀请国内外AIGC领域的行业代表专家、学者、企业大咖重磅参会,从技术层面、应用层面、价值投资层面,全生态视角探讨AIGC技术下的内容产业新业态。

出门问问副总裁李维发表了题为《AIGC 时代,数字人引领内容创作新范式》的演讲。

李维表示,出门问问是一家以生成式AI和语音交互为核心的人工智能公司。目前着眼于大模型及大模型所能够辐射到的多模态AIGC各个方向的探索和创新并自研了一个名为"序列猴子"的大模型,该模型具有通用能力。在配音方面拥有许多付费客户,特别是魔音工坊。在多模态AIGC方面,他们的产品包括奇妙文、言之画和奇妙元。奇妙文可以辅助用户生成文案,写小说和诗歌,并且可以调用言之画生成相关图片。魔音工坊是一个配音助理工具,可以帮助用户进行配音编辑和混音。奇妙元是一个数字人制作平台,支持2D、2.5D和3D形象生成。出门问问追求高质量的大脑,以生成有价值的内容。除了大脑,还注重声音和外观的表现,并且开发了智能手表等硬件产品。

以下是李维在2023 ChinaJoy AIGC大会上的演讲全文(略经钛媒体App整理):

很高兴有机会跟大家分享出门问问在大模型、AIGC方面的工作。

出门问问是一家以生成式AI与语音交互为核心的人工智能公司。从语音助手开始,软硬结合,现在着眼于大模型及大模型所能够辐射到的多模态AIGC各个方向的探索和创新。自研大模型的名字叫做“序列猴子”,“序列猴子”怎么来的呢?法国数学家埃米尔·博雷曾提出一个“无限猴子”定理,如果时间没有限制的话,让一只猴子在打字机上打字,能打出一部莎士比亚出来。“序列猴子”的意思是如果把足够的数据Feed给模型,最终模型能力一定会具有通用性。

“序列猴子”是GPT形式具有通用能力的大模型。

可以看到它已经具备一定的推理能力和计算能力,除了对话,大家都知道大模型人机对话的丝滑能力已经超过一般人类了,这是大模型的特点。

在大模型赋能下,我们是最早进入AIGC赛道,最早跟大模型接通的企业之一,在配音方面拥有最多付费客户,特别是魔音工坊,魔音工坊做配音工作,我们在抖音里看到的配音很多都是出自魔音工坊。

在多模态方面的AGIC,奇妙文是用大模型来帮助生成内容、文案。言之画可以文字生图、图生图,魔音工坊是最早进入市场的,做得比较成功的一款产品。奇妙元是数字人制作平台,现在处于爆发的前期,可以把奇妙元看成是魔音工坊的延伸。奇妙文是大模型长线,可以辅助用户生成文案,写小说、诗歌。在奇妙文当中,用户可以调用言之画生成图片,跟文字相关的图片,能够自动生成。

魔音工坊是配音助理。

魔音工坊在国外的版本叫做DupDub,因为有用户基础,有很多反馈,做得比较丝滑,比较讲究,有各种编辑,能够使你的配音更加契合视频的需要需求。混音的功能非常实惠,有各种组合的可能性,把一种情绪变成另外一种情绪。

奇妙元集中了各种模态,现在处于爆发期。数字人分三种模式,一种是2D,一种是2.5D,一种是3D。

最简单的是2D,2D是图片一键生成,不过已经很逼近2.5D了,2.5D要做声音克隆和形象克隆,还需要些时间。

像这个是2D,图片一键生成,这是25年前的我。 这是2.5D,现在的我。

3D形象转2D形象,在多模态方面有AIGC沉淀矩阵,最主要的是底座“序列猴子”,因为它是AIGC产品矩阵的大脑。

我们所追求的是要有高质量大脑,否则怎么生成有价值的内容,或者至少是辅助生成。在创作类型中,大模型起很大作用,在其他场景,大模型可能会有幻觉的问题需要人去把控。但不管怎么说,大脑很重要。其他的都涉及感知层面的,要有动听的声音,我们已经做到了,配音在业界做的是在前列的。要有好看的外表,我们公司也做硬件,比如说智能手表,通过软件植入到硬件中跟客户接触。

以及还有在企业方面数字人的应用。

谢谢大家!

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App

Baidu
map