文 | 追问nextquestion
在当今人工智能的浪潮影响下,AI生成技术已成为创意产业的一大助力。剧本创作和广告文案编写等创作者如今面临着一个关键的选择:是否应该借助先进的人工智能模型,来激发和丰富他们的创意创作?
近日Science Advance上发表的一项研究给出了让人喜忧参半的回答。尽管人工智能能显著提升个体的创造力,它却可能产生较为平庸、缺乏独创性的创意输出。该研究结果强调了人工智能在创意写作中的潜力和风险,有助于理解大模型应用对人类行为及其社会文化所带来的冲击。
问题:如何评估创意?
生成式人工智能技术,现如今能够在文本(例如 ChatGPT)、图像(例如 Midjourney)、音频(例如 Jukebox)和视频(例如 Pictory)中产生看起来有创意的内容。虽然之前的研究已证明人工智能能与人类合作开发故事情节,但这种合作是否真的能激发灵感,还是仅仅将创作者的思维限制在AI提供的范例之内,进而限制创意的飞扬,目前的研究还相对匮乏。
而在评估创造力时,我们通常从两个维度进行考量:新颖性和实用性。新颖性衡量一个想法与现状或常规期望的偏离程度,是衡量故事的原创性和稀有性的关键指标。而实用性则关注想法与预期目标的契合程度,涵盖了故事或文案对目标受众的适应性,以及其形成系列产品(书)的可能性和商业化(出版)概率。
在该研究中,研究人员在线招募了293名参与者,并要求他们撰写一个简短的八句话故事。为了探究大模型在创意写作中的作用,参与者被随机分配到三个组别:一组未接受任何人工智能提示(仅人类组)、一组获得一个由大模型产生的想法,以及一组获得五个由大模型产生的想法。为评估这些故事的创造力,研究人员又另外在线招募了600名评估者,他们在不知情的情况下,根据实用性、新颖性和几个情感维度对参与者写的故事进行了打分。
发现:个体创意增加,群体多样性降低
研究发现,人工智能生成的创意可以作为人类思维的跳板,提供潜在的起点,引发多样的故事情节发展,形成一种“树状结构”。相较于未接受大模型提示的组,使用5条提示的参与者获得了最大的创造力收益,他们的故事在新颖性方面的得分高出8.1%,在实用性方面高出9%(图2A)。
此外,通过让参与者在写作前进行发散性思维任务——列出10个完全不同的词汇,研究人员评估了参与者的内在创造力。研究发现,对于创造力本身就很高的参与者,人工智能提供的创意几乎不影响其故事的创造性。然而对于创意不足的参与者,人工智能的帮助显著降低了他们作品的单调性,减少了15.2%。
之后研究者通过Open AI提供的文本嵌入,计算故事间的相似度,结果发现接受人工智能创意提示的参与者之间的故事相似性增加了10.7%,其变化和多样性也更少。这表明,尽管人工智能辅助可以提高个体的创造力,但它也可能在群体层面导致参与者创意之间的雷同,进而减低集体的新颖性,减少了创意的多样性。
讨论
无独有偶,今年2月发表于Scientific Reports的论文则从流畅性、独创性和详细程度考察了GPT-4的发散性思维,得出了类似的结果。
GPT-4在所有发散性思维的测量维度上都会优于人类参与者。特别是在控制了回答流畅性之后,GPT-4在原创性和详细程度上的表现尤为突出。但相较于人类,GPT-4在回答中使用了更高频率的重复词汇,且在词汇选择上更为集中。这与本研究所表现出的集体新颖性降低是一致的。
大模型如何影响人类独特行为特征——创造力?基于目前的研究,我们可以明确的说,生成式AI辅助的创意写作确实可以增强个人的创造力,但同时也存在关键风险:集体创造力的新颖性可能因此受损。
如果出版业接受更多受AI启发的生成式内容,这些内容将在整体上可能变得越来越雷同,进而失去创作者个体的独特性。这里存在一个可能的恶性循环,即一旦个别作家认为AI辅助的写作提高了他们的创造性,那他们可能会更有动力且更频繁地依赖此类技术,这反过来又可能削弱整体文学作品的创新性。
当然,目前的实验设计仍然存在缺陷,研究者只是于在线平台招募了非专业写作者志愿参与实验,参与者没有获得额外经济刺激。拿到生成式人工智能提示的参与者获得的是实验中根据提示词模板产生的,而非写作者自由与ChatGPT对话。写作任务也只是完成短短8句不需要考虑复杂因果关系的短篇故事写作,这些都和现实中的创意创作不符合。此外,鉴于该研究基于西方文化背景,其结果是否适用于中国文化仍有待验证。
总而言之,虽然人工智能将为创意产业带来了巨大潜力,但如何平衡其利与弊,确保技术的健康发展,将是我们不可回避的挑战。那么,知晓了实验结果的你,将会如何选择?
根据《网络安全法》实名制要求,请绑定手机号后发表评论