学术研究

研究成果

当前位置: 首页 > 学术研究 > 研究成果

出版学人 | 陆朦朦：当创意遇上AI：人工智能赋能网络文学多模态叙事的可能与限度

发布日期：2024-12-22 作者：来源：点击：

多模态大模型技术的发展为网络文学的多模态叙事提供了诸多技术层面的可供性。在实践应用领域，2023年6月，阅文集团围绕“升级AIGC赋能原创的多模态多品类内容大平台，构建新的IP上下游一体化生态体系”的目标，贯通“多模态内容—大产品平台”运营链，打通多模态内容与产品的一体化运作模式。中文在线也在AI大模型、AI多模态方面开展技术建设并进行商业化落地，2023年10月发布的AI大模型“中文逍遥”，可根据图片内容撰写优质小说，展现出其多模态应用能力。对于网络文学创作而言，多模态叙事形成的复合文本深刻影响着阅读体验与理解深度，它不仅革新了叙事符号的组装方式，更开创性地构建了一个全方位、立体化、情境化、交互性的文本世界，人工智能在网络文学领域的深度介入将极大拓宽多模态叙事文本表达的边界与影响力。

一、人工智能赋能网络文学多模态叙事的可能面向

1.人工智能赋能网络文学数据库生产与多模态再现

网络文学创作的数据库化渐成行业趋势，将已出现的创作元素和符号作为可共享的数据，模拟数据库的采集、存储、提取和更新方式进行写作，这种方式不仅提升创作效率，也重塑着文体结构模式。人工智能技术的介入无疑加速了网络文学数据库生产方式的效率，例如阅文集团旗下的AIGC产品阅文妙笔，可以通过对输入的作品类型、性别、标签等细节分析之后，结合对角色的大概设想，获得AI生成的角色称号、外貌、性格、经历等信息。多模态AI同时利用多种模态类型数据形成多模态融合数据源进而生成内容，任何围绕网络文学文本的多种形态媒介内容都可以成为输入源头，并经由多模态AI输出内容。在实际应用的多模态AI项目中，其应用操作情境也建立在数据库式的使用逻辑上，例如由Charima.ai公司研发的Web Comics项目，通过提供内置的头像生成器、图像、GIF、音乐和音效管理器、免费背景图像库、1000个高级AI语音资源等，供用户进行择选、调试、实验、创作，拼贴缝合到故事中以增强用户参与度与沉浸体验。

2.人工智能赋能网络文学效率化叙事与容错性创新

传统的网络文学文本仅仅由单一的文字符号构成，文字符号构成的文本欣赏空间是扁平化的，允许单一的视觉感官进入网络文学作品的体验场景，构成了传统的网络文学“静观式”的这种场景。尽管在网络文学IP产业链延伸的推动下，原始文本转向多模态符号共同叙事的实践应用层出不穷，但不同媒介产业生产的特定机制导致这类多模态叙事存在产业间隔与开发成本等掣肘，难以真正形成高效率的网络文学多模态叙事创作，并且由于影视创作技术存在一定的门槛，网络文学多模态叙事需要成熟的影视化工业体系才得以成型。随着文生图，文生视频等大模型技术的应用，网络文学多模态叙事的创作门槛进一步降低，“普惠性”的多模态叙事创作成为可能。同时，文本内容的即时性多模态转化与创意想法的高效率效果验证，提供了巨大的网络文学文本多模态叙事转化的容错创新空间，使多模态叙事通过微调、迭代与优化达到一定的审美要求。

3.人工智能赋能网络文学个性化交互与定制化体验

多模态人工智能通过文本、图像和视频数据等组合来学习、理解和分析用户习惯和偏好，从而为用户推荐符合其喜好的网络文学作品、创建实时适应的定制故事和叙述，为每个个体提供完全独特的内容体验，这已经成为畅想人工智能赋能网络文学创作的普遍共识性观点。在多模态AI的技术加持下，对跨媒介消费行为的追踪可以有效整合用户围绕网络文学阅读产生的一系列多模态行为数据，通过分析用户的阅读数据和行为模式，AI可以构建用户画像，生成定制化的故事情节、角色设定和视听效果。例如，在描述一个奇幻场景时，AI可以自动生成与之相匹配的视觉画面和背景音乐，而且是千人千面的配置，不仅身临其境且极致个性化。同时，多模态人工智能可以检测和理解用户阅读时的情绪，包括语音语调、情感态度和面部表情，分析判断具体情境下用户的情绪状态与心理需求，给予针对性定制化的响应与反馈，使多模态故事世界的交互体验显著增强。

二、人工智能赋能网络文学多模态叙事的限度反思

1.人工智能赋能网络文学多模态叙事的意义深度与模态广度

尽管网络文学研究中不乏批评创作类型化、同质化的声音，但传统的网络文学创作仍然是建立在人类个人性与社会性感知、体验的基础上，是融合诸多文化创意元素与社会背景知识，且设计多种修辞手法与语境转换后的结果。人工智能在处理这些复杂的语言和逻辑时往往采用简化的方式，导致作品的意义被压缩或扭曲。此外，多模态人工智能大模型的性能及其泛化到新任务或领域的能力可能会受到训练标记数据可用性的限制，导致网络文学原作品故事意义与价值观念在多模态转化中的粗粒化呈现与有损压缩，最终造成意义深度的稀释。就当前的多模态叙事技术实现而言，尽管可支持多模态叙事的工具已经在应用层面如雨后春笋般涌现，但应用级的所谓多模态工具往往仍然垂直在某一单模态或双模态领域，例如文生图、文生视频、文生语言等等，而一部完整的多模态叙事作品需要实现无缝融合的效果，还需人类主体整合各类AIGC工具，为多模态叙事项目“配齐”最佳技术栈。

2.人工智能赋能网络文学多模态叙事的有限想象与价值对齐

在内容生成阶段，由于模型训练的语料库的不可控，可能导致偏见、“观点霸权”、刻板印象、文化片面性等问题，这在多模态内容生成中依然存在，并不会因为模态的转变而消除，甚至会因视听模态叙事内容的广泛传播性与渗透性更容易将偏见性、片面性观点潜移默化地嵌入社会文化中，并将主观认知通过貌似技术中立的大模型予以客观化，来强化在社会现实中抽取的大模型底层预训练数据所带有的现实偏见与文化霸权，使其成为普遍性的默认惯例与规则。此外，在网络文学多模态叙事实践应用中的多模态大模型往往是全球主要几家大型科技公司研发的产物，其对模型应用的追求必然遵循数字资本主义的逻辑，使得嵌入其中的有关知识价值体系、符号象征系统、文化多样性架构等置于全球性技术扩张的普遍性生产范式之下，这种生产范式在本质上是消弭地区、种族、文化等任何不能被资本一体化运作框架所涵盖的差异性因素。

3.人工智能赋能网络文学多模态叙事的情感体验与人性价值

虽然人工智能为网络文学的多模态叙事与跨媒介融合提供了生产力工具与创意可能性，但其缺乏人类创作者独有的情感深度、生活经验和主观意识。人类主体的创意生成与审美体验往往建立在独有的对社会生活的感触之上——深刻的情感理解、同理心、敏感性和感受文化细微差别的能力——这在内容创作与生产中是区别于人工智能技术的至关重要的因素。这种主体性的缺失，使得AI与人类在审美体验上难以形成共通感，难以体验人类世界的情感、意境和象征意义。因此，人工智能赋能网络文学多模态叙事可能在模态的丰富性与视觉性上有一定的冲击力，但其在深层内涵层面具有明显的限制。AI生成的多模态作品往往呈现出某种程式化和同质化特征，缺乏生命力与艺术张力。在内涵层面，AI作为没有肉身性体验的机器，其创作缺乏人性深度，难以形成对现实世界的经验性主观感受与洞察。纯粹人工智能生成的多模态叙事是一种“无病呻吟”式的创作，更多体现的是多模态文本的技术性拼贴与增殖，而不是建立在人类主体意向性的交流与表达欲望上。

三、结语

人工智能广泛渗透至网络文学的各个领域，带来前所未有的可能性和变革。从数据库生产与多模态再现，到效率化叙事与容错性创新，再到个性化交互与定制化体验，AI不仅能帮助创作者构思情节、生成文本，还能结合图像、音频、视频等多媒体元素，创造出更加立体、丰富的叙事体验。这种多模态叙事不仅增强了作品的表现力，还拓宽了读者的感知维度，使网络文学在形式和内容上实现了前所未有的飞跃。然而，AI赋能网络文学多模态叙事也存在一定的限度。未来的网络文学多模态叙事创作与体验，势必需要人类主体、人工智能“拟主体”、人机交互主体多元共存来促进人工智能与人文精神的深度融合，这显然还有很长一段路要走。

陆朦朦

博士，浙江传媒学院出版学院副教授，主要研究方向：数字文化产业、国际出版等。

文字原发表于 | 《编辑之友》

文字来源 | 陆朦朦

美术编辑 | 何瑜

责审 | 郑采妮

终审 | 方宁

上一条：出版学人 | 崔波：新质生产力促进数字版权贸易高质量发展：共生逻辑与实现路径
下一条：出版学人 | 隗静秋袁晶晶储倩：出版营销破圈发展的多维度分析：融合、协同与创新

首页

学院概况

人才培养

产学共建

学术研究

国际交流

品牌活动

联系我们

实验室建设

English

学术研究

研究成果

出版学人 | 陆朦朦：当创意遇上AI：人工智能赋能网络文学多模态叙事的可能与限度