生成式ai 到底能不能算个合格的“作家”,这事儿还挺值得琢磨的。

咱来聊聊生成式AI到底能不能算个合格的“作家”,这事儿还挺值得琢磨的。刘宇彤(我自己)最近看了不少这方面的消息,发现现在大家伙儿都特别看好这玩意儿在文学上的能耐。国内的科技企业、搞大模型的研发机构,甚至网文平台都在发力布局这个赛道。比如阅文集团弄了个叫“作家助手”的软件,把DeepSeek-R1这个大家伙给接上了,结果用这个功能的人数和每天活跃的用户量都蹭蹭往上涨;中文在线那边也是靠着自研的“中文逍遥”平台,弄出了一整套从想剧情到接着写的全流程辅助体系。 说白了,AI创作现在主要还是在写诗、编词条、写短篇小说这些短的文本上最火,现在也开始慢慢试着去搞长篇小说,试着让这东西变成能赚钱的新路子。不过说到底,AI能不能真的写出像模像样的小说,现在还真不好说。要想搞懂它到底行不行,关键得去看看数据标注这块。数据标注就是给AI喂训练样本,说白了就是让大模型照着要求写东西,然后我们再去挑刺儿,从用词、讲逻辑、审美这些方面来看看它写得对不对。这其实不仅仅是纯粹的技术活,更是咱们人类审美跟机器互动的一种文化活动。 在做这个数据标注的时候,也发现了不少头疼的问题。比如现在的AI创作高度依赖以前的文学素材,就像刘震云说的那样,“AI创作就是在总结过去”,根本没办法自己去想未来、搞创新。哪怕是模仿以前的作品,它的本事也很有限,只能停留在比较浅的层面上。特别是模仿名家大作的时候更明显,它也就是会模仿个样子、用个经典句式和意象。你要是让它写个鲁迅的乡土小说,它可能会把百草园、瓜田、社戏这些词儿一股脑儿堆上去,甚至还能学着鲁迅那种反讽的笔法。 可问题在于它根本不懂这些背后的深意。鲁迅写这些东西是为了批评国民性、同情底层老百姓的苦难。AI就算学得再像样子,也写不出这种深刻的情感和批判精神。在古典文学这块更是难办,AI写出来的诗要么就是一堆华丽的辞藻没有啥味道,要么就是把经典诗句重新排列组合一下。虽然平仄押韵这种表面功夫不难做到,但想写得流畅通顺、意境自然就很难了。 主要原因就是它的标注训练其实就是在抠那些表面的词儿和句式。标注者没法把我们心里对文学作品的情感和思想完全转化成算法能听懂的逻辑,也没法教会它真正懂什么叫“诗言志”、“情生诗歌”。所以AI只能学到皮毛,学不到灵魂。 靠着这种肤浅的模仿能力批量去做网络小说或者短剧剧本确实能赚到钱,甚至形成了一条产业链。但要是真让它去写高质量的文本或者续经典篇章,操作起来还挺费劲的。 还有一个大问题是它理解创作指令太机械化了。比如你让它写一篇抒情散文描绘秋日的城市公园,它可能就只会把“秋日”、“城市”、“公园”这些词重复罗列一遍。有时候还会因为理解不到位犯低级错误,比如你要求它按照分镜格式写剧本,它可能给你整出一篇长篇小说来。 现在市面上的一些工具在面对带有修辞手法或者隐喻的指令时也经常晕菜,生成出来的东西经常跟你想要的差了十万八千里。这种机械化的理解让它很难精准地满足咱们的需求。 另外AI本身的基本能力也有不少硬伤,多语种混在一起乱七八糟、叙事逻辑断裂、情节套路老套等等问题频繁出现,写长篇小说续航能力明显不足。这可能是因为用来标注的数据虽然多但都太碎了。 除了这些问题之外我们还得警惕一个更危险的事儿:在训练大模型的时候那些做标注的人也会被卷进这种不成熟的“拟文学”环境里去。时间长了他们的文学感知力和审美判断力可能会被标签化和程式化给无形地窄化掉。 所以我们得用更批判的眼光重新审视一下AI和文学创作的关系。虽然AI有潜力但咱们也不能盲目吹捧它的价值还得小心技术里藏着的人文危机。只有把技术和文学本身结合起来坚守人类的文化主体性才能保住文学那种独有的人文温度和精神内核。