2月7日 消息:清华CoAI团队、聆心智能团队、GLM技术团队联手研发了CharacterGLM,一个专门为定制中文AI角色设计的模型,参数规模从6B到66B不等。相较于传统模型,CharacterGLM在表现上更为出色,使用门槛也更低。
为了让AI角色更加逼真,团队深入研究了人的语言表达特征,并聚焦于属性和行为两大要素。属性决定了语言表达的内容,而行为则影响语言表达的风格和口吻。基于这一理念,CharacterGLM在设计中融入了身份、兴趣、观点等多重属性,以及语言学特征和性格等行为要素。
为了确保AI角色的真实性和吸引力,团队还制定了一套评估标准,包括一致性、拟人化和吸引力。这些标准不仅要求AI角色在交互中保持稳定的属性和行为,还要展现出自然的交互方式和引起用户兴趣的能力。
为了实现这一目标,团队采用了多种数据收集方法,包括人类角色扮演、大语言模型合成、文学作品提取和人机交互等。这些方法不仅保证了数据的多样性和丰富性,还为模型的训练提供了有力的支持。
在模型训练方面,团队首先设计了角色prompt,将角色描述转化为流畅的自然语言描述。然后,使用6B到66B参数的ChatGLM作为基座模型,进行有监督的微调。最后,通过引入人机交互数据,促进模型的迭代式自我完善。
目前,CharacterGLM-66B版本的API已经开放,同时CharacterGLM-6B模型也已开源。基于CharacterGLM,团队还研发了全新的AI虚拟聊天陪伴产品AiU,并上架各大应用商店。此外,团队还开发了一款恋爱攻略游戏,名为“哎呦,恋爱怎么这么难!”,进一步展示了CharacterGLM在实际应用中的潜力。
CharacterGLM-6B 模型开源:https://github.com/thu-coai/CharacterGLM-6B