(资料图片)
近日,NLP国际顶会ACL(The Association for Computational Linguistics)进行的国际赛事WASSA 2023(13th Workshop on Computational Approaches to Subjectivity, Sentiment & Social Media Analysis)公布获奖结果,天翼云智能边缘事业部AI团队在混合语种竞赛的MLEC、MCEC两项赛道中均取得亚军的成绩。
这是继天翼云在中文语言理解零样本学习权威榜单ZeroCLUE拔得头筹之后,获得的又一重要奖项,进一步夯实了天翼云AI在认知智能领域的行业领先地位。
ACL是全球影响力最大、最具活力的国际学术组织之一,是自然语言处理与计算语言学领域最具权威性的专业学会。ACL会议是NLP领域顶级会议,同时也是CCF 推荐的A类国际学术会议。而本次WASSA混合语种竞赛吸引了来自全球的58个优秀团队参与。
WASSA 2023成绩排名
情感是人类基本的心理经验之一,且难以被定义。在不同语种情境下,人类识别文本的各类情感具有一定难度,而将这些知识转移到机器上,用机器识别混合语种(code mixed)文本中蕴含的情感将更具挑战性。WASSA 2023中的混合语种赛事便是针对混合语种文本多标签情感分类(MLEC)和多类别情感分类(MCEC)举办的竞赛。混合语种的每个样本中包含愤怒、喜悦、热爱等12类情感中的一类或多类,参赛者需要尽可能准确地识别各文本样本中蕴含的情感。 本次竞赛中,天翼云AI团队的算法重点采用了“提示学习”(Prompt Learning)技术。“提示学习”是大模型研究的前沿技术之一,也被称为自然语言处理领域的“第四范式”。传统“预训练+微调”的NLP模型应用方式不仅会消耗大量的计算、存储资源,也会浪费预训练模型的泛化能力。应用“提示学习”技术,则可以通过设计不同的提示词、无需进行模型微调,就能进行下游任务的适配和部署,这一方式实现了预训练模型的高效利用,同时保留了模型的泛化能力。
模型微调与提示学习的对比
天翼云AI团队的算法方案仅使用单张GPU卡就实现了混合语种情感分类任务的适配和推理,方案中的数据预处理、提示词设计、数据推理全流程可在数小时内完成。利用少量的算力和存储资源,算法方案就能高效部署到下游任务中,这体现了天翼云AI团队在大模型、认知智能领域的技术沉淀,以及对相关业务场景的深度理解。
目前,天翼云AI团队“提示学习”技术已在实际业务中得到广泛应用,尤其是“大模型+提示学习”的技术范式有效地将大模型的能力应用到下游各类任务和业务场景中。未来,天翼云将继续推进人工智能领域技术创新与突破,加快打造原创技术策源地,推动数字技术与产业深度融合,赋能千行百业数字化转型。