近日,实验室关于食品大语言模型的工作“FoodSky: A food-oriented large language model that can pass the chef and dietetic examinations”(作者:周鹏飞,闵巍庆,傅超然,金颖,黄鸣宇,黎向阳,梅舒欢,蒋树强)被Patterns (Cell Press)接收。Patterns是Cell Press旗下的学术期刊,旨在发表数据科学领域突破性的原创研究,分享计算机科学、生命科学和社会科学等跨学科的数据科学解决方案,促进跨学科研究者之间的交流合作。
食品是人类生存和社会发展的基石。作为人类健康与社会可持续发展的重要支柱,食品科学的智能化转型已成为全球关注的焦点。随着饮食文化多元化与慢性疾病防控需求的日益急迫,如何通过人工智能技术实现精准营养干预、跨文化膳食适配及饮食-疾病关联挖掘,成为食品智能领域亟待解决的核心问题。尽管通用大语言模型在多种任务中表现卓越,但其在食品领域面临知识体系碎片化、语义解析粗粒度等局限性,难以满足个性化营养指导、烹饪方法创新等复杂任务对专业化知识的需求。针对上述挑战,本文构建了面向烹饪和营养领域的大语言模型FoodSky,通过融合细粒度语义感知与多层级知识推理技术,突破了食品智能的技术瓶颈。为构建模型的知识基础,本文首先整合多种权威来源的食品数据,构建了食品语料库FoodEarth。进一步,本文提出了基于主题的选择性状态空间模型(TS3M)和分层主题检索增强生成算法(HTRAG),以增强FoodSky捕获细粒度食品语义和生成上下文感知食品相关文本的能力。TS3M通过集成主题相关信息,优化模型输出的准确性;HTRAG则通过在推理过程中检索外部知识库来增强生成能力。本文在中国国家厨师考试和营养师考试(CDE)、食品长对话(FoodLongConv)、食品问答(FoodQA)等多个基准测试上对FoodSky 进行了全面评估,并针对模型结构、训练数据规模以及在不同区域美食上的泛化能力等进行了消融实验。大量实验表明,FoodSky在厨师和营养师考试中展现出专家级性能,准确率分别达到83.3%和91.2%,能够为烹饪和饮食问题提供可靠建议。此外,FoodSky不仅能够激发烹饪创意和促进更健康的饮食模式,还为特定领域大语言模型应对真实世界中的食品相关挑战,建立了新基准。
附件: