中国科学院智能信息处理重点实验室依托于中国科学院计算技术研究所,成立于1987年。在实验室学术委员会的学术指导和计算技术研究所的大力支持下,实验室逐渐发展成为我国智能信息处理领域的重要基础研究基地。
  实验室的研究工作围绕国家需求和国际科技发展前沿,同时考虑服务于国民经济建设的需要。实验室的定位是探索机器感知与认知的机理、理论、方法、技术,开展基础性研究以及相关的应用基础性研究,提出新的概念与模型,解决核心技术问题,并构建相应的系统。实验室的目标是在智能信息处理基础理论研究领域达到世界一流水平,培育前瞻思想,产出一流成果,培养基础人才,从而为智能技术形成智能产业提供基础原理、核心技术以及关键应用原型,为“人工智能”走向“人工智能+”提供技术支撑,为国家信息技术的长期发展储备知识、创新技术和人才。
  智能信息处理重点实验室以信息的智能处理为主线,依托计算技术研究所在系统、网络等方面的优势,从信息的获取、表示、理解与转换等几个方面进行布局,构成了一个互为依托的有机整体。实验室的主要研究方向,包括计算机视觉、模式识别、机器学习与数据挖掘、自然语言处理与理解、多媒体技术、医疗影像分析、生物信息学、大规模知识处理和智能人机接口等。
        过去十年来,实验室在中国计算机学会认定的A类国际刊物(如IEEE T PAMI, IEEE T IP, IJCV,AI等)以及领域A类国际会议(如CVPR,ICCV,ACL,AAAI, IJCAI, ACM MM等)上发表论文200余篇,获得发明专利授权100余项,所发表的论文被国内外同行引用超过30,000次。在高维、非线性视觉模式方面的研究成果获2015年度国家自然科学二等奖,在神经机器翻译方面的工作获得ACL大会的Best Long Paper Award。
        在应用方面,所研发的人脸识别、机器翻译、知识处理、蛋白质序列鉴定技术被成功的产业化或被华为等合作伙伴规模化应用到其产品中,产生了良好的经济和社会效益。
实验室新闻
31 2025.10
实验室团队荣获ICCV 2025连续手语识别竞赛冠军
2025年10月20日,ICCV 2025多模态连续手语识别竞赛(The First Multimodal Sign Language Recognition Challenge, MSLR)公布榜单,实验室团队(闵越聪、杨一帆、焦培淇、南子皙、陈熙霖)获得连续手语识别赛道“非特定人识别”和“未见语句识别”两个任务的冠军。实验室团队长期深耕于手语识别与翻译领域,这是继在今年WWW 2025 跨视角手语孤立词识别竞赛(Cross-View Isolated Sign Language Recognition)中获得了基于RGB和RGB-D模态输入两个任务的冠军之后本年度再次获奖。图1. 闵越聪助理研究员领取比赛证书ICCV 2025 MSLR聚焦于多模态场景下的连续手语识别,旨在推动从单一视觉模态(如RGB视频)向融合姿态、雷达、深度等多模态的识别系统转变。针对真实应用中手语交流所面临的实际挑战,连续手语识别竞赛设置了非特定人识别与未见语句识别两个任务,以促进模型在跨手语者与跨语义结构泛化能力方面的提升。实验室团队在前期提出的VAC、CoSign等连续手语识别方法基础上,进一步引入跨语种预训练与动静态信息融合等方法,有效增强了模型的鲁棒性与泛化能力。最终,团队所提出方法以字错误率(WER)绝对值低于第二名2.2%和19.58%的显著优势在非特定人识别与未见语句识别两个任务中均获得冠军。图2. ICCV 2025 MSLR竞赛 团队获奖证书今年早些时候,团队还在WWW 2025 跨视角手语孤立词识别竞赛(Cross-View Isolated Sign Language Recognition, CV-ISLR)中同样取得冠军的佳绩。该竞赛旨在关注多视角场景下的手语识别问题。WWW2025竞赛评测涵盖了实验室场景、自然场景、合成背景与时序扰动四个子集,并设置了基于RGB与RGB-D模态输入的两个任务。实验室团队(彭钰婷、焦培淇、邹鸿刚、闵越聪、陈熙霖)通过跨视角数据增强与多模态融合等关键技术,有效提升了模型在未见视角下的识别性能,获得了RGB与RGB-D两个任务的冠军。图3. WWW 2025 CV-ISLR竞赛 团队获奖证书
科研动态

实验室关于食品大语言模型的工作被 Patterns 接收

近日,实验室关于食品大语言模型的工作“FoodSky: A food-oriented large language model that can pass the chef and dietetic examinations”(作者:周鹏飞,闵巍庆,傅超然,金颖,黄鸣宇,黎向阳,梅舒欢,蒋树强)被Patterns (Cell Press)接收。Patterns是Cell Press旗下的学术期刊,旨在发表数据科学领域突破性的原创研究,分享计算机科学、生命科学和社会科学等跨学科的数据科学解决方案,促进跨学科研究者之间的交流合作。食品是人类生存和社会发展的基石。作为人类健康与社会可持续发展的重要支柱,食品科学的智能化转型已成为全球关注的焦点。随着饮食文化多元化与慢性疾病防控需求的日益急迫,如何通过人工智能技术实现精准营养干预、跨文化膳食适配及饮食-疾病关联挖掘,成为食品智能领域亟待解决的核心问题。尽管通用大语言模型在多种任务中表现卓越,但其在食品领域面临知识体系碎片化、语义解析粗粒度等局限性,难以满足个性化营养指导、烹饪方法创新等复杂任务对专业化知识的需求。针对上述挑战,本文构建了面向烹饪和营养领域的大语言模型FoodSky,通过融合细粒度语义感知与多层级知识推理技术,突破了食品智能的技术瓶颈。为构建模型的知识基础,本文首先整合多种权威来源的食品数据,构建了食品语料库FoodEarth。进一步,本文提出了基于主题的选择性状态空间模型(TS3M)和分层主题检索增强生成算法(HTRAG),以增强FoodSky捕获细粒度食品语义和生成上下文感知食品相关文本的能力。TS3M通过集成主题相关信息,优化模型输出的准确性;HTRAG则通过在推理过程中检索外部知识库来增强生成能力。本文在中国国家厨师考试和营养师考试(CDE)、食品长对话(FoodLongConv)、食品问答(FoodQA)等多个基准测试上对FoodSky 进行了全面评估,并针对模型结构、训练数据规模以及在不同区域美食上的泛化能力等进行了消融实验。大量实验表明,FoodSky在厨师和营养师考试中展现出专家级性能,准确率分别达到83.3%和91.2%,能够为烹饪和饮食问题提供可靠建议。此外,FoodSky不仅能够激发烹饪创意和促进更健康的饮食模式,还为特定领域大语言模型应对真实世界中的食品相关挑战,建立了新基准。
学术活动

【学术报告】中国科学院-马普学会计算生物学伙伴研究所 汪思佳 研究员于1月13日来访实验室

报告题目:人类外貌表型研究中的影像学应用时间:1月13日下午15:00-16:00地点:计算所501会议室报告摘要:人类表型组研究需要对各个层面的表型进行高通量的量化分析,图像 分析就成为了研究人体外貌表型的重要工具。我将介绍若干利用图像 分析技术量化研究人体外貌表型的案例,包括3D人脸图像分析、DXA 影像分析、面部衰老特征分析等。以上案例凸显出针对不同生物学问 题,非常有必要利用相应合理的图像分析方法来解决。也希望通过以 上案例,为图像分析技术在生物医学领域的应用拓宽新的思路。报告人简介:汪思佳,中国科学院-马普学会计算生物学伙伴研究所研究员、博士生 导师。现任中国科学院计算生物学重点实验室副主任、中国科学院上 海生物医学大数据中心副主任、国际人类表型组计划执行委员会常务 委员兼秘书长。入选国家重要人才计划,先后获得国家基金委“ 优秀青年科学基金”与“重大研究计划”资助。在Cell、Am J Hum Genet等国际知名期刊上发表论文三十余篇,论文累计引用2000余次 。担任Ann Hum Genet杂志的资深副主编。目前课题组的主要科研方 向为开发及运用系统组学分析方法及人工智能算法,利用人群队列产 生的生物大数据,构建人类外貌相关表型与基因及其它相关表型的互 作网络,建立预测个体健康状况的算法模型。