中国科学院智能信息处理重点实验室依托于中国科学院计算技术研究所,成立于1987年。在实验室学术委员会的学术指导和计算技术研究所的大力支持下,实验室逐渐发展成为我国智能信息处理领域的重要基础研究基地。
  实验室的研究工作围绕国家需求和国际科技发展前沿,同时考虑服务于国民经济建设的需要。实验室的定位是探索机器感知与认知的机理、理论、方法、技术,开展基础性研究以及相关的应用基础性研究,提出新的概念与模型,解决核心技术问题,并构建相应的系统。实验室的目标是在智能信息处理基础理论研究领域达到世界一流水平,培育前瞻思想,产出一流成果,培养基础人才,从而为智能技术形成智能产业提供基础原理、核心技术以及关键应用原型,为“人工智能”走向“人工智能+”提供技术支撑,为国家信息技术的长期发展储备知识、创新技术和人才。
  智能信息处理重点实验室以信息的智能处理为主线,依托计算技术研究所在系统、网络等方面的优势,从信息的获取、表示、理解与转换等几个方面进行布局,构成了一个互为依托的有机整体。实验室的主要研究方向,包括计算机视觉、模式识别、机器学习与数据挖掘、自然语言处理与理解、多媒体技术、医疗影像分析、生物信息学、大规模知识处理和智能人机接口等。
        过去十年来,实验室在中国计算机学会认定的A类国际刊物(如IEEE T PAMI, IEEE T IP, IJCV,AI等)以及领域A类国际会议(如CVPR,ICCV,ACL,AAAI, IJCAI, ACM MM等)上发表论文200余篇,获得发明专利授权100余项,所发表的论文被国内外同行引用超过30,000次。在高维、非线性视觉模式方面的研究成果获2015年度国家自然科学二等奖,在神经机器翻译方面的工作获得ACL大会的Best Long Paper Award。
        在应用方面,所研发的人脸识别、机器翻译、知识处理、蛋白质序列鉴定技术被成功的产业化或被华为等合作伙伴规模化应用到其产品中,产生了良好的经济和社会效益。
实验室新闻
10 2025.01
实验室王文彬博士、侯瑞兵博士喜获中国图象图形学学会2024年“博士学位论文激励计划提名奖”
2024年11月22日,2024年度“中国图象图形学学会博士学位论文激励计划”(原CSIG优博)正式揭晓,智能信息处理重点实验室王文彬博士、侯瑞兵博士获得计划提名奖,在此热烈祝贺王文彬博士及其导师陈熙霖研究员、侯瑞兵博士及其导师常虹研究员!“中国图象图形学学会博士学位论文激励计划” 设立于2017年,授予在图像图形及其相关领域的基础理论或应用基础研究方面有重要突破,或在关键技术和应用技术方面有重要创新的中国图像图形领域博士学位论文的作者。经评选,中国图象图形学学会决定授予10位博士2024年“中国图象图形学学会博士学位论文激励计划奖”与10位博士2024年“中国图象图形学学会博士学位论文激励计划提名奖”以表彰他们的博士论文在创新及学术影响力方面的突出表现。(获奖公告https://www.csig.org.cn/23/202411/52239.html,https://www.csig.org.cn/59/202411/52241.html)王文彬,中国科学院计算技术研究所2017级博士生,其博士论文工作围绕《类人感知的场景图生成》开展,针对场景图结构粒度模糊、内容粒度不一等瓶颈问题,构建符合人类感知习惯的场景层次化结构,形成场景结构解析基础;建模上下文信息,实现鲁棒的细粒度关系预测。所提出方法发表在IJCV、CVPR、ICCV、ECCV等计算机视觉领域刊物和会议上。侯瑞兵,中国科学院计算技术研究所2016级博士生,其博士论文工作围绕《基于时空建模的行人重识别研究》开展,所提出方法发表在TPAMI、CVPR等计算机视觉领域刊物和会议上,其中谷歌学术引用1800余次,单篇最高引用700余次。
科研动态

实验室关于食品大语言模型的工作被 Patterns 接收

近日,实验室关于食品大语言模型的工作“FoodSky: A food-oriented large language model that can pass the chef and dietetic examinations”(作者:周鹏飞,闵巍庆,傅超然,金颖,黄鸣宇,黎向阳,梅舒欢,蒋树强)被Patterns (Cell Press)接收。Patterns是Cell Press旗下的学术期刊,旨在发表数据科学领域突破性的原创研究,分享计算机科学、生命科学和社会科学等跨学科的数据科学解决方案,促进跨学科研究者之间的交流合作。食品是人类生存和社会发展的基石。作为人类健康与社会可持续发展的重要支柱,食品科学的智能化转型已成为全球关注的焦点。随着饮食文化多元化与慢性疾病防控需求的日益急迫,如何通过人工智能技术实现精准营养干预、跨文化膳食适配及饮食-疾病关联挖掘,成为食品智能领域亟待解决的核心问题。尽管通用大语言模型在多种任务中表现卓越,但其在食品领域面临知识体系碎片化、语义解析粗粒度等局限性,难以满足个性化营养指导、烹饪方法创新等复杂任务对专业化知识的需求。针对上述挑战,本文构建了面向烹饪和营养领域的大语言模型FoodSky,通过融合细粒度语义感知与多层级知识推理技术,突破了食品智能的技术瓶颈。为构建模型的知识基础,本文首先整合多种权威来源的食品数据,构建了食品语料库FoodEarth。进一步,本文提出了基于主题的选择性状态空间模型(TS3M)和分层主题检索增强生成算法(HTRAG),以增强FoodSky捕获细粒度食品语义和生成上下文感知食品相关文本的能力。TS3M通过集成主题相关信息,优化模型输出的准确性;HTRAG则通过在推理过程中检索外部知识库来增强生成能力。本文在中国国家厨师考试和营养师考试(CDE)、食品长对话(FoodLongConv)、食品问答(FoodQA)等多个基准测试上对FoodSky 进行了全面评估,并针对模型结构、训练数据规模以及在不同区域美食上的泛化能力等进行了消融实验。大量实验表明,FoodSky在厨师和营养师考试中展现出专家级性能,准确率分别达到83.3%和91.2%,能够为烹饪和饮食问题提供可靠建议。此外,FoodSky不仅能够激发烹饪创意和促进更健康的饮食模式,还为特定领域大语言模型应对真实世界中的食品相关挑战,建立了新基准。
学术活动

【学术报告】中国科学院-马普学会计算生物学伙伴研究所 汪思佳 研究员于1月13日来访实验室

报告题目:人类外貌表型研究中的影像学应用时间:1月13日下午15:00-16:00地点:计算所501会议室报告摘要:人类表型组研究需要对各个层面的表型进行高通量的量化分析,图像 分析就成为了研究人体外貌表型的重要工具。我将介绍若干利用图像 分析技术量化研究人体外貌表型的案例,包括3D人脸图像分析、DXA 影像分析、面部衰老特征分析等。以上案例凸显出针对不同生物学问 题,非常有必要利用相应合理的图像分析方法来解决。也希望通过以 上案例,为图像分析技术在生物医学领域的应用拓宽新的思路。报告人简介:汪思佳,中国科学院-马普学会计算生物学伙伴研究所研究员、博士生 导师。现任中国科学院计算生物学重点实验室副主任、中国科学院上 海生物医学大数据中心副主任、国际人类表型组计划执行委员会常务 委员兼秘书长。入选国家重要人才计划,先后获得国家基金委“ 优秀青年科学基金”与“重大研究计划”资助。在Cell、Am J Hum Genet等国际知名期刊上发表论文三十余篇,论文累计引用2000余次 。担任Ann Hum Genet杂志的资深副主编。目前课题组的主要科研方 向为开发及运用系统组学分析方法及人工智能算法,利用人群队列产 生的生物大数据,构建人类外貌相关表型与基因及其它相关表型的互 作网络,建立预测个体健康状况的算法模型。