3月15日,国度自然科学基金委员会现宣布可表明、可通用的下一代人工智能要领重大研究打算2024年度项目指南。
3月15日,国度自然科学基金委员会现宣布可表明、可通用的下一代人工智能要领重大研究打算2024年度项目指南。
一、科学方针
本重大研究打算面向以深度进修为代表的人工智能要领鲁棒性差、可表明性差、对数据的依赖性强等基本科学问题,挖掘呆板进修的根基道理,成长可表明、可通用的下一代人工智能要领,并敦促人工智能要领在科学规模的创新应用。
二、焦点科学问题
本重大研究打算针对可表明、可通用的下一代人工智能要领的基本科学问题,环绕以下三个焦点科学问题开展研究。
(一)深度进修的根基道理。
深入挖掘深度进修模子对超参数的依赖干系,领略深度进修背后的事情道理,成立深度进修要领的迫近理论、泛化误差阐明理论和优化算法的收敛性理论。
(二)可表明、可通用的下一代人工智能要领。
通过法则与进修团结的方法,成立高精度、可表明、可通用且不依赖大量标注数据的人工智能新要领。开拓下一代人工智能要领需要的数据库和模子练习平台,完善下一代人工智能要领驱动的基本设施。
(三)面向科学规模的下一代人工智能要领的应用。
成长新物理模子和算法,建树开源科学数据库、常识库、物理模子库和算法库,敦促人工智能新要领在办理科学规模巨大问题上的示范性应用。
三、2024年度扶助研究偏向
(一)培养项目。
环绕上述科学问题,以总体科学方针为牵引,对付摸索性强、选题新颖、前期研究基本较好的申请项目,将以培养项目标方法予以扶助,研究偏向如下:
1.神经网络的新架构和新的预练习或自监视进修要领。
针对图像、视频、图、流场等数据,成长更高效的神经网络新架构,预练习或自监视进修要领,并在真实数据集长举办验证。
2.深度进修的暗示理论和泛化理论。
研究卷积神经网络(以及其它带对称性的网络)、图神经网络、轮回神经网络、低精度神经网络、动态神经网络、生成扩散模子等模子的泛化误差阐明理论、鲁棒性和不变性理论,并在实际数据集长举办验证;研究无监视暗示进修、预练习-微调范式等要领的理论基本,成长新的泛化阐明要领,指导深度进修模子和算法设计。
3.深度进修练习算法的理论基本。
研究神经网络损失景观的布局和练习算法的特性,包罗但不限于:临界点的漫衍及其嵌入布局、极小点的连通性,不变性边沿(edge of stability)和损失尖峰(loss spike)现象、算法的隐式正则化、不变性和收敛性;练习进程对付超参的依赖性问题、神经网络影象劫难、练习时间巨大度阐明等问题;成长卷积网络、Transformer网络、扩散模子、殽杂专家模子等模子的收敛速度更快、时间巨大度更低的练习要领。
4.大模子的基本问题。
研究多任务、大都据、大模子的基本问题,包罗但不限于大模子的暗示理论和泛化理论、大模子练习的不变性、标度率(scaling law)、涌现等现象;研究新型 (structured) state model的基本性质,包罗它是否有影象劫难(curse of memory)的坚苦;领略Transformer模子的表达和泛化本领、上下文进修(In-Context learning),Chain of Thoughts推理的有效性,以及模子的外推本领(譬喻length generalization)等。
5.微分方程与呆板进修。
研究求解微分方程正反问题及解算子迫近的概率呆板进修要领;基于生成式扩散概率模子的物理场生成、模仿与补全框架;基于微分方程设计新的呆板进修模子和网络布局,加快模子的推理、阐明神经网络的练习进程。
6.图神经网络的新要领。
操作随机游走、多项式近似、和谐阐明、粒子方程等数学理论办理深度图神经网络太过平滑、太过挤压、合用异配图与动态图等问题;针对药物设计、推荐系统、多智能体网络协同节制等重要应用场景设计有效的、可扩展的、具有可表明性的图暗示进修要领。
7.人工智能的安详性问题。
针对主流呆板进修问题,成长隐私掩护协同练习和预测要领;成长面向反抗样本、数据投毒、后门等阐明、进攻、防止和修复要领;研究呆板进修框架对模子滋扰、粉碎和节制的要领;成长可控精度的隐私计较要领,数据和模子(包罗大模子)的公正性、靠得住性的评估与评级要领。
8.科学计较规模的人工智能要领。
针对电子多体问题,成立薛定谔方程数值计较、第一性道理计较、自由能计较、粗粒化分子动力学等的人工智能要领,摸索人工智能要领在电池、电催化、合金、光伏等体系研究中的应用。
针对典范的物理、化学、质料、生物、燃烧等规模的跨标准问题和动力学问题,成长物理模子与人工智能的融合要领,摸索巨大体系变量隐含物理干系的挖掘要领和构效干系的数学表达,成立具有通用性的跨标准人工智能帮助计较理论和要领,办理典范巨大多标准计较问题。
9.以数据为中心的呆板进修。
针对数据质量、数量和效率等因素,成长呆板进修要领为下游呆板进修模子提供大量高质量数据;针对AI for Science数据侧,研究和设计高效的科学数据(如对卵白质和药物构图)构建和预处理惩罚方法;针对大模子数据侧,从数据获取本钱和效率出发,成立科学和系统的数据质量评预计策,设计高效的数据选择要领,构建有效的数据配例如法,并摸索大模子帮助数据质量晋升的要领(如自动数据标注)。
10.基于量子计较的呆板进修算法。
研究差异范例的进修要领如何映射到一般的量子进程,提出新算法操作量子特性实现高效进修;研究量子呆板进修相对付经典呆板进修要领在表达本领以及泛化本领上的优势,摸索量子呆板进修的可表明性,成立量子呆板进修在量子物理和化学的应用场景。
11.开放型项目。
与可表明、可通用的下一代人工智能要领和AI for Science 规模相关的要领,重点支持在算法和模子方面的创新课题。
(二)重点支持项目。
环绕焦点科学问题,以总体科学方针为牵引,拟以重点支持项目标方法扶助前期研究成就积聚较好、对总体科学方针在理论和要害技能上能发挥敦促浸染、具备产学研用基本的申请项目,研究偏向如下:
1.下一代人工智能要领。
成长团结逻辑推理、常识和法则的人工智能要领,成立具有可表明和可通用性的人工智能理论框架;成长合用于持续、麋集数据(如图像)和非布局化数据(如分子布局)的新型神经网络架构,有效捕获空间、布局、语义等多维度的上下文信息,提高对数据的建模本领。在真实数据集长举办验证。
2.新一代脑开导的人工智能模子与有效练习算法。
针对大脑神经元的物理形态和生物物理的多样性,成立生物神经元与人工神经元之间的简捷且有效的映射干系,使人工神经元具有生物神经元的树突非线性整合与计较成果,为成立其它范例生物神经元与人工神经元的映射提供统一的理论和算法框架。团结大脑神经元网络毗连布局、脑区异质性和宏观梯度等特点,设计带生物神经元特性约束的人工神经网络模子,实现影象、决定等高级认知成果。实现不少于3种生物神经元与人工神经元之间的有效映射和3种重要的树突计较成果,与现有映射对比,实现精度、机能和参数可表明性上的晋升。
3.多智能体协作进修理论与要领。
针对多智能体协作时漫衍式数据处理惩罚所面临的挑战,如泛化机能缺乏保障、适应性和可扩展性弱等困难,研究高效的多智能体协作进修理论与要领,详细包罗:(1)研究晋升多智能体协作进修系统泛化机能的算法,阐明泛化误差界;(2)针对动态变革的情况和不绝扩展的网络局限,研究多智能体系统的适应性和可扩展性,确保智能体可以或许有效进修并高效协作;(3)在多智能体系统中处理惩罚和融合多模态数据(如文本、图像和传感器数据)的要领,,以加强进修结果和晋升决定质量;(4)研究在及时或近及时情况中的协作进修和决定计策,存眷动态和不确定情况下的应急响应和要害决定;(5)探究智能体的本性化进修计策,在保持个别优势的同时有效举办集团进修和常识共享。
4.多模态融合及生成基本模子。
研究多模态数据融合及生成的基本模子,办理数据视角、维度、密度、收罗和标注难易水平差异而造成的融合困难;研究模态融合进程中的模态对齐问题,担保模态预测的一致性并淘汰融合进程中信息损失;研究轻量级的融合模子,晋升在模态间非完美对齐状态下融合模子的鲁棒性;研究用易收罗、易标注模态数据来引导难收罗、难标注模态数据的预练习与微调要领;研究大局限多任务、多模态进修的预练习问题,实现少样本/零样本迁移,成长跨模态多样性数据生成的要领;研究多模态大模子的新型、统一概率建模要领,办理离散、持续殽杂数据范例的概率建模与生成困难,提高多模态基本模子的生成效率。在多模态模子中实现不少于3个模态的暗示进修、对齐及生成本领,模子参数不少于7B,摸索在智能座舱、自动驾驶或多模态对话等规模的应用验证。积聚用于练习多模态大模子的优质标注数据,并摸索数据闭环,收罗数量高出标注样本不少于2个量级的非完美标注或无标注数据,实现模子迭代优化。
5.模子与数据融合的大模子练习要领。
摸索系统性的、自适应数据选取要领,以到达数据和模子的有机融合,包罗:在模子练习进程中on-the-fly 选取下一步所回收的数据的要领;成立数据和模子有机融合的呆板进修框架;成长替代大模子练习普遍回收的先处理惩罚数据、再做模子练习的两步走模式的有效要领。
6.视频原生的自监视进修要领。
针对视频数据既是时间序列又是图像,但又差异于一般的时间序列和图像的特点,充实操作视频数据的属性和特点,成长一套新的自监视进修框架,类比针对时间序列的predict next token 的框架和针对图像数据的填空框架,并在实际视频数据集上加以验证。
7.支持下一代人工智能的通用型高质量科学数据库。
大局限高质量科学数据是人工智能驱动的科学研究新范式的须要条件。研究科学数据、科技文献等的常识工具标注、抽取、融合中的主动进修机制与自动关联算法;研究面向常识工具的智能编码与呆板可识读的多元理会,支持跨规模常识工具的广谱关联,实现与不少于3个国际主流科技资源标识动态互通,支持与外部数据资源智能化融合;研究多模态跨学科常识碎片对齐与常识工具识别要领,以及多学科规模数据自动出产与加强算法,形成切合国际类型或经同行评议的且包围不少于8个学科规模的高质量科学数据1PB以上。
8.AI for Science 的基本设施建树与示范应用。
成长AI for Science的基本设施要领,包罗:基本物理模子的人工智能算法;高效率、高精度的尝试表征算法;自动化和智能化尝试平台建树;科学文献和科学数据的整合与智能应用。成长AI for Science的创新应用,包罗但不限于:巨大催化体系(催化剂动态布局变革、回响网络高度巨大等问题);碳达峰和碳中和中的焦点催化回响;工况条件下的电化学表征要领;生物医学中的高效率和高精度的成像技能;有机合成的自动化和智能化办理方案;定向进化卵白质工程等。重点支持理论和尝试相结归并形成闭环的项目。
四、项目遴选的根基原则
(一)细密环绕焦点科学问题,勉励基本性和交错性的前沿摸索,优先支持原创性研究。
(二)优先支持面向成长下一代人工智能新要领或能敦促人工智能新要领在科学规模应用的研究项目。
(三)重点支持项目应具有精采的研究基本和前期积聚,对总体科学方针有直接孝敬与支撑。
五、2024年度扶助打算
拟扶助培养项目约25项,直接用度扶助强度不高出80万元/项,扶助期限为3年,培养项目申请书中研究期限应填写 2025年1月1日-2027年12月31日 ;拟扶助重点支持项目约6项,直接用度扶助强度约为300万元/项,扶助期限为4年,重点支持项目申请书中研究期限应填写 2025年1月1日-2028年12月31日 。
六、申请要求及留意事项
(一)申请条件。
本重大研究打算项目申请人该当具备以下条件:
1. 具有包袱基本研究课题的经验;
2. 具有高级专业技能职务(职称)。
在站博士后研究人员、正在攻读研究生学位以及无事情单元可能地址单元不是依托单元的人员不得作为申请人举办申请。
(二)限项申请划定。
执行《2024年度国度自然科学基金项目指南》 申请划定 中限项申请划定的相关要求。
(三)申请留意事项。
申请人和依托单元该当当真阅读并执行本项目指南、《2024年度国度自然科学基金项目指南》和《关于2024年度国度自然科学基金项目申请与结题等有关事项的告示》中相关要求。
1. 本重大研究打算项目实行无纸化申请。申请书提交日期为2024年4月15日-4月22日16时。
(1)申请人该当凭据科学基金网络信息系统中重大研究打算项目标填报说明与撰写提纲领求在线填写和提交电子申请书及附件质料。
(2)本重大研究打算旨在细密环绕焦点科学问题,对多学科相关研究举办计谋性的偏向引导和优势整合,成为一个项目集群。申请人应按照本重大研究打算拟办理的焦点科学问题和项目指南发布的拟扶助研究偏向,自行制定项目名称、科学方针、研究内容、技能蹊径和相应的研究经费等。
(3)申请书中的扶助种别选择 重大研究打算 ,亚类说明选择 培养项目 或 重点支持项目 ,附注说明选择 可表明、可通用的下一代人工智能要领 ,受理代码选择T01,按照申请的详细研究内容选择不高出5个申请代码。培养项目和重点支持项目标相助研究单元不得高出2个。
(4)申请人在申请书起始部门应明晰说明申请切合本项目指南中的扶助研究偏向,以及对办理本重大研究打算焦点科学问题、实现本重大研究打算科学方针的孝敬。
假如申请人已经包袱与本重大研究打算相关的其他科技打算项目,该当在申请书正文的 研究基本与事情条件 部门阐述申请项目与其他相关项目标区别与接洽。
2. 依托单元该当凭据要求完成依托单元理睬、组织申请以及审核申请质料等事情。在2024年4月22日16时前通过信息系统逐项确认提交本单元电子申请书及附件质料,并于4月23日16时前在线提交本单元项目申请清单。
3. 其他留意事项。
(1)为实现重大研究打算总体科学方针和多学科集成,得到扶助的项目认真人该当理睬遵守相关数据和资料打点与共享的划定,项目执行进程中应存眷与本重大研究打算其他项目之间的彼此支撑干系。
(2)为增强项目标学术交换,促进项目群的形成和多学科交错与集成,本重大研究打算将每年举行1次扶助项目标年度学术交换会,并将不按期地组织相关规模的学术研讨会。获扶助项目认真人有义务介入本重大研究打算指导专家组和打点事情组所组织的上述学术交换勾当。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。