通过分析AI智能体在国土空间规划行业领域的应用前景,提出国土空间规划智能体的定义、构建路径,探索国土空间规划智能问答、报告生成、智能核验、监测评估等智慧规划场景,为AI智能体技术在国土空间规划业务工作中的应用提供路径参考和方向指引。
[关键词]人工智能;智慧国土;国土空间规划;AI智能体
[文章编号]1006-0022(2025)02-0028-09
[中图分类号]TU981、TP18、TP391
[文献标识码]A
[引文格式]陈志远,吴洪涛,罗亚,等.人工智能赋能智慧国土空间规划的关键路径:AI智能体的构建[J].规划师,2025(2):28-36.
人工智能技术在大算力、大数据和各类算法模型的加持下,正以其强大的智慧动能推动社会经济各领域的生产力重塑和颠覆式创新,成为引领全球未来国际竞争的战略性技术,已经纳入国家战略部署。在国家治理体系和治理能力现代化进程中,利用人工智能技术可以提高决策效率、增强公共服务、促进公民参与等,为推动国家治理的智能化转型提供良好机遇。《新一代人工智能发展规划》提出到2030年我国成为世界主要人工智能创新中心;《中共中央 国务院关于全面推进美丽中国建设的意见》提出深化人工智能等数字技术应用,构建美丽中国数字化治理体系,建设绿色智慧的数字生态文明;2024年《政府工作报告》提出深化大数据、人工智能等研发应用,开展“人工智能+”行动。
国土空间规划作为国家空间发展的指南、可持续发展的空间蓝图和各类开发保护建设活动的基本依据,其智慧治理水平对实现人与自然和谐共生的现代化至关重要。在美丽中国、数字中国的战略驱动下,面向全域全要素统筹、全周期闭环、高质量发展、多跨协同治理的挑战,空间规划的优化和升级向“可感知、能学习、善治理、自适应”的智慧国土空间规划方向迈进。人工智能与3S、物联网等技术的融合,在海量时空数据的规律挖掘、知识获取、仿真推演、模拟预测和内容快速生成等方面具有人类无法企及的优势,为规划师和政府决策者加强空间模拟仿真、加强资源分配、吸引公民参与、提升预测精度、增强施政准度提供了可靠的技术支撑。因此,全国国土空间规划实施监测网络作为加快建设智慧国土空间规划的重要抓手,自然资源部在相关政策文件中明确要求加强规划业务管理和人工智能等技术的融合,建设国土空间规划专业大模型。
近年来,业界也陆续开展了一些相关创新性的工作研究和实践探索。例如,吴彤等提出人工智能技术赋能城市空间治理存在市场主导型、政府主导型及社会主导型等3种赋能模式,并从治理手段、治理结构及治理流程等3个方面构建具体路径;田莉等以住区规划设计教学改革为例,探索“专业知识+人工智能”双驱动的城乡规划设计教学模式,开发基于大语言模型的多智能体交互系统、低代码方案自动生成器等智能化工具;梁程程等用视觉大模型对遥感影像进行老城区复杂建成环境的智能识别,辅助精准划定更新重点区域。总体来看,首先人工智能在理论和方法层面的现有研究已经颇有成果,对具体在智慧国土空间规划中的应用探索奠定了可靠基础,也进一步为相关应用模式、场景的构思与设计提供了有益的参考。其次,由于人工智能技术应用和智慧国土空间规划实践均尚处于探索阶段,语言、视觉类大模型也都有涉及,主要集中在基于通用大模型的专业大模型构建与典型场景/工具功能应用,对基于AI智能体的研究较少且未将其作为核心主题。最后从实践应用来看,现有研究多集中在某一特定业务领域,体系性稍显不足,也未触及更进一步的工程化、产业化应用。
综合上述背景和现状,本文通过对人工智能技术发展现状和国家相关政策文件的综合分析,基于对人工智能技术在推进智慧国土空间规划建设中的广泛应用前景和现实需求的理解,以AI智能体在具体领域的工程化、产业化为导向,开展其构建路径研究。具体而言,在国家政策和行业需求的现实驱动下,考虑到语言类大模型的成熟度更高、应用场景需求更趋于明朗,以语言会话类规划智能体为典型,对规划智能体的构建路径和在全国国土空间规划实施监测网络中的场景应用进行具体阐述,以期为实现人工智能在行业的工程化、产业化应用和复制推广提供有益参考。
1 AI智能体在国土空间规划中的应用前景分析
1.1 人工智能是智慧国土空间规划转型发展的主要动力
新时期的国土空间规划具有前瞻性、科学性、协调性、操作性的基本特征,涉及跨学科融合、跨行业统筹,理论与实践相结合,具有极强的系统性、复杂性、专业性。在美丽中国、数字中国的战略驱动下,为适应新时期的国土空间治理现代化要求,国土空间规划需要不断提升其科学性、精准性和动态适应性,以高品质规划引领高质量发展。面向“可感知、能学习、善治理、自适应”的智慧国土空间规划目标,加快实现国土空间规划的智慧化转型发展成为必然趋势。业界研究普遍认为,人工智能技术是国土空间规划智慧化转型升级的主要动力支撑与发展重点。党安荣等认为,智慧国土空间规划将人工智能等技术方法综合运用于国土空间规划的编制、审批、实施、监督、评估、预警等各环节,通过规划管理全过程的智慧化,最终实现国土空间规划管理决策与治理的智慧化。
1.2 大模型与智能体融合是人工智能技术发展的重点方向
大模型(Large Model)与AI智能体(AI Agent)的融合协同,成为AI赋能的双引擎,加速了智慧时代的来临。大模型具备大规模的参数和强大的学习理解能力,具有泛化涌现和广泛场景应用的突出优势,尤其是在自然语言处理和计算机视觉等领域;大模型的主要价值在于自主学习和不断优化的智能预测、智能生成方面,如语言模型的文本生成、智能问题和图像识别模型的图像分类与内容生成等。AI智能体是随着大模型应用深化而崛起的,其基于大模型或其他人工智能算法,具有自主感知、决策和执行等关键能力,能够与环境进行交互,并根据环境的变化做出相应的决策和行动。
从现有的理解来看,大模型通过大量参数来学习数据中的复杂模式,是一个更专注于特定任务的计算模型;AI智能体是一个更广泛的概念,它可能包含大模型作为其决策的一部分,但它的目标是实现与环境交互的自主行为,即更加强调与环境的实时交互、自主决策和行动能力,如机器人自动化控制、自动驾驶等。总体上,大模型和AI智能体作为当前人工智能领域的两个重要技术概念,它们的融合创新塑造了更加智慧化、更加多样化、更加简捷化的全新用户互动模式,为加快推进智慧国土空间规划提供了机遇。
国土空间规划的前瞻性、复杂性等特点,对人工智能技术的产业化应用较其他领域具有更强的现实需求。自然资源部将人工智能技术作为推进智慧规划、智慧国土建设的重要抓手,并纳入相关工作部署:《自然资源数字化治理能力总体方案》要求“积极探索推进语言、视觉、多模态等生成式人工智能大模型试点应用,提升国土空间态势变化的分析理解能力”;《全国国土空间规划实施监测网络建设工作方案(2023—2027年)》提出要建设国土空间规划专业大模型,加大人工智能等技术应用力度。
大模型、AI智能体在智慧国土空间规划应用中的侧重有所不同。生成式大模型提供分析、预测和生成能力,是智慧能力提供者;AI智能体则通过大模型与能力工具的连接、功能整合,可以自动化、智能化地执行复杂任务,是智慧应用的执行者。国土空间规划全周期错综复杂,跨群体、跨层级、跨地域、跨系统、跨部门、跨业务的特性贯穿始终,其应用智能化、智慧化的实现,对交互便捷化、执行自动化、反馈动态化、任务协作化提出了更高的挑战,大模型还不足以支撑。为此,必须进一步利用AI智能体的推理、记忆和任务调度能力,发挥其在主动性、适应性、协同性和交互性上的优势,才能支撑规划科学编制与方案智能生成、规划智能审批与自动流转、规划动态监测与智能预警处置、规划智能评估与智慧推演仿真。简而言之,AI智能体的应用深度直接影响着应用智能化、智慧化水平,是智慧国土空间规划的关键抓手。
在国土空间规划智能体的建设中,核心思路是以行业性大语言模型为核心,补充更新国土空间规划行业知识,以历史记忆为参考,理解要求并自主任务编排,通过自动调用相关工具,按步骤完成行动,达到国土空间规划领域需求智能化处理的目的。国土空间规划智能体的构建路径,主要涵盖国土空间规划大模型建设、国土空间规划知识库构建和国土空间规划智能体生成3个阶段。见图1。
国土空间规划大模型属于垂直领域类模型,是指将国土空间规划领域知识输入基础大语言模型,经过训练和优化后形成的大语言模型,与通用语言模型相比,其具备更高的领域专业性和实用性,核心特征有3点:一是领域专业性,经过专门的训练,能够更好地理解和处理国土空间规划领域的知识、术语和上下文;二是高质量输出,在国土空间规划领域中进行了优化,输出质量通常比通用大模型更高;三是特定任务效果更好,对于规划知识、规划专业词汇、规划分析等领域的任务,垂直领域大模型通常比通用大模型表现更好。其构建路径包含基础大模型选取、训练集制作、模型预训练、模型微调和模型验证等步骤。
在基础大模型选取时主要考虑多个因素,包括数据适配性、模型复杂度、可扩展性、计算效率、领域知识、模型性能和准确性、可训练性、数据质量和多样性及模型可解释性等。根据具体任务和数据的特点,综合考虑以上因素,目前常用的参数规模在7B~14B较为适宜,同时考虑各大模型的可扩展性和定制性,以适应国土空间规划的不断发展和变化。在实际应用中,应兼顾大模型的训练时间、推理速度、资源消耗等,根据项目的时间与资源限制加以平衡后再行选择。
训练集是模型训练微调的基础,针对国土空间规划领域知识,利用自动化和非自动化形式,广泛收集各类与国土空间规划相关的数据,包括但不限于技术文档、需求文档、管理文档、政策文档、宣传文档等。一个典型的训练数据集,通常包含输入特征和对应的标签(表1)。
每个样本包含多个输入特征,这些特征描述了特定区域的地理、环境、社会经济等方面的信息,这些特征可以是数值型(如高程、坡度、人口密度等)或分类型(如土壤类型、水文条件等)。同时,每个样本都有一个或多个标签,用于指示该区域在国土空间规划中的适宜用途或需要采取的措施。这些标签可以是分类标签(如适宜农业用地、适宜城市建设用地等)或描述性标签(如需要防洪排涝措施、需要水资源管理等)。在具体的实践中,国土空间规划训练数据集包含更多的输入特征和更复杂的标签体系。此外,数据集的构建还需要考虑数据的准确性、完整性、一致性和代表性等因素,以确保模型能够学习到有效的模式和规律。
在预训练阶段,使用无监督学习方法对数据集进行学习,从中提取数据集中的特征,形成一个包含模型参数的预训练模型。在训练过程中将海量知识进行沉淀并存储于大规模神经网络,形成大模型的通识与泛化能力。通过预训练减少对标记数据的需求,提高模型的泛化能力,同时可以加快模型的训练速度和降低模型的过拟合风险。但无监督学习算法的参数对模型性能有很大影响,因此需要通过实验来设置最佳的参数。
在模型微调阶段,基于业务对话数据、合成数据构建的指令微调数据集对模型进行微调,使大模型具备空间规划专业知识解读、空间规划数据分析的能力。
在模型验证阶段,基于测评集数据,对国土空间规划大模型基础的知识问答、文本生成、知识推理、工具使用等能力进行评测,得到答案准确率、成功率等评价指标,从而完成国土空间规划大模型性能的评测(表2)。
国土空间规划知识库构建是指对国土空间规划行业知识进行结构化处理和向量化存储,通过检索增强生成(Retrieval-augmented Generation,简称“RAG”),可提升大模型对知识的检索能力和推理能力,其构建路径包含分类汇集、数据预处理、向量化存储及检索增强生成等步骤。
国土空间规划知识库包含但不限于国土空间规划领域相关国家政策、地方政策、法律法规、标准规范、规划成果等,可按照内容、数据类型等分类归集,明确每项内容的数据来源与质量要求。见表3。
对国土空间规划相关的多模态数据进行预处理,根据数据类型的不同开展相关工作。对于文本类数据,需进行文本数据清洗、价值识别、段落结构切分和智能分块等预处理操作;对于图像数据,需进行数据清洗、价值识别、图像要素切分、智能分块等预处理;对于结构化数据,需通过读取表结构和数据,自动解析和映射成为张量、矩阵等形式,并进行数据标准化、归一化等预处理操作,以确保输入数据的准确性和一致性。
国土空间规划知识文件进行数据预处理后,需将知识进行向量化并存储在向量数据库中,便于大模型实现高维矢量数据的存储、检索和相似性搜索。
对于空间规划中的文档数据(如文本、法律法规、标准规范等),可采用如word2vec模型,实现向量化表示句子、段落和文档等长文本集。对于空间规划中的图像数据(如规划图件、效果图、示意图等),可采用如graph2vec模型,实现向量化图像像素节点和图像全语义特征提取。
RAG将国土空间规划大模型与国土空间规划知识库的精确度结合在了一起,当模型需要回答问题时,首先从知识库中检索与问题相关的各类信息,其次将这些碎片化的信息进行重组与构建后,形成有条理、有逻辑的回答内容。RAG的混合特性弥补了大模型的广泛生成能力与知识库中专业、详细信息之间的差距。在它的帮助下,国土空间规划大模型不仅会产生相关且详细的输出,还具有丰富的上下文联系。
虽然国土空间规划大模型在语言理解和交互式决策制定等任务中表现出很好的能力,但是通常其推理(如思维链提示)和行动(如行动计划生成)能力仍有不足。通过智能体的建设,可以结合大模型的语言理解和处理能力,以及智能体的自主性和交互性,实现自动化地完成各种复杂任务。其构建路径包含记忆库建设、工具注册、任务规划和执行反馈等步骤。
记忆包含短期记忆和长期记忆。短期记忆主要是指在任务执行期间所涉及的各类与任务进展、环境因素、交互情况等相关的上下文信息,会在子任务的执行过程中产生和暂存,如同一个个临时的“记忆片段”,在任务完结后被全部清空。记忆库主要指存储长期记忆,使其能够被大模型调用历史信息、行业知识、背景规则等,以增强智能体的场景理解能力和任务规划水平。记忆库专注于标准问答对的存储与管理,类似于FAQ(Frequently-asked Questions)数据库,但更加智能化。它需要支持问答对的快速检索与关联,帮助用户快速获取所需信息(表4)。此外,记忆库还应具备自适应学习能力,通过分析用户的问询模式、常见问题和反馈,自动生成新的问答对,扩充知识库内容。
面向国土空间规划领域,构建专业工具集,其来源既包含现有国土空间规划应用中的成熟工具,也包含新建和完善的专业工具。工具作为大模型插件使用,需提供各种参数和选项,并可根据具体需求进行配置和调整,以适应不同的场景和要求。通过使用这些插件,大模型可以获得更多的功能选项,满足国土空间规划实施监测的不同场景和需求。见图2。
通过自然语言构造提示词(Prompt)工程对任务进行拆解和决策,目前主要采用反思(ReAct)和思维链(CoT)两种提示词的方式进行任务规划。
ReAct方式是指智能体在面对问题时将对执行任务的每个动作(包括思考、参数调用等)进行观察,如果这些动作被识别到存在问题将返回上一层重新执行,如此反复后输出最终结果。该方式可有效提高输出结果的质量,但也会消耗更多的时间。
CoT方式通过Prompt规定智能体任务的执行过程,当智能体遇到问题后会按照Prompt的预设流程执行,快速输出结果。该方式有效提高了智能体的输出效率,但相比ReAct则缺乏灵活性。由于国土空间规划的专业性,通常会利用CoT方式将复杂问题分解为多步骤的子问题,显著增强了大模型的推理能力,也最大限度地降低了大模型忽视求解问题的“关键细节”的现象。
基于人工输入或系统触发,智能体自动完成理解、分析和任务规划,自动执行任务并反馈结果。它允许用户通过交互界面对过程及结果进行交互,优化任务执行。
按照应用方向和使用角色的不同,国土空间规划智能体可在多个场景开展应用,可以通过Copilot方式被现有应用系统集成并呼出,也可以在单独界面进行交互和反馈。基于国土空间规划“一张图”实施监督系统、国土空间规划实施监测网络等建设要求,笔者开展了国土空间规划智能体的应用设计和场景验证。
利用国土空间规划智能体,实现用户通过自然语言问答的方式快速检索政策法规、相关内容和权威出处。在规划审批、实施、监督等业务办理过程中,实现政策法规、管理要求等内容面向相关业务人员自动推送,极大地节省查找资料的时间,提高规划管理业务办理效率。
可交互式查询国土空间规划相关法规政策。例如,在查询某地区开展土地综合整治有哪些政策支持时,智能体能够自动检索并汇总出该地区及上级相关部门发布的关于土地综合整治的政策文件,自动提取出相关政策条款,并显示该结果引用的具体来源文件,综述政策支持的成效。
可交互式查询国土空间规划的专业性规范。例如,历史风貌区内的建设活动应当遵守哪些规范?何种地下空间可用于建设?类似问题由智能体进行语义理解,在知识库中进行检索匹配并给出答案。
对标准规范的查询需要更高的命中率,用户可通过对答案进行人工编辑或标注的方式进行反馈,智能体在回答下一位用户问到的类似问题时,可自动命中已标注好的回答,从而提高回答的准确性。
针对国土空间规划的专业性问题进行查询和解答。例如,2024年某区域的养老设施数量与2030年规划相比,供给差值有多少?该类问题由智能体开展任务规划,对区域内的养老设施进行查询统计,同时与该区域2030年的规划值进行差值计算并给出结果。
利用国土空间规划智能体,采用问答方式,实现专业报告的纲目编写、内容填写和风格转换,通过交互式界面实现人工修正和完善,整体缩短报告编写过程中找数据、做计算、编纲目的时间,将更多精力放在问题分析、业务判读和决策制定上。见图3。
用户可调用内置的报告大纲模板,也可依据用户上传的参考资料提供报告主题,由智能体自动生成报告大纲和要点。根据用户反馈,可对大纲进行局部重写、细化或提炼,满足不同颗粒度需求。
确定大纲后,智能体可根据章节主题要求,进行数据检索、分析、计算,根据分析结果自动填充报告内容,包括图表、图形、数据点等。此外,智能体可以根据需要调整报告的布局、颜色方案、字体大小等样式,还可识别数据中的异常行为或异常值,进行标注和用户提醒,确保报告的准确性和可靠性。
不同报告的受众群体、专业程度和阅读习惯各异。例如:总结报告宜采用总分结构,条理清晰;学术性报告注重逻辑推理和论证过程;公众报告则以简洁明快的短句为主。在报告编写前可预设行文风格,在报告编写后也可选择行文风格转换,智能体通过改变用词习惯、调整句式结构等方式来调整行文风格。
利用国土空间规划智能体,实现用地规划许可的智能核验,包含信息提取、空间分析、意见生成等,有效提升规划许可审查工作的科学性和效率。见图4。
基于智能体实现对项目材料中关键信息的自动化提取,包含项目信息、申报事项、权属信息、批准依据等项目基本信息,以及规划用地情况、土地使用强度、建筑设计要求、交通市政要求、特殊要求等项目许可信息。
根据项目范围进行自动定位,由智能体调用预设的空间分析规则,将规划许可与土地利用现状、生态保护红线、永久基本农田、城镇开发边界、详细规划等数据叠加比对分析,判断地块与周边环境及其他规划要素的空间关系,直观呈现冲突区域,计算冲突范围和数值,汇总并形成空间审查结果。
基于提取的项目信息和空间审查结果,智能体按照审查意见模板和行文风格,可自动生成项目审查意见,并可根据要求进行成果格式转换和成果发送。
应用国土空间规划智能体,基于问答方式,依据国土空间规划监测评估要求和具体问题,快速选取指标、抽取数据,开展监测分析评价,生成图文表一体化的专题可视化结果,并推送分析结论和相关规划管理要求,为领导监管决策提供决策支持,改变按模块、场景开发的系统建设和应用模式。
针对国土空间总体规划实施监管要求,面向开展“三区三线”、城市四线、用地结构、产业空间、安全韧性等监测方向,由智能体抽取调查监测、用途管制、开发利用、耕地保护、生态修复等管理数据,调用相关指标计算模型开展自动计算和分析,结果以图数一体化方式自动展示,全面反映总体规划的实施情况。
围绕专项规划目标和要求,智能体自动调用专项规划重大项目实施数据,汇总实施进度与指标,与规划指标开展对比分析和监测预警,对于偏离规划目标较大的区域或项目,智能体可按规则发出提示预警。
围绕详细规划目标和要求,智能体自动调用规划单元内的现状数据和实施数据,关联展示规划单元内用地、建筑等要素从现状、规划、实施到更新现状的时空演变过程。自动汇总实施数据,提供规划指标剩余量、规划传导情况、规划实施率等信息,监测详细规划实施情况。
通过提供多样化的输入方式来传达设计意图,国土空间规划智能体将这些抽象化的规划构想转化为直观可视化的设计效果。用户可选择或描述个性标签(建筑功能、视角、时间、风格、天气等),上传现状照片/手绘草图/初步建模图片等作为底图,通过设置线稿约束、景深约束、要素分割等控制参数,由智能体输出总平效果图或建筑设计图,并可进行局部交互式调整。见图5。
聚焦于建筑基地总体布局,在输入设计意图时,可用文字描述地块功能分区、建筑分布、交通流线等关键信息,或上传场地现状图、平面设计草图等基础资料。智能体据此生成多种布局与风格的总平效果图,并提供全面的方案对比视角。效果图生成后,用户能修改局部区域,让方案更符合实际需求,还可调整图面色彩、线条样式等优化视觉效果。最终效果图可按指定尺寸、分辨率与格式导出,满足项目汇报、审批、备案等多种场景要求。
聚焦单体建筑或建筑群,用户可输入建筑布局、用途、风格、高度等精准的文字指令,界定建筑功能与周边环境要素等信息,也能上传参考图片,让智能体捕捉风格偏好与场地现状。基于输入信息,快速生成多张贴合意图的效果图。之后,用户可进行精细化调整,如调节色彩、光影、材质等参数,或利用局部修改工具优化完善特定区域。最终的效果图,可根据建筑设计、房地产营销、建筑施工等不同应用场景需求,以常见的图片格式进行导出与分享,为规划决策、方案展示等提供支持。
本文对国土空间规划智能体建设进行了探索,提出了国土空间规划智能体构建的技术路径,并在相关应用场景中开展了典型实践,在取得一定的创新实效的同时,也面临一些现实挑战与不足。首先,现有应用中的大模型训练成本较高,需要大量的计算资源和时间来训练及运行,加上训练数据样本的质量和训练人员的规划专业水平,制约着模型训练的精度。其次,国土空间规划智能体的自主决策和行动能力还难以应对复杂多变的环境,与算法、决策工具和应用功能的协同还不够,与其他智能体的协同尚未涉及。最后,在应用上,对三维时空的智慧场景应用也有待进一步加强。
随着实践的不断深入,未来应实现从单一大模型到涵盖语言大模型、视觉大模型等在内的多模态大模型的协同,从单AI智能体到多AI智能体的协同,整体上将智能体和多模态大模型的整合作为方向,并结合基于实景三维的多维度时空应用场景延伸,创造虚实孪生互馈、全场景联动、全周期智慧的智慧国土空间规划新图景和新范式。