一、现阶段环境执法监测面临的挑战
近年来在地方的环境执法实践中尝试着采取一系列新的措施和方法来改善环境执法的状况,特别是在我国财政预算有限的情况下,想要短期内突破这一环境执法瓶颈就必须在技术水平上有所创新,利用自动化、大数据、人工智能等优势弥补人力、财力不足的问题。随着人工智能、大数据等技术的不断发展,在越来越多的地区,执法监测已逐渐步入智能化时代,例如:将无人机技术与图像识别算法结合,用以监控森林火灾;通过传感器收集建筑污染物数据,并上传到区块链网络。在共识算法的基础上,引入了链上信息流。智能合约被编程为自动监测建筑污染物水平并评估环境绩效;将无人机技术应用于海岸带综合管理,证实该方法对联合国海岸带可持续发展目标有积极作用;将智能感知系统应用于农业监测,用于监测农作物危害信息。客观而言,环境执法监测信息化、智能化是大势所趋,是解决前述传统环境执法监测所面临两大核心问题的有效途径,但这也意味着对科技赋能下的环境执法监测有了更严格的要求。
(二)科技赋能下环境执法监测问题产生的深层次矛盾
实践层面而言,新时代生态执法监测一方面需要适应执法监测职能和机构调整所带来的制度调整和工作模式的变化,并解决由此变化所带来的新时代执法监测所面临的执法监测定位不清晰、联动不协调和能力不平衡不到位等问题。另一方面,执法监测机构还需要满足新时代背景下,对执法监测数据质量、数据的应用范围和数据监测能力的新要求。这些实践层面的产生的新问题,其背后是环境执法监测所隐藏更深层次的两个矛盾,即环境执法监测与智能化监管难以有效结合,以及监测数据的证明力问题。在环境执法监测与智能化结合方面,智能化监测设备尽管在绝大多数情况下可以有效地自动生成有关监测数据,但如何更公平客观地选择和采用相关数据,能否充分、主动地利用数据,其决定权还是依赖执法监测人员。例如在环境统计和核查等方面。进一步而言,如何利用智能化遏制并破解传统环境执法监测所面临的“找关系”和“说情”等问题,是使环境执法更加公开、公平,并有效提升执法的权威性的核心课题之一。在监测数据证明力方面,生态环境部在印发的《生态环境部关于加强生态环境监督执法正面清单管理推动差异化执法监管的指导意见》中提出“积极推行非现场执法方式,采取差异化监管措施,提升生态环境监管执法精细化水平,实现对守法者无事不扰,对违法者利剑高悬”。相对“现场监管”而言,“非现场执法”提出了更进一步的要求,非现场监管更侧重于发现机制以及事中、事后的持续监管,而非现场执法则意味着调查取证、告知申诉等流程也可以不去现场,而是通过信息技术在线上实现。2021年修订的行政处罚法明确电子数据可作为一个独立的证据种类,并规定“电子技术监控设备记录违法事实应当真实、清晰、完整、准确”。这些要求对于数据的证明力都提出了更高要求。
二、无人机和人工智能的理论基础及应用优势
在过去的几十年里,无人机技术已经取得了巨大的进步,最初,无人机技术大多被应用于军事领域。随着技术的不断发展,无人机开始向民用方向普及,被应用于各行各业,最近几年,无人机更是成为广大摄影爱好者不可或缺的设备。无人机技术的成功离不开其坚实的技术基础,包括了硬件和软件要素,使得无人机得以实现自主飞行、感知环境、定位导航、通信交流能力,这些技术全部得益于无人机的控制系统。
无人机的飞行控制系统被视为其核心“大脑”,它类似于飞行器的中央神经系统。这一系统集成了处理器、传感器和执行器,负责监测飞行状态、调整飞行姿态、执行飞行计划和保持飞行的稳定性。飞控器通常搭载惯性测量单元,用于测量加速度,以及陀螺仪来测量角速度。此外,自稳定系统的应用有助于保持飞行的平稳性,使无人机能够在风力和其他环境变化下保持稳定。高级飞控算法的运用进一步赋予无人机高级功能,如悬停、路径规划和自动驾驶、智能避障等。使得对无人机的操控变得愈发简便、安全,即使是一些难以发现的电线、树枝,无人机在飞行过程中都能准确躲避,保障了无人机在飞行过程中的安全。除此之外,无人机厂商更是根据不同的场景需要,研发出多种多样的无人机,这些无人机具备复杂环境穿梭能力、抗风能力、承重能力等,为无人机在各行各业的应用奠定了基础。
2.传感器飞速发展自从20世纪50年代,科研人员就开始研究如何让机器对图像进行智能判断,受限于当时的硬件条件和理论基础,对于图像领域的人工智能技术多以特征工程为主,如边缘检测、形状分析和模式匹配。研究者尝试开发算法来检测和描述图像中的基本特征,如边缘、角点和直线。并加入适当的规则,让算法基于图像的特征对图像进行判断。虽然这些方法在某些特定任务上表现良好,但它们的适用性受到了限制,因为需要耗费大量时间来制定规则,而且对复杂的图像和场景处理效果有限。直至20世纪90年代,机器学习技术不断发展,图像识别领域也引入了机器学习的方法,如支撑向量机(Support Vector Machine,简称SVM)等,基于这些机器学习方法,研究人员不必再花费大量时间为特定的任务设定特征判定规则,机器学习方法可以自动利用起这些特征实现任务目标。但是随着计算机硬件的发展,计算机算力大幅度提升,加上分布式研发框架日益成熟,深度学习方法的兴起,传统的机器学习被掩盖了光芒。传统的机器学习虽然不需要设定复杂的规则,但是依然依赖于特征工程,研究人员所使用的特征提取方法很大程度影响着算法的效果。但深度学习让特征工程也变得“智能”了,深度学习模型对数据的处理过程更像是人脑,人脑依赖于神经元之间的电位传递信息,每当人脑对事物进行感知,都会引发神经元之间的电位变化,以此传递经验信息,并得出最终的判断。而深度学习模型和人脑的思考过程非常相似,随着计算机算力的提升,这个模型似乎越来越“聪明”。2010年代以来,深度学习技术,尤其是卷积神经网络(Convolutional Neural Networks,简称CNN),引领了图像识别领域的发展。卷积神经网络可以自动从图像中提取特征,而不需要手工定义规则。它们具有多个卷积层和池化层,可以处理不同层次的图像特征,使计算机能够更好地理解和分类图像。大规模数据集(如ImageNet)的可用性以及GPU等硬件的改进使得深度学习模型能够在大规模图像识别任务中取得卓越的性能,包括图像分类、物体检测和图像分割。除此之外,注意力机制(Attention机制,详见图1)的崛起给了图像处理领域带来了第二选择,注意力机制的概念最早也来自图像识别领域,于2015年首次被引入自然语言处理领域。2017年提出的“多头注意力机制”的概念,该机制使模型能够同时关注输入中的多个位置。之后,研究人员又重新将注意力机制融入计算机视觉领域,提出了视觉Transformer算法(Vision Transformer)。此后,注意力在计算机视觉领域的地位迅速提高,并有很快取代卷积结构的趋势。Attention机制就像人脑处理感官信息的过程一样,人脑并不会将感官接收到的信息全部加以处理,它往往会基于经验,下意识地将一连串信息赋予不同的权值,也就是说,对于复杂的场景,人脑会下意识地关注到事物的重点区域,同时也会忽略掉部分信息,这就可以表示成一种特殊的映射关系:Attention=f(g(x),x)其中g(x)代表人脑对感官接收到的信息加以处理,而f(g(x),x)则表示对处理后的信息加入注意力机制,对于重要信息,就增大权重,对于不重要的信息就将权重置零忽略。通过深入研究了Attention原理以及基于Attention原理的Transformer结构,开发出了一种高度创新的深度学习模型。这个模型不仅在处理图像信息时能够关注到关键区域,还在融合信息、学习特征方面表现出色。4.算力指数型提升和大规模数据集的出现
模型训练的时间成本是一项重要而复杂的考量。当今,计算机设备不仅变得越来越精密,而且性能也不断提升。同时,研发人员也在积极推动研发框架的升级和创新。深度学习模型的训练已经从过去依赖于传统的中央处理器(CPU)发展到使用图形处理器(GPU),甚至还有专门为人工智能任务设计的张量处理器单元(TPU)等硬件设备。这种技术进步促使以前只存在于梦想中的复杂模型得以变成现实。
但仅仅依赖于硬件的提升是不够的,正如,想制造一辆车,不一定要从造轮子开始,深度学习模型的训练也是如此。对于同一种事物的学习,一个博学多识的学者一定会比一个婴儿学得快,这就是迁移学习的思想,迁移学习是一种机器学习模型训练方法,旨在通过将一个领域中已经训练好的模型的知识迁移到另一个相关领域或任务中,以提升新任务的性能。这种方法基于一个假设:在不同的任务之间,存在一些共享的特征或知识,可以从一个任务中受益于另一个任务。这种模型训练的思想恰恰为研发的模型训练节约的大量的时间成本,借助于在其他领域的数据集中学习到的知识,强化已有模型,使本团队的模型具备很好的泛化能力的同时,在针对性的数据集上也拥有很好的识别效果。
1.监测适用领域的广泛性与灵活性
无人机能够快速覆盖大范围的地区,进行高效的数据采集。相比传统方法,无人机可以更迅速地获取环境数据,从而提供实时或近实时的监测结果。无人机可以实时将采集的数据传输到监测中心,使监测人员能够迅速做出反应,采集的数据可以被送往人工智能系统进行分析,识别异常情况、模式和趋势。这有助于更好地理解环境变化,制定科学的环境保护策略。无人机本身就是一个高度灵活的平台,可以搭载多种传感器、摄像头以及其他设备。不同的传感器、摄像头和设备可以根据任务需求进行装载和更换,从而使无人机能够满足不同的环境监测要求。这种多功能性使得无人机成为一种非常强大且适应性强的工具,为环境监测提供了全新的可能性。
2.更低的监测成本与更高的数据证明力相比传统的人工监测方法,对于部分特定的执法监测领域,无人机得益于其技术特点拥有更低的使用成本。特别是对于传统人工执法难以到达的监管区域,如陡峭的山区、悬崖峭壁、深坑洼地等区域,以及因自然灾害或特殊原因无法有效到达的地方,无人机都可以凭借自身灵活性替代人工有效对这些区域进行监测。本研究在使用无人机进行火点数据采集时也验证了这一优势,无人机由于“飞得高,看得远”的特点,能看到很多执法监测站在地面看不到的隐藏火点,有些火点被树木、山体等遮挡,有些则处于深坑中,但在无人机面前都无所遁形。同时,乡村田间,只有部分电线杆和树木会成为无人机飞行过程中的障碍物,但这些物体大多高度不超过30米,无人机能够非常轻松超过这个高度,实现无遮挡飞行,相比于执法人员穿梭于田间小路,无人机效率更高、视野更广阔、数据采集更迅速。此外,面对越来越复杂的监测对象和更加严格的数据要求,无人机可以从技术手段上保证监测数据的“天地空”“水陆空”全时覆盖。利用所搭配的网络传输模块,确保了数据的实时性和安全性,大幅度提高了“非现场执法”对于数据证明力的高要求,达到完整的执法过程可回溯管理。结合AI针对所采集数据进行数据处理,一方面可以有效监管执法人员的行为,最大程度上避免对数据的主观选择和不公正使用,另一方面则可以在形成成熟的软件模型后高效高质低价地处理相关数据,并在一次性开发后迅速进行大面积推广降低成本,以更好地满足社会的需求。
三、无人机与人工智能技术在秸秆禁烧中的应用实践
图2 秸秆、黑斑、火点航拍图
2.设计实验模型图3 实验流程
3.模型训练与参数调优表2 损失函数和优化器的性能分析
表2给出了模型在各种优化器和损失函数条件下的分类性能。本研究使用5个经典优化器(SGD、RMSprop、Adagrad、Adam和Adamw)和4个经典损失函数(LabelSmoothLoss、CrossEntropyLoss、Asymmet-ricLoss和FocalLoss)来评估模型。本研究的评估标准是准确性。最初,通过测试不同的优化器,结果显示Adamw在冻结前2模块参数和冻结前3模块参数模式下都优于其他优化器,准确率分别为99.3%和97.5%。在冻结前2模块参数情况下,Adam、Adagrad和RMSprop表现出相似的性能,准确率为94%,而SGD的准确率最低,分别为87.4%和77.09%。之后,在固定优化器的情况下调整损失函数,探讨不同损失函数对实验结果的影响。本研究在之前的实验中选择了最优的优化器Adawm,然后分别使用La-belSmoothLoss、CrossEntropyLoss、AsymmetricLoss和FocalLoss四个损失函数作为误差评估标准。Trans-former模块有四个模块。本研究冻结了不同数量阶段的参数,并调整了上述参数进行比较。实验表明,损失函数对结果影响不大。当冻结Transformer模块的前2模块时,四个损失函数的分类性能分别为99.334%、99.304%、99.346%和99.348%,而当冻结Transformer模块的前3级时,只有FocalLoss的性能略好于其他三个,相差0.1%。经实践证明,“无人机+AI”在数据采集、数据传输、执法监测等方面都有着极大的潜力。1.环境监测数据的准确性和可靠性评估
秸秆禁烧主要监测正在燃烧中的火点和燃烧后留下的黑斑,在深度学习模型中,将模型的预测结果与真实类标签的差值作为误差评估标准,并将差值反向传播回深度学习模型的每一层,根据此标准更新参数,经过多次迭代,使误差值收敛到一定范围内,当误差收敛时,训练所得的模型就可以用于最终的实践。但误差收敛只能作为模型训练是否结束的参考条件,准确率等评估指标才能评价该模型是否有应用价值。而要想得到一个优秀的模型,就需要让模型学习足够的“经验”,也就意味着,研究需要尽可能多的样本,或者借助迁移学习实现“站在巨人的肩膀上”。本研究中,为使模型学习到足够的经验,本研究团队让模型学习其他数据集中的经验,通过加载预训练模型,获取具有丰富经验的模型参数,并将模型前端部分参数冻结,防止这些参数在反向传播时更新,同时只开放模型后端部分参数,让这些参数根据本研究所使用的数据集进行更新迭代,从而使本模型可以在其他模型的基础上更适用于对秸秆焚烧火情数据的判断。要想证实“无人机+AI”模式能够为执法监测提供助力,要从准确性和可靠性两个角度进行实验分析。本研究团队的人工智能模型,只有达到或者超过人工监管相近的准确率,才有可能为执法监测提供助力。实验结果详见图4所示,分别展示了当实验冻结不同模块数量参数情况下,所获得的准确率与模型参数之间的关系,其中T(Tiny)、S(Small)、B(Base)代表基础模型的规模,数字8和16代表模型在训练过程中所使用的扫描窗口大小。这两者在一定程度上影响着模型的效果,但是,模型效果的好坏,不仅需要理论支撑,更需要实验证明。本研究的模型准确率高达99.38%,而且在不同模式下,准确率波动范围不超过2.29%,相对稳定。
图4 模型准确率分析
除此之外,研究团队还将该模型与现有开源模型效果进行对比分析,详见图5所示。其中ResNet-18,ResNet-50,ResNet-101,ResNet-152和Convnext都是卷积神经网络相关的深度学习模型,ViT,Swin-Transformer-V2-T,Swin-Transformer-V2-S,Swin-Transformer-V2-B为基于Transformer结构的深度学习模型,而Conformer同时拥有卷积神经网络结构和Transformer结构,从实验结果可以看出,随着Resnet网络层数从18增加到152的过程中,准确率也随之增加,但准确率最高为93.954%。相比之下,本研究团队研发的模型准确率提升了5.4%,与基于Transformer结构的深度学习模型相比,本研究团队研发的模型准确率也有小幅度提升。可见,这种将卷积与Transformer相互结合的方式可以有效提升模型性能,也是一种可行的研究方向,这种方法结合迁移学习的训练策略,可以在不增加训练时间成本的前提下,提升模型的性能,而且结合图4的实验结果可以看出,这种方法也具备相当不错的稳定性,准确率波动范围较小,能够被执法检测部门接受。图5 不同算法准确率对比从可靠性角度分析,本研究所使用的人工智能模型应该是“智能”的,也就是说可以准确判断出,是基于航拍图片中的哪些信息(像素点)进行判断并得出分类结果的。Grad-CAM策略可以记录深度学习模型的每一层所传递的重要信息,也就是每一个像素点对分类结果的贡献度,如果某一个像素点对分类结果贡献度较大,就会被赋予较大的权值,反之权值就会非常小。研究人员将这些信息记录下来,并标记在原始航拍图片上,就可以知道深度学习模型的判断依据,根据这些依据,就可以分析出,模型是否能够正确判断哪些像素点属于火点或者黑斑。图6是在原始图片基础上标注的效果图,从图中可以看出,本研究使用的模型能够准确识别出图片中的黑斑和火点,这种效果图和红外线成像有着本质的区别,红外线成像是基于传感器的效果图,传感器有效距离短,且对传感装置有着较高要求,而基于图像的方法,能为监管者提供更远的距离,而且图像记录的信息远多于红外传感装置,为“无人机+AI”模式未来发展提供无限空间。图6 分类依据信息标注效果图
2.执法效率与成本效益分析从成本效益角度分析,在秸秆禁烧监测领域,本研究团队的“无人机+AI”模式可以大量减少人力监测资源。实践中,基层乡镇部门执法工作人员可以根据工作需要,在最低仅需一人的情况下,主动高效地对可能发生火情的区域进行大面积、长时间、高效率的监测作业。同时,无人机理论上可以做到连续作业无需休息,其作业和维护成本远低于传统人力执法监测方式。对于特殊条件下具有危险性的区域,利用无人机监测可以减少执法人员的风险,提高了工作安全性。总体而言,“无人机+AI”模式在秸秆禁烧监管方面的实践体现了巨大的应用优势,为执法监测人员提供了更为高效、准确、经济的环境执法监测方式,具有广阔的推广前景。通过无人机高清图像采集,再结合AI深度学习模型分析,可以更快捷、准确地识别违规行为,大幅提升了监管效率。更低的成本和更灵活的部署特征,使得该技术同样可以有效地适用于符合条件的城市地区。除了秸秆禁烧监测外,该模式在水源保护、空气质量监测、生态保护等其他环境保护监测领域也具有巨大的应用潜力,值得进一步研究。
往期精彩回顾
许燕佳|手术机器人介入下医疗事故罪的认定——以“严重不负责任”的认定为核心
顾伟 周响|人形机器人生成内容著作权合理使用制度研究
任赖锬 王晨骅|陪伴型人形机器人的升格演化、形象区分与法律规制
管皓|机器人时代的产业税收优惠法治体系化路径探析——基于财税政策文献的计量分析方法
谭韵璇|关于国际海事条约能否适用于船舶人形机器人的研究
陈易|合同法视角下人形机器人使用者的权益保护
上海市法学会官网