现在位置:首页 > 科学传播 > 人物风采

郭雷:以反馈控制“对付”智能时代不确定性

作者: 2020-01-22 10:50 来源:中国科学报
放大 缩小

    “不确定性无处不在,人们也总是想尽各种办法‘对付’不确定性,以达到调控目的或期望目标。但是,就像我们在理想化的封闭环境中通过练习学会了开车,真正到了复杂开放的实际公路上,还会面临各种不确定性。也就是说,理想模型与现实情况可能存在着较大差异,而解决它的一个有力且必要的机制就是实时反馈调控。”中国科学院院士、中国科学院数学与系统科学研究院研究员郭雷表示。

  前不久,在法国召开的电气与电子工程师学会(IEEE)决策与控制大会上,郭雷荣获国际自动控制领域颇具声望和影响力的学术荣誉之一“波德奖”。他也是首位获得该奖项的华人科学家。他在会议期间作了唯一的大会报告“波德讲座”。近日,他在回国后分享了题为《反馈与不确定性》的报告内容。

  “无处不在” 

  郭雷表示,在人工智能时代,反馈控制与学习算法一样,也将扮演关键角色,两者都是对付系统不确定性的有力手段。控制系统是自动化或智能化系统的“大脑”,支配控制系统运行的是控制算法。

  研究控制算法如何具体设计,如何保障其具有安全、稳定、优化等良好性能的学科是控制系统理论,而这一理论核心和关键的概念就是反馈。

  “反馈无处不在,正如控制论创始人维纳所说,反馈普遍存在于动物和机器中,存在于几乎一切有目的的行为中。在控制系统中,反馈的主要目的是对付各种不确定性因素对系统性能的影响。”郭雷说,“反馈与不确定性”是控制论的核心议题,它们之间的定量关系是富有挑战性的基本科学问题。

  近百年来,关于反馈控制和不确定性的研究,无论在理论上还是应用上,都取得了巨大进展。例如,现代控制理论和电子通信先驱波德就留下了两大“遗产”:波德图和波德积分公式,它们对线性系统控制器的设计分析和反馈系统局限性的理解认识,产生了持久的影响。

  “三个故事” 

  关于以反馈对付不确定性,郭雷在报告中讲了三个典型“故事”:自校正调节器(线性系统的非线性反馈);比例—积分—微分(PID)控制器(非线性系统的线性反馈);反馈机制能力(非线性系统的非线性反馈)。

  首先是自校正调节器。郭雷指出,它的稳定性与收敛性被认为是自适应控制领域的“中心问题”。其表面看起来基本而又自然,但本质上却是由一组很复杂的非线性与非平稳随机动态方程所刻画,这使其研究过程中面临意想不到的数学困难。也正因如此,自校正调节器的稳定性和收敛性曾经是控制领域长期悬而未决的著名难题。

  郭雷随后讲述了他如何实现理论研究的突破,从而建立自校正调节器的全局稳定性、渐近最优性、最优收敛速度等重要性能的过程,特别提到对智能系统基础理论研究的启发和借鉴意义。比如,在处理复杂系统问题时,在人工智能系统设计中实现机器学习与实时决策的有机结合,这种“边学习边控制”的反馈机制,对真正“智能行为”的研究有重要意义。

  再者是“比例—积分—微分(PID)”控制器。这是一种仅通过利用控制系统输出的偏差来校正输入端信号的线性反馈控制方法,具有无模型、数据驱动、简单易用等特点。

  “越简单有效的方法往往越具有持久的生命力。”郭雷说,PID控制器具有百余年历史,是迄今为止实际工程技术系统中应用最为广泛的控制器,例如,95%以上的过程控制迴路都是基于PID控制。 PID控制被誉为“控制工程师的面包和黄油”,也被认为“没有它就没有现代文明”。

  郭雷指出,值得注意的是,绝大多数实际系统都是非线性不确定性系统,但迄今为止,绝大多数理论研究却都集中在线性系统,并且控制器参数的选取一般凭借经验或实验。因此,PID理论研究与实践之间存在着较大鸿沟,控制理论学者有责任来填补它。

  近年来,郭雷与合作者在PID控制的基础理论方面取得重要研究成果,它们不仅奠定了PID在工程中成功应用的理论基础,还将为进一步改进或设计实际工程控制系统提供理论指导。

  “有所为,有所不为” 

  在郭雷看来,目前在控制理论中有两大领域与“反馈与不确定性”研究的关系最密切,那就是鲁棒控制和自适应控制。但是,由于问题提法的不同,以前很少有具体研究结果涉及反馈机制对付不确定性的最大能力和根本局限。

  他说:“面对系统的不确定性,我们不仅要知道反馈机制能够做什么,更要知道它不能做什么,这样会激励我们不断改进控制器的设计,以接近或达到理论上最大能力的极限,也可以减少系统建模和学习的压力,还能避免在控制器设计中走不必要的弯路。”

  “控制论发展至今,虽然进展很大,但远未成熟。”郭雷表示,信息技术的快速发展,使得研究越来越复杂的控制系统成为可能,同时也带来了一系列有意义的挑战性新问题,而对它们的研究往往仍然依赖于对控制领域的基本概念和基本问题的理解。

  郭雷认为,除了不确定性外,社会、经济、生物领域的许多复杂系统和未来“智能”工程系统等都需要加以调控,但它们作为被控对象可能会有自己的“追求目标”。对这类复杂系统的控制,已经超出传统控制论或博弈论框架,需要在未来研究中加以重视。