登陆

极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!

admin 2019-06-04 201人围观 ,发现0个评论

对立测验、鲁棒学习和办法化验证。

AI 科技谈论按:核算机编程开展至今,bug 和软件就一向如影随形。多年来,软件开发人员现已创立了一套在布置之前进行测验和调试的最佳办法,但这些办法并不适用于现在的深度学习体系。现在,机器学习的干流办法是依据练习数据集来练习体系,然后在另一组数据集上对其进行测验。尽管这样可以显现模型的均匀功用,但即便在最坏的状况下,保证稳健或可被承受的高功用也是至关重要的。对此,DeepMind 发布文章介绍了可以严厉辨认和消除学习猜测模型中的 bug 的三种办法:对立测验(adversarial testing)、鲁棒学习(robust learning)和办法化验证(formal verification)。AI 科技谈论编译如下。

机器学习体系默认设置的鲁棒性较差。一旦引进纤细差错,那么即便在特定范畴中体现优于人类的体系,或许连简略问题都处理不了。例如,考虑图画扰动的问题:假如在输入图画中参加少数经细心核算的噪声,那么一个比人类更拿手做图画分类使命的神经网络就很简略将树懒误分类为赛车。

掩盖在典型图画上极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!的对立输入或许导致分类器将树懒过错地分类为赛车。两个图画在每个像素中最多相差 0.0078。第一张图画被归类为三趾树懒,置信度> 99%。第二张概率>99% 的图画被归类为赛车。

这不是一个全新的问题。核算机程序一向都存在 bug。几十年来,软件工极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!程师从单元测验到办法化验证上装了许多技能东西包。这些办法在传统软件上运转杰出,可是因为这些模型的规划问题和结构不完好(或许包含数亿个参数),因而选用这些办法来严厉测验神经网络等机器学习模型是十分具有应战性的。这就需求开发用于保证机器学习体系布置更牢靠的新办法。

从程序员的视点来看,bug 便是一切不契合体系标准(即预期功用)的行为。作为「智能化」使命的一部分,咱们需求对评价一起性的技能进行研讨,即机器学习体系不只要与练习集和测验集一起,还要与描绘体系期望特点的标准列表一起。这些特点或许包含对输入中细小扰动的鲁棒性,防止灾难性毛病的安全束缚,或发生契合物理规律的猜测。

咱们一起致力于严厉开发和布置与所需标准牢靠一起的机器学习体系,在本文中,咱们将谈论机器学习范畴面临的三个重要技能应战。

1、有用地测验与标准的一起性。咱们探究有用的办法来测验机器学习体系是否与规划者和体系用户所期望的特点(例如不变性或鲁棒性)一起。这是用于显现模型或许与期望行为不一起的状况的一种办法,即在评价期间体系地查找最坏状况的成果。

2、练习与标准一起的机器学习模型。即便有很多的练习数据,标准的机器学习算法练习出的猜测模型也可以得出与具有鲁棒性和公平性的期望标准不一起的猜测成果,这就要求咱们重新考虑练习算法,要求这些算法不只可以很好地拟合练习数据,还要可以契合预期标准。

3、办法化验证机器学习模型与标准的一起性。这需求这样一种算法,即关于一切有或许的输入,该算法都能证明模型的猜测成果与标准之间是一起且可被证明的。尽管办法化验证范畴几十年来一向在研讨这种算法,尽管开展不错,但该办法并不能轻易地扩展到当今的深度学习体系。

测验与标准的一起性

对立样本的鲁棒性是深度学习中研讨相对较好的一项作业。从这项作业中引申出的一个主要使命是评价强对立样本的重要性,以及规划可以做有用剖析的通明模型。在和业界其他研讨者协作时,咱们发现许多模型在面临弱对立样本时看起来很稳健,可是,在面临更强的对立因子时,模型显现出的对立准确度底子为 0%(Athalye et al,2018,Uesato et al,2018,Carlini and Wagner,2017)。

尽管在监督学习下,大多数作业都重视一些稀有过错(其间以图片分类使命居多),可是将这些办法扩展到其他场景中也是一件需求重视的作业。在最近关于发现严重过错的对立办法的研讨中,咱们将这些办法运用于测验强化学习的智能体,这些智能体主要被运用在对安全性要求很高的场景中。开发自主体系的一个应战是,因为小过错或许会导致很严重的成果,因而咱们容不得呈现一点失误。

咱们的方针是规划一个「攻击者」,以便咱们提早检测到一些过错(例如,在受控环境中)。假如「攻击者」可以有用地辨认给定模型的最坏状况输入,则可以让咱们在布置模型之前捕捉到一些稀有失误。与图画分类器相同,面临一个弱的「攻击者」进行评价会在布置期间形成一种幻觉,即这是安全的。这类似于「红队研判法(red teaming)的软件实践」,不过对歹意攻击者形成的失误进行了延展,一起还包含了天然呈现的失误,例如泛化缺乏形成的失误。

针关于强化学习智能体的对立测验,咱们开发了两种互补的办法。首要,咱们运用无导数优化来直接最小化智能体的预期报答。在第二部分中,咱们学习了一种对立价值函数,该函数依据经历猜测哪些状况最有或许导致智能体失误。然后,咱们运用学习好的函数进行优化,将评价要点放在最有问题的输入上。这些办法只构成了某个丰厚且正在添加的潜在算法空间的一小部分,一起,关于严厉评价智能体方面未来的开展,咱们也感到十分激动。

比较于随机测验,这两种办法现已完成了很大的改善。运用咱们的办法,可以在几分钟内检测到原需求花费数天才干发现乃至底子无法发现的失误(Uesato et al,2018b)。咱们还发现,对立测验会定性地发现咱们智能体的行为和在随机测验集评价的猜测成果之间存在的差异。特别是,运用对立性环境结构,咱们发现智能体在履行 3D 导航使命上的均匀水平可与人类在同一使命上的体现相媲美,不过,它在十分简略的迷宫上学历证明却使命上,还不可以完好地找到方针(Ruderman et al,2018)。此外,这项作业还着重,咱们需求规划的体系除了要能对立「攻击者」,还要可以抵挡天然失误。

运用随机抽样,咱们简直从不调查具有高失利概率的地图,可是对立测验标明这样的地图的确存在。即便在移除了许多墙面,变成比原始地图更简略的地图后,这些地图上的失利概率仍然很高。

练习与标准一起的模型

对立测验旨在找到违背标准的反例。因而,它往往会高估模型与这些标准的一起性。在数学上,标准是必须在神经网络的输入和输出之间坚持的某种联系。这可以选用某些键输入和输出参数的上限和下限的办法。

受此调查的启示,一些研讨人员(Raghunathan et al,2018; Wong et al,2018; Mirman et al,2018; Wang et al,2018),包含咱们在 DeepMind 的团队(Dvijotham et al,2018; Gowal et al.,2018),研讨了与对立测验程序无关的算法(用于评价与标准的一起性)。这可以从几许学上了解,咱们可以经过束缚一组给定输入状况下的输出空间来束缚与标准相差最大的状况(例如,运用距离鸿沟传达;Ehlers 2017,Katz et al,2017,Mirman et al,2018)。假如此区间相关于网络参数是可微分的而且可以快速核算,则可以在练习期间运用它。然后可以经过网络的每个层传达原始鸿沟框。

咱们证明晰「距离鸿沟传达」(interval bound propagation )是快速且有用的办法,而且与从前的信仰相反,这种办法可以获得愈加强壮的成果(Gowal et al,2018)。特别地,咱们证明它可以下降在 MNIST 和 CIFAR-10 数据集上的用于图画分类的现有技能的可证明的过错率(即,任何「攻击者」可完成的最大过错率)。

该范畴未来的下一步,将会是学习正确的几许笼统以核算更严厉的输出空间过度概率。咱们还期望练习出可以与更杂乱的标准一起的网络,然后捕捉到抱负的行为,例如上面说到的不变性和与物理规律的一起性。

办法化验证

严厉的测验和练习十分有助于构建强壮的机器学习体系。极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!可是,没有多少测验可以办法化地保证体系的行为契合咱们的要求。在大规划的模型中,因为输入扰动有无量多种,因而咱们很难罗列出给定输入集(例如,对图画的无量小扰动)一切或许的输出。可是,与在练习中的状况相同,咱们可以经过在输出集上设置几许区域来找到更有用的办法。办法化验证是 DeepMind 正在进行的研讨主题。

关于怎么核算网络输出空间上的准确几许区域,机器学习研讨界现已提出了几个的风趣的 idea(Katz et al,2017,Weng et al,2018; Singh et al,2018)。咱们的办法(Dvijotham et al,2018),则依据优化和二元性,包含将验证问题表述为一个企图找到被验证的特点中最大的违规行为的优化问题。一起,该问题经过在优化中运用二元性的思维而变得更易于核算。这就会带来了额定的束缚,其运用所谓的「切开平面」来细化经「距离鸿沟传达」核算得来的鸿沟框。这种办法尽管合理但不完好:或许存在爱好特点为真,但此算法核算的区域规模缺乏以极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!证明该特点的状况。可是,一旦咱们得到了区域规模,这就办法化的保证了不会有违背特点的行为。下图以图形办法说明晰该办法。

这种办法使咱们可以将验证算法的适用性扩展到更广泛的网络(激活函数,体系结构)、一般标准和更杂乱的深度学习模型(例如生成模型、神经进程等)以及对立鲁棒性以外的标准(Qin,2018)。

总结

在高风险状况下布置机器学习带来了共同的应战,而且需求开发相应的可以牢靠地检测毛病形式的评价手技能。更详细而言便是,咱们以为,比较于仅仅从练习数据中隐含地生成标准的办法而言,学习与标准的一起性的办法可以带来更有用的改善。咱们关于正在进行的对立评价、鲁棒性模型学习和办法化标准验证的研讨,都感到十分振奋。

为了保证实际国际中的 AI 体系可以做出「正确的作业」,咱们还需求做更多的作业来创立自动化东西。咱们对以下方向的开展特别感爱好:

1、学习对立性评价和验证:跟着 AI 体系的扩展和杂乱程度不断添加,规划能很好拟合 AI 模型的对立性评价和验证算法将变得越来越困难。假如咱们可以运用 AI 的强壮功用来促进评价和验证,那么将大大加快这项研讨的开展。

2、开发用于对立性评价和验证的东西并对外开放:为 AI 工程师和从业者供给易于运用的东西十分重要,这些东西可以在 AI 体系导致广泛的负面影响之前,就让研讨者知道其或许的毛病形式。这需求对对立性评价和验证算法完成某种程度上的标准化。

3、扩展对立样本的规模:到目前为止,大多数关于对立样本的作业都会集在对小扰动(一般是图画)的模型不变性上。这为开发对立性评价、鲁棒学习和验证办法供给了极好的测验渠道。咱们现已开端探究与实际国际直接相关特点的代替标准,并对未来在这方面的研讨感到振奋。

4、学习标准:在 AI 体系中捕获「正确」行为的标准一般难以进行精准陈说。当咱们可以构建可以展现杂乱行为并在非结构化环境中举动的愈加智能的智能体时,咱们将可以创立可以运用部分人类规划的体系,但这些体系还需极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!求从可评价的反应中愈加深化地学习标准。

DeepMind 经过负责任地进行机器学习体系开发和布置,致力于对社会发生活跃的影极彩登录网址是什么-机器学习模型中的 bug 太难找?DeepMind 呈上了三种好办法!响。为了保证开发人员的奉献是有活跃意义的,咱们还需求应对许多技能应战。咱们致力于参加这项作业,并很快乐可以与更多人协作处理这些应战。

via:https://deepmind.com/blog/robust-and-verified-ai/

AI 科技谈论报导

点击 阅览原文,检查往期内容:多图详解 DeepMind 的超人类水准星际争霸 AI 「AlphaStar」

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。
  • 油价不只创下30多年来最大单日涨幅 成交量也创出前史新高
  • 中芯世界 (0981.HK):给予“买入”评级 目标价13.84港币
  • 极彩登录网址是什么-MarketPulse:黄金、原油日内走势前瞻
  • 请关注微信公众号
    微信二维码
    不容错过
    Powered By Z-BlogPHP