2024ITValue-文章详情顶部

图灵奖得主Bengio、姚期智等警告:“灾难性结果”随时可能发生,需将AI安全视为全球公共产品

钛度号
“人类失去控制或恶意使用这些人工智能(AI)系统,可能会给全人类带来灾难性的后果。”

文 | 学术头条 

如今,AI大模型引发的潜在风险,已成为日益严峻的焦点问题,正受到来自全球各界的关注。

日前,三位图灵奖得主 Yoshua Bengio、Geoffrey Hinton、姚期智,与来自世界各地的几十位科学家共同签署了一封公开信——“AI 安全国际对话威尼斯共识”,呼吁为推动人工智能的发展制定更好的保障措施。

他们在公开信中警告道,“随着人工智能的快速发展,这些‘灾难性的结果’随时可能发生。”

完整中文版“共识”内容如下:

人工智能系统能力的迅速发展,正将人类推向一个人工智能可以达到甚至超越人类智能的世界。专家普遍认同这些人工智能系统可能会在未来数十年内被开发出来,很多人认为它们的到来会更快。人工智能系统的滥用或失控可能给全人类带来灾难性后果。然而,我们尚未开发出必要的科学手段来管控和保障对高级智能的使用。由于人工智能带来的风险具有全球性,我们必须将人工智能安全视为全球公共产品,并为实现这些风险的全球治理而努力。我们必须未雨绸缪,齐心防范任何随时可能出现的灾难性风险。

国际社会的初步积极举措表明,即使在紧张的地缘政治局势下,在人工智能安全和治理方面开展合作也是可以实现的。各国政府和人工智能开发者在两次峰会上承诺遵循基础性原则,以促进人工智能的负责任发展,并最大限度地减少风险。得益于这些峰会,各国陆续设立了人工智能安全研究所或相似机构,推进测评、研究和标准制定工作。

上述努力值得肯定,必须持续推进。各国需要为人工智能安全研究所提供足够的资源,并继续召开峰会,支持其他国际治理举措。然而,各国需要在现有的努力上迈出更大步伐。作为第一步,各国应设立有能力在其境内监测和应对人工智能事故与灾难性风险的部门。各国监管部门应协同合作,制定应对重大人工智能事故与灾难性风险的全球应急计划。长远来看,各国应建立国际监管机制,以防止出现可能带来全球灾难性风险的模型。

我们必须开展深入的基础研究,以确保高级人工智能系统的安全性。这项工作刻不容缓,以确保我们拥有充足的时间来开发和验证相关技术,在需要管控高级人工智能时应对自如。为此,我们呼吁各国将人工智能安全视为一个独立于人工智能能力地缘战略竞争的合作领域,专注于国际学术与技术合作。

为了应对可能到来的由高级人工智能系统引发的灾难性风险,国际社会应考虑启动以下三项工作程序:

应急准备协议和制度

就应对先进人工智能系统所需的技术和制度措施,各国应达成一致,无论这些系统的开发时间线如何。为促进这些协议的达成,我们需要建立一个国际机构,将各国人工智能安全监管部门聚集在一起,在制定和审核人工智能安全法规方面,推动不同司法管辖区的对话与合作。该机构将确保各国采纳并实施一套基本的安全准备措施,包括模型注册、信息披露与预警机制。

随着时间推移,该机构还可以制定验证方法的标准,并承诺使用这些方法来执行各国对安全保障体系的本地化实施。各国可以通过奖惩机制来相互监督这些方法的执行,例如将市场准入与遵守全球标准挂钩。专家和安全监管机构应建立事故报告和应急预案,并定期交流,确保验证过程中采用的方法反映出当前最新的科学理解。该机构将发挥关键的初步协调作用。然而,从长远来看,各国需要进一步努力,确保对高级人工智能风险的有效全球治理。

安全保障体系

前沿人工智能开发者必须向本国监管部门证明,其所开发或部署的系统不会逾越红线,例如在 AI 安全国际对话北京共识中所界定的红线。

为实现这一目标,我们需要在风险和红线问题上进一步建立科学共识。此外,我们应建立预警阈值,即模型的能力水平表明该模型可能会越过或接近越过红线。该方法建立在现有的自愿承诺(如负责扩大政策)的基础上,对不同框架进行统一和协调。能力低于预警阈值的模型只需有限的测试和评估,而对于超出这些预警阈值的高级人工智能系统,我们则必须采用更严格的保障机制。

虽然测试可以警示我们关注风险,但它只能提供对模型的粗略理解,无法为高级人工智能系统提供足够的安全保障。开发者应该提交高置信度的安全案例,并以一种能够说服科学界相信其系统设计是安全的方式进行量化,这也是其他安全关键工程学科的常见做法。此外,足够先进系统的安全报告应讨论开发者的组织流程,包括有利于安全的激励机制和问责结构。

当前的部署前测试、评估和保障措施远不够充分。高级人工智能系统可能会逐渐增加与其他人工智能系统和用户进行的复杂多智能体交互,而这可能导致难以预测的潜在风险。部署后的监控是整个保障体系的关键部分,它可以包括对模型行为的持续自动评估、人工智能事故追踪的集中数据库,以及人工智能在关键系统中的应用报告。进一步的保障还可以通过自动化运行时验证来实现,例如确保安全报告中的假设条件依然成立,并在模型运行到超出预期范围的环境时安全地关闭系统。

各国在确保安全保障的落地中发挥着关键作用。各国应要求开发者定期进行测试,判断模型是否具备带来潜在风险的能力,并通过第三方独立的部署前审计保证透明度,确保这些第三方获得必要的权限,包括开发者的员工、系统和记录等必要证据,以核实开发者的主张。此外,对于超出早期预警阈值的模型,各国政府可要求开发者在进一步训练或部署这些模型前,必须获得独立专家对其安全报告的批准。各国可以帮助建立人工智能工程的伦理规范,例如要求工程师承担类似于医疗或法律专业人士的个人责任,保护公众利益。最后,各国还需要建立治理流程,以确保部署后的充分监测。

尽管各国在安全保障体系上可能有所差异,国家间仍应合作,确保体系间的互认性与可比性。

全球人工智能安全和验证的独立研究

AI 安全和验证的独立研究对于开发确保安全的高级人工智能系统至关重要。国家、慈善机构、企业、和专家应设立一系列全球人工智能安全与验证基金。这些资金应当逐步增加,直至其在全球人工智能研发支出中占据重要比例,以充分支持并增强独立研究能力。

除了人工智能安全基础研究,这些资金的其中一部分将专门用于隐私保护和安全验证方法的研究,为国内治理和国际合作提供支持。这些验证方法将允许各国可信地核实人工智能开发者的评估结果,以及他们在安全报告中指定的任何缓解措施是否到位。在未来,这些方法还可能允 许各国验证其他国家提出的相关安全声明,包括对安全保障体系的遵守情况,以及重大训练运 行的申报。

全面的验证最终可以通过多种方式进行,包括第三方治理(如独立审计)、软件(如审计跟踪)以及硬件(如人工智能芯片上的硬件支持治理机制)。为确保全球信任,跨国联合开发验证方法,并对其进行压力测试将变得尤为重要。

至关重要的一点是,全球广受信赖的验证方法,在过去曾使各国能在全球地缘政治紧张局势下,对特定的国际协议作出承诺,而它在未来也可能再次发挥同样的作用。

完整名单如下:

本文系作者 学术头条 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2024-09-23 23:04

国内期货主力合约多数上涨

2024-09-23 23:04

香港国际机场8月客货运量同比均录得两位数增幅

2024-09-23 23:02

美联储古尔斯比:当前的利率水平比中性利率高出数百个基点

2024-09-23 23:00

泛大西洋投资集团计划年底前在阿布扎比设立办事处

2024-09-23 22:49

美国银行计划在2026年底前开设超165家新分行

2024-09-23 22:47

上海阳光玫瑰价格腰斩,部分中高端水果价格大跳水

2024-09-23 22:46

今年秋冬猪肉上市量将稳定增加

2024-09-23 22:39

俄罗斯“联盟MS-25”载人飞船返回地球

2024-09-23 22:36

Stellantis:部分国家可能会出现更多裁员

2024-09-23 22:35

美国银行下调多家奢侈品公司评级

2024-09-23 22:29

规范满减、起送费等机制,外卖“新规”征求意见

2024-09-23 22:26

阿里巴巴涨超2%,股价创逾一年新高

2024-09-23 22:14

美联储官员古尔斯比:未来一年可能需要更多的降息,利率需要显著下降

2024-09-23 22:13

成都街头再现大量“氢马儿” 引发市民安全担忧,交通运输局回应

2024-09-23 22:12

远洋集团清盘聆讯延期至12月,境外债务重组债权人会议召集聆讯定于10月举行

2024-09-23 22:04

中证协公布8720名保代撤否信息,超千名保代撤否率为100%

2024-09-23 22:01

齐齐哈尔:转让自用五年以上且唯一的家庭生活用房,免征个人所得税

2024-09-23 21:56

美国9月商业活动稳定,物价压力上升

2024-09-23 21:54

美国10年期国债收益率在标普PMI数据公布后攀升至三周高点3.779%

2024-09-23 21:54

特斯拉涨幅扩大至4%,股价创两个月新高

扫描下载App

Baidu
map