美国启动人工智能安全研究所国际网络
2024年11月20日,美国商务部和国务院在旧金山联合举办国际人工智能安全研究网络(INASI)首次会议,正式宣告该网络的成立。美国人工智能安全研究所(US AISI)担任该网络的首任主席,初始成员包括澳大利亚、加拿大、欧盟、法国、日本、肯尼亚、韩国、新加坡、英国和美国。
INASI会议围绕三大主题展开,包括合成内容的风险管理、基础模型测试以及对高级AI系统的风险评估。参会成员包括来自各国的官员代表和技术专家、领先的AI行业开发人员、学者、非政府组织和公众利益集团,通过汇集政府、行业、学术界和公众的领先思想以期在AI安全和创新领域启动有意义的国际合作。会议具体内容包括:
1、签署INASI联合使命宣言
会议开始前,10个初始成员一致通过一份联合使命宣言,明确该网络旨在汇聚全球技术专家,促进对AI安全风险及其缓解措施的共同认知,并推动最佳实践的应用与共享。该网络围绕四大领域展开合作:加速推进AI安全领域的研究进程;合作制定模型测试与评估的最佳实践;促进形成如先进AI系统测试解释等共通方法论;增强全球范围内的包容性,确保信息共享。
2、投入超过1100万美元全球研究资金
随着生成式AI的兴起以及功能强大的AI模型的快速迭代,大规模合成内容变得比以往更容易、更快速且成本更低。虽然合成内容具有积极意义,但也存在诸多风险,需要加以识别、研究与防范。为推进对AI合成内容的科学研究和安全发展,INASI发起一项联合研究议程以降低潜在风险,呼吁学术界对当前研究空白进行聚焦与调查。为响应这一议程,各国政府和几家主要慈善机构已承诺投入总计超过1100万美元资金推动这项重要研究。美国AISI正在发布其第一份指导报告,确定了一系列方法以解决人工智能生成内容的风险。
3、完成首次跨国AI联合测试
会议期间,来自美国AISI、英国AISI和新加坡数字信任中心的技术专家领导完成了INASI首次联合测试。此次测试围绕多语言、国际化的AI展开,目标是在跨越语言、文化和场景的情况下,形成更稳定、可重复的AI安全测试方法。测试以Meta的Llama 3.1 405B模型为对象,重点围绕基础学术知识、“封闭领域”幻觉和多语言能力三大核心主题,为后续开展跨国测试和评估最佳实践奠定基础。
4、发布先进AI系统风险评估联合声明
INASI发布联合声明以评估先进AI系统的风险,强调风险评估应具备六项关键原则:可操作性、透明性、全面性、多方参与性、可迭代性以及可重复性。该声明基于《布莱切利宣言》和《首尔意向声明》及其他AI安全倡议成果,呼吁成员实施统一的风险评估指导方法,并为推进全球协调一致和互操作性制定路线图。
5、建立国家安全人工智能测试风险(TRAINS)工作组
为解决国家安全问题,加强美国在人工智能创新方面的领导地位,美国AISI协调来自商务部、国防部、能源部、国土安全部以及国家安全局和国立卫生研究院的专家组建国家安全人工智能测试风险工作组。该工作组将在关键的国家安全和公共安全领域,如辐射和核安全、化学与生物安全、网络安全、关键基础设施、常规军事能力等,对先进AI模型进行协调研究和测试。
国际人工智能安全研究网络的成立将推动全球范围内安全、可靠和值得信赖的人工智能创新的科学基础。 (李宏 赵梦珂)