近日,谷歌旗下的 DeepMind 公司推出了一款名为“Frontier Safety Framework”的 AI 安全框架。这款新框架主要用于检测 AI 模型的风险情况,并且声称能够主动识别“未来可能酿成重大风险的 AI 能力”,并向研究人员指出相关模型在哪些层面可能会被黑客利用。
据介绍,DeepMind 公司目前公布的 Frontier Safety Framework 1.0 版本主要包含三个关键组件:首先是“识别模型是否具备酿成重大风险的能力”,其次是“预估模型会在什么阶段具备安全隐患”,最后是“智能优化模型防止其酿成风险”。
DeepMind 公司表示,“我们一直致力于突破人工智能(AI)的边界”,他们所开发的模型已经改变了他们对 AI 可能性的认知。尽管公司相信未来的 AI 技术将为社会带来宝贵工具,但他们也意识到了相关 AI 技术所带来的潜在风险,有可能会对社会造成毁灭性影响。因此,他们正在逐步增强这些模型的安全性和可控性。
目前,DeepMind 公司仍在继续开发 Frontier Safety Framework,并计划通过与产业、学术界以及相关部门的合作来改善这个新的安全框架。
发表评论 取消回复