分享好友 最新动态首页 最新动态分类 切换频道
2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用
2024-12-27 00:37

点击蓝字

2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用


圆桌讨论



尼塔山·拉库马尔(Nitarshan RAJKUMAR)提到,模型级别的安全性与应用级别的安全性之间存在区别。就像人们将充电器插入插座时,不会关心供电问题或者其他极端风险,而只关心这个充电器到底能不能正常工作。


阿葡丽尔·钱(April CHIN)将基础模型类比为“微型核反应堆”,把实际应用比作通过“微型核反应堆”来为电灯泡供电。对于基础模型,需要确保其按预期运行,防范各种潜在风险,规避灾难性后果。而对于实际应用,则需要确保其不会在多种文化背景下产生偏见、歧视和不良后果。


罗宾·韦斯顿(Robin WESTON)倾向于认为两者之间的关联度不高,因为基础模型的安全验证对人工智能应用安全的检测是否具有帮助,不得而知。并且在实际应用阶段,如果加入太多检查和防护措施,反而会打破产品开发的连贯性和减缓开发速度,在客观上降低产品质量。



尼塔山·拉库马尔(Nitarshan RAJKUMAR)赞同到,对于下游应用者而言,他们更关注的是市场需求和产品销售。对于他们而言,安全问题理论上是国家和社会层面的范畴,应由政府部门和相应机构对此负责,由他们进行评估,保这些技术不会带来巨大风险。当然,应用者也会认为即便自己对此有责任,也不具备相应的能力,无法像监管者那样可以确保这些技术不会被恶意使用。


阿葡丽尔·钱(April CHIN)提到,应用者希望通过安全测试帮助他们和客户建立起对人工智能技术的信任基础。应用者可以借此更好地弥合学术基准和业务基准的差距,同时也能更好地向治理部门和客户证明这个系统足够安全,从而使产品顺利投入使用。


罗宾·韦斯顿(Robin WESTON)以自己工作为例,提到其更专注于为客户提供数字化的解决方案比如构建技术系统,因此大部分精力会花在如何确保系统的正常运行,只有20%的精力会放在基础模型安全性的问题上



尼塔山·拉库马尔(Nitarshan RAJKUMAR)认为,值得肯定的是现在对于安全问题的关注越来越大,很多像自己这样的技术专家正在逐渐将关注点转移到政策和治理领域。目前来看,提高安全性的关键还在于是否能提高模型的透明度,因为政府和社会能借此更好掌握技术实际发展水平和提前发现大规模风险出现的迹象。但同时,一些看似可行的方法实际上还存在挑战性,比如测试阶段的重点测试对象就很难明确,正如尼塔山·拉库马尔曾一度认为错误信息和虚假信息将是公众最关心的问题和风险,然而结果却并非如此。


阿葡丽尔·钱(April CHIN)提出,关键在于让所有相关方(模型提供者、使用者、监管机构等)在技术生命周期中具有清晰的责任和协议,确保每个环节都能做到风险最小化。不仅是对基础模型本身进行安全性测试,还包括对基础模型在实际应用中的表现进行持续监控和改进,从而确保其在不同情境下都是安全、可靠,且符合法律和伦理要求。


罗宾·韦斯顿(Robin WESTON)表示,人们需要找到一种测试方式,既能保持技术发展速度,又能明确重点风险领域,同时还要考虑到系统延迟的实际情况。此外,确保模型安全不仅在于保证模型本身的安全,还要考虑到边界条件、护栏等与模型进行互动的部分。




新浪微博:@清华大学人工智能国际治理研究院

微信视频号:THU-AIIG

Bilibili:清华大学AIIG


最新文章
逾期通讯录消除攻略:如何有效处理不良记录,恢复信用?
1. 到相关的逾期联系人管理平台或应用。2. 找到逾期联系人的列表,常常这些列表会在“逾期管理”或“联系人管理”等板块中。3. 选中您想要撤销的逾期联系人。4. 点击“编辑”或“管理”按,进 系人的详细信息页面。5. 查找“撤销逾期”或“
长沙十大网络舆情公关公司排名揭晓:为城市形象护航
在当今信息高速传播的时代,网络舆情的影响力日益凸显。长沙,这座充满活力的城市,也有着一批专业的网络舆情公关公司,在维护城市形象和企业声誉方面发挥着重要作用。长沙网络舆情公关公司具备先进的舆情监测技术。他们能够实时监控各类网
超好用:免费好用的图床
经常写文章的小伙伴可能会头疼,图片需要一张一张的上传,费劲也耗时,今天就推荐几款超简单的图床工具。图床就是一个在网络上存储图片的地方,目的是为了节省本地服务器空间,加快图片打开速度。话不多说,进入正题。永久存储免注册,图片
探秘系统设计界面神器,打造精美交互界面
在当今数字化浪潮汹涌澎湃的时代,系统设计界面的质量直接关乎用户与软件、平台交互的顺畅性与愉悦感。一款出色的系统设计界面软件,犹如一位幕后的魔法大师,能够将设计师的创意灵感精准地转化为直观、实用且富有魅力的用户界面。无论是打
魔音工坊的文案制作过程融合了先进的人工智能技术和大数据分析,为客户提供了一种全新的文案创作体验。以下是具体步骤和优化后的
在数字化时代人工智能的应用已经渗透到各行各业文案创作也不例外。魔音工坊作为一家专注于音频制作和文案生成的企业凭借其特别的技术,为广大创作者提供了高效、便捷的文案生成解决方案。本文将深入探讨魔音工坊的文案制作过程,揭示其背后
淘宝店铺该应该如何补单才会迅速的提升排名?
五、成交额=客单价成交笔数,成交笔数=流量转化率,流量=直通车投入费用/平均点击费用六、利润=营业额利润率=客户价格成交笔数利润率=客户价格流量转换率利润率=客户价格转换率转换率开通费用/平均点击费用在综合排名中,店铺质量得分会影
重磅通报“正宗南通长牌怎么开挂”玩家曝光开挂详情-知乎
您好:正宗南通长牌这款游戏可以开挂,确实是有挂的,咨询加微信【5722507】很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实
抖音直播的5种主流玩法
抖音直播的主流玩法有哪些,抖音是时下特别热门的营销平台,那么在直播方面有哪些主流玩法呢。一起来看看下面的介绍吧。1、 模式分析:兴趣电商+Tiktok选择联盟,即商家在选择联盟中选择高佣金产品,使用直播内容(如前文写的跑步)激发观
苹果手机最好用的浏览器【手机最好用的浏览器 知乎】
有时候我们在手机上看视频或听音乐时,遇到好的在线资源想下载回来,这时就需要用到嗅探功能去找到资源的真实地址,再把它下载到手机里。带有这种功能的浏览器在安卓系统的手机里比比皆是,但苹果手机里却是凤毛麟角,不是功能不够好,就是
相关文章
推荐文章
发表评论
0评