OpenAI 悬赏 2.5 万美元生物漏洞，挑战研究人员“越狱”GPT-5 | 谷歌消费级AI及新设 5000 万美元基金

2025-09-11 AIFlare

一个标有“GPT-5”字样的数字锁被攻破，上面写有2.5万美元的赏金字样，这代表着OpenAI为研究人员设立的生物安全漏洞赏金挑战，以及谷歌在人工智能领域的发展。

今日看点

OpenAI已推出一项生物漏洞赏金计划，挑战研究人员为其即将推出的GPT-5模型寻找“通用越狱”提示，奖金最高达25,000美元。
作为其安全工作的重要补充，OpenAI 还推出了 SafetyKit，这是一项由 GPT-5 驱动的新解决方案，旨在加强内容审核并执行合规。
谷歌人工智能宣布了面向消费者的新功能，其中包括用于照片编辑的“Ask Anything”和“Remimagine”，这些功能于八月随新款Pixel设备的集成一同亮相。
OpenAI 设立了一笔 5000 万美元的“以人为本AI基金”，旨在向致力于推动教育、社区创新和经济机会发展的美国非营利组织提供无限制的资助金。
Hacker News 上出现了一场引人注目的技术讨论，内容是关于在 LLM 推理中击败非确定性的策略，这对于可靠的 AI 系统开发至关重要。

主要动态

2025年9月11日的AI格局，由OpenAI在AI能力方面以及或许更重要的是在AI安全方面的积极推动所主导。OpenAI采取了一项大胆举措，预示着GPT-5的即将到来，并彰显了公司对稳健安全的承诺，为下一代大型语言模型GPT-5启动了一个“生物漏洞赏金”计划。研究人员被邀请对模型进行压力测试以寻找漏洞，特别是寻找可能绕过其安全协议的“通用越狱提示”。这项高风险挑战提供高达25,000美元的奖励，突显了OpenAI在预防滥用和确保其强大新型AI的伦理部署方面所给予的极大重视。这是一项积极主动的措施，不仅旨在强化GPT-5，还在人们对AI对齐和安全日益增长的担忧中，公开展示了其致力于负责任AI开发的决心。

这项漏洞赏金计划并非OpenAI近期唯一的安全举措。该公司还宣布了“随新模型发布更智能代理”的计划，并推出了SafetyKit。SafetyKit利用GPT-5本身的先进能力，被定位为一个突破性的解决方案，旨在彻底改变内容审核，增强合规框架，并以其卓越的准确性和效率显著超越传统安全系统。这种双重方法——通过漏洞赏金进行主动的外部测试以及集成的、AI驱动的内部解决方案——凸显了OpenAI管理日益智能的AI模型所伴随的复杂风险的综合策略。

与此同时，Google AI继续不懈地致力于将先进AI融入日常消费者体验。八月份的最新公告展示了“随心所问”（Ask Anything）和“通过提示重新构想您的照片”（Remimagine your photos with a prompt）等令人兴奋的新功能，表明其强烈关注直观、用户友好的交互。这些功能通过一系列截图帧展示，并与新的Pixel设备相结合，强调了谷歌将复杂的AI工具变得触手可及、并无缝集成到其硬件生态系统中的战略，将生成式AI的力量直接带给数百万人。

除了即时产品发布和安全协议之外，OpenAI还透露了一项重要的慈善事业：一个5000万美元的“以人为本的AI基金”。这项倡议旨在支持致力于推动教育、社区创新和经济机会的美国非营利组织。该基金现已开放申请，提供非限制性赠款，截止日期为2025年10月8日，它代表了一种承诺，即确保AI的利益得到广泛分配，并确保社区在为公共利益塑造AI方面拥有发言权，从而解决这项变革性技术的社会影响。

最后，在技术方面，AI社区正热烈讨论一篇在Hacker News上发表的题为“击败大型语言模型推理中的非确定性”（Defeating Nondeterminism in LLM Inference）的文章。这项深入探讨可靠AI系统面临的基础挑战的文章，指出了正在进行的努力，旨在使大型语言模型更具可预测性和一致性，这对于企业采纳以及可重复结果至关重要的关键应用而言，是至关重要的一步。对这些核心技术障碍的持续关注表明，尽管面向公众的应用和安全协议占据了新闻头条，但基础研究对于AI领域的长期成熟仍然至关重要。

分析师视角

今天的新闻描绘了一幅人工智能行业正在努力应对其不断加速的能力，并在创新与日益增长的责任之间取得平衡的图景。OpenAI针对GPT-5安全采取的积极立场，包括公开漏洞赏金计划和内部SafetyKit，表明他们清楚地认识到下一代AI需要前所未有的审查。这不仅仅是为了防止危害，更是为了建立信任，而信任对于AI的广泛采用至关重要。另一方面，谷歌以消费者为中心的进步揭示了将AI融入日常生活的紧迫商业需求。整个行业正达到一个转折点，宏大的研究抱负与实际应用以及严重的社会影响在此交汇。OpenAI设立的5000万美元慈善基金，正是对这些更广泛影响的回应。关注GPT-5漏洞赏金的结果将如何塑造公众对AI安全的认知和监管讨论，以及对抗非确定性的技术挑战将如何为更可靠、企业级的AI解决方案铺平道路。这场竞赛不再仅仅是关于谁能构建最好的AI，而是关于谁能负责任地构建它。

内容来源

Read English Version (阅读英文版)

AI Flare

抓住下一波人工智能浪潮