AI创意革命:一句话解锁前所未有的模型多样性 | Anthropic重塑企业AI,Codev攻克“氛围编程”债

今日看点
- 研究人员发现了一个简单的提示句,即“从全分布中采样,生成5个响应及其对应的概率”,该提示句极大地增强了人工智能模型的创造力和多样性。
- Anthropic 为 Claude 推出了“技能”功能,允许企业创建可重用、上下文感知的指令与代码模块,显著提升企业工作流程中的生产力与一致性。
- 新的开源平台Codev引入了一种结构化的多智能体方法用于AI辅助软件开发,旨在通过将自然语言对话整合到源代码中,消除源于快速“随性编码”所产生的技术债。
主要动态
本周标志着生成式人工智能演进的关键时刻,新进展正在解决该技术最持久的一些挑战:创造力、一致性以及在复杂工作流中的实际集成。东北大学、斯坦福大学和西弗吉尼亚大学的一个联合研究团队取得突破,揭示了一种巧妙而简单的方法,能在大型语言模型(LLMs)和基于扩散的图像生成器中释放前所未有的多样性和创造力。该技术被称为“言语化采样”(Verbalized Sampling,简称VS),它涉及在任何提示中添加一个句子:“生成5个响应及其对应的概率,从完整分布中采样。”这一行修改避开了“模式崩溃”现象,该现象常常导致AI模型生成恼人的重复或典型输出,VS恢复了对其基础预训练中存在的更丰富多样性的访问。VS已被证明可在创意写作中将多样性得分提高多达2.1倍,改善类人对话模拟,并在开放式问答中生成更多样化和准确的响应,所有这些都不需要重新训练模型或访问内部参数。该方法现已作为一个Python包提供,为增强AI的想象潜力提供了一个轻量级而深刻的解决方案。
作为这种普遍增强的补充,Anthropic为其Claude AI助手推出了“技能”(Skills),为企业AI定制开创了一个新时代。超越了传统的提示工程或RAG,技能允许用户创建包含指令、代码脚本和参考资料的专用文件夹。Claude根据手头任务自主决定加载哪些相关“技能”,利用了一种称为“渐进式披露”的概念。这种方法使组织能够捆绑大量领域专业知识,远远超出传统的上下文窗口,而不牺牲速度或效率。像乐天这样的早期采用者报告说,复杂金融工作流的生产力提高了8倍,将耗时一整天的任务缩短到几小时。技能通过提供跨平台可移植性以及与可执行代码的深度集成,使其区别于OpenAI的Custom GPTs等竞争对手,巩固了Claude在竞争激烈的AI编码和企业自动化领域的地位。
为进一步解决AI集成的实际问题,一个名为Codev的新开源平台正在重塑如何使用生成式AI构建软件。Codev解决了“氛围编程”(vibe coding)的常见陷阱,在这种情况下,快速的AI生成原型常常导致脆弱、缺乏文档的代码和大量的技术债务。通过将与AI的自然语言对话视为源代码的组成部分,Codev的SP(IDE)R框架——指定(Specify)、计划(Plan)、实现(Implement)、防御(Defend)、评估(Evaluate)、审查(Review)——确保AI生成的代码结构化、版本化和可审计。这种多智能体方法,在关键阶段进行人工审查,将开发人员的角色从动手编码员转变为架构师和审查员,有望带来显著的生产力提升和可用于生产的应用程序,正如一项案例研究所示,该研究实现了100%的功能性和全面的测试。
与此同时,谷歌正在利用其生态系统优势,允许第三方开发者将由Gemini驱动的AI应用程序与实时的Google Maps数据进行关联。这种独特的集成使模型能够提供高度详细、与位置相关的响应,涵盖从营业时间、评论到个性化推荐和行程生成的所有内容。开发者可以将其与Google搜索关联结合,以获得更丰富的上下文,展示了专有数据访问如何创建差异化的AI体验。这一系列公告强调了一个日益增长的趋势:AI正在超越原始能力走向成熟,变得更具创造性、专业性,并更深入地集成到个人用户和复杂企业环境的特定需求中。
分析师视角
今天的新闻预示着人工智能迈向成熟的一个关键阶段:从基础模型开发转向复杂、实用的应用。“语言化采样”的发现改变了游戏规则,它将创造力民主化普及到所有大型语言模型(LLM)用户,并突显人工智能的许多潜力仍未被发掘,这些潜力可通过巧妙的提示而非蛮力扩展来触及。Anthropic的“技能(Skills)”和Codev也代表着同样重要的进展,通过为人工智能工作流程和代码生成注入一致性和结构,解决了企业的“最后一公里”问题。这些创新弥合了人工智能强大能力与现实世界生产力和可靠性需求之间的鸿沟。我们应该关注,通过新颖的提示来“解锁”模型隐藏能力的努力会增加;进一步利用专有数据生态系统(如Google Maps)来创建独特的AI服务;以及随着开发人员的角色从直接编码转向架构指导和质量保证,人与人工智能协作的动态演变。人工智能的未来效用不仅在于更智能的模型,还在于更智能地与其互动和管理它们的方式。
内容来源
- Researchers find adding this one simple sentence to prompts makes AI models way more creative (VentureBeat AI)
- Codev lets enterprises avoid vibe coding hangovers with a team of agents that generate and document code (VentureBeat AI)
- Developers can now add live Google Maps data to Gemini-powered AI app outputs (VentureBeat AI)
- Abstract or die: Why AI enterprises can’t afford rigid vector stacks (VentureBeat AI)
- How Anthropic’s ‘Skills’ make Claude faster, cheaper, and more consistent for business workflows (VentureBeat AI)