一句话激发LLM创造力, Codev驾驭“Vibe Coding”, 谷歌地图赋能Gemini应用, Strella助推AI研究

今日看点
- 研究人员发现了一种简单的提示词修改,称之为“口头化采样”,它通过规避模式塌陷,在无需重新训练的情况下,显著提高了LLM输出的多样性和创造力。
- Codev 推出了一个开源平台,该平台利用多智能体AI团队,将自然语言规范转化为结构化、版本化的代码,旨在消除“凭感觉编程”所产生的技术债。
- 谷歌现在允许开发者将实时的谷歌地图数据直接集成到 Gemini AI 应用中,从而实现极其准确、具备位置感知能力的响应,适用于广泛的实际用例。
- Strella 获得了 1400 万美元,用于扩展其人工智能客户研究平台。该平台通过进行语音访谈,提供更快、更真实的反馈,并包含独特的移动屏幕共享功能。
主要动态
本周人工智能领域,焦点转向如何从生成模型中发掘更大的效用和更高的精度,这包括从简单的提示词技巧到复杂的企业级平台。或许最容易实现的突破来自一个研究团队,他们发现只要在AI提示词中添加一句话——“生成5个响应及其对应的概率,从完整分布中采样。”——就能让大型语言模型(LLM)和图像生成器显著提高创造力,减少重复性。这种被称为“口头化采样”(Verbalized Sampling, VS)的方法,直接对抗了“模式崩溃”(mode collapse)现象,即模型倾向于输出最典型结果。通过将内部概率分布“口头化”,GPT-4和Gemini等模型现在可以生成更多样化、更接近人类的响应,从而增强创意写作、对话模拟、开放式问答和合成数据生成能力。这项创新无需重新训练或访问内部参数,只需重新措辞用户查询,并且在更大规模的模型上表现更佳。
与此同时,软件开发领域正在应对“即兴编程”(vibe coding)的挑战——由AI促进的快速原型开发常常导致代码脆弱且缺乏文档。一个新的开源平台Codev提出了一种解决方案,它将自然语言对话视为源代码本身不可或缺的一部分。它的SP(IDE)R框架引导多智能体AI团队进行规格制定、规划、实施、防御(测试)、评估和审查,并在关键节点进行人工监督。这种结构化方法(Codev自身就是用它构建的)有望开发出可用于生产环境的应用程序,大幅提高生产力和代码质量,有效地将自然语言“编译”成代码,并重新定义开发者的角色,使其成为架构师和审阅者。
谷歌利用其独特资产,采取了一项重要举措,为Gemini AI开发者引入了一项新功能:利用实时谷歌地图数据为模型提供基础。这使得应用程序能够通过调用超过2.5亿个地点的信息,提供详细的、与位置相关的响应,从而增强本地搜索、旅行规划和房地产服务。开发者可以通过Gemini API集成此功能,并将其与谷歌搜索基础相结合,以获取更丰富的上下文信息。该功能使应用程序能够提供以前无法实现的、事实准确且具有深度上下文的信息,尽管谷歌强调需谨慎注明来源,且仅在地理环境相关时才使用。
最后,客户研究领域正被Strella重塑,这家初创公司最近在A轮融资中筹集了1400万美元。Strella的人工智能平台自动化并加速了客户访谈过程,将过去需要数周的工作压缩到几天内完成。其基于语音的AI主持人进行访谈、综合分析结果,甚至能检测欺诈行为。令人惊讶的是,据报道,参与者对AI主持人提供的反馈比对人类主持人更诚实,从而获得了更丰富的洞察。Strella的移动应用程序还提供独特的持久屏幕共享功能,使研究人员能够实时观察用户与应用程序的互动,为移动体验研究开辟了新途径,并使企业能够更广泛地获取客户洞察。
分析师视角
本周新闻突显了人工智能的一个关键转折点:从原始计算能力成熟为复杂、以用户为中心的应用。“口语化采样”方法是一个颠覆性的创新,它表明大型语言模型(LLM)的许多潜在能力被当前的提示范式所限制。这凸显了提示工程作为一项核心技能日益增长的重要性。另一方面,Codev 则展现了企业向代理式AI转变的趋势,以实现结构化、可审计的工作流程,直接解决了早期AI开发应用中的“技术债”挑战。谷歌Gemini在地图上的落地应用,展示了专有数据和生态系统整合的战略优势,在竞争激烈的市场中提供了显著的差异化。Strella 的成功,尤其是关于参与者对AI保持诚实度的发现,预示着未来AI将促进更深入、更无偏见的人类反馈。贯穿始终的主线是,人们越来越关注人类与AI如何协作、优化和互动以取得实际成果,从而超越通用能力,转向高度专业化和有影响力的应用。
内容来源
- Researchers find adding this one simple sentence to prompts makes AI models way more creative (VentureBeat AI)
- Codev lets enterprises avoid vibe coding hangovers with a team of agents that generate and document code (VentureBeat AI)
- Developers can now add live Google Maps data to Gemini-powered AI app outputs (VentureBeat AI)
- Amazon and Chobani adopt Strella’s AI interviews for customer research as fast-growing startup raises $14M (VentureBeat AI)
- Should AI do everything? OpenAI thinks so (TechCrunch AI)