AI每日速递:2025年5月31日——AI演进速度加快
AI领域正在以前所未有的速度发生转变,这一主题在今天的新闻中得到了广泛回应。从多模态AI推理的重大飞跃到科技巨头的雄心勃勃的目标,发展速度超过了以往的技术革命。…
AI领域正在以前所未有的速度发生转变,这一主题在今天的新闻中得到了广泛回应。从多模态AI推理的重大飞跃到科技巨头的雄心勃勃的目标,发展速度超过了以往的技术革命。…
本文是对AI领域近期重要文章 **MMSI-Bench: A Benchmark for Multi-Image Spatial Intelligence** …
本文是对AI领域近期重要文章 **Argus: Vision-Centric Reasoning with Grounded Chain-of-Thought*…
AI领域持续快速发展,多模态模型的进步、创新的评估技术以及对AI生成内容失控潜在风险的警示,共同构成了今天的亮点,展现了该领域的令人兴奋的进展和严峻挑战。 对多…
本文是对AI领域近期重要文章 **Launch HN: MindFort (YC X25) – AI agents for continuous pentest…
本文是对AI领域近期重要文章 **3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D La…
今天的AI领域一片繁荣,各行各业都在取得进展。从增强的安全测试到计算机视觉的创新方法,再到大型语言模型(LLM)的持续改进,新闻都突显了创新的快速步伐。许多发展…
今天的AI领域捷报频传,各个方面都取得了进展。从提高多智能体LLM的可靠性到加速模型训练,甚至探索用户与AI应用程序交互的新方法,该领域持续快速发展。 最令人兴…
本文是对AI领域近期重要文章 **Silence is Not Consensus: Disrupting Agreement Bias in Multi-Ag…
本文是对AI领域近期重要文章 A Convergence Theory for Diffusion Language Models: An Informatio…
今天的AI新闻主要集中在大语言模型(LLM)的进步上,重点是提高效率、增强推理能力,并将它们的应用扩展到更复杂和多样化的任务中。几篇研究论文和行业公告表明,这是…
本文是对AI领域近期重要文章 It’s High Time: A Survey of Temporal Information Retrieval …
本文是对AI领域近期重要文章 On Path to Multimodal Historical Reasoning: HistBench and HistAge…
本文是对AI领域近期重要文章 RedAHD: Reduction-Based End-to-End Automatic Heuristic Design wit…
今天的AI新闻展示了几个关键领域的显著进步:增强的推理能力、训练效率的突破以及多模态AI系统的重大进展。总体趋势表明AI应用将更加强大、高效和通用。 其中最引人…
今天的AI新闻显示出一种向更强大、更通用的模型发展的趋势,多模态能力和高效模型融合方面取得了重大进展。主要主题是超越自回归架构,寻求提高训练和推理效率,并专注于…
今天的AI世界一片繁忙,展示了从解决复杂优化问题到征服历史推理挑战等一系列应用的进步。几篇关键的研究论文强调了大型语言模型(LLM)日益增长的复杂性和它们与其他…
今天的AI新闻展示了多模态模型能力和高效模型融合技术的重大进展。研究人员正在突破大型语言模型(LLM)的可能性边界,并探索新的训练方法以提高其性能和效率。 几篇…
Transformer 对自然语言处理 (NLP) 和计算机视觉 (CV) 的变革性影响是不可否认的。它们的扩展性和有效性推动了这些领域的进步,但这些模型日益增…
近期诺贝尔奖表彰了蛋白质发现领域的突破性进展,突显了基础模型 (FM) 在探索巨大组合空间中的变革潜力。这些模型有望彻底改变众多科学学科,然而,人工生命 (AL…
图形处理巨头英伟达计划通过预计于2025年上半年推出的Jetson Thor紧凑型计算平台,进一步进军机器人领域。这款专为人形机器人设计的平台,最初由《金融时报…
Meta AI在2024年末推出的两项突破性研究计划正在挑战支撑大多数当前大型语言模型 (LLM) 的基本下一个token预测范式。字节级Transformer…
在AI视频生成领域引发最初热潮仅仅一年后,竞争格局据报道正在发生重大转变。焦点正从单纯实现视频生成能力转向证明盈利能力的重大挑战。这种演变似乎正在削弱OpenA…
大型语言模型领域的重要参与者DeepSeek AI最近发表了一篇研究论文,详细介绍了一种旨在增强通用奖励模型 (GRM) 在推理阶段可扩展性的新技术。同时,该公…
中国北京 – 2025年4月15日 – 为凸显其技术实力和全球雄心,并为未来潜在的IPO铺平道路,中国人工智能公司智谱AI宣布全面开源其下一代通用语言模型 (G…
OpenAI的o1系列和DeepSeek-R1的显著成功,已无可辩驳地证明了大规模强化学习(RL)在引出复杂的推理行为和显著增强大型语言模型(LLM)能力方面的…
DeepSeek AI宣布发布DeepSeek-Prover-V2,这是一个突破性的开源大型语言模型,专门为Lean 4环境中的形式化定理证明而设计。最新版本在…
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能…
与Expedia集团首席营销官乔晨·科迪克的对话 原文链接: https://openai.com/index/expedia-jochen-koedijk
DeepSeek-V3团队(首席执行官梁文峰为共同作者)发布了一篇14页的技术论文,阐述了“AI架构的扩展挑战与硬件反思”。这篇后续技术报告深入探讨了大型语言模…
Codex是一个基于云的编码代理。Codex由codex-1驱动,它是针对软件工程优化的OpenAI o3版本。codex-1使用强化学习在各种环境下的真实世界…
隆重推出 Codex:一款基于云的软件工程代理,能够并行处理多种任务,由 codex-1 提供支持。借助 Codex,开发人员可以同时部署多个代理,以独立处理编…
在我们的年度开发者大会上,我们宣布了如何通过 Gemini 使 AI 更加有用。 原文链接: https://blog.google/technology/ai…
了解 Google AI 模式下新的购物功能,以及一款可使用个人照片进行虚拟试穿的新工具。 原文链接: https://blog.google/products…
从 Imagen 4 和 Veo 3 到 Flow,今天就试试这些新的生成式媒体工具吧。 原文链接: https://blog.google/technolog…
今天在 I/O 大会上,我们展示了如何通过 AI 模式使用最新的 Gemini 模型来增强搜索功能。 原文链接: https://blog.google/pro…
Google I/O 2025 充满了大量的公告、诸多发布和丰富的演示!如果你仍意犹未尽,可以深入了解…… 原文链接: https://blog.google/…
为所有人打造 AI 产品家族。 原文链接: https://openai.com/sam-and-jony
Responses API 的新功能:远程 MCP、图像生成、代码解释器等等。借助 GPT-4o 和 o 系列模型,赋能更快、更智能的代理,并增加了可靠性和效率…
了解谷歌2025 I/O开发者大会上最重要的公告和发布。 原文链接: https://blog.google/technology/ai/google-io-2…
我们即将推出星门阿联酋——这是OpenAI人工智能基础设施平台星门的首次国际部署。 原文链接: https://openai.com/index/introdu…
今天,我们启动了面向利用人工智能支持政府并改善社区服务的初创企业的全新Google for Startups计划的申请。增长…… 原文链接: https://b…
CodeRabbit 利用 OpenAI 模型彻底改变代码审查——提高准确性,加快 PR 合并速度,并帮助开发人员更快地交付产品,减少 bug,提高投资回报率。…
谷歌研究的“绿色通行计划”旨在利用人工智能降低交通排放,现已扩展到波士顿的114个路口。这项技术利用人工智能和Go…… 原文链接: https://blog.g…
参加这个关于 Google I/O 2025 的小测验,看看你对今年 I/O 大会上发布的内容了解多少。 原文链接: https://blog.google/t…
OpenAI宣布在德国慕尼黑开设其首个办事处。 原文链接: https://openai.com/index/openai-deutschland
我们将用基于OpenAI o3的版本替换现有的基于GPT-4o的Operator模型。API版本将继续基于4o。 原文链接: https://openai.co…
OpenAI刚刚完成了其迄今为止最大的一笔收购,以65亿美元全股票交易收购了Jony Ive和Sam Altman秘密的设备创业公司io。Ive,这位传奇设计师…
微软公司声称,其最新的AI模型之一能够准确预测空气质量、飓风、台风以及其他与天气相关的现象。在本周发表在《自然》杂志上的一篇论文和一篇配套博客文章中,微软详细介…
OpenAI正在更新为Operator提供动力的AI模型,Operator是一款能够自主浏览网页并在云托管虚拟机中使用特定软件来满足用户请求的AI代理。不久,O…
许多现实世界的问题需要跨多个尺度进行推理,这需要模型不仅作用于单个数据点,而且作用于整个分布。我们引入了生成分布嵌入(GDE),这是一个将自动编码器提升到分布空…
WonderPlay是一个新颖的框架,它集成了物理模拟和视频生成,可以从单张图像生成动作条件的动态3D场景。虽然先前的工作局限于刚体或简单的弹性动力学,Wond…
我们介绍了一种快速有效的基于区域的图像表示生成模型——区域编码器网络 (REN),该模型使用点提示。最近的方法将与类别无关的分割器(例如,SAM)与基于patc…
伦理决策是人类判断的关键方面,而大型语言模型 (LLM) 在决策支持系统中的应用日益广泛,因此需要对其道德推理能力进行严格评估。然而,现有的评估主要依赖于单步评…
上周,埃隆·马斯克的AI聊天机器人Grok出现了一个bug,导致它即使在与该主题无关的问题提示下,也会向用户讲述南非的种族灭绝阴谋论……不久之后,Grok对大屠…
Mistral AI,这家法国公司开发了AI助手Le Chat和多个基础模型,正式被认为是法国最有前景的科技初创公司之一,可以说是唯一一家能够与OpenAI竞争…
风险投资家一直专注于投资利用技术来颠覆既有行业或创造全新商业类型的公司。但一些风投开始改变其投资风格。他们不再资助初创企业,而是收购成熟的企业——例如呼叫中心、…
19岁的泰迪·华纳一直对机器人技术很感兴趣。他的家族从事相关行业,他说自己高中时期就在机械加工厂工作。现在,华纳正在创建他自己的机器人公司Intempus,致力…
TechCrunch Disrupt 2025 的早鸟票价优惠只剩最后 24 小时啦!活动将于 10 月 27 日至 29 日在旧金山的莫斯康展览中心西馆举行。…
距离TechCrunch Disrupt 2025门票高达900美元的优惠活动仅剩48小时——第二张门票可享90%折扣。太平洋时间5月25日晚上11:59之后,…
我们认为,整理一份词汇表,对我们文章中使用的一些最重要的词语和短语进行定义,会很有帮助。 原文链接: https://techcrunch.com/2025/0…