这是Chroma团队的最新研究结论,他们用升级版“大海捞针”(NIAH)测试了包括GPT-4.1、Claude 4、Gemini 2.5和Qwen3等在内的18个开源和闭源的主流大模型。这是Chroma团队的最新研究结论,他们用升级版“大海捞针”(NIAH)测试了包括GPT-4.1、Claude 4、Gemini 2.5和Qwen3等在内的18个开源和闭源的主流大模型。
QLExpress 是阿里巴巴开源的动态脚本引擎,专为电商场景设计。它的核心能力就是动态执行脚本,支持 Java 语法,还能调用 Java 对象和方法。简单来说,你可以把复杂的业务逻辑写成脚本,让 QLExpress 帮你执行,就像在 Java 代码里嵌入了一个 “小脑袋”,专门处理变化频繁的规则。QLExpress 是阿里巴巴开源的动态脚本引擎,专为电商场景设计。它的核心能力就是动态执行脚本,支持 Java 语法,还能调用 Java 对象和方法。简单来说,你可以把复杂的业务逻辑写成脚本,让 QLExpress 帮你执行,就像在 Java 代码里嵌入了一个 “小脑袋”,专门处理变化频繁的规则。
当 LLM 仍在“翻聊天记录”找答案时,MIRIX 已把 3 万张截图塞进 15 MB,并记住你是谁——记忆不再是缓存,而是你的下一份可交易资产。当 LLM 仍在“翻聊天记录”找答案时,MIRIX 已把 3 万张截图塞进 15 MB,并记住你是谁——记忆不再是缓存,而是你的下一份可交易资产。
这一章,我们不再浮于表面,不再喊口号,不再说“Transformer很强”,“注意力是核心”这种说了等于没说的废话,而是撸起袖子,从最基本的构件开始,一点点拼出这个神奇架构的模样,带你看懂它、拆解它、理解它的工作逻辑。这一章,我们不再浮于表面,不再喊口号,不再说“Transformer很强”,“注意力是核心”这种说了等于没说的废话,而是撸起袖子,从最基本的构件开始,一点点拼出这个神奇架构的模样,带你看懂它、拆解它、理解它的工作逻辑。
在科技圈,沉寂颇久的孙正义又扔下了一颗重磅炸弹。他公开表示,打算在今年于软银集团内部部署 10 亿个 AI 智能体,还要给这些智能体设计专门的操作系统。在科技圈,沉寂颇久的孙正义又扔下了一颗重磅炸弹。他公开表示,打算在今年于软银集团内部部署 10 亿个 AI 智能体,还要给这些智能体设计专门的操作系统。
今天给大家推荐一个自己近期整理的项目 ——Awesome-Chunker,一站式聚合并复现了当下主流的文本分块技术,从经典方法到前沿算法应有尽有,助你在 RAG 开发中少走弯路!今天给大家推荐一个自己近期整理的项目 ——Awesome-Chunker,一站式聚合并复现了当下主流的文本分块技术,从经典方法到前沿算法应有尽有,助你在 RAG 开发中少走弯路!
美国对生成式AI的应用,堪比当年个人PC电脑和互联网普及的历程。美国对生成式AI的应用,堪比当年个人PC电脑和互联网普及的历程。
CoLLabLLM通过多轮对话模拟和多轮感知奖励,使模型能够预测自身响应对未来交互的影响,从而给出更准确的结果提升用户体验。CoLLabLLM通过多轮对话模拟和多轮感知奖励,使模型能够预测自身响应对未来交互的影响,从而给出更准确的结果提升用户体验。
作者从OpenAI的企业文化,技术栈揭秘,以及在OpenAI用7天时间打造编程代理code x 的故事,让我们首次得以窥见OpenAI内部,非常值得一看。作者从OpenAI的企业文化,技术栈揭秘,以及在OpenAI用7天时间打造编程代理code x 的故事,让我们首次得以窥见OpenAI内部,非常值得一看。
在刚刚爆出被小扎挖走,加入meta超级智能实验室后,Jason Wei 连发两篇文章,一篇是关于 AI 发展的核心驱动力公式——“验证者定律”,另一篇则是从强化学习中悟出的人生哲学——“人生要走 On-Policy 路线”。在刚刚爆出被小扎挖走,加入meta超级智能实验室后,Jason Wei 连发两篇文章,一篇是关于 AI 发展的核心驱动力公式——“验证者定律”,另一篇则是从强化学习中悟出的人生哲学——“人生要走 On-Policy 路线”。
本文提出首个大模型推理任务的可靠性基准,希望借此抛砖引玉,引出更多对新生代推理模型可靠性的关注和优秀工作,让人们更加信任模型的输出,让 AI 更好地服务于人类~本文提出首个大模型推理任务的可靠性基准,希望借此抛砖引玉,引出更多对新生代推理模型可靠性的关注和优秀工作,让人们更加信任模型的输出,让 AI 更好地服务于人类~
本综述系统梳理了离散扩散方向的研究图谱,呈现了离散扩散语言模型(dLLMs)与离散扩散多模态语言模型(dMLLMs)的理论基础、代表模型、训练与推理技术,以及在推理、视觉、生物等多个领域的应用进展。本综述系统梳理了离散扩散方向的研究图谱,呈现了离散扩散语言模型(dLLMs)与离散扩散多模态语言模型(dMLLMs)的理论基础、代表模型、训练与推理技术,以及在推理、视觉、生物等多个领域的应用进展。
万万没想到,仅仅过了两周,事情迎来了反转!同样据 The Information 独家消息,Anthropic 重新聘回了这两位 Claude Code 的关键负责人。万万没想到,仅仅过了两周,事情迎来了反转!同样据 The Information 独家消息,Anthropic 重新聘回了这两位 Claude Code 的关键负责人。
国外一个小哥受到了前段时间火遍全网的皮克斯台灯机器人启发,给自己手搓的“小宠物”。国外一个小哥受到了前段时间火遍全网的皮克斯台灯机器人启发,给自己手搓的“小宠物”。
Kimi K2是一款强大的新型开源模型,旨在处理复杂任务。凭借其先进的架构和智能决策能力,它不仅能对提示做出响应,还能采取实际行动。从编程到数据分析,它旨在让每个人都能使用高级人工智能工具。Kimi K2是一款强大的新型开源模型,旨在处理复杂任务。凭借其先进的架构和智能决策能力,它不仅能对提示做出响应,还能采取实际行动。从编程到数据分析,它旨在让每个人都能使用高级人工智能工具。
Anthropic提出的MCP(模型上下文协议)就是其中最知名的方案之一。MCP于去年正式亮相,帮助模型轻松接入外部数据存储、API乃至其他功能及工具,但同时也为新一波安全威胁打开了大门。Anthropic提出的MCP(模型上下文协议)就是其中最知名的方案之一。MCP于去年正式亮相,帮助模型轻松接入外部数据存储、API乃至其他功能及工具,但同时也为新一波安全威胁打开了大门。
线程池的主要组成部分包括工作线程、任务队列、线程管理器等。线程池的设计有助于优化多线程程序的性能和资源利用,同时简化了线程的管理和复用的复杂性。线程池的主要组成部分包括工作线程、任务队列、线程管理器等。线程池的设计有助于优化多线程程序的性能和资源利用,同时简化了线程的管理和复用的复杂性。
来自哥伦比亚大学、Vector人工智能研究所以及南洋理工大学的一个联合研究团队发现:人工智能模型在处理意外事件时的推理能力存在严重缺陷。来自哥伦比亚大学、Vector人工智能研究所以及南洋理工大学的一个联合研究团队发现:人工智能模型在处理意外事件时的推理能力存在严重缺陷。
中国AI初创公司月之暗面,刚刚发布了其最新重量级产品Kimi-K2。这是一款参数规模高达一万亿的开源大模型,以挑战GPT-4.1和Claude Sonnet 4为目标。中国AI初创公司月之暗面,刚刚发布了其最新重量级产品Kimi-K2。这是一款参数规模高达一万亿的开源大模型,以挑战GPT-4.1和Claude Sonnet 4为目标。
2025年5月,美国国家安全局等机构联合公告确认敌对势力正对各行业AI系统发动投毒攻击,篡改训练数据使模型运行与现实脱节,这要求CISO重新审视风险、架构、关系与共同责任。2025年5月,美国国家安全局等机构联合公告确认敌对势力正对各行业AI系统发动投毒攻击,篡改训练数据使模型运行与现实脱节,这要求CISO重新审视风险、架构、关系与共同责任。
Sim Studio,正是一款面向开发者的开源工具,旨在降低 Agent 工作流构建门槛。它以模块化组件为基础,支持可视化编排、模型调用、上下文管理与外部系统集成,适配 LangChain、RAG、工具调用等主流场景,为工程化落地提供了一套灵活且高扩展性的方案。Sim Studio,正是一款面向开发者的开源工具,旨在降低 Agent 工作流构建门槛。它以模块化组件为基础,支持可视化编排、模型调用、上下文管理与外部系统集成,适配 LangChain、RAG、工具调用等主流场景,为工程化落地提供了一套灵活且高扩展性的方案。
近日,马斯克旗下的人工智能项目又有新动作,AI聊天机器人Grok推出了 30 美元包月的 AI 伴侣服务,这一消息迅速在科技圈和大众群体中引发广泛讨论,争议声此起彼伏。近日,马斯克旗下的人工智能项目又有新动作,AI聊天机器人Grok推出了 30 美元包月的 AI 伴侣服务,这一消息迅速在科技圈和大众群体中引发广泛讨论,争议声此起彼伏。
本文将带你系统梳理 Milvus 的设计理念、核心组件、典型应用场景以及实战部署建议,帮助你在大模型时代构建更强大的 AI 检索系统。本文将带你系统梳理 Milvus 的设计理念、核心组件、典型应用场景以及实战部署建议,帮助你在大模型时代构建更强大的 AI 检索系统。
本文深入剖析了启动并持续推动变革的五大关键策略。本文深入剖析了启动并持续推动变革的五大关键策略。
MCP 在面试中被问到的概率很大,因为它是热门的 AI 技术。这其中包括 MCP 生产级别的使用问题,如 MCP 如何进行安全验证?MCP 底层实现原理?底层实现协议?MCP 服务重启后客户端如何自动重连?MCP 如何进行企业级部署?等问题。MCP 在面试中被问到的概率很大,因为它是热门的 AI 技术。这其中包括 MCP 生产级别的使用问题,如 MCP 如何进行安全验证?MCP 底层实现原理?底层实现协议?MCP 服务重启后客户端如何自动重连?MCP 如何进行企业级部署?等问题。
前言云测试专注于提供一站式应用测试解决方案,旨在有效解决应用开发及测试阶段面临的成本管控、技术瓶颈与效率优化等核心问题,确保应用...前言云测试专注于提供一站式应用测试解决方案,旨在有效解决应用开发及测试阶段面临的成本管控、技术瓶颈与效率优化等核心问题,确保应用...
今天,我想继续来完善 AI 视频案例。用 MiniMax语音的音频能力,给我的花木兰视频,配上合适的音频。今天,我想继续来完善 AI 视频案例。用 MiniMax语音的音频能力,给我的花木兰视频,配上合适的音频。
生命从一颗未受精的卵细胞开始,通过自我组装形成复杂生物。这个过程如何孕育意识?Michael Levin揭示了生物与AI在意识连续谱上的惊人联系。生命从一颗未受精的卵细胞开始,通过自我组装形成复杂生物。这个过程如何孕育意识?Michael Levin揭示了生物与AI在意识连续谱上的惊人联系。
OpenAI如何以自下而上的文化和行动导向,推动大模型突破?从零到上线仅用7周,Calvin带你走进OpenAI编程智能体Codex的诞生过程,体验高强度冲刺的魔力。OpenAI如何以自下而上的文化和行动导向,推动大模型突破?从零到上线仅用7周,Calvin带你走进OpenAI编程智能体Codex的诞生过程,体验高强度冲刺的魔力。
麦当劳的McHire招聘网站因AI聊天机器人Olivia的安全漏洞,导致数百万求职者个人信息泄露。麦当劳的McHire招聘网站因AI聊天机器人Olivia的安全漏洞,导致数百万求职者个人信息泄露。
ThinkDiff 将多模态推理能力传递给扩散模型,创造出高质量的统一多模态理解与生成模型。它用极少的训练资源和常见的数据,让扩散模型具备了在多模态上下文中进行推理和创作的能力。ThinkDiff 将多模态推理能力传递给扩散模型,创造出高质量的统一多模态理解与生成模型。它用极少的训练资源和常见的数据,让扩散模型具备了在多模态上下文中进行推理和创作的能力。
超长上下文窗口的大模型也会经常「失忆」,「记忆」也是需要管理的。超长上下文窗口的大模型也会经常「失忆」,「记忆」也是需要管理的。
OpenAI、谷歌DeepMind、Anthropic带头,联合各企业非盈利组织公开发表了一篇立场文件。OpenAI、谷歌DeepMind、Anthropic带头,联合各企业非盈利组织公开发表了一篇立场文件。
Jason Wei,思维链的提出者、o1系列模型的关键人物,被曝也被扎克伯格请走,即将入职Meta。Jason Wei,思维链的提出者、o1系列模型的关键人物,被曝也被扎克伯格请走,即将入职Meta。
传统的主数据管理,就像是让一群人工编辑去整理图书馆。AI的出现,完全改变了这个游戏。AI+主数据不仅仅是技术升级,它是商业模式的根本性变革。传统的主数据管理,就像是让一群人工编辑去整理图书馆。AI的出现,完全改变了这个游戏。AI+主数据不仅仅是技术升级,它是商业模式的根本性变革。
Chain-of-Action 提出了一种新颖的模仿学习范式,其核心是轨迹自回归建模。Chain-of-Action 提出了一种新颖的模仿学习范式,其核心是轨迹自回归建模。
Meta 针对 OpenAI 的挖人竟然还在继续!Meta 针对 OpenAI 的挖人竟然还在继续!
通过使用页表缓存,Linux内核能够显著提升虚拟地址到物理地址转换的速度,从而加快系统的响应和执行效率。不过需要注意,在多处理器或多核系统上,由于存在并发访问和一致性问题,对于共享数据结构如页表缓存的设计与管理需要特别小心。通过使用页表缓存,Linux内核能够显著提升虚拟地址到物理地址转换的速度,从而加快系统的响应和执行效率。不过需要注意,在多处理器或多核系统上,由于存在并发访问和一致性问题,对于共享数据结构如页表缓存的设计与管理需要特别小心。
MiniMax开源了基于闪电注意力机制的专家混合模型Minimax。MiniMax开源了基于闪电注意力机制的专家混合模型Minimax。
现在,紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了,推出完全透明开源的端到端共情语音语言大模型OpenS2S。现在,紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了,推出完全透明开源的端到端共情语音语言大模型OpenS2S。
这篇综述当中,作者分析了循环、递归、连续思维等潜空间推理的形式,并将这些方法总结成了一个框架。这篇综述当中,作者分析了循环、递归、连续思维等潜空间推理的形式,并将这些方法总结成了一个框架。
报告指出:在软件开发、数学竞赛、科学问答等任务中,agent已能完成相当于人类花费50–200分钟才能完成的任务,并且这种能力还在快速提升——大约每2–6个月就能翻一番。报告指出:在软件开发、数学竞赛、科学问答等任务中,agent已能完成相当于人类花费50–200分钟才能完成的任务,并且这种能力还在快速提升——大约每2–6个月就能翻一番。
正在北京出席链博会的老黄,刚刚带来“非常、非常好的消息”:H20恢复供应。有消息称,据说包括腾讯字节在内的大批中国客户已经在排队买卡了。正在北京出席链博会的老黄,刚刚带来“非常、非常好的消息”:H20恢复供应。有消息称,据说包括腾讯字节在内的大批中国客户已经在排队买卡了。
想象一下,你在加拿大的森林里迷路5小时,手机电量只剩3%,Google Maps失灵,信号微弱。但ChatGPT靠实时坐标救了场,堪称AI导航的教科书,快来围观。想象一下,你在加拿大的森林里迷路5小时,手机电量只剩3%,Google Maps失灵,信号微弱。但ChatGPT靠实时坐标救了场,堪称AI导航的教科书,快来围观。
你以为你在掌控AI,其实是AI在驯化你!最新研究警告:ChatGPT正改变英语的表达方式,悄然植入自己的偏好。是时候重新审视,我们到底在表达自我,还是AI的「复读机」?你以为你在掌控AI,其实是AI在驯化你!最新研究警告:ChatGPT正改变英语的表达方式,悄然植入自己的偏好。是时候重新审视,我们到底在表达自我,还是AI的「复读机」?
当 LLM 代码模型在 HumanEval 拿下 80+ 分,却在 LeetCode 真机上连错 40%,我们应该意识到:问题不在模型,而在“尺子”。本文拆解上海 AI Lab & 西交大最新研究 SAGA,看如何用“人机协作”把测试用例做成可度量、可规模化的 AI 产品,让评估从“玄学”变“科学”。当 LLM 代码模型在 HumanEval 拿下 80+ 分,却在 LeetCode 真机上连错 40%,我们应该意识到:问题不在模型,而在“尺子”。本文拆解上海 AI Lab & 西交大最新研究 SAGA,看如何用“人机协作”把测试用例做成可度量、可规模化的 AI 产品,让评估从“玄学”变“科学”。
刚刚,国内首个免费可用Deep Research上线了!它在多个权威评测中拿下第一,准确率直接碾压开源WebSailor。研究过程中,它能多线迭代追搜,直至逻辑闭环。更绝的是,一键生成炫酷的互动研究报告,视觉效果直接拉满。刚刚,国内首个免费可用Deep Research上线了!它在多个权威评测中拿下第一,准确率直接碾压开源WebSailor。研究过程中,它能多线迭代追搜,直至逻辑闭环。更绝的是,一键生成炫酷的互动研究报告,视觉效果直接拉满。
交易成了!OpenAI前CTO初创拿到了20亿种子轮融资,成立5个月公司估值冲到120亿美元。未来几个月,这个汇聚OpenAI顶尖大佬团队,将发布首个多模态AI产品,还会开源部分组件。交易成了!OpenAI前CTO初创拿到了20亿种子轮融资,成立5个月公司估值冲到120亿美元。未来几个月,这个汇聚OpenAI顶尖大佬团队,将发布首个多模态AI产品,还会开源部分组件。
分布式锁和事务就像一对欢喜冤家,既相互依赖,又相互排斥。锁可以保证数据的一致性,但如果用错了地方,就会成为性能瓶颈。分布式锁和事务就像一对欢喜冤家,既相互依赖,又相互排斥。锁可以保证数据的一致性,但如果用错了地方,就会成为性能瓶颈。
在鸿蒙应用开发中,状态管理是构建响应式界面的核心支柱,而单向数据流(UnidirectionalDataFlow,UDF)作为鸿蒙架构的重要设计原则,贯穿于...在鸿蒙应用开发中,状态管理是构建响应式界面的核心支柱,而单向数据流(UnidirectionalDataFlow,UDF)作为鸿蒙架构的重要设计原则,贯穿于...