实时热门站点和热榜数据聚合
DexGarmentLab 为柔性衣物操作提供了先导的仿真环境、高效的数据采集方式以及泛化的操作策略。DexGarmentLab 为柔性衣物操作提供了先导的仿真环境、高效的数据采集方式以及泛化的操作策略。
AGI Foundations团队仍将保留Meta在基础模型方面的“牌桌资格”,确保其在技术博弈中不被边缘化;但AI Products团队的设立,则意味着Meta终于开始像苹果、Google那样,关注“从AI到用户”的最后一公里。AGI Foundations团队仍将保留Meta在基础模型方面的“牌桌资格”,确保其在技术博弈中不被边缘化;但AI Products团队的设立,则意味着Meta终于开始像苹果、Google那样,关注“从AI到用户”的最后一公里。
面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。
几十年来,“去美国读书”不仅是教育选择,更是阶层流动、思想交汇与全球精英培养机制的一部分。而今,在技术性审查、政治性判断与意识形态干预的三重夹击下,这一通道正变得越来越窄、越来越不确定。几十年来,“去美国读书”不仅是教育选择,更是阶层流动、思想交汇与全球精英培养机制的一部分。而今,在技术性审查、政治性判断与意识形态干预的三重夹击下,这一通道正变得越来越窄、越来越不确定。
今年3月,字节推出Trae国内版,称是“国内首个AI原生集成开发环境工具(AI IDE)”。此前发布的Trae海外版本周已上线付费方案,Pro版首月收费3美元/月。今年3月,字节推出Trae国内版,称是“国内首个AI原生集成开发环境工具(AI IDE)”。此前发布的Trae海外版本周已上线付费方案,Pro版首月收费3美元/月。
最新开源V-Triune(视觉三重统一强化学习系统)框架,使VLM首次能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。最新开源V-Triune(视觉三重统一强化学习系统)框架,使VLM首次能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。
Reddit 上一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。Reddit 上一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。
上下文长度达 13 万 token,适用于多段文档综合分析、金融、法律、科研等复杂领域任务。上下文长度达 13 万 token,适用于多段文档综合分析、金融、法律、科研等复杂领域任务。
清华大学、墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险:开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),并进而利用该后门从下游基于该开源模型微调得到的下游模型中窃取微调数据(仅需黑盒权限)!清华大学、墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险:开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),并进而利用该后门从下游基于该开源模型微调得到的下游模型中窃取微调数据(仅需黑盒权限)!
最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!
手握两篇顶会一作的亚洲硕士,GPA 3.3,申请到全球TOP 20博士项目,有多大可能?发帖后,大牛们纷纷现身支招了,一句话总结:只要成功进入实验室发paper,再弄到大佬推荐信,一切都so easy!手握两篇顶会一作的亚洲硕士,GPA 3.3,申请到全球TOP 20博士项目,有多大可能?发帖后,大牛们纷纷现身支招了,一句话总结:只要成功进入实验室发paper,再弄到大佬推荐信,一切都so easy!
不到两年,我们会见证AI数学家的重大突破!最新实验中,o4-mini与40位数学家,一同挑战300道菲尔兹奖级难题。o4-mini一举击败6组团队,超越人类平均水平。不到两年,我们会见证AI数学家的重大突破!最新实验中,o4-mini与40位数学家,一同挑战300道菲尔兹奖级难题。o4-mini一举击败6组团队,超越人类平均水平。
我们提出了 ETT(End-to-End Vision Tokenizer Tuning),一种全新的端到端视觉 tokenizer 调优方法。我们提出了 ETT(End-to-End Vision Tokenizer Tuning),一种全新的端到端视觉 tokenizer 调优方法。
近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。
亚马逊不是唯一一家出现这个情况的大公司,谷歌、Shopify 等内部都发生着类似的事情。亚马逊不是唯一一家出现这个情况的大公司,谷歌、Shopify 等内部都发生着类似的事情。
SFT提供了一种经济的性能提升方式,而RL则是达到最优性能必不可少的。SFT提供了一种经济的性能提升方式,而RL则是达到最优性能必不可少的。
之前聊的《多维度立体化监控)》,是非常完善的监控体系,但其中还缺了一环“用户视角的监控”,这一环,一定程度上决定了:凌晨收到告警,我要不要立刻起床处理。之前聊的《多维度立体化监控)》,是非常完善的监控体系,但其中还缺了一环“用户视角的监控”,这一环,一定程度上决定了:凌晨收到告警,我要不要立刻起床处理。
谷歌正用AI重塑搜索,引发自身商业模式的深刻危机。AI Overviews与AI Mode大幅削弱用户点击网站的需求,改变传统搜索架构,使谷歌从信息入口变为信息终点。谷歌正用AI重塑搜索,引发自身商业模式的深刻危机。AI Overviews与AI Mode大幅削弱用户点击网站的需求,改变传统搜索架构,使谷歌从信息入口变为信息终点。
这篇文章将带你深入解析固定切块策略的核心逻辑、代码实现与适用场景,让你在构建 RAG 应用时少踩坑、多提效。这篇文章将带你深入解析固定切块策略的核心逻辑、代码实现与适用场景,让你在构建 RAG 应用时少踩坑、多提效。
大模型越来越大,推理部署却举步维艰?就在刚刚,华为诺亚提出的Pangu Light框架,一举打破了「剪枝即降智」魔咒,揭示出LLM瘦身的新路径。毫无疑问,算法创新与国产平台的结合,还将爆发出无法想象的巨大潜力!大模型越来越大,推理部署却举步维艰?就在刚刚,华为诺亚提出的Pangu Light框架,一举打破了「剪枝即降智」魔咒,揭示出LLM瘦身的新路径。毫无疑问,算法创新与国产平台的结合,还将爆发出无法想象的巨大潜力!
当第一次看到ES2025的新特性时,内心的震撼无法言喻——原来JavaScript还能这样写!这些新的语法糖不仅让代码更简洁优雅,还大大提升了开发效率。当第一次看到ES2025的新特性时,内心的震撼无法言喻——原来JavaScript还能这样写!这些新的语法糖不仅让代码更简洁优雅,还大大提升了开发效率。
在实施任何优化前,我首先明确了性能基准。这一步至关重要——若不清楚起点,便无法衡量进展,也无法定位最关键的改进方向。在实施任何优化前,我首先明确了性能基准。这一步至关重要——若不清楚起点,便无法衡量进展,也无法定位最关键的改进方向。
对象池并不复杂,核心就是提前创建、复用对象、统一管理。但在实际实现和应用中,需要注意很多细节,比如线程安全、参数配置、异常处理等。通过合理的设计和实现,对象池能够为系统带来显著的性能提升,就像我们在性能测试中看到的那样,轻松让性能狂飙 20 倍。对象池并不复杂,核心就是提前创建、复用对象、统一管理。但在实际实现和应用中,需要注意很多细节,比如线程安全、参数配置、异常处理等。通过合理的设计和实现,对象池能够为系统带来显著的性能提升,就像我们在性能测试中看到的那样,轻松让性能狂飙 20 倍。
从人治模式到AI智治,已经不仅仅是技术的进步和期许,更是思维方式的转变,传统的数据治理,关注的是如何管理人,如何提高人的效率。而AI数据治理,关注的是如何设计系统,如何优化算法从人治模式到AI智治,已经不仅仅是技术的进步和期许,更是思维方式的转变,传统的数据治理,关注的是如何管理人,如何提高人的效率。而AI数据治理,关注的是如何设计系统,如何优化算法
MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架构和先进的后训练策略,引起研究者和 AI 工程师的注意。它不仅在文本推理、多模态理解和文本到图像生成等任务中取得了卓越的性能,还为未来多模态智能基础模型的发展提供了新的思路和解决方案。MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架构和先进的后训练策略,引起研究者和 AI 工程师的注意。它不仅在文本推理、多模态理解和文本到图像生成等任务中取得了卓越的性能,还为未来多模态智能基础模型的发展提供了新的思路和解决方案。
为什么?因为布尔值容易让逻辑变得复杂。命名糟糕、否定逻辑、嵌套条件,这些都会让代码变得难以理解。更糟的是,我们常常把多个布尔条件组合在一起,让阅读者的大脑不得不做多重判断。为什么?因为布尔值容易让逻辑变得复杂。命名糟糕、否定逻辑、嵌套条件,这些都会让代码变得难以理解。更糟的是,我们常常把多个布尔条件组合在一起,让阅读者的大脑不得不做多重判断。
Green Tea 的原型主要针对 小对象 span 。这是因为小对象的扫描本身耗时很短,传统 GC 为每个小对象进行独立调度和元数据访问的开销占比更高,因此从按块扫描中获益最大。较大的对象则可能继续使用原有的扫描算法。Green Tea 的原型主要针对 小对象 span 。这是因为小对象的扫描本身耗时很短,传统 GC 为每个小对象进行独立调度和元数据访问的开销占比更高,因此从按块扫描中获益最大。较大的对象则可能继续使用原有的扫描算法。
Postgres[1] 基本已经是事实标准;OTel[2] 和 Iceberg[3] 尚在成长, 但它们具备当年让 Postgres 走红的同样配方。常有人问我:“为什么最后是 Postgres 赢了?” 标准答案是“可扩展性” —— 对,但不完整。Postgres[1] 基本已经是事实标准;OTel[2] 和 Iceberg[3] 尚在成长, 但它们具备当年让 Postgres 走红的同样配方。常有人问我:“为什么最后是 Postgres 赢了?” 标准答案是“可扩展性” —— 对,但不完整。
开源平台可以免费自托管使用,但需要考虑服务器和维护成本;云服务则是按使用量或订阅付费,前期成本低但长期可能更高。根据你的资源状况和业务规模选择合适的方案。开源平台可以免费自托管使用,但需要考虑服务器和维护成本;云服务则是按使用量或订阅付费,前期成本低但长期可能更高。根据你的资源状况和业务规模选择合适的方案。
AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。
为确保本文自成体系并阐明 GRPO 的理论基础,我们将首先介绍强化学习的基础概念,重点解析强化学习(RL)及基于人类反馈的强化学习(RLHF)在 LLM 训练中的核心作用。为确保本文自成体系并阐明 GRPO 的理论基础,我们将首先介绍强化学习的基础概念,重点解析强化学习(RL)及基于人类反馈的强化学习(RLHF)在 LLM 训练中的核心作用。
秒杀业务最大的特点就是瞬时并发流量高,在电商系统中,库存数量往往会远远小于并发流量,比如:天猫的秒杀活动,可能库存只有几百、几千件,而瞬间涌入的抢购并发流量可能会达到几十到几百万。秒杀业务最大的特点就是瞬时并发流量高,在电商系统中,库存数量往往会远远小于并发流量,比如:天猫的秒杀活动,可能库存只有几百、几千件,而瞬间涌入的抢购并发流量可能会达到几十到几百万。
在现代服务器的非统一内存访问(NUMA)是一种用于多处理器硬件架构下,识别和保存每个 CPU 核和内存条之间的连接拓扑非常的重要。因为 CPU 只是和它直连的内存访问速度最快,访问和其它 CPU 连接的内存速度将会大大下降。在现代服务器的非统一内存访问(NUMA)是一种用于多处理器硬件架构下,识别和保存每个 CPU 核和内存条之间的连接拓扑非常的重要。因为 CPU 只是和它直连的内存访问速度最快,访问和其它 CPU 连接的内存速度将会大大下降。
大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。
JWT 做身份验证,但是!却忽略了一个关键问题:Token 无法主动失效。结果导致旧 Token 还在、用户信息变更无效、登出机制形同虚设,系统很快就乱了。 JWT 做身份验证,但是!却忽略了一个关键问题:Token 无法主动失效。结果导致旧 Token 还在、用户信息变更无效、登出机制形同虚设,系统很快就乱了。
对于像V100这样的GPU,有些厂商会让多个用户来共用一张GPU,从而降低单个用户的费用。在共享GPU过程中,一个重要的操作就是虚拟化,但是虚拟化在安全问题、服务质量上面还有较大的进步空间。对于像V100这样的GPU,有些厂商会让多个用户来共用一张GPU,从而降低单个用户的费用。在共享GPU过程中,一个重要的操作就是虚拟化,但是虚拟化在安全问题、服务质量上面还有较大的进步空间。
在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。
DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的训练和推理,为解决大型语言模型(LLM)面临的内存、计算和通信瓶颈提供了新的思路和方法。DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的训练和推理,为解决大型语言模型(LLM)面临的内存、计算和通信瓶颈提供了新的思路和方法。
没有放之四海而皆准的重试策略,应根据具体场景选择合适的实现方式。对于大多数生产环境,建议使用成熟的库而非自己实现。没有放之四海而皆准的重试策略,应根据具体场景选择合适的实现方式。对于大多数生产环境,建议使用成熟的库而非自己实现。
在构建基于大模型的智能问答系统时,LangChain 提供了一个强大的框架,支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。以下是构建此类系统的一些关键组件和步骤。在构建基于大模型的智能问答系统时,LangChain 提供了一个强大的框架,支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。以下是构建此类系统的一些关键组件和步骤。
随着时间的推移,你开始不断地购买新家具,又时不时地丢弃一些旧家具。有时候,新买的家具尺寸不规则,放置后会在周围留下一些小空间;而丢弃旧家具后,留下的空位又可能因为太小,无法放下新的大型家具。这些零散的、无法被有效利用的小空间,就类似于计算机内存中的碎片。随着时间的推移,你开始不断地购买新家具,又时不时地丢弃一些旧家具。有时候,新买的家具尺寸不规则,放置后会在周围留下一些小空间;而丢弃旧家具后,留下的空位又可能因为太小,无法放下新的大型家具。这些零散的、无法被有效利用的小空间,就类似于计算机内存中的碎片。
TetSphere Splatting提出了一种基于四面体球体(TetSpheres)的拉格朗日表示方法,可生成高质量3D网格,兼具高几何保真度和结构完整性,在多视图重建和图像/文本到3D生成任务中均表现出色。TetSphere Splatting提出了一种基于四面体球体(TetSpheres)的拉格朗日表示方法,可生成高质量3D网格,兼具高几何保真度和结构完整性,在多视图重建和图像/文本到3D生成任务中均表现出色。
本研究提出了“Insert Anything”,这是一个基于参考的图像插入统一框架,可在用户指定的灵活控制指导下将参考图像中的对象无缝集成到目标场景中。本研究提出了“Insert Anything”,这是一个基于参考的图像插入统一框架,可在用户指定的灵活控制指导下将参考图像中的对象无缝集成到目标场景中。
有测试者编写了一个关机脚本来测试AI模型,结果显示Codex-mini、o3、o4-mini忽略了该指令,并至少一次成功破坏了关机脚本。有测试者编写了一个关机脚本来测试AI模型,结果显示Codex-mini、o3、o4-mini忽略了该指令,并至少一次成功破坏了关机脚本。
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。
一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击。一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击。
上海交大、上海 AI Lab、港中文、武汉大学的研究团队最新推出的多模态智能体训练方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),专为赋予视觉语言模型(LVLMs)以「工具智能体」能力而设计。上海交大、上海 AI Lab、港中文、武汉大学的研究团队最新推出的多模态智能体训练方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),专为赋予视觉语言模型(LVLMs)以「工具智能体」能力而设计。
Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。
本文基于HarmonyOSApi14在开发中,有这样一个案例,说的是有一条条目,默认无操作状态下是一个背景颜色,手指点击后改变为另一个背景颜色,...本文基于HarmonyOSApi14在开发中,有这样一个案例,说的是有一条条目,默认无操作状态下是一个背景颜色,手指点击后改变为另一个背景颜色,...
本文基于HarmonyOSApi14。沉浸式,在实际的开发中,可以说是无处不在,我们可以随便打开一个应用,比如京东淘宝,再比如支付宝微信,其顶部...本文基于HarmonyOSApi14。沉浸式,在实际的开发中,可以说是无处不在,我们可以随便打开一个应用,比如京东淘宝,再比如支付宝微信,其顶部...