热门内容

实时热门站点和热榜数据聚合

7
🔥1.6万 👤英雄联盟官方
30
🔥1.5万 👤英雄联盟官方
游研社

游研社 · 全部文章

14分钟前更新
原神

原神 · 最新动态

2分钟前更新
崩坏3

崩坏3 · 最新动态

14分钟前更新
36氪

36氪 · 人气榜

2小时前更新
51CTO

51CTO · 推荐榜

40分钟前更新
1
首个面向柔性衣物灵巧操作的仿真平台来了,北大、伯克利联合发布首个面向柔性衣物灵巧操作的仿真平台来了,北大、伯克利联合发布

DexGarmentLab 为柔性衣物操作提供了先导的仿真环境、高效的数据采集方式以及泛化的操作策略。DexGarmentLab 为柔性衣物操作提供了先导的仿真环境、高效的数据采集方式以及泛化的操作策略。

2
Meta闪电分拆AI帝国!Llama团队一劈为二:一边狂卷AGI,一边死磕OpenAIMeta闪电分拆AI帝国!Llama团队一劈为二:一边狂卷AGI,一边死磕OpenAI

AGI Foundations团队仍将保留Meta在基础模型方面的“牌桌资格”,确保其在技术博弈中不被边缘化;但AI Products团队的设立,则意味着Meta终于开始像苹果、Google那样,关注“从AI到用户”的最后一公里。AGI Foundations团队仍将保留Meta在基础模型方面的“牌桌资格”,确保其在技术博弈中不被边缘化;但AI Products团队的设立,则意味着Meta终于开始像苹果、Google那样,关注“从AI到用户”的最后一公里。

3
刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立

面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。

4
突发!美国全球冻结学生签证,新规曝光:社交账号历史成“必查项”突发!美国全球冻结学生签证,新规曝光:社交账号历史成“必查项”

几十年来,“去美国读书”不仅是教育选择,更是阶层流动、思想交汇与全球精英培养机制的一部分。而今,在技术性审查、政治性判断与意识形态干预的三重夹击下,这一通道正变得越来越窄、越来越不确定。几十年来,“去美国读书”不仅是教育选择,更是阶层流动、思想交汇与全球精英培养机制的一部分。而今,在技术性审查、政治性判断与意识形态干预的三重夹击下,这一通道正变得越来越窄、越来越不确定。

5
突发!传字节内部禁用Cursor、Windsurf!突发!传字节内部禁用Cursor、Windsurf!

今年3月,字节推出Trae国内版,称是“国内首个AI原生集成开发环境工具(AI IDE)”。此前发布的Trae海外版本周已上线付费方案,Pro版首月收费3美元/月。今年3月,字节推出Trae国内版,称是“国内首个AI原生集成开发环境工具(AI IDE)”。此前发布的Trae海外版本周已上线付费方案,Pro版首月收费3美元/月。

6
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-BenchMiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

最新开源V-Triune(视觉三重统一强化学习系统)框架,使VLM首次能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。最新开源V-Triune(视觉三重统一强化学习系统)框架,使VLM首次能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。

7
全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug

Reddit 上一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。Reddit 上一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。

8
强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

上下文长度达 13 万 token,适用于多段文档综合分析、金融、法律、科研等复杂领域任务。上下文长度达 13 万 token,适用于多段文档综合分析、金融、法律、科研等复杂领域任务。

9
开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

清华大学、墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险:开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),并进而利用该后门从下游基于该开源模型微调得到的下游模型中窃取微调数据(仅需黑盒权限)!清华大学、墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险:开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),并进而利用该后门从下游基于该开源模型微调得到的下游模型中窃取微调数据(仅需黑盒权限)!

10
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!

11
GPA只有3.3,顶会一作两篇,成功杀进TOP 20 AI博士?小哥曝光关键秘诀GPA只有3.3,顶会一作两篇,成功杀进TOP 20 AI博士?小哥曝光关键秘诀

手握两篇顶会一作的亚洲硕士,GPA 3.3,申请到全球TOP 20博士项目,有多大可能?发帖后,大牛们纷纷现身支招了,一句话总结:只要成功进入实验室发paper,再弄到大佬推荐信,一切都so easy!手握两篇顶会一作的亚洲硕士,GPA 3.3,申请到全球TOP 20博士项目,有多大可能?发帖后,大牛们纷纷现身支招了,一句话总结:只要成功进入实验室发paper,再弄到大佬推荐信,一切都so easy!

12
o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守

不到两年,我们会见证AI数学家的重大突破!最新实验中,o4-mini与40位数学家,一同挑战300道菲尔兹奖级难题。o4-mini一举击败6组团队,超越人类平均水平。不到两年,我们会见证AI数学家的重大突破!最新实验中,o4-mini与40位数学家,一同挑战300道菲尔兹奖级难题。o4-mini一举击败6组团队,超越人类平均水平。

13
ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式

我们提出了 ETT(End-to-End Vision Tokenizer Tuning),一种全新的端到端视觉 tokenizer 调优方法。我们提出了 ETT(End-to-End Vision Tokenizer Tuning),一种全新的端到端视觉 tokenizer 调优方法。

14
One RL to See Them All?一个强化学习统一视觉-语言任务!One RL to See Them All?一个强化学习统一视觉-语言任务!

近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。

15
大厂程序员:AI正在将我们变成高速流水线工人,受不了了大厂程序员:AI正在将我们变成高速流水线工人,受不了了

亚马逊不是唯一一家出现这个情况的大公司,谷歌、Shopify 等内部都发生着类似的事情。亚马逊不是唯一一家出现这个情况的大公司,谷歌、Shopify 等内部都发生着类似的事情。

16
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

SFT提供了一种经济的性能提升方式,而RL则是达到最优性能必不可少的。SFT提供了一种经济的性能提升方式,而RL则是达到最优性能必不可少的。

17
什么类型的监控,才决定我凌晨要不要起床处理?什么类型的监控,才决定我凌晨要不要起床处理?

之前聊的《​​多维度立体化监控​​)》,是非常完善的监控体系,但其中还缺了一环“用户视角的监控”,这一环,一定程度上决定了:凌晨收到告警,我要不要立刻起床处理。之前聊的《​​多维度立体化监控​​)》,是非常完善的监控体系,但其中还缺了一环“用户视角的监控”,这一环,一定程度上决定了:凌晨收到告警,我要不要立刻起床处理。

18
谷歌·搜索:献给AI的第一个「祭品」?谷歌·搜索:献给AI的第一个「祭品」?

谷歌正用AI重塑搜索,引发自身商业模式的深刻危机。AI Overviews与AI Mode大幅削弱用户点击网站的需求,改变传统搜索架构,使谷歌从信息入口变为信息终点。谷歌正用AI重塑搜索,引发自身商业模式的深刻危机。AI Overviews与AI Mode大幅削弱用户点击网站的需求,改变传统搜索架构,使谷歌从信息入口变为信息终点。

19
一文读懂 RAG Fixed-Size Chunking 策略解析与优秀实践一文读懂 RAG Fixed-Size Chunking 策略解析与优秀实践

这篇文章将带你深入解析固定切块策略的核心逻辑、代码实现与适用场景,让你在构建 RAG 应用时少踩坑、多提效。这篇文章将带你深入解析固定切块策略的核心逻辑、代码实现与适用场景,让你在构建 RAG 应用时少踩坑、多提效。

20
告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒

大模型越来越大,推理部署却举步维艰?就在刚刚,华为诺亚提出的Pangu Light框架,一举打破了「剪枝即降智」魔咒,揭示出LLM瘦身的新路径。毫无疑问,算法创新与国产平台的结合,还将爆发出无法想象的巨大潜力!大模型越来越大,推理部署却举步维艰?就在刚刚,华为诺亚提出的Pangu Light框架,一举打破了「剪枝即降智」魔咒,揭示出LLM瘦身的新路径。毫无疑问,算法创新与国产平台的结合,还将爆发出无法想象的巨大潜力!

21
原来可以这样写 JavaScript!ES2025 新语法糖原来可以这样写 JavaScript!ES2025 新语法糖

当第一次看到ES2025的新特性时,内心的震撼无法言喻——原来JavaScript还能这样写!这些新的语法糖不仅让代码更简洁优雅,还大大提升了开发效率。当第一次看到ES2025的新特性时,内心的震撼无法言喻——原来JavaScript还能这样写!这些新的语法糖不仅让代码更简洁优雅,还大大提升了开发效率。

22
性能优化!七个策略,让Spring Boot 处理每秒百万请求性能优化!七个策略,让Spring Boot 处理每秒百万请求

在实施任何优化前,我首先明确了性能基准。这一步至关重要——若不清楚起点,便无法衡量进展,也无法定位最关键的改进方向。在实施任何优化前,我首先明确了性能基准。这一步至关重要——若不清楚起点,便无法衡量进展,也无法定位最关键的改进方向。

23
玩崩系统才懂!对象池这招让性能狂飙 20 倍玩崩系统才懂!对象池这招让性能狂飙 20 倍

对象池并不复杂,核心就是提前创建、复用对象、统一管理。但在实际实现和应用中,需要注意很多细节,比如线程安全、参数配置、异常处理等。通过合理的设计和实现,对象池能够为系统带来显著的性能提升,就像我们在性能测试中看到的那样,轻松让性能狂飙 20 倍。对象池并不复杂,核心就是提前创建、复用对象、统一管理。但在实际实现和应用中,需要注意很多细节,比如线程安全、参数配置、异常处理等。通过合理的设计和实现,对象池能够为系统带来显著的性能提升,就像我们在性能测试中看到的那样,轻松让性能狂飙 20 倍。

24
AI重塑数据治理的底层逻辑AI重塑数据治理的底层逻辑

从人治模式到AI智治,已经不仅仅是技术的进步和期许,更是思维方式的转变,传统的数据治理,关注的是如何管理人,​​如何提高人的效率​​。而AI数据治理,关注的是​​如何设计系统,如何优化算法​​从人治模式到AI智治,已经不仅仅是技术的进步和期许,更是思维方式的转变,传统的数据治理,关注的是如何管理人,​​如何提高人的效率​​。而AI数据治理,关注的是​​如何设计系统,如何优化算法​​

25
MMaDA:多模态大型扩散语言模型的创新突破MMaDA:多模态大型扩散语言模型的创新突破

MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架构和先进的后训练策略,引起研究者和 AI 工程师的注意。它不仅在文本推理、多模态理解和文本到图像生成等任务中取得了卓越的性能,还为未来多模态智能基础模型的发展提供了新的思路和解决方案。MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架构和先进的后训练策略,引起研究者和 AI 工程师的注意。它不仅在文本推理、多模态理解和文本到图像生成等任务中取得了卓越的性能,还为未来多模态智能基础模型的发展提供了新的思路和解决方案。

26
布尔值的陷阱:如何避免编程中的逻辑混乱布尔值的陷阱:如何避免编程中的逻辑混乱

为什么?因为布尔值容易让逻辑变得复杂。命名糟糕、否定逻辑、嵌套条件,这些都会让代码变得难以理解。更糟的是,我们常常把多个布尔条件组合在一起,让阅读者的大脑不得不做多重判断。为什么?因为布尔值容易让逻辑变得复杂。命名糟糕、否定逻辑、嵌套条件,这些都会让代码变得难以理解。更糟的是,我们常常把多个布尔条件组合在一起,让阅读者的大脑不得不做多重判断。

27
我所理解的 Go 的 GC (Garbage Collection) 垃圾回收机制我所理解的 Go 的 GC (Garbage Collection) 垃圾回收机制

Green Tea 的原型主要针对 小对象 span 。这是因为小对象的扫描本身耗时很短,传统 GC 为每个小对象进行独立调度和元数据访问的开销占比更高,因此从按块扫描中获益最大。较大的对象则可能继续使用原有的扫描算法。Green Tea 的原型主要针对 小对象 span 。这是因为小对象的扫描本身耗时很短,传统 GC 为每个小对象进行独立调度和元数据访问的开销占比更高,因此从按块扫描中获益最大。较大的对象则可能继续使用原有的扫描算法。

28
开放数据标准:Postgres,OTel,与Iceberg,你知道哪个?开放数据标准:Postgres,OTel,与Iceberg,你知道哪个?

Postgres[1] 基本已经是事实标准;OTel[2] 和 Iceberg[3] 尚在成长, 但它们具备当年让 Postgres 走红的同样配方。常有人问我:“为什么最后是 Postgres 赢了?” 标准答案是“可扩展性” —— 对,但不完整。Postgres[1] 基本已经是事实标准;OTel[2] 和 Iceberg[3] 尚在成长, 但它们具备当年让 Postgres 走红的同样配方。常有人问我:“为什么最后是 Postgres 赢了?” 标准答案是“可扩展性” —— 对,但不完整。

29
Dify、n8n、扣子、Fastgpt、Ragflow到底该怎么选?超详细指南来了Dify、n8n、扣子、Fastgpt、Ragflow到底该怎么选?超详细指南来了

开源平台可以免费自托管使用,但需要考虑服务器和维护成本;云服务则是按使用量或订阅付费,前期成本低但长期可能更高。根据你的资源状况和业务规模选择合适的方案。开源平台可以免费自托管使用,但需要考虑服务器和维护成本;云服务则是按使用量或订阅付费,前期成本低但长期可能更高。根据你的资源状况和业务规模选择合适的方案。

30
AdaptThink:推理模型的自适应思考范式AdaptThink:推理模型的自适应思考范式

AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。

31
DeepSeek 技术解析:LLM 训练中的强化学习算法DeepSeek 技术解析:LLM 训练中的强化学习算法

为确保本文自成体系并阐明 GRPO 的理论基础,我们将首先介绍强化学习的基础概念,重点解析强化学习(RL)及基于人类反馈的强化学习(RLHF)在 LLM 训练中的核心作用。为确保本文自成体系并阐明 GRPO 的理论基础,我们将首先介绍强化学习的基础概念,重点解析强化学习(RL)及基于人类反馈的强化学习(RLHF)在 LLM 训练中的核心作用。

32
Redis如何助力高并发秒杀系统?看完这篇我彻底懂了!!Redis如何助力高并发秒杀系统?看完这篇我彻底懂了!!

秒杀业务最大的特点就是瞬时并发流量高,在电商系统中,库存数量往往会远远小于并发流量,比如:天猫的秒杀活动,可能库存只有几百、几千件,而瞬间涌入的抢购并发流量可能会达到几十到几百万。秒杀业务最大的特点就是瞬时并发流量高,在电商系统中,库存数量往往会远远小于并发流量,比如:天猫的秒杀活动,可能库存只有几百、几千件,而瞬间涌入的抢购并发流量可能会达到几十到几百万。

33
Linux 内核是如何感知到硬件上的 NUMA 信息的?Linux 内核是如何感知到硬件上的 NUMA 信息的?

在现代服务器的非统一内存访问(NUMA)是一种用于多处理器硬件架构下,识别和保存每个 CPU 核和内存条之间的连接拓扑非常的重要。因为 CPU 只是和它直连的内存访问速度最快,访问和其它 CPU 连接的内存速度将会大大下降。在现代服务器的非统一内存访问(NUMA)是一种用于多处理器硬件架构下,识别和保存每个 CPU 核和内存条之间的连接拓扑非常的重要。因为 CPU 只是和它直连的内存访问速度最快,访问和其它 CPU 连接的内存速度将会大大下降。

34
知识图谱、大模型与幻觉:自然语言处理的视角知识图谱、大模型与幻觉:自然语言处理的视角

大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。

35
用了 JWT,上线第一天,系统就挂了......用了 JWT,上线第一天,系统就挂了......

 JWT 做身份验证,但是!却忽略了一个关键问题:Token 无法主动失效。结果导致旧 Token 还在、用户信息变更无效、登出机制形同虚设,系统很快就乱了。 JWT 做身份验证,但是!却忽略了一个关键问题:Token 无法主动失效。结果导致旧 Token 还在、用户信息变更无效、登出机制形同虚设,系统很快就乱了。

36
提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术提升GPU利用率:探索NVIDIA的MIG与MPS虚拟化技术

对于像V100这样的GPU,有些厂商会让多个用户来共用一张GPU,从而降低单个用户的费用。在共享GPU过程中,一个重要的操作就是虚拟化,但是虚拟化在安全问题、服务质量上面还有较大的进步空间。对于像V100这样的GPU,有些厂商会让多个用户来共用一张GPU,从而降低单个用户的费用。在共享GPU过程中,一个重要的操作就是虚拟化,但是虚拟化在安全问题、服务质量上面还有较大的进步空间。

37
RAG(检索增强生成):提升大语言模型性能的终极指南RAG(检索增强生成):提升大语言模型性能的终极指南

在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。

38
DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章

DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的训练和推理,为解决大型语言模型(LLM)面临的内存、计算和通信瓶颈提供了新的思路和方法。DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的训练和推理,为解决大型语言模型(LLM)面临的内存、计算和通信瓶颈提供了新的思路和方法。

39
Golang重试机制终极指南,如何应对各种失败场景Golang重试机制终极指南,如何应对各种失败场景

没有放之四海而皆准的重试策略,应根据具体场景选择合适的实现方式。对于大多数生产环境,建议使用成熟的库而非自己实现。没有放之四海而皆准的重试策略,应根据具体场景选择合适的实现方式。对于大多数生产环境,建议使用成熟的库而非自己实现。

40
基于大模型的智能问答系统基于大模型的智能问答系统

在构建基于大模型的智能问答系统时,LangChain 提供了一个强大的框架,支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。以下是构建此类系统的一些关键组件和步骤。在构建基于大模型的智能问答系统时,LangChain 提供了一个强大的框架,支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。以下是构建此类系统的一些关键组件和步骤。

41
Linux内核内存碎片:悄然蚕食程序性能的 “蛀虫”Linux内核内存碎片:悄然蚕食程序性能的 “蛀虫”

随着时间的推移,你开始不断地购买新家具,又时不时地丢弃一些旧家具。有时候,新买的家具尺寸不规则,放置后会在周围留下一些小空间;而丢弃旧家具后,留下的空位又可能因为太小,无法放下新的大型家具。这些零散的、无法被有效利用的小空间,就类似于计算机内存中的碎片。随着时间的推移,你开始不断地购买新家具,又时不时地丢弃一些旧家具。有时候,新买的家具尺寸不规则,放置后会在周围留下一些小空间;而丢弃旧家具后,留下的空位又可能因为太小,无法放下新的大型家具。这些零散的、无法被有效利用的小空间,就类似于计算机内存中的碎片。

42
ICLR2025 | MIT何恺明团队提出TetSphere:拉格朗日体积网格精准还原高质量3D形状!ICLR2025 | MIT何恺明团队提出TetSphere:拉格朗日体积网格精准还原高质量3D形状!

TetSphere Splatting提出了一种基于四面体球体(TetSpheres)的拉格朗日表示方法,可生成高质量3D网格,兼具高几何保真度和结构完整性,在多视图重建和图像/文本到3D生成任务中均表现出色。TetSphere Splatting提出了一种基于四面体球体(TetSpheres)的拉格朗日表示方法,可生成高质量3D网格,兼具高几何保真度和结构完整性,在多视图重建和图像/文本到3D生成任务中均表现出色。

43
图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长

本研究提出了“Insert Anything”,这是一个基于参考的图像插入统一框架,可在用户指定的灵活控制指导下将参考图像中的对象无缝集成到目标场景中。本研究提出了“Insert Anything”,这是一个基于参考的图像插入统一框架,可在用户指定的灵活控制指导下将参考图像中的对象无缝集成到目标场景中。

44
o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制

有测试者编写了一个关机脚本来测试AI模型,结果显示Codex-mini、o3、o4-mini忽略了该指令,并至少一次成功破坏了关机脚本。有测试者编写了一个关机脚本来测试AI模型,结果显示Codex-mini、o3、o4-mini忽略了该指令,并至少一次成功破坏了关机脚本。

45
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。

46
Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光

一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击。一家瑞士网络安全公司发现,GitHub官方MCP服务器正在面临新型攻击。

47
让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

上海交大、上海 AI Lab、港中文、武汉大学的研究团队最新推出的多模态智能体训练方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),专为赋予视觉语言模型(LVLMs)以「工具智能体」能力而设计。上海交大、上海 AI Lab、港中文、武汉大学的研究团队最新推出的多模态智能体训练方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),专为赋予视觉语言模型(LVLMs)以「工具智能体」能力而设计。

48
Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4oMeta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。

49
#我的鸿蒙开发手记# HarmonyOS开发之了解多态样式stateStyles#我的鸿蒙开发手记# HarmonyOS开发之了解多态样式stateStyles

本文基于HarmonyOSApi14在开发中,有这样一个案例,说的是有一条条目,默认无操作状态下是一个背景颜色,手指点击后改变为另一个背景颜色,...本文基于HarmonyOSApi14在开发中,有这样一个案例,说的是有一条条目,默认无操作状态下是一个背景颜色,手指点击后改变为另一个背景颜色,...

50
#我的鸿蒙开发手记# HarmonyOS开发之如何实现沉浸式效果#我的鸿蒙开发手记# HarmonyOS开发之如何实现沉浸式效果

本文基于HarmonyOSApi14。沉浸式,在实际的开发中,可以说是无处不在,我们可以随便打开一个应用,比如京东淘宝,再比如支付宝微信,其顶部...本文基于HarmonyOSApi14。沉浸式,在实际的开发中,可以说是无处不在,我们可以随便打开一个应用,比如京东淘宝,再比如支付宝微信,其顶部...