2025CCF开源大会见闻
本文最后更新于:2025年8月20日
感谢老板让我们去上海开会见世面
受邀报告
受邀报告里有三个我印象比较深刻:郑伟民、王兴兴和陈云霁。
郑伟民院士报告的题目是大模型推理服务在系统层面的挑战,主要讲了章明星老师做的 Mooncake 和 KTransformers,分别解决大规模 LLM Serving 场景下 kvcache 的优化问题和大模型的端侧部署。 还有最后还有一些清华大模型创业公司的宣传(清华创业氛围真的浓厚啊)
宇树的王兴兴大概讲了从大学中做机器人到后面去创业的故事,中间有很多宇树机器人的宣传视频(机器狗是真的帅啊),最后对目前具身智能产业做了总结和展望。 (这个演讲内容应该和2025年世界机器人大会的相同)
目前限制具身智能应用的应用的瓶颈是模型还不够聪明,无法做到日常通用场景无障碍地完成需求。 对于当下最火的 VLA 技术路线,王兴兴表示:“我个人对 VLA 模型还是保持一个比较怀疑的态度”,他认为世界模型(通过模型生成视频然后驱动机器人完成视频中的动作)VLA方案更快收敛,成功概率更大。存在的问题:视频生成模型太关注视频生成的质量,导致算力消耗大,但对机器人干活,并不需要那么高的视频质量。
但是他还是相当乐观,王兴兴觉得最近几年就会出现具身智能的 GPT 时刻,可以说是未来已来。
陈云霁老师介绍了一些他们团队在AI + chip/sys 领域的一些工作,包括了芯片设计、操作系统、基础库和高性能算子方面,感觉工作做得非常有体系
分会场
kimi,这是本次大会我最期待的一个talk,讲了很多训练的细节,可惜我不是特别懂,很多细节没有get到。现场有人问了一个印象比较深刻的问题:训练过程的MFU,kimi的同学说压榨MFU不是现在的主要目标,提升RL的throughput比较重要,这个是提升模型智能的关键。
这次大会上能看到一些经常出现的框架,veRL,aibrix之类的,也听到了一些比较crazy的东西,比如说跨数据中心的LLM训练,可惜来讲的是个做算法的同学,并且看起来目前只有个demo,所以没什么具体的细节。
当然还有大家喜闻乐见的rust,rust分会场有三个议题都与rust os相关,看来大家对于写os有非常大的热情。 我个人对于LLM会和Rust这种约束比较严格,需要和编译器斗智斗勇的语言碰撞出什么奇妙的火花一直比较感兴趣。 当时也和rust会场chair 冯洋老师的学生们简单聊了一下,使用LLM将现有的C语言生态转译到Rust的可行性,他们表示,其中很大一个难点是代码中使用到的底层api和基础库的转换,两者之间没办法做一一映射。
总结
本次大会内容和质量都很不错,有学术开源,有商业开源,可惜缺少了爱好开源。 还有一个比较大的遗憾是没有poster,缺少和大家面对面的交流。