Hedge Fund Day 1: 算力调度不是 GPU 租赁

今天准备看共绩科技。

一开始我以为这就是一家 GPU rental company。

后来发现这个判断有点偷懒。说它是 GPU 租赁,不能算错,但也像把滴滴说成“汽车租赁公司”。表面上好像对了,实际上把最重要的东西漏掉了。

共绩真正想做的,应该更接近一个 AI 时代的算力滴滴:把分散的、闲置的、波动的 GPU 资源,调度给同样分散、同样波动的 AI 需求。它们官网写的是弹性算力服务平台,融资新闻里更直接,把这套东西叫成“电网式算力调度网络”。

这个比喻也不能乱用。因为只要用了“滴滴”两个字,听起来就很容易变成创业 BP:

我们是 XX 领域的 Uber。

然后投资人开始微笑,创业者开始冒汗。

所以今天我不想先下判断。我更想记录一下:如果我要认真看这家公司,哪些问题是真的问题。

1. 不能只问有多少卡

看算力公司,最容易问的问题是:

你们有多少 GPU?

这个问题当然重要,但它太粗了。

如果一家公司的故事是“我们有很多卡”,那它很快就会进入一个很朴素的竞争世界:谁卡多,谁便宜,谁交付快。这个世界也不是不好,只是听起来不太像一个高壁垒的平台,更像一个很辛苦的资源生意。

他们自己的定价页也很直观:4090、5090、H20、A800、H800 等机型按秒 / 按小时计费。这个页面让我更确定,价格是入口,但不是我最该盯的地方。

我现在更想问的是:

有多少资源是真正可以商业化调度的?

这个词很无聊,但很关键。

因为“资源”至少可以拆成几层:

  • 潜在资源
  • 签约资源
  • 接入资源
  • 稳定调度资源
  • 可商业化调度资源

这几层完全不是一回事。

一台理论上存在的电脑,不等于供给。

一张偶尔在线的显卡,不等于收入。

一个可以稳定接任务、能隔离、能计费、能交付、客户出了问题有人负责的节点,才比较接近资产。

所以这家公司真正的核心,不是把 GPU 数字写大,而是把“不稳定的资源”变成“客户感觉稳定的服务”。

这句话听起来很平淡,但我感觉里面有很多 pain。

2. AI 推理让算力需求变得很不讲道理

训练模型的时候,算力需求比较像一顿大餐。你知道自己要吃很多,提前订桌,准备预算,然后开始烧钱。

推理不一样。

推理更像一天到晚吃零食,而且随时可能突然来一群人一起吃。

一个 AI 应用平时可能很安静,某天因为活动、节日、发布会、热点、或者某个用户突然想批量生成三千张图,流量就冲上来了。

这时候传统云当然也能解决问题,只是成本和弹性不一定舒服。

我看到的一个案例是 Remy。共绩自己和媒体都写到过,Remy 在春节 / 新品发布这种峰值场景里需要快速扩 GPU,相关报道里提到过48 小时扩到约 1900 张卡。这种案例很适合讲故事,但也很适合追问:峰值之后的留存、毛利和复购到底怎么样。

所以“潮汐算力”这个词虽然有一点 marketing 味,但它描述的问题是真的:

  • 图像生成有峰值
  • 视频生成吃资源
  • PDF / OCR 这类任务可以批量爆发
  • LLM inference 的用户行为很难预测
  • Agent 可能把一个请求拆成很多次模型调用

如果需求本身变得越来越潮汐化,那么调度就不只是后台技术,而可能变成商业模式的一部分。

这也是我觉得共绩有意思的地方。

不是因为“它有 GPU”。

而是因为它在问:

能不能把波动变成利润?

3. 技术壁垒到底在哪里

我看到材料里提到自研 Rust 底层调度系统。

我的第一反应是:

为什么不用 Kubernetes?

然后又想问:

为什么不用 KubeEdge?为什么不用 Karmada?

当然,我问这些名字的时候,也有一点装懂成分。人类看到熟悉的技术名词,会自然产生一种“我参与了讨论”的错觉。

但问题本身还是有必要的。

如果只是管理稳定的云服务器,那现成系统已经很多了。重新做一套底层调度,听起来就像是工程师表达自我的一种昂贵方式。

但如果共绩要管理的是个人 PC、网吧电脑、IDC、公有云、政企集群这些异构资源,那问题确实会变复杂。

因为这些资源并不听话:

  • 机器可能下线
  • 网络可能波动
  • 配置不一致
  • 镜像启动有冷启动
  • 任务会失败
  • 客户还要求 SLA

所以我真正想知道的是:

自研系统解决了什么现有框架解决不了的问题?

如果答案清楚,那这是壁垒。

如果答案不清楚,那可能只是一个很贵的工程选择。

这里我会把几个参照物提前放在桌上:Kubernetes 本来就是生产级容器编排系统;KubeEdge 是把 Kubernetes 能力延伸到边缘节点;Karmada 做多集群、多云调度。共绩如果要证明自研必要性,就要讲清楚这些东西在它的场景里具体卡在哪里。

4. 算法不要先神化

材料里提到 Monte Carlo reinforcement learning。

我看到的时候有一点兴奋。因为这个词会让人觉得自己离 David Silver 的课很近。

大概近到 YouTube 推荐栏的距离。

但冷静下来之后,还是要问:

为什么一定要用这个?

调度的目标很多:

  • 延迟要低
  • 成本要低
  • 空闲要少
  • 违约要少
  • 故障切换要快
  • 资源利用率要高

这些目标之间很容易打架。你优化成本,可能伤害稳定性;你优化稳定性,可能牺牲利用率;你优化利用率,客户可能开始不快乐。

所以我对算法最关心的不是名字,而是三件事:

  1. reward function 到底怎么设?
  2. 有没有简单 baseline?
  3. 线上数据能不能证明它比普通规则更好?

很多时候,公司说“AI 调度算法”,最后真正有用的可能是一个规则系统、一堆经验参数、以及几个很累的工程师。

这也没问题。

但这和“算法壁垒”是两回事。

我还看到一篇关于跨云弹性推理场景下模型分发的文章,里面提到模型仓库、对象存储加速、分布式缓存、数据预热这些问题。这个方向比“我们用了 AI 算法”更具体,因为模型文件和业务数据不会像算力一样说迁移就迁移。

5. SLA 是最容易变魔术的地方

基础设施公司最喜欢的数字之一是 99.99%。

它看起来很优雅。

也很危险。

因为这个数字背后有太多口径问题。

我想问:

  • 统计周期是什么?
  • 哪些客户被算进去?
  • 节点故障但客户无感知,算不算故障?
  • 任务重试算不算失败?
  • 有没有真实赔付记录?
  • SLA 写在合同里,还是写在 PPT 里?

如果没有清楚口径,99.99% 就不一定是服务承诺,也可能只是一个气氛组数字。

我现在越来越觉得,看 infrastructure company 的时候,最重要的不是它怎么讲稳定,而是它怎么定义不稳定。

6. 最后还是商业问题

共绩官网上讲了很多关键词:弹性算力、峰值扩容、低成本、批处理、Serverless、PDF 数据处理、图像生成、视频生成、LLM 推理。

这些场景都合理。

官网案例里列了 Remy、面壁智能、Liblib、Tripo 等客户,也写到面壁智能 PDF 数据处理、Liblib 高峰扩容这些场景。另一个比较有用的外部材料是上海证券报对付智的采访,里面提到个人电脑可以随时中断共享,以及景区旅拍案例里后台个人电脑更换了很多台但前台无感知。这种说法很强,所以更需要访谈时拿真实口径验证:原文在这里

但我最担心的是:如果客户只是因为便宜而来,那客户也会因为更便宜而走。

低价是优势,但低价本身不是护城河。

所以更重要的问题是:

客户为什么留下?

可能是因为:

  • 峰值扩容真的快
  • 交付支持更强
  • 资源池更灵活
  • 接入之后迁移成本高
  • 对波动推理的理解更深
  • 政企算力网络带来特殊资源
  • 反向托管让客户自己的闲置资源也能变现

这里面有些可能是壁垒,有些只是 feature,有些可能只是销售话术。

尽调的工作,大概就是把这三类东西分开。

听起来很简单。

做起来应该很烦。

7. 我真正想验证的事情

明天访谈,我不想把问题问成“请介绍一下贵司技术优势”这种礼貌废话。

我更想把问题问具体。

对 CTO,我想问:

K8s / KubeEdge / Karmada 到底哪里不够用?

高波动节点的真实中断率是多少?

任务迁移、预热、容错怎么做?

Monte Carlo RL 相比简单规则系统提升在哪里?

对 CPO,我想问:

这是标准化产品,还是项目交付?

哪类客户复购最好?

哪个案例最能复制?

对 COO,我想问:

资源池里有多少是真正可商业化调度资源?

毛利率有没有扣掉算力分成、带宽、电费、运维和交付成本?

回款周期会不会把利润变成应收账款?

对 CEO,我想问:

公司最终想成为 AI 云、调度平台、政企算力网络运营方,还是全球潮汐算力网络?

如果云厂商降价,共绩剩下的优势是什么?

当前最大瓶颈是供给、客户、技术、毛利、现金流、合规,还是竞争?

另外,融资也要问清楚。最近一轮公开新闻是 2026 年 5 月的近亿元 Pre-A 轮融资,资金用途写的是技术研发和市场拓展。这两个词都很宽,访谈时最好拆成具体里程碑:系统安全、客户拓展、资源池扩张,分别花多少钱,换什么指标。

Current Take

我现在还不知道共绩是不是一家好公司。

如果现在就说“我看懂了”,那基本是在骗自己。

但我觉得这个问题本身值得看:

闲置、不稳定、分散的算力,能不能被包装成稳定、可交付、可计费的基础设施?

如果答案是否,那它更像 GPU rental with extra steps。

如果答案是 yes,那它就不只是卖卡,而是在做一张调度网络。

这张网络里有技术问题,有供给问题,有客户问题,有现金流问题,也有一点点玄学问题。

说白了,就是能不能让客户看不到背后的混乱。

而企业服务最朴素的价值,可能就是:

让别人替你承受混乱。

这句话听起来不太像 pitch deck。

但可能比 pitch deck 诚实一点。