队列一体化之后,短短一周,沙箱看板上的“待排期”数字从三十几跳到一百二十多。最先焦虑的不是城市,而是省里:联络员在群里发了一句很短的话——
“领导问:为什么排这么久?是不是你们机制把效率搞没了?”
这句话听起来像责问,背后却是一把典型的杠杆:只要效率被质疑,谁就有机会把“优先”“推荐”“协调”重新塞回来——理由永远是“为了推进”。
数科副总也紧跟着发来信息:“运行槽不够。扩容要预算。否则队列会更长。”
这是对手最擅长的战场:资源与成本。
因为成本一旦不透明,就会产生俘获——你只能依赖运营方告诉你“需要多少”,你无法判断“为什么需要”。最后的结果往往是:预算给了,钥匙也给了。
林远把手机扣在桌面上,抬头看陈毅:“这一仗不是扩不扩容,是把扩容做成公共决策。我们要把槽位成本拆出来,写进公开账本。让预算增长不再靠恐吓,而靠可复核数据。”
他在白板上写下八个字:
成本透明,运维去俘获。
一张最难写的表:每个运行槽多少钱
当天晚上,陈毅、老许、数科安全负责人在会议室里摊开了一堆材料:服务器成本、带宽、存储、日志、HSM签名服务、值班人力、故障响应、还有“冷却与补证”的工单处理成本。
陈毅问了一个很现实的问题:“我们公开成本,会不会让人骂你们贵?省里会不会嫌麻烦?”
林远没回避:“会被骂。被骂也要公开。因为不公开,下一步就是‘你们太慢,所以给我们优先权’,最后把钥匙交出去,永远拿不回来。”
他把成本拆成三层,像工程造价分解一样:
1)固定成本(CapEx/基础设施)
沙箱集群节点折旧(按月)
网络/专线/防火墙
HSM/密钥管理服务(双人授权)
存储与日志归档(保留周期)
2)变动成本(OpEx/按运行槽计)
每次测试运行的计算/IO消耗
运行日志摘要计算与签名调用
验真接口调用量
自动补证清单生成
3)人力成本(Service/按事件计)
7×12值班
故障响应(按SLA等级)
抽查复测旁听与复核
安全事件立案与追踪
“把这三层写清楚。”林远说,“然后算出一个东西:一个运行槽(slot)的单位成本。同时算出队列长度对应的服务能力:每天多少槽、平均耗时多少、补证率多少。”
老许一边敲计算表一边叹气:“这比写小说难。”
林远笑了一下:“但这是制度线的爽点。你把成本写出来,就等于把对手的‘资源恐吓’拆掉。”
联席会:预算要,但钥匙不给
第二天上午,省信息处组织了“沙箱扩容与预算评审会”。这次会议很特殊:银行风控也被拉进来了,因为“风险定价”已经开始依赖这些机制;审计联络也在,因为预算一旦动,就会被审计盯。
数科副总开场就抛数字:“我们测算,至少要把运行槽从每日40提升到每日120,才能把排期压到三天以内。预算需要增加××万。”
他没有解释为什么,只给了一个总数——典型的“信我”。
林远没有直接质疑,而是把昨晚做出来的表投到屏幕上。标题很冷:
《沙箱运行槽单位成本与扩容收益(公开版)》
第一页就是单位成本拆解:
固定成本摊销:每槽 A 元
变动成本:每槽 B 元
人力成本(按事件平均摊):每槽 C 元
合计:每槽 A+B+C 元
第二页是“效率曲线”:
当前每日槽位:40
当前平均耗时:L0 18min / L1 46min / Δ 22min
当前补证率:38%(导致重复占槽)
当前no-show率:9%(冷却已降低)
预测:若槽位提升到80,排期从7天降到3.5天;若提升到120,排期降到2天,但边际收益递减。
第三页最关键:扩容不是唯一手段——还有两项“便宜得多”的效率改进:
提升Practice使用率(减少正式补证轮次)→ 预计补证率从38%降到25%
优化用例组合与并行(不增加机器)→ L1平均耗时从46min降到35min
“我们不是反对扩容。”林远开口,“我们反对用一个总价把省里绑架。扩容应该是:多少槽、多少钱、带来什么收益、替代方案是什么。”
银行何经理看着表,第一次露出明显的认可:“这种我们愿意支持。因为风险机制依赖稳定服务能力,预算透明能减少外部质疑。”
审计联络也立刻接:“预算评审最怕黑箱。单位成本+边际收益+替代方案,这是可审计结构。”
这章没有结束,请点击下一页继续阅读!
喜欢重生2005:我在惠州买地皮请大家收藏:(m.zjsw.org)重生2005:我在惠州买地皮爪机书屋更新速度全网最快。