欢迎来到发电小说

手机版

发电小说 > 玄幻小说 > 京圈公子历练,全汉东疯了 > 第1084章 看起来完美,用起来致命。

底色 字色 字号

第1084章 看起来完美,用起来致命。

    陈默的数据仪錶盘上,那条曲线在第二十天的时候出现了一个陡峭的拐点——高质量数据的比例从23%跳到了41%。
    他给苏哲打了个电话,声音里带著一种克制的兴奋:
    “书记,现在总量八千九百万组。高质量的三千六百万。按这个速度——再有两周——”
    “別算了。”苏哲打断他,“给你一个坏消息。”
    陈默的声音停住了。
    “openai和西门子的forge项目提前了。威尔逊刚发来的情报——他们原计划三个月后正式发布,现在改成了六周。发布会定在底特律,三大车企全部站台。”
    电话那头的键盘声也停了。
    “六周。”陈默重复了一遍。
    “够吗?”
    陈默用了十秒做计算。苏哲在电话这头能听到他急促的呼吸声。
    “勉强。但数据量必须在四周內突破一亿组,而且高质量占比不能低於45%。否则模型训练出来的效果会有明显短板——特別是在复杂曲面和多物理场耦合这两个维度上。”
    苏哲没回话。他在想另一件事。
    六周。forge提前发布。
    这不正常。
    openai的项目管理一向保守——他们在发布gpt系列產品的时候,从来不提前。总是延期。
    为什么这次反而提前了?
    苏哲拨了威尔逊。
    “forge提前发布的原因查到了吗?”
    “正在查。初步判断是西门子那边施压了。”威尔逊的声音带著一点不確定,“我在旧金山的线人说,西门子数字工业的ceo上周亲自飞了一趟旧金山跟openai谈判。原因——他们的大夏区业务数据非常难看。盘古造物上线后的三个月里,西门子nx在大夏的新增订阅量下降了61%。续约率从88%掉到了53%。”
    苏哲把这几个数字默默记下了。
    “他们急了。”威尔逊下了一个判断,“forge如果不儘快上市,西门子在大夏的存量客户也会流失。所以他们寧愿发一个不那么完善的版本,也要抢时间。”
    苏哲把电话掛了。
    急了的对手会犯错。但急了的对手也最危险——因为他们没什么好失去的了。
    当天晚上,苏哲做了一个决定。
    他让林锐通知老周:“法律意见书我签了。明天上午送工信部和国家网信办。”
    林锐愣了一下。之前苏哲说时机不对,怎么突然改了主意?
    苏哲没解释。他在办公桌上铺开了一张白纸,用笔画了一条时间线。
    时间线的左端標註著“现在”,右端標註著“六周后——forge发布”。
    在时间线的中间偏左位置,他画了一个標记:“举报西门子数据违规。”
    在標记的右侧,他画了一条虚线延伸出去,旁边写著:“调查启动→西门子被要求暂停数据同步→大夏用户数据服务中断→ nx用户被迫迁移→迁移到哪里?”
    答案不需要写。盘古造物是唯一的选择。
    他在虚线的终点画了第二个標记:“用户涌入→数据涌入→训练加速。”
    时间差。
    举报的目的不是惩罚西门子。是製造一个窗口期——在forge发布之前,让盘古系统吃掉西门子在大夏的剩余市场份额,同时获得这些用户手里的高质量工业数据。
    一箭三雕。
    第二天上午十点,老周带著法律意见书和全套证据材料坐上了飞燕京的航班。
    证据包括三部分:西门子nx用户协议第17.3款的条文分析、三条数据出境链路的流量监控记录、以及47pb数据跨境传输总量的统计报告。
    老周在机场候机厅给苏哲打了最后一个確认电话。
    “书记,这个举报一出去,西门子肯定会反应。他们在欧洲的政治资源不少——”
    “让他们反应。”苏哲的声音很平,“他们能做的无非两件事:要么游说华盛顿施压,要么在欧洲法院反诉。两条路都需要时间。我们要的就是时间。”
    老周掛了电话,登了机。
    三天后。
    国家网信办发布了一份“关於开展外资工业软体数据安全专项检查的通知”。通知没有点名任何公司,但检查范围精確地覆盖了cad、cae、plm三类工业软体——全球在这三个领域有份额的外资企业,不超过五家。
    通知发布当天下午,西门子大夏区总部的法务总监紧急飞往燕京。ptc的大夏区总裁约翰·格林——刚从纽约回来没两天——又订了一张去燕京的机票。达索系统的亚太区副总裁也出现在了首都机场的出港大厅。
    三家公司的法务团队在燕京的律所里连夜开会。他们拿到的那份专项检查通知,措辞虽然是例行公事的口吻,但內行人一眼就能看出——这不是常规的年度检查,这是有人递了料。
    谁递的,他们猜不到具体是谁。但能在这个时间点、这个精確度上触发国家级检查的人,一只手数得过来。
    检查的第一步是要求三家公司提交在大夏境內的用户数据存储和传输的完整报告。期限:七天。
    七天。
    这个期限本身就是一种信號。如果是友好检查,通常给三十天。七天意味著——別磨蹭。
    西门子大夏区的技术团队在七天里加了六个通宵,勉强拼出了一份数据传输报告。报告试图把47pb的数据出境说成是“系统运维所需的正常数据同步”,但法务总监在签字之前犹豫了很久。
    他知道这个解释站不住。
    47pb的“正常同步”——全世界没有一个运维工程师能面不改色地说出这句话。
    消息传到京海的时候,陈默正在超算中心盯著训练进度条。
    数据银行的上传量在专项检查通知发布后出现了一次跳跃式增长。原因不复杂——很多正在使用西门子nx的企业,在看到检查通知后开始担心自己的数据安全。“我的设计文件是不是已经被西门子拿走了?”这个疑问在行业论坛和微信群里蔓延的速度比任何gg都快。
    恐慌催生行动。大批企业开始把nx里的设计文件导出,迁移到盘古造物系统上。迁移的过程中,数据自然而然地进入了数据银行。
    第二十三天。总上传数据量:九千四百万组。高质量占比:44.7%。
    陈默发的消息比之前任何一次都长,总共三行:
    “一亿组的门槛快了。高质量占比还差零点三个百分点。有一个领域的数据缺口很大——精密模具。国內这个行业的头部企业只有那几家,都还没上传。”
    苏哲看著这条消息,拨了一个他很久没打过的號码。
    电话响了两声就接了。
    “苏书记?”对方的声音有点意外。
    “老李,在厂里?”
    “在。刚从车间出来。”
    苏哲嘴角微微动了一下。电话那头的人是红星工具机厂的李建国——第一个上传数据的人。
    “帮我个忙。你认识温州和东莞做模具的那些老板吗?”
    “认识几个。以前工具机展上碰过面。怎么了?”
    “帮我约他们吃顿饭。我请客。”
    李建国在电话那头笑了——粗哑的、带著机油味的笑声。
    “苏书记请吃饭,他们得排著队来。”
    三天后,京海。
    一家不起眼的本帮菜馆的包厢里,苏哲坐在主位上。左右两边坐著七个人——全是长三角和珠三角做精密模具的老板。最大的一家年產值十二亿,最小的一家也有一亿八。
    李建国坐在苏哲旁边,负责暖场和翻译——不是语言翻译,是把苏哲的官方用语翻译成车间老板们听得懂的大白话。
    饭吃到一半的时候,苏哲把筷子放下了。
    “各位老板,我今天请客没別的事。就想问一个问题——你们的模具设计数据,现在存在哪?”
    七个老板面面相覷。
    温州来的赵老板最先开口,人精瘦,说话快:“在我电脑硬碟里。两个移动硬碟做备份。”
    东莞的胡老板接了句:“我们用的nx,数据在西门子的云上存了一份。”
    苏哲点了一下头。“存在西门子云上的那份,你们看过用户协议的第17.3款吗?”
    胡老板的筷子停了。
    苏哲没有继续说。他从包里拿出一份列印好的文件——西门子nx用户协议第17.3款的中文翻译,以及工信部法律专家对这一条款的合规性分析。
    文件在七个人手里传了一圈。
    包厢里安静了大约二十秒。
    赵老板第一个把文件拍在桌上:“我的模具数据被他们拿去训练ai了?”
    “目前在查。”苏哲的回答很克制,“但条款写得很清楚——他们有权这么做。至於做没做,国家网信办在查。”
    胡老板的脸色已经变了——不是生气,是后怕。他的公司给一家军工企业做过配套的弹药箱模具。那批模具的设计数据如果流到境外——
    “苏书记,”胡老板放下筷子,声音压得很低,“盘古造物的数据银行——我的数据上传之后,保证不出境?”
    “保证。盘古系统的全部数据存储在国內四个超算节点上。没有任何跨境链路。数据安全审查已经通过了网信办的最高等级认证。”
    苏哲说这话的时候语速不快,但每个字都砸得实。
    那顿饭吃了两个半小时。散场的时候,七个老板里有五个当场表示愿意上传数据。剩下两个说回去跟合伙人商量,但语气也鬆了。
    陈默在第二十八天收到了一批他盼了很久的东西——超过八百万组精密模具行业的设计数据,涵盖注塑、衝压、压铸和吹塑四个细分领域。数据质量极高,每一组都附带了完整的工艺参数和质检报告。
    他把这批数据灌进训练框架的那天晚上,模型的损失函数曲线出现了一次明显的下降。
    收敛加速了。
    凌晨三点,陈默截了一张训练面板的图,发给苏哲。
    没有文字说明。只有一个绿色的进度条和一个数字:
    **数据总量:1.07亿组。**
    苏哲看到这条消息的时候刚从床上坐起来——他的手机设了陈默的消息免打扰例外。
    一亿的门槛过了。
    他回了一个字:“训。”
    然后他翻到威尔逊的最新情报。forge发布会倒计时:三十一天。
    时间够不够,他不確定。但已经没有退路了。
    forge发布会倒计时十五天。
    陈默已经连续在敦煌待了十一天。他把行军床从中控室挪到了隔壁的设备间——中控室的空调噪音影响他判断模型输出的微妙差异。设备间没有窗户,白天黑夜全靠手錶分辨。
    训练框架在一亿零七百万组数据的餵养下推进得很顺利。模型在標准零件设计、工艺路线规划和材料选型三个基础维度上的表现已经超过了市面上所有商用cad软体的辅助功能。陈默甚至开始乐观——按这个趋势,两周后正式版发布的时候,至少能在通用製造领域跟forge掰一掰手腕。
    然后他看到了那组测试结果。
    航空叶片设计的盲测。陈默让模型根据一组真实的气动载荷参数,自主生成涡轮叶片的三维模型和加工方案。模型用了七秒完成输出。三维模型的外形漂亮得无可挑剔——流线型前缘、变截面叶身、精確的扭转角分布。
    但加工方案里有一行参数让陈默的眼皮跳了一下。
    五轴铣削的第三道工序,进给速度標註为每分钟4200毫米,刀具选型为r6的球头铣刀。
    陈默不搞机械加工。但他在京海待了快一年,跟红星厂的人混得够久,耳朵里灌进去的东西比他自己想像的多。他隱约觉得这个数字不太对劲。
    他打开参考资料库检索了一下。
    没有这个工艺参数组合。
    不是“没有完全匹配的”——是“完全不存在”。模型凭空编造了一个在现实中无法执行的加工参数。进给速度4200配r6球头铣刀,在鈦合金曲面上切削——刀具的寿命大概不超过三十秒。
    陈默的手指在键盘上悬了五秒,然后他开始批量跑测试。
    一个小时后,结果出来了。
    在复杂曲面生成领域——涉及航空叶片、汽轮机转子、精密模具型腔这类非规则几何体的设计——模型的“幻觉”发生率是14.3%。
    每七个方案里,有一个是假的。看起来完美,用起来致命。
上一章目录下一章推荐本书加入书签

设置

字体样式
字体大小