CompuWave

全球计算联盟IP栏目CompuWave:即刻登船 与全球计算专家共逐技术蓝海

DeepSeek:重塑智能计算产业生态的新契机




当下人工智能蓬勃发展,大模型技术平台 DeepSeek 备受关注。本文探讨其引发的三大关键趋势:一是凭借技术创新,推动大模型技术从云向边和端大规模部署,解锁多领域应用场景;二是其开源策略凸显开放架构和开源的重要性,也带来对大模型技术栈生态的新启示;三是技术研究成果结合工程优化,实现 “芯片 - 软件 - 大模型 - 应用” 全链条创新,推动产业协同发展升级。总体而言,DeepSeek 为智能计算产业带来新机遇与新启示。






在人工智能技术飞速迭代的当下,智能计算的技术、产品与产业正重塑计算产业格局。DeepSeek 作为新兴大模型技术平台,以独特优势和创新理念,为大模型技术大规模应用和产业发展带来新契机。下面聚焦其引发的三个关键趋势,探讨对计算产业的深远影响。

DeepSeek推动大模型在边和端的大规模部署

传统大模型应用依赖云端计算,存在数据传输延迟问题,难满足即时响应场景需求,且处理用户敏感数据时还有泄露风险。DeepSeek 通过强化学习和自研推理加速引擎,融合多种先进算法,以较少算力实现高性能突破,让大模型在边缘侧和端侧设备部署成为可能,如今各类DeepSeek一体机的出现就是例证。


大模型技术从云向边和端迁移,解锁了更多应用场景。工业领域,智能工厂设备可利用本地大模型实时诊断故障和进行预测性维护,提高生产效率和设备可靠性;医疗领域,便携式医疗设备借助本地大模型能快速筛查和诊断疾病,为患者提供更及时医疗服务;消费领域,AI 手机、智能眼镜等端侧设备智能交互能力更强,用户可通过语音、手势自然流畅交互,享受更个性化服务体验;自动驾驶领域,车辆利用本地大模型实时感知环境和决策,提升行车安全性。随着这些新场景的拓展,将极大拓展智能计算产业的规模和社会价值。

传统技术栈架构和生态模式需重新考量,

开放架构和开源成关键

大模型技术迅猛发展,传统技术栈架构弊端凸显,制约行业进步。核心问题是算子层过度依赖特定厂家私有技术,算子作为大模型计算基本操作单元,其性能直接影响模型运行效率。但传统技术栈采用特定厂家独有的算子实现方式,技术相对封闭,虽然为深度学习的早期普及做出了重要贡献,但因其无法容纳来自全行业的技术创新和针对特定底层芯片的优化,限制其他企业和开发者在算子层创新优化,已经成为技术多元化发展的一个障碍。


DeepSeek 开源策略为打破传统技术栈架构和生态模式束缚提供新契机。它不仅开放模型参数,还公开技术栈关键模块代码,为软硬件协同创造新空间,让开发者自由探索创新。通过开放模型和工具链,开发者能根据需求定制优化大模型技术栈,针对不同应用场景和业务需求个性化调整大模型,实现高效应用开发。比如医疗领域,开发者结合 DeepSeek 开放资源和医疗专业数据知识,可开发更精准疾病诊断模型;金融领域可优化模型提高风险评估准确性和效率。


开源促进全球开发者社区协作创新。在开源平台,开发者自由分享模型和代码,交流经验见解。跨地域、跨领域交流合作让不同背景开发者相互启发,推动技术进步。开放生态吸引大量开发者、企业和研究机构参与,形成有活力和创新精神的生态系统,加速大模型技术发展应用。


尤其是DeepSeek采用直接调用CUDA架构的PTX方式,极大提升了系统性能,这给我们带来对CUDA以及算子层架构的重新认识,将其看作由一系列库或功能构成的框架,根据上层业务的需要调用特定功能甚至添加自己的算子和功能,而不是按传统方式的高层调用方式,这样就为算子层的渐进演化和容纳全行业的技术创新提供了新机会。可在PyTorch 等深度学习框架开源的基础上,计算产业可借鉴 DeepSeek 的经验,渐进式地开展算子层优化,结合开源和标准化等产业生态构建工具,逐步形成开放的算子层架构。开发者基于开放框架,根据不同场景和硬件平台定制算子,提升系统性能效率。这种方式可汇聚开源社区力量,完善算子层架构,吸引更多参与者,形成更有竞争力的创新生态。

技术研究结合工程优化,推动全链条创新

DeepSeek 在技术研究上成果显著。它融合创新混合专家模型(MoE)架构、改进的多头潜在注意力机制(MLA)以及群组相对策略优化(GRPO)等技术,为大模型性能提升提供理论支持。这些先进算法能更好处理复杂数据和任务,提高模型准确性和效率。


仅有技术研究不够,还需工程优化将成果转化为实际产品应用。DeepSeek 在工程优化方面做了大量工作,如提高通信效率,提升计算和通信并行度,减少计算资源消耗,提高模型运行效率。芯片设计上,结合技术研究成果开发更适合大模型运行的芯片架构;软件层面,优化算子层、框架层、通信机制等,提高系统整体性能。通过工程优化,实现技术与产品紧密结合,推动大模型技术实际应用。通过技术研究与工程优化结合,推动 “芯片 - 软件 - 大模型 - 应用” 全链条创新。全链条协同创新是大模型产业升级核心动力,让各环节紧密相连、相互促进。


芯片层面,芯片企业可与大模型研发团队合作,根据模型算力等要求优化架构,与软件开发者协同确保适配,持续提升计算效率;软件层面,开发者可与芯片、大模型团队及应用企业配合,优化操作系统和开发工具,开发定制化方案拓展应用场景;大模型作为核心,与芯片合作加速训练,与软件协同优化推理,根据应用反馈微调提升性能;应用层面,各行业企业参与协同,结合行业数据和大模型开发针对性方案,如金融风险评估、医疗智能诊断等,应用创新又为大模型优化提供数据和场景。


这种全链条协同创新形成良性循环,推动大模型产业迈向新高度,将为经济社会发展注入新活力。

结语

DeepSeek为大模型产业带来新发展机遇。它推动大模型技术从云到边和端大规模部署,支持更多应用场景;促使传统技术栈架构和生态模式变革,让开放架构和开源成为产业发展基石;通过技术研究与工程优化结合,实现 “芯片 - 软件 - 大模型 - 应用” 全链条创新。计算行业和产业组织可以借鉴DeepSeek的经验,加强技术创新和产业协同,构建开放的智能计算产业,推动智能计算在更多的场景中得到采用,为人类社会发展贡献更多价值。