北京安定医院黄牛票贩子号贩子跑腿代挂号电话DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?
黄牛号贩子跑腿代挂号(18910288832)微信需要挂号联系客服(18910288832)各大医院服务项目!专家挂号,办理住院加快.检查加快,产科建档,指名医生挂号北京,上海,南京,天津.广州,各大医院代挂号
国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。
2月28日,DeepSeek最新宣布,开源面向DeepSeek全数据访问的推进器3FS(Fire-Flyer File System)。据介绍,这是一款并行文件系统,可利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,加速和推动DeepSeek平台上所有数据访问操作。
至此,DeepSeek开源周正式结束,此前2月21日午间,DeepSeek曾宣布,将开源5个代码库,以完全透明的方式与全球开发者社区分享研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”(开源周)。
“此次开源周提供的五个项目,覆盖了AI开发的核心环节——从硬件性能压榨、模型训练优化到数据处理提速,目标是让开发者开箱即用,降低技术门槛和成本,让开发者能够更高效、低成本、广泛地使用大模型。”对于开源的具体影响,华东师范大学数据科学与工程学院教授王伟告诉澎湃新闻记者,预计将拉动更多云服务提供商,降低自建云计算中心或私有化部署成本,形成更强大的生态圈,与其他大模型生态体系竞争。
他提到,DeepSeek之所以选择开源路线,不担心被同行超越,是因为其核心竞争模式和利润来源不需要依靠售卖模型服务而盈利,此外,也说明DeepSeek有相当的技术信心,“相信自己不会迅速被业内竞争对手超越,能够坚持引领最先进的技术在自身体系下持续发展。”
“此次DeepSeek的开源,从更大意义上来说,是在引导全球范围内的标准制定,形成更强的DeepSeek生态,通过开源能够吸引更多国家的开发者加入到DeepSeek生态中,将很大程度提升中国在人工智能领域的全球引领能力。”王伟认为,如果DeepSeek在全球范围内形成较强的开源生态,将会推动国内的芯片厂商进一步适配,拥有更广阔的场景和市场,实现商业闭环。
此次DeepSeek究竟开源了哪些项目,对于大模型行业有什么意义?澎湃新闻记者梳理了从2月24日至28日所有的开源项目。由于这些项目涉及众多专业术语,记者使用了DeepSeek网页版提供项目具体解释:
2月24日,首个开源的代码库为FlashMLA。
FlashMLA被称为提升显卡潜力的“加速器”,FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产。
FlashMLA专门用于优化显卡(尤其是英伟达旗下GPU)的计算效率。比如,AI处理不同长度的句子(如长文本和短文本)时,它能动态分配算力,避免资源浪费,让处理速度接近硬件极限。实测显示,这让AI翻译、内容生成等任务更快、更省成本。
2月25日,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库。
DeepEP被称为大模型训练的“通信管家”,专门用于提升大模型训练效率设计,比如,当多个AI专家模型(MoE架构)协同工作时,它能高效协调它们之间的通信,减少延迟和资源消耗,同时支持低精度计算(如FP8),进一步节省算力。
2月26日,DeepSeek宣布开源DeepGEMM:DeepGEMM被称为矩阵计算的“省电小能手”,这是一个优化矩阵乘法(AI训练的核心计算)的工具。通过低精度计算(FP8)提升速度,再用英伟达CUDA技术修正误差,既快又准,代码仅300行,安装简单,适合快速部署。
2月27日,DeepSeek开源两个工具和一个数据集:DualPipe、EPLB 以及来自训练和推理框架的分析数据,梁文锋本人也名列开发者之中。
DualPipe主要用于解决流水线并行中的“等待时间”问题。比如,多个任务步骤速度不一时,它能双向调度,减少空闲时间。EPLB则用于自动平衡GPU负载,当某些AI专家模型任务过重时,它会复制任务到空闲显卡,避免“忙的忙死,闲的闲死”。
2月28日,DeepSeek宣布开源3FS(Fire-Flyer File System)系统:3FS被称为数据处理的“极速组合”,采用分布式文件系统,利用高速存储和网络技术(如SSD、RDMA),让数据读取速度达到每秒6.6TB,适合海量数据训练。
DeepSeek究竟为何要选择开源?此次开源将如何辐射行业?
“DeepSeek的这波开源,相当于在英伟达的AI护城河上架起了浮桥。”北京邮电大学智能交互设计专业副教授谭剑向澎湃新闻记者表示,更重要的是,DeepsSeek团队这些开源模块证明了他们有能力深入剖解英伟达CUDA和并行计算芯片的紧密耦合模式,这也是传统AI研究领域认为是不可撼动的软硬件基础设施,是英伟达宽阔的护城河。
需要挂号联系客服 北京上海南京广州天津西安医院黄牛号贩子跑腿代挂号