北京昊伟坤业科技
有限公司
公司地址:
北京市海淀区永丰屯538号1号楼2层227
技术热线:13601390828
销售热线:13041227525
邮箱:chenk@bjhwky.com
5月16日,浪潮信息“智算 开新局·创新机”全国巡展南京站开幕。会上,浪潮信息服务器操作系统KOS正式发布,KOS通过软硬协同的一体化设计,依托业内最全整机产品线,实现整机系统架构优化,最大程度发挥多元算力价值。
KOS是浪潮信息依托十余年的高端主机操作系统研发经验和龙蜥社区最新的成果,打造的面向智算时代的服务器操作系统,支持x86、ARM等多种芯片架构和计算场景,性能和稳定性通过了多项权威评测和大规模部署验证。通过软硬协同优化,基于KOS的人工智能、虚拟化、云原生等应用在开发效率、运行效率、扩展性等方面都得到了增强。在虚拟化场景,虚拟机迁移加速提升8倍;在云原生场景,容器密度提升10%;在分布式存储场景,随机写性能提升15%。凭借广泛的兼容生态、遍布全国的服务体系、丰富的行业实践,浪潮信息服务器操作系统KOS已经成为行业用户的首选。
大会外展,浪潮信息演示了KOS服务器操作系统及CentOS迁移解决方案,面对CentOS迁移替换需求,为行业用户提供了从环境调研、迁移评估、迁移验证、迁移实施到运行监控“五步走”的一站式解决方案,实现高效平滑迁移,整体迁移过程的自动化率达到 95%。
01 智算时代以系统设计应对算力发展瓶颈
AIGC的蓬勃发展,摩尔定律的失效,对算力系统提出了极大挑战。当前硬件性能提升遇到瓶颈,软件成为满足算力增长需求的一个方向,通过优化资源调度,同样能够达到最大化释放算力的效果。
作为算力基础设施提供商,浪潮信息提出了以应用为导向,以系统设计为中心,建立多元异构算力融合、软硬协同设计与优化的技术发展路线,持续提升计算力。操作系统是以系统设计为中心路线的关键,通过发挥操作系统软硬协同设计与优化的核心作用,将进一步使能硬件创新、充分释放硬件算力。
02 1+1>2 软硬协同深度优化实现场景增强
本次发布的服务器操作系统KOS,是基于龙蜥操作系统开发的衍生商业版,具备高效软硬协同、稳定可靠、全天候运维、全栈安全可信四大特点,同时依托自身覆盖云、数、智、边等业内最全整机产品线,实现整机系统架构优化,最大程度发挥多元算力价值。
在软硬协同方面,KOS通过设备管理、设备发现等一系列措施,简化了不同类型设备的管理,目前已与100+服务器整机、350+主流CPU、GPU、FPGA、网卡、存储及网络设备完成兼容认证,实现主流数据库、中间件、虚拟化、容器全覆盖;同时,KOS也提供了异构算力的编程模型和高效开发库,为上层提供统一的开发接口和运行时支持,屏蔽底层计算的差异,简化上层业务使用各种通用计算设备和专用加速设备。
通过软硬协同调度优化,基于KOS的人工智能、虚拟化、云原生等应用在开发效率、运行效率、扩展性等方面都得到了增强。同时,通过使能处理器的高级加速特性,KOS实现了云原生、人工智能场景的性能突破,基于分层内存的优化提升了PMEM/CXL内存的访问性能,基于NVME-oF互连与SMC-R实现了高性能存储、高性能网络。目前,KOS已经支撑浪潮信息分布式存储、虚拟化、云、AI等产品多次打破世界纪录。
为了最大化的发挥主机系统计算侧、存储侧、网络侧的算力,KOS设计了应用、算力、芯片跨层次的资源调度机制,通过深度感知应用的算力需求特征、负载特征,以及算力设备的能耗特征,实现业务与算力的最佳匹配和弹性伸缩。
03 高可靠机制保障系统级安全
作为一款服务器操作系统,稳定可靠是KOS的第一要求。
KOS通过安全可靠、RAS增强、完善的集群高可用支撑能力,提升整机系统的可靠性。KOS建立了从硬件启动、内核启动、驱动加载、应用执行完整可信链,为用户实现系统运行时持续保护、升级时安全检查、故障或破坏时自动恢复,保障系统安全性。
浪潮信息充分利用自身整机厂商的硬件优势,在操作系统层面联合固件、硬件进行协同创新,对整机系统RAS特性进行了增强。其中,KOS具备关键数据冗余机制,可对核心数据内存进行镜像保障业务关键数据可靠,而增强性容错能力则可将引起系统宕机的UCE进行降级容错处理,大幅降低了系统宕机率。此外,KOS深度挖掘硬件的RAS能力,支持CPU、内存等核心部件的热替换,能够有效提升系统可维护性,支持内核、应用软件的热升级,能够有效保障用户业务连续性。
除了系统层面的RAS增强外,在应用业务层KOS也提供了完善的集群高可用套件,包括集群数据共享、集群资源管理、集群成员管理等,有效支撑了业务集群化改造,保障业务连续性。
随着数据中心规模集中化、设备复杂程度与日俱增,运维普遍面临着监控数据不丰富、故障定位难、自动化程度不高等问题。浪潮信息KOS提供全天候运维解决方案,具备深度监控、专家诊断规则、云端运维服务接入等能力。KOS支持基于专家规则的自动化运维和诊断,可以方便地进行故障定位、性能分析、性能优化。同时,KOS可以无缝接入到浪潮信息InService云端运维服务,实现运维远程托管,提供故障预测、实时告警、一键报修、资源扩容、技术支持等全场景全天候运维能力。
凭借十余年高端主机操作系统经验沉淀、全面的产品体系、龙蜥的生态优势和遍布全国的软硬件全服务链,浪潮信息KOS累计装机量已超过20万,广泛服务于政府、金融、电信、互联网等行业用户,已成为千行百业客户业务稳定可靠运行的最佳选择。