规格参数 |
*.规格参数指标:(*)理论浮点计算能力*****Gflops; 并行环境:MPICH*等并行计算环境; 数值计算环境:包含有****多个用于工程和科学应用的数学函数。系统采用最新架构并发处理器,可扩展需要*颗,处理器***核心;基础频率*.*HZ;(*)数据指标:并行云系统采用高效数据系统,由于需要提供处理器直接数据读取,可分配容量每个处理核心至少需要**GB的容量;(*)存储容量:为方便使用,需配置热插拔硬盘背板(**Gbps)读写,*TB的企业级固态系统盘,作为热备份需要部署备份软件支持秒级切换阵列接口需要**口,前段硬盘损坏无差别替换不影响主体业务;可大数据高速存储至少**TB u.*数据中心级服务器高速存储硬盘,Sequential Read*,*** MB/s’*,*** MB/sKCU**;(*)网络双控存储:最大可安装**块*.*寸硬盘支持后期扩容*PB;向下级联,最大支持***块SAS/SATA盘 ;网络双控存储备份:为保证数据安全部署Active-Standby;(*)GPU:*张:接口:PCI Express *.*接口版本;CUDA核心 ****个,兼容性:需要与常规服务器机型完美兼容;(安装要求:测试无误硬件要求全新、原厂供货且包装完整,不接受组装及翻新使用过的产品 涡轮官方显卡 ;(*)网络接口:Intel ***** 双口万兆网口,***GB Intel OPA 高速网卡,含线缆模块;(*)设备外观:并行云机架式准系统,配带原装上架导轨。板载**个内存插槽;可前置**个*.*英寸SATA/SAS/SSD/U.*硬盘,存储部分可安装**块*.*寸硬盘;集成系统管理芯片,支持IPMI*.*、KVM over IP、虚拟媒体等管理功能,支持Redfish;可选TPM国际通用安全模块;(*)供电模块:为了确保平台的稳定可靠运行,需要提供冗余供电模块;支持大于等于**个双宽GPU卡,GPU连接拓扑。 *.产品特性:(*)平台能够处理大规模的机器学习任务。通过将机器学习任务分解成多个子任务,并利用并行处理能力,可以同时处理多个任务,从而提高任务的效率和吞吐量;(*)可通过虚拟化技术,创建虚拟环境,将机器学习场景映射到虚拟机中进行模拟。虚拟化技术能够隔离不同的机器学习实例,提供独立的计算环境,确保机器学习过程的可靠性和安全性;(*)同时支持多用户的协同工作。用户可以通过平台进行实时交流和协作,共享任务资源、数据和结果。使用网络协作的方式促进了团队合作和知识共享,提高了机器学习任务的效率和质量;(*)具备弹性计算的特性,能够根据用户需求进行资源调配。根据机器学习任务的规模和复杂度,平台可以动态分配计算资源,确保机器学习任务能够在最短的时间内完成,提高计算效率和灵活性;(*)数据安全由于机器学习过程中会产生大量的数据,平台提供了高效的数据管理系统,能够对机器学习数据进行存储、处理和分析。这样的数据管理能力为用户提供了更方便、可靠的数据支持,帮助用户更好地理解机器学习结果和做出决策。由于计算机机器学习技术可以重复进行无限次模拟实验,因此可以得出不同的结果,各种结果相互比较。 *.软件开发环境:需要完成并行超算云服务线下资源和公有云的结合使用。(平台搭建并行云计算),完成网络系统配置。:Parallel cloud集群管理系统 V*.*,含三年期 并行云 授权,安装调试完毕现场核验,集群软件需要与主机厂家为同一品牌。具体功能如下:(*)资源虚拟化:采用轻量级容器虚拟化技术,实现对 CPU、内存、磁盘等资源的虚拟化和统一管理。针对人工智能领域的特定需求,提供异构计算资源管理接口,实现异构计算资源的虚拟化统一管理,支持为容器以直通方式挂载异构计算资源;(*)容器管理:支持将创建的容器在线进行镜像打包,并支持将打包好的镜像上传镜像仓库,实现镜像版本的持续更新;(*)模型训练:允许用户上传自定义的代码程序和数据文件,通过在线提交计算资源需求即可启动训练任务,支持单机多卡和多机多卡的训练任务。支持在 Web 界面通过、VNC 客户端直接访问虚拟环境。支持通过 VScode 等工具进行远程调试;(*) 作业监控:支持输出损失率、准确率等动态可视化监控图表,同时支持输出训练过程日志,并提供日志查看功能;(*)版权:管理软件必须是国产,且为保证集群系统运行的稳定兼容性,必须与计算节点硬件品牌一致。 *.配置大模型 AI 加速模组,支持主流大语言模型 Llama *、Moss、Stable Diffusion、ChatGLM-*B 的训练和推理,能达到模型的快速收敛效果;预装支持多模态 AI 模型的运行库,可快速启动训练和推理任务;离线预装载完整版主流大语言模型库,保证模型完整的前提下可以进行百亿参数规模的模型训练和推理;预装专业 AI 加速库,在不影响快速收敛的前提下可以对 Transformer 模型中的参数进行精度优化;提供定制的 WEB UI 调参界面,支持浏览器中对模型做参数微调;AI 对话内容支持流式输出,并保存为文本文件提供 MPI 并行计算环境、浮点计算数学库及相关编译工具。提供网络文件系统和并行计算系统设置及维护。提供网络安全、系统配置服务,常规 Linux 使用介绍等。 |