发布“源2
2023-11-28 09:40:37
描述
  发布“源2.0”基本大模型的算力龙头!  11月27日,记者从浪潮信息中了解到,公司当天发布了“源2.0”基本大模型,并宣布全面开源。“源2.0”基本大模型包括1026亿、518亿和21亿三种参数模型,在编程、推理和逻辑方面表现
[本文共字,阅读完需要分钟]

  发布“源2.0”基本大模型的算力龙头!

  11月27日,记者从浪潮信息中了解到,公司当天发布了“源2.0”基本大模型,并宣布全面开源。“源2.0”基本大模型包括1026亿、518亿和21亿三种参数模型,在编程、推理和逻辑方面表现出先进的能力。

  同日,该公司在投资者关系平台上表示,作为计算系统的供应商,该公司支持多种异构计算能力,可以适应各种结构的人工智能加速芯片。公司一直致力于构建多种计算能力平台。公司期待与行业内更多的制造商合作,共同授权数千个行业。

  多项模型评价表现良好

  浪潮信息是世界领先的IT基础设施产品、解决方案和服务提供商,拥有8个研发中心、10个生产基地和26个分支机构,覆盖120多个国家和地区。公司长期扎根于服务器行业,专注于为客户提供先进的云计算、大数据、边缘计算等计算产品和解决方案。

  浪潮信息显示,基础大模型的关键能力是大模型在行业和应用中的重要支撑,但基础大模型的发展也面临着算法、数据和计算能力的诸多挑战。“源2.0”基础大模型提出了新的改进方法,提高了能力。

  据报道,在算法方面,“源2.0”提出并采用了一种新的注意算法结构,可以更好地学习自然语言的局部和全球语言特征,更准确、更人性化地理解自然语言的相关语义,提高模型的自然语言表达能力,提高模型的准确性。

  在数据方面,“源2.0”通过使用中英文书籍、百科全书、论文等高质量的中英文材料,降低了互联网语料内容的比例,结合高效的数据清理过程,为大型培训提供了高质量的专业数据集和逻辑推理数据集。

  “为了获取中文数学数据,我们清理了自2018年以来约12个PB的互联网数据,但只获得了约10个GB的数学数据,投资巨大,收入小。为了更有效地获得相对稀缺的高质量的中文数学和代码数据集,“源2.0”采用了基于大模型的数据生产和过滤方法,提高了各类数据质量,获得了一批高质量的数学和代码预训练数据,同时确保了数据的多样性。浪潮信息相关负责人举例说。

  在计算能力方面,“源2.0”采用不均匀流水平行方法,综合采用“平行流水线+优化器参数平行+数据平行”策略,显著降低了芯片间P2P带宽大模型的需求,为硬件差异大的训练环境提供了高性能的训练方法。

  上述负责人告诉记者,作为1000亿级的基本模型,“源2.0”在行业公开评估中进行了代码生成、数学问题解决和事实问答能力测试。测试结果表明,“源2.0”在许多模型评估中显示出更先进的能力性能。

  实现计算能全过程绿化

  在数字经济时代,计算能力已成为核心生产力。数据中心的绿色降碳作为计算能力的重要载体,涉及服务器、存储、网络、电源、散热、基础设施管理等方面。

  为了全面推进绿色计算,浪潮信息提出了“低碳、高效、健康”的绿色计算理念。浪潮信息服务器产品线总经理赵帅说:“我们应该从服务器的基本部件到整个机器系统,再到整个数据中心,在计算能力生产、运营和服务的各个环节实现整个计算能力过程的绿色,促进绿色计算能力在企业中的广泛应用。”

  据介绍,目前,浪潮信息从整体数据中心的规划、建设到实施一套完整的绿色解决方案,实现了从室外液体冷却到室内CDU的一次侧循环冷源、集液器、液冷二次侧循环、液冷服务器等全线布局,为用户打造绿色节能数据中心交钥匙工程。“同时,还可以帮助客户根据客户的环境采用模块化、预制化等不同的建设模式,最大限度地节能降碳。”

  构建绿色算力产业生态生态

  绿色计算是一个长期的过程,新的绿色节能技术正在不断迭代和演变。目前,浪潮信息已参与制定并发布了10多项液体冷却相关设计技术标准,牵头制定并发布了国内第一批冷板液体冷却核心部件集团标准,涵盖冷板、连接系统、冷量分配单元、监控系统等,填补了冷板液体冷却数据中心标准的空白。

  浪潮信息作为国内领先的计算能力企业,还牵头制定了《模块化数据中心通用规范》的国家标准,进一步促进了绿色数据中心产业的快速发展和绿色节能技术的大规模普及。

  赵帅说:“绿色实践和测量体系是减少计算能力来源碳排放所必需的。“由于行业定义了国家和地区宏观能效控制和大型计算能力中心的能效标准,但对整机和部件,特别是使用环节的碳排放评价缺乏统一的标准。为准确计算服务器计算能力和碳排放水平,浪潮信息与中国信息通信研究院联合发布了《绿色计算能力白皮书》,建立了“绿色计算能力评价体系”

  浪潮信息在促进绿色计算能力标准化的同时,通过智能、模块化、预制等创新实践,不断打造绿色数据中心的新模式,布局和建设一系列绿色生产线,促进绿色计算能力产业健康生态的建设。

  此外,浪潮信息还建立了亚洲最大的天池液冷产业基地,建立了研发、测试、生产、质量控制和交付全链液冷智能制造能力,实现了液冷产品的标准化、质量和系列生产,年产能超过10万台。

  浪潮信息表示,未来将继续与产业链上下游合作伙伴合作,依托强大的研发储备、丰富的产品系统、优秀的绿色智能供应交付能力,构建完善的生态产业模式,促进数据中心产业转型升级,加快数据中心产业绿色低碳发展。

  浙商证券研究日报指出,随着深度学习领域的快速发展,越来越多的应用场景需要使用大型模型进行培训和推理。然而,在大型模型开发的整个过程中,企业往往面临着切换硬件集群、适应底部硬件和微调优化等复杂问题。此外,由于大型模型研发周期长、部署门槛高等一系列挑战,“节省机会”开发手段难以满足需求。

  平安证券认为,目前,全球大型模型技术的发展正在蓬勃发展,大型模型需要大计算能力。作为全球服务器行业的领导者,浪潮信息在人工智能GC技术创新方面取得了积极的成果。公司具有较强的抗风险能力。在供应链波动后,从长远来看,公司仍将深刻受益于计算能力(包括人工智能计算能力)需求的增长。资料来源:《中国证券报》