鹏城实验室等开展合作突破国产算力大模型长窗口技术_

发布时间:2023-11-20 浏览: 次作者:作者：黄钰涵

　　齐齐哈尔新闻网北京11月19日电 (记者张素)上下文窗口长度，对于模型理解和生成与特定上下文相关文本极为重要，是大模型核心技术之一。记者近日采访获悉，鹏城实验室等相关机构开展合作，在国产算力大模型长窗口技术方面有所突破。

　　通常来说，更长的上下文窗口可以提供更丰富的语义信息，并且能够让模型生成的内容更准确流畅。“鹏城—百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练，未来可升级至192K。

　　据知，为提升上下文窗口长度和模型整体性能，百川智能和鹏城实验室对模型进行了全流程优化。在数据集构建方面，研发人员采用精细的数据构造，实现段落、句子粒度的自动化数据过滤、选择、配比，进一步提升了数据质量。

　　在全生命周期的模型工具集中方面，包括来自北京大学的王亦洲、杨耀东团队在内，多方开展合作，创新提出带安全约束的RLHF对齐技术，有效提升了模型内容生成质量和安全性。

　　鹏城实验室相关负责人表示，接下来还将广泛联合企业、高校和科研院所，通过开源群智的合作模式共享资源，为千行百业插上人工智能的“翅膀”。百川智能相关负责人也表示，希望通过开源、与合作伙伴共创等方式，助力中国大模型创新，促进本土大模型生态日益繁荣。

　　有评论认为，上述在大模型训练和应用领域的合作研发实践，对于国产算力大模型发展具有积极示范作用，希望更多科研机构、企业厂商基于各自优势形成合力，更好地满足国内不断增长的智能化转型需求，助力中国人工智能产业持续发展。(完)

【编辑:黄钰涵】

相关文章Related