鹏城实验室等开展合作 突破国产算力大模型长窗口技术

11

北京11月19日电 (记者 张素)上下文窗口长度,对于模型理解和生成与特定上下文相关文本极为重要,是大模型核心技术之一。记者近日采访获悉,鹏城实验室等相关机构开展合作,在国产算力大模型长窗口技术方面有所突破。

通常来说,更长的上下文窗口可以提供更丰富的语义信息,并且能够让模型生成的内容更准确流畅。“鹏城—百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练,未来可升级至192K。

据知,为提升上下文窗口长度和模型整体性能,百川智能和鹏城实验室对模型进行了全流程优化。在数据集构建方面,研发人员采用精细的数据构造,实现段落、句子粒度的自动化数据过滤、选择、配比,进一步提升了数据质量。

在全生命周期的模型工具集中方面,包括来自北京大学的王亦洲、杨耀东团队在内,多方开展合作,创新提出带安全约束的RLHF对齐技术,有效提升了模型内容生成质量和安全性。

鹏城实验室相关负责人表示,接下来还将广泛联合企业、高校和科研院所,通过开源群智的合作模式共享资源,为千行百业插上人工智能的“翅膀”。百川智能相关负责人也表示,希望通过开源、与合作伙伴共创等方式,助力中国大模型创新,促进本土大模型生态日益繁荣。

有评论认为,上述在大模型训练和应用领域的合作研发实践,对于国产算力大模型发展具有积极示范作用,希望更多科研机构、企业厂商基于各自优势形成合力,更好地满足国内不断增长的智能化转型需求,助力中国人工智能产业持续发展。(完) 【编辑:黄钰涵】

摩洛哥确诊病例增至1184例

人民日报:制止餐饮浪费 食堂责无旁贷

因伴侣感染新冠病毒 新西兰总理将居家隔离7天

山西朔州以瓷为媒对外开放合作 陶瓷产业助煤城转型发展

印度成功发射一箭9星 旨在加强海洋监测能力

江苏睢宁捣毁一特大黑产交易平台 涉案金额超2000万元

千分制不够用搞出双千分制:勿让基层困在指标体系里

西班牙拉帕尔马岛岩浆再次迸发 累计疏散逾6000人

飞海南航班客座率达九成 哈尔滨机场全力保障候鸟老人顺畅出行

意甲女排联赛对阵皮内罗洛 朱婷替补助斯坎迪奇连胜

交通运输部:不得擅自关停关闭高速公路服务区和收费站

保持人民情怀 记录伟大时代 习近平这样要求新闻工作者

香港邮政将发行“非物质文化遗产-扎作技艺”特别邮票

河南禹州市两地调整为高风险区域

ECMO,紧急大驰援

文章版权声明:除非注明,否则均为杜芹网络原创文章,转载或复制请以超链接形式并注明出处。