扫描打开手机站
随时逛,及时抢!
当前位置:首页>综合资讯>

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用

时间:2023-07-15 16:01:40 来源:网络整理 作者:bianji123

感谢IT之家网友提供鲫鱼和雪狐的线索!

IT之家7月15日消息,智普AI联合清华KEG实验室决定-6B、-6B权重完全开放给学术研究,并在完成企业注册并获得授权后,允许免费商业使用。 注册地址点击此处进入。

IT之家此前报道,清华自然语言处理团队于3月14日发布了中英双语对话模型-6B百思特网,初步具备问答和对话功能。 该模型基于模型(百思特网GLM)架构,拥有 62 亿个参数。 结合模型量化技术,用户可以在消费级百思特网显卡上本地部署(INT4量化级别仅需要6GB显存)。

运-6B型号于6月25日发布,在保留原型号对话流畅、部署门槛低等特点的基础上,增加了诸多新功能:

-6B采用了Multi-Query,提高了生成速度,减少了生成过程中KV Cache的内存占用。 同时-6B使用Mask进行对话训练,连续对话时可以复用前几轮的KV Cache,进一步优化了内存使用。

广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。

本文地址:https://www.best73.com/zdmzt/274424.html
特别声明:以上内容来源于编辑整理发布,如有不妥之处,请与我方联系删除处理。
热门资讯
查看更多