关闭广告

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro10337人阅读



机器之心报道

编辑:蛋酱、陈萍

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。



我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

  • CodeLlama - 70B,基础代码模型;
  • CodeLlama - 70B - Python,专门面向 Python 的 70B;
  • Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。



Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

  • Code Llama,基础代码模型;
  • Code Llama-Python,Python 微调版;
  • Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。



Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:







也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。



参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

遥望科技去年预亏至少8亿元:鞋履业务经营亏损,计提坏账金额大幅增加

澎湃新闻 浏览 10372

见证历史,瑞银宣布收购瑞信;海外欠债9.8亿?张兰回应:被资本算计

证券时报e公司 浏览 16927

上海一医院侧门疫情后封闭至今 官方回应病人无法接受

上观新闻 浏览 59922

男子骑电动车跑1500公里回家:每天花1百元 骑了半个月

极目新闻 浏览 71150

ST华铁连续四年财报不真实拟被罚

雷达财经 浏览 10578

国乒梦之队!大满贯首日6战全胜,王曼昱惊险,樊振东陈梦横扫

天涯沦落人 浏览 9591

普京就芬兰加入北约发出警告:俄将在西北设新军区

环球网资讯 浏览 10725

9.4分国产神剧一夜口碑暴跌差评不断,全因"爹味"?

毒舌电影 浏览 16449

上海市监局回应"凉皮里加黄瓜丝"被罚:重点不是黄瓜丝

上游新闻 浏览 82633

消息称三星下半年推出Vision Pro竞品,搭载XR2 Plus Gen 2

IT之家 浏览 10461

亚马逊史上最惨裁员规模又扩大了:媒体和游戏直播部门新年解雇数百人

华尔街见闻官方 浏览 10195

何婉鸿葬礼完成,紧挨弟弟何鸿燊安葬,旧照公开

素素娱乐 浏览 17468

互联网大厂加码订购背后 国产芯片仍缺生态加持

财联社 浏览 12441

媒体:国产"双尾蝎"编队试飞视频首公开 三点值得关注

枢密院十号 浏览 83572

贝嫂素颜出镜翻车,疑眼皮提拉失败额头过度填充

好丹 浏览 10505

上月7只新基金有效认购仅为1户

每日经济新闻 浏览 10396

全台湾拼吃菠萝,军队吃完监狱吃?

海峡导报社 浏览 23848

立陶宛称中国有可能干涉立陶宛大选 外交部:没有兴趣

外交部网站 浏览 74746

斯基拉:国米仍想明夏免签塔雷米,计划开出3年合同打动他

直播吧 浏览 11476

俄发视频展示缴获的美战车 美称无法证实

环球网资讯 浏览 13830

蔡依林宣布入驻快手,独家直播开唱定档7月14日

网易科技报道 浏览 13189
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1