关闭广告

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro8741人阅读



机器之心报道

编辑:蛋酱、陈萍

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。



我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

  • CodeLlama - 70B,基础代码模型;
  • CodeLlama - 70B - Python,专门面向 Python 的 70B;
  • Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。



Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

  • Code Llama,基础代码模型;
  • Code Llama-Python,Python 微调版;
  • Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。



Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:







也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。



参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

智能体验持续进化,路特斯再迎OTA升级

天天汽车 浏览 8543

火箭不该交易探花签:追米切尔或掏空休城 20岁神射才是最佳选择

罗说NBA 浏览 7246

拜登下令空袭叙利亚,好战本性暴露无遗

趣看热点 浏览 172292

比亚迪数据合规新动作:对外招募供应商,百人以上大型综合性律所优先

21世纪经济报道 浏览 11785

15岁男孩玩直播花光姐姐17万彩礼 姐姐:本想给他买房

新闻晨报 浏览 49310

媒体:俄乌战场形势发生微妙变化 俄军开始攻城略地

上观新闻 浏览 11684

美联储1月会议最值得关注的大事:何时开始放缓"缩表"?

Wind万得 浏览 8896

因国内矛盾被美大使警告后 以色列怒怼:少管闲事

环球网资讯 浏览 15068

民营企业家行贿25万一审被判11年半 二审改判1年2个月

经济观察报 浏览 53926

俄专家称瓦格纳集团未来或有三种可能:不会彻底消亡

红星新闻 浏览 68663

楼市半载江湖巨变:超300条调控政策,仍未扭转市场降温走向

第一财经资讯 浏览 11444

中美科技角力20年:从山寨王国到弯道超车

字母榜 浏览 14310

记者:巴黎引进维加交易取得进展,希望球员本周末完成体检

直播吧 浏览 11374

马嵬坡之变主谋是陈玄礼?唐玄宗痛失杨贵妃竟然他想报复

趣看热点 浏览 22010

年末商战打响,京东采销喊话拼多多

第一财经资讯 浏览 8638

乔欣、章若楠的“叠叠乐”穿搭,适合逛公园吗?

瑞丽网 浏览 15031

又一老夫少妻宣布婚讯,娱乐圈怎么了?

她刊 浏览 9222

特朗普上台后,美国的“狗腿子”要小心了!

浏览 886

NBA全明星赛:东部211分创历史轻取西部,利拉德39分夺MVP

懂球帝 浏览 8489

“AI原生”骗局江湖:真的真视频、假的真视频、真的假视频、假的假视频

钛媒体APP 浏览 8582

黄奕在了不起的姐姐中谈到女儿曾被前夫诱导拍对话视频

趣看热点 浏览 23776
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1