- 业界 2024-05-16 09:52

uiuc发布starcoder2-凯发游戏

站长之家（chinaz.com）5月16日消息:uiuc与bigcode组织的研究者们最近发布了starcoder2-15b-instruct，这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了codellama-70b-instruct，登上了代码生成性能榜单之巅。

starcoder2-15b-instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。通过自我生成数千个指令-响应对，直接对starcoder-15b基座模型进行微调，无需依赖昂贵的人工标注数据，也无需从商业大模型中获取数据，避免了潜在的凯发游戏的版权问题。

qq截图20240516095238.png

在humaneval测试中，starcoder2-15b-instruct以72.6%的pass@1成绩脱颖而出，较codellama-70b-instruct的72.0%有所提升。在livecodebench数据集的评估中，这一自对齐模型的表现甚至超越了基于gpt-4生成数据训练的同类模型，证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。

starcoder2-15b-instruct的数据生成流程主要包括种子代码片段的采集、多样化指令的生成和高质量响应的生成三个核心步骤。种子代码片段的采集是通过从开源代码片段中选取高质量、多样化的种子函数开始的。然后，基于这些种子函数的不同编程概念，starcoder2-15b-instruct能够创建出多样化且真实的代码指令。最后，通过自我验证的方式确保生成的响应是准确且高质量的。

qq截图20240516095244.png

starcoder2-15b-instruct在备受瞩目的evalplus基准测试中表现出色，超越了规模更大的grok-1command-r 和dbrx，并与snowflake arctic480b和mixtral-8x22b-instruct等业界翘楚性能相当。此外，在livecodebench和ds-1000等评估平台上也展现出了强大的实力。

该项目的成功实施得到了美国东北大学arjun guha课题组、加州大学伯克利分校、servicenow和hugging face等机构的鼎力支持。

starcoder2-15b-instruct-v0.1的发布标志着研究者们在代码模型自我调优领域迈出了重要一步。这款模型的成功实践展示了通过自我调优同样能够构建出性能卓越的代码模型。同时，该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。

模型地址:https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴u盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙cpu排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

腾讯云 ai 代码助手正式上线基于混元大模型打造

2024-05-222.2万阅读

2024-05-072.3万阅读

openai 发布新的模型规范，揭示对ai行为的期望

2024-05-092.2万阅读

2024-05-232.0万阅读

2024-05-131.6万阅读

2024-04-281.4万阅读

大模型api接口费用对比：阿里百度字节ai哪家最便宜？

2024-05-235782阅读

2024-05-171.3万阅读

2024-05-239029阅读

2024-05-214350阅读

openai发布最新旗舰大模型gpt-4o：免费试用价格五折速度提高一倍

2024-05-142.2万阅读

2024-05-202.3万阅读

2024-05-239071阅读

2024-05-231.4万阅读

凯发游戏-凯发ag旗舰厅

it业界

热点视频

站长资讯

好物榜

更多分类

更多主题

uiuc发布starcoder2-凯发游戏

推荐关键词

24小时热搜

大家正在看

腾讯云 ai 代码助手正式上线基于混元大模型打造

openai 发布新的模型规范，揭示对ai行为的期望

大模型api接口费用对比：阿里百度字节ai哪家最便宜？

openai发布最新旗舰大模型gpt-4o：免费试用价格五折速度提高一倍

ai日报：谷歌终极杀器硬刚gpt-4o、sora；字节推出豆包大模型“全家桶”；阿里再推ai虚拟试衣神器；腾讯开源混元文生图大模型

微软宣布 gpt-4o 模型在 azure openai 上使用

“数字中国”前瞻：谁是ai大模型时代的驯龙高手？

腾讯问卷推出ai功能已接入腾讯混元大模型

小米ai大模型milm通过备案将应用于手机、汽车产品中

大模型免费时代来了！腾讯自研混元大模型全面降价：混元-lite模型免费

凯发游戏-凯发ag旗舰厅

it业界

热点视频

站长资讯

好物榜

更多分类

更多主题

uiuc发布starcoder2-凯发游戏

推荐关键词

24小时热搜

大家正在看

腾讯云 ai 代码助手正式上线 基于混元大模型打造

openai 发布新的模型规范，揭示对ai行为的期望

大模型api接口费用对比：阿里百度字节ai哪家最便宜？

openai发布最新旗舰大模型gpt-4o：免费试用 价格五折速度提高一倍

ai日报：谷歌终极杀器硬刚gpt-4o、sora；字节推出豆包大模型“全家桶”；阿里再推ai虚拟试衣神器；腾讯开源混元文生图大模型

微软宣布 gpt-4o 模型在 azure openai 上使用

“数字中国”前瞻：谁是ai大模型时代的驯龙高手？

腾讯问卷推出ai功能 已接入腾讯混元大模型

小米ai大模型milm通过备案 将应用于手机、汽车产品中

大模型免费时代来了！腾讯自研混元大模型全面降价：混元-lite模型免费

腾讯云 ai 代码助手正式上线基于混元大模型打造

openai发布最新旗舰大模型gpt-4o：免费试用价格五折速度提高一倍

腾讯问卷推出ai功能已接入腾讯混元大模型

小米ai大模型milm通过备案将应用于手机、汽车产品中