海外主机测评

您现在的位置是:首页 > 数据库 > 正文

数据库

阿里云通义千问开源 免费可商用

cds8202023-08-07数据库48
8月3日,AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商业化。至此,阿里

8月3日,AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商业化。至此,阿里云也成为首个宣布大模型开源的大型中国互联网科技公司。用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

开源地址:https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练。预训练数据类型多样,包括大量网络文本、专业书籍、代码等。同时,阿里云在Qwen-7B的基础上,使用对齐机制打造了类ChatGPT的AI助手Qwen-7B-Chat。

通义千问7B预训练模型在多个权威基准测评中表现出色,中英文能力远超国内外同等规模开源模型,部分能力甚至“跃级”赶超12B、13B尺寸开源模型。

在英文能力测评基准MMLU上,通义千问7B模型得分超过一众7B、12B、13B主流开源模型。该基准包含57个学科的英文题目,考验人文、社科、理工等领域的综合知识和问题解决能力。

在中文常识能力测评基准C-Eval上,通义千问在验证集和测试集中都是得分最高的7B开源模型,展现了扎实的中文能力。

此外,Qwen-7 B-Chat专门针对API、数据库、模型等工具进行优化,方便用户可以构建基于Qwen-7 B的LangChain(浪链)、Agent(代理)和代码解释器等。

阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。

开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭,以AI模型为核心服务AI开发者。目前,魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型,已经成为中国大模型开源第一门户。

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~