大模型生产方式新变革,浪潮信息重磅发布四大技能模型

  当前,人工智能正在从技术向应用转化,如何有效解决应用场景碎片化问题成为关键,大模型的出现,使得模型的生产效率得到了极大的提高,技能模型就是典型的代表。前不久,浪潮信息发布了基于“源1.0”大模型生成的4个技能大模型(Skill Model),分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”。

  试想一下,千行百业都使用人工智能,如果一个场景一个场景的去定制,无论是时间成本还是人力成本都很高,维护的难度也很大。而技能大模型(Skill Model)带来了AI模型生产方式的新变革,将原本耗时数月经年的大模型开发训练周期,缩短至短短数周,极大降低了开发与训练成本。

  此次,浪潮信息发布了对话模型(“源晓问”)、翻译模型(“源晓译”)、问答模型(“源晓搜”)和古文模型(“源晓文”),在继承“源1.0”大模型通用的知识与能力基础上,面向特定领域的场景进行针对性的技能优化,模型精度和训练效率均处于业界领先:在十分之一参数量的情况下,即可在相同任务上复现98%的通用大模型效果,推理速度最高提升9倍。“源1.0”是浪潮信息在2021年发布的巨量中文语言模型,参数量高达2457亿,比此前OpenAI发布的GPT-3大模型,参数量增加40%,训练数据集提升10倍,发布时便问鼎中文语言理解评测基准CLUE榜单的零样本和小样本学习两类总榜冠军。

  目前,“源1.0”已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等等内容的开源开放,在GitHub社区、浪潮源官网均可以申请获取相关的资源,已有超600家用户借助“源1.0”提供的数据集和API,构建了覆盖金融、互联网、医疗和自动驾驶等行业的高水平人工智能应用。

  在未来,浪潮信息将继续进行技能大模型(Skill Model)的模型生产方式变革,推动AI生产力的升级,让行业用户甚至是中小用户也能利用大模型开展深度创新,从而加速整个社会的智能化升级。


本文地址:http://www.kejihangye.com/chanye/2148.html

温馨提示:创业有风险,投资须谨慎!编辑声明:科技行业网是仅提供信息存储空间服务平台,转载务必注明来源,部分内容来源用户上传,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,不可作为直接的消费指导与投资建议。文章内容仅供参考,如有侵犯版权请来信告知E-mail:1074976040@qq.com,我们将立即处理。

相关文章
今日推荐 MORE+
科技先锋 MORE+
科技新闻 MORE+
APP下载