马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

219次浏览

  马斯克用行动反击 开源自家顶级大模型 压力给到OpenAIJji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然不同的选择。3月17日,马斯克宣布开源Grok-1,这使得Grok-1成为当前参数量最大的开源大语言模型,拥有3140亿参数,远超OpenAI GPT-3.5的1750亿。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有意思的是,Grok-1宣布开源的封面图为Midjourney生成,可谓“AI helps AI”。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  一直吐槽OpenAI不open的马斯克,自然要在社交平台上含沙射影一番,“我们想了解更多OpenAI的开放部分。”Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  Grok-1遵照Apache 2.0协议开放模型权重和架构。这意味着它允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。这种开放性鼓励了更广泛的研究和应用开发。项目发布至今,已经在GitHub上揽获6.5k星标,热度还在持续增加。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  项目说明中明确强调,由于Grok-1是一个规模较大(314B参数)的模型,需要有足够GPU内存的机器才能使用示例代码测试模型。网友表示这可能需要一台拥有628 GB GPU内存的机器。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  此外,该存储库中MoE层的实现效率并不高,之所以选择该实现是为了避免需要自定义内核来验证模型的正确性。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  目前已开源的热门大模型包括Meta的Llama2、法国的Mistral等。通常来说,发布开源模型有助于社区展开大规模的测试和反馈,意味着模型本身的迭代速度也能加快。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,由马斯克旗下的AI创企xAI在过去4个月里开发。回顾该模型的开发历程:Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在宣布成立xAI之后,相关研究人员首先训练了一个330亿参数的原型语言模型(Grok-0),这个模型在标准语言模型测试基准上接近LLaMA2(70B)的能力,但使用了更少的训练资源;Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  之后,研究人员对模型的推理和编码能力进行了重大改进,最终开发出了Grok-1并于2023年11月发布,这是一款功能更为强大的SOTA语言模型,在HumanEval编码任务中达到了63.2%的成绩,在MMLU中达到了73%,超过了其计算类中的所有其他模型,包括ChatGPT-3.5和Inflection-1。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  与其他大模型相比,Grok-1的优势在哪呢?Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  xAI特别强调,Grok-1是他们自己从头训练的大模型,即从2023年10月开始使用自定义训练堆栈在JAX和Rust上训练,没有针对特定任务(如对话)进行微调;Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  Grok-1的一个独特而基本的优势是,它可以通过X平台实时了解世界,这使得它能够回答被大多数其他AI系统拒绝的辛辣问题。Grok-1发布版本所使用的训练数据来自截至2023年第三季度的互联网数据和xAI的AI训练师提供的数据;Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%,这一庞大的参数量为其提供了强大的语言理解和生成能力。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  xAI此前介绍,Grok-1将作为Grok背后的引擎,用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。未来,长上下文的理解与检索、多模态能力都是该模型将会探索的方向之一。Jji流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:http://m.llsum.com/show-2-3998-0.html马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

6.98~8.58 万元,比亚迪海鸥荣耀版车型上市:纯电续航 305 405km
3 月 6 日消息,比亚迪海鸥荣耀版今日起上市,官方指导价为 6.98~8.58 万元,之前的版本为 7.38-8.98 万元。活力版 6.98 万元自由版 7.58 万元飞翔版 8.58 万元整理新车参数如下:尺寸:长宽高 3780×1715×1540mm,轴距
宝马集团:超级充电站已投建54座,对外开放
近日,宝马公布了最新的充电设施建设情况。官方数据显示,截至2024年1月底,宝马已投建54座超级充电站项目,覆盖国内17个一、二线城市,向所有品牌的电动车开放。  截至2024年1月底,已有632家宝马授权经销商配备了充电设
江淮华为工厂项目公示:年产量超20万
近日, 安徽省生态环境厅受理公示了江淮年产20万辆中高端智能纯电动乘用车建设项目环境影响报告书。据报告书显示,该工厂将投资39.805亿元。按照产销预测,未来5年,江淮乘用车销量将超50万辆,其中新增的DE和X6平台产品将
东风公司王建清两会建议:创新企业用工机制
2024年全国两会期间,东风公司全国人大代表王建清带来4项与汽车产业相关建议,包括《关于创新用工机制 吸引高技能人才稳岗建功的建议》《关于推动新能源汽车产业高质量发展 加快把湖北建成中部地区崛起重要战略支点
Stellantis宣布:5年向南美投资56亿欧元
3月7日,Stellantis集团宣布从2025年到2030年期间,集团将向南美洲投资56亿欧元。据悉,这将是南美洲汽车产业史上所获得的金额最大的投资。  值得一提的是,Stellantis集团将“南美洲、中东及非洲、中国、印度和亚太”
五菱扬光新能源商用车正式上市:首搭红 1 号电池,7.18 万元起
3 月 11 日消息,据“五菱汽车”官方公众号,五菱扬光车型今日正式上市,该车号称“全新一代超大空间新能源商用车”,整理该车规格售价信息如下:230KM 实用性:7.18 万元 300KM 实用性:7.98 万元 300KM 舒适性:8.38 万元

热点精选

最新推荐

您可能感兴趣