Stability AI发布的新日语StableLM语言模型

Stability AI推出了其首个日语模型(LM),日语StableLM Alpha。该型号不仅是该公司的首创,而且还是日语使用者表现最好的开放式LM,在该领域树立了新标准。

日语 StableLM 是一个强大的工具,拥有 7 亿个参数和一个通用语言模型。它赢得了表现最佳的公开日本LM的殊荣,这是在综合基准测试套件中对其他四组日本LM进行严格测试后获得的头衔。

Stability AI已经使日本StableLM Base Alpha 7B在商业上可行的Apache许可证2.0下可用。与此同时,专为研究用途而设计的日本StableLM Instruct Alpha 7B将在学术界掀起波澜。

Stability AI 日语 StableLM

日本StableLM Base Alpha 7B是一个强大的工具,使用主要来自网络的大规模数据进行文本生成训练。这些数据主要由日语和英语文本组成,一小部分材料以源代码的形式存在。训练数据是一项协作工作,包括由Stability AI Japan创建的数据集,以及与EleutherAI Polyglot项目的日本团队合作开发的数据集,以及Stability AI Japan社区的成员。

日语 StableLM Instruct Alpha 7B 模型是一种独特的语言模型,经过微调以遵循用户说明。这种额外的调整是使用监督微调 (SFT) 进行额外训练来实现的。该模型的性能在各种任务上进行了评估,包括句子分类、句子对分类、问答和句子摘要。该评估是使用EleutherAI的lm-evaluation-harness基准进行的,其中日本StableLM Instruct Alpha 7B获得了令人印象深刻的54.71分,远远领先于其他日本型号。

这些模型在拥抱面部中心很容易获得,在那里可以测试它们以进行推理和额外的训练。这一举措证明了Stability AI对开放获取生成AI的承诺。该公司正积极与合作伙伴合作,在全球范围内提供下一代基础设施,重点是成像、语言、代码、音频、视频、3D 内容、设计、生物技术和其他科学研究。此版本标志着他们的使命向前迈出了重要一步,为日语使用者带来了先进的语言建模功能。

未经允许不得转载:统信UOS之家 » Stability AI发布的新日语StableLM语言模型

相关文章