据OpenCompass评测平台最新数据,OPPO大模型AndesGPT-7B以62.2的综合分位列中文数据集综合榜单中第五,在同为70亿(7B)规模参数下的大模型中排名第一。值得注意的是,OpenCompass提供的完整开源可复现的评测框架,可同时对大模型的多项能力进行评测,同时也意味着AndesGPT-7B是国内终端厂商首个已开源的大模型,将持续为中文大模型开源社区做出贡献。
(OpenCompass大语言模型评测榜单-中文数据集 2023/10/30)
OpenCompass是一款开源、高效、全面的评测大模型体系及开放平台,提供了多个不同维度的数据集和评测方式,基于语言、知识、推理、学科、理解、5 大维度,50余个数据集评估大语言模型能力。包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力,共计40+任务覆盖各项能力。
作为OPPO自主训练的大语言模型,AndesGPT以“端云协同”为基础架构设计思路,包含了一系列不同参数规模的大语言模型,从十亿起步,最高可多达千亿级,可支撑多元化的应用场景。据悉,OPPO于2020年就已启动大模型相关技术的探索与实践,大模型相关专利布局超过1400多个,目前也正联手10余所高校探索深入的合作,相关课题涉及端侧轻量化、大模型赋能泛在服务、意图推理、多模态生成等。AndesGPT-7B在OpenCompass平台上表现出色的情况下,也为大模型开源社区的共同进步贡献自己的力量。
目前,基于AndesGPT大模型打造的全新小布助手开启公测,对外展示了其云端应用的部分能力。同时,OPPO也与联发科技合作共建轻量化大模型端侧化部署方案,实现精度不掉点效果下端侧化性能更优,共同推动 AndesGPT 大语言模型和多模态大模型在端侧逐步落地。
11月16日,AndesGPT会在即将发布的ColorOS 14系统中被首次应用,AndesGPT更多元化的应用场景或将在之后揭晓。