本报记者 袁传玺
在持续了一年多的国产大模型鏖战后,云计算大厂终于陷入以价格换市场的老套路中。
5月21日,阿里云宣布通义千问大模型降价,其中GPT-4级主力模型Qwen-Long降价幅度甚至达到97%,API输入价格从0.02元/千tokens(文本中的基本单位)降至0.0005元/千tokens。一元钱买不到一个包子,却可以买200万tokens;另一大模型头部企业百度,宣布文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费,立即生效;就在上周,字节跳动在火山引擎原动力大会上发布豆包大模型,并喊出“0.8厘就能处理1500多个汉字,比行业便宜99.3%”的口号。
这意味着,大模型API调用的“免费时代”或将正式开启。
价格战硝烟已起
根据过去无数场互联网巨头商战经验,价格战后没有赢家。可是,为何大模型价格战不可避免?
业界普遍认为,抢占市场份额、加快商业化进程,是大模型价格战的主要起因。赛智产业研究院院长赵刚对《证券日报》记者表示,在“百模大战”的背景下,市场洗牌是必然趋势。当前,AI市场尚不成熟且应用场景不足,大模型价格战既能带来更多的应用合作伙伴和用户群体,激发更多应用场景,也能挤压竞争对手的生存空间,其必然成为头部互联网企业抢占市场竞争优势的重要手段。
“当前价格战的背后,也体现出国产大模型产品的大同小异,差距不大只能拼价格。预期价格战后将会有一批企业被淘汰,因此企业的首要目的是尽快扩大规模,确保领先地位。”工信部信息通信经济专家委员会委员盘和林向记者表示,预计随着同质化日益严重,未来大模型在C端有望实现免费化,B端价格则会继续下探。
另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。例如百度曾公布其文心大模型的推理成本已降到了一年前的1%。
“降低成本是推动大模型快进到‘价值创造阶段’的一个关键因素,并且大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。”火山引擎总裁谭待表示,大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值,从而催化出超越现有产品和组织模式的创新。
中小厂商路在何方?
硬币的另一面,就是行业中小及初创企业的生存空间被进一步压缩。2024年被认为是AI应用元年。根据云技术平台统计,截至2024年4月底,大模型相关项目中标公告已累计发布近200个,超越2023年总数。
一位大模型初创公司的负责人对《证券日报》记者表示,相较于大模型产业内的头部企业而言,中小公司的生存空间本就有限,在成本压力和价格战双重夹击下,目前公司已经陷入“进一步退两步”的尴尬局面,目前正在积极寻求转型。
对于AI大模型中小企业未来的机会,360集团创始人周鸿祎向《证券日报》记者表示,把模型做小是机会,以后每个人都可以在自己的电脑上、网联车上、手机上用起一个小规模的大模型,成为个人的私人助理,帮助个人进行更好的知识管理、信息采集、信息获取。面向个人(To C)的大模型也是方兴未艾,这里面一样可以发挥中国的人口红利优势和应用开发用户体验的优势。
当前,大模型行业进入竞争加剧的“白刃战”,企业要找到适合自身的发展之路,在数据、算法、算力都不如头部企业的前提下,如何走出差异化的变现之路,是中小大模型企业目前最应该做的,无论是深耕细分领域的行业大模型,还是加速应用的落地,都是大模型企业迫切需要解决的。而整个行业或将迎来强者越强,弱者越弱的马太效应。
在赵刚看来,随着市场格局重组,大模型产业生态将初步形成。国产通用大模型的市场集中度将进一步提升,头部大模型企业将主导通用大模型市场;行业大模型和专用大模型企业,将发展细分领域的轻量型、专业型大模型;更多中小创新企业则聚焦应用和商业模式创新,开发满足用户个性化需求的产品和解决方案。