OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
OpenAI发布多模态小模型GPT-4o mini,小模型成AI发展新趋势

近日,OpenAI正式发布了多模态小模型GPT-4o mini,这一举动在全球范围内引起了广泛关注。此前,OpenAI凭借GPT-3开创了AI模型的“暴力美学”时代,并以训练超大参数规模的模型能力在AGI赛道上建立了护城河。然而,此次发布的GPT-4o mini似乎标志着OpenAI正在转向“小模型”领域。
事实上,欧洲和中国的大模型团队早在2023年上半年就开始研究小模型。从智谱AI发布的对话小模型ChatGLM-6B,到Mistral发布的7B模型,再到面壁智能团队推出的2.4B的MiniCPM和多模态小模型8B MiniCPM-Llama3-V 2.5,以及商汤的1.8B SenseChat Lite和上海人工智能实验室OpenGV Lab团队的Intern-VL系列,小模型的发展已经成为一种趋势。
OpenAI的入局进一步证明了端侧模型和“智能小模型”是大势所趋。AI技术大牛Andrej Karpathy也在推特上表达了对小模型的看法,他认为未来会出现参数规模小但思考能力强的小模型,这些小模型才是AI“大模型”的最终目标。Karpathy指出,当前AI模型之所以“大”,是因为训练方法还不够高效。他强调,让小模型更智能的关键在于模型的知识,即训练数据。
总之,OpenAI发布GPT-4o mini不仅展示了小模型的巨大潜力,也预示着AI领域将迎来一个新的发展阶段。随着更多企业和研究机构的加入,小模型将成为推动AI技术进步的重要力量。