当前位置：首页 > 社会 > 正文内容

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

admin8个月前 (08-07)社会127

OpenAI发布多模态小模型GPT-4o mini，小模型成AI发展新趋势

近日，OpenAI正式发布了多模态小模型GPT-4o mini，这一举动在全球范围内引起了广泛关注。此前，OpenAI凭借GPT-3开创了AI模型的“暴力美学”时代，并以训练超大参数规模的模型能力在AGI赛道上建立了护城河。然而，此次发布的GPT-4o mini似乎标志着OpenAI正在转向“小模型”领域。

事实上，欧洲和中国的大模型团队早在2023年上半年就开始研究小模型。从智谱AI发布的对话小模型ChatGLM-6B，到Mistral发布的7B模型，再到面壁智能团队推出的2.4B的MiniCPM和多模态小模型8B MiniCPM-Llama3-V 2.5，以及商汤的1.8B SenseChat Lite和上海人工智能实验室OpenGV Lab团队的Intern-VL系列，小模型的发展已经成为一种趋势。

OpenAI的入局进一步证明了端侧模型和“智能小模型”是大势所趋。AI技术大牛Andrej Karpathy也在推特上表达了对小模型的看法，他认为未来会出现参数规模小但思考能力强的小模型，这些小模型才是AI“大模型”的最终目标。Karpathy指出，当前AI模型之所以“大”，是因为训练方法还不够高效。他强调，让小模型更智能的关键在于模型的知识，即训练数据。

总之，OpenAI发布GPT-4o mini不仅展示了小模型的巨大潜力，也预示着AI领域将迎来一个新的发展阶段。随着更多企业和研究机构的加入，小模型将成为推动AI技术进步的重要力量。