当前位置:首页 > 旅游 > 正文内容

让「GPT-4V」跑在手机上,这家中国大模型公司做到了

admin3个月前 (08-07)旅游42

面壁发布MiniCPM-V 2.6,端侧视频理解全面超越GPT-4V

让「GPT-4V」跑在手机上,这家中国大模型公司做到了

近日,面壁公司正式发布了MiniCPM-V 2.6,这款新模型在端侧性能上实现了对GPT-4V的全面超越。MiniCPM-V 2.6在单图、多图、视频理解等多模态核心能力上取得了显著突破,三项能力均达到了20B以下的SOTA成绩。该模型的单图理解能力已经可以与Gemini 1.5 Pro和GPT-4o mini相媲美。

此次发布的MiniCPM-V 2.6不仅在性能上有所提升,还在视觉token方面进行了优化,比同类模型低75%。这使得MiniCPM-V 2.6在编码像素密度上取得了两倍于GPT-4o的成绩。更重要的是,面壁将“实时”视频理解、多图联合理解、多图ICL等能力首次搬到了端侧,使大模型具备了实时看到真实世界的能力,这对于实现AGI具有重要意义。

MiniCPM-V 2.6的端侧内存占用仅为6GB,端侧推理速度达到18tokens/s,比上一代模型快33%。该模型还支持llama.cpp、ollama、vllm推理,并且兼容多种语言。此外,MiniCPM-V 2.6还具备强大的视频OCR功能,能够识别视频画面中的密集文字,为用户提供关键信息总结。

通过这些创新,面壁公司展示了其在端侧视频理解领域的技术优势,推动了多模态大模型在实际应用中的发展。未来,随着技术的不断进步,我们可以期待更多类似的技术突破,为人工智能的发展注入新的动力。

扫描二维码推送至手机访问。

版权声明:本文由文雀网发布,如需转载请注明出处。

本文链接:https://www.360wq.com/index.php/post/2060.html

分享给朋友:

“让「GPT-4V」跑在手机上,这家中国大模型公司做到了” 的相关文章

中国巴丹吉林沙漠—沙山湖泊群被列入《世界遗产名录》

中国巴丹吉林沙漠—沙山湖泊群被列入《世界遗产名录》

巴丹吉林沙漠—沙山湖泊群成功入选《世界遗产名录》在近日于印度新德里举行的联合国教科文组织第46届世界遗产大会上,中国的巴丹吉林沙漠—沙山湖泊群成功列入《世界遗产名录》。这一消息标志着中国自然遗产保护工作再次取得重要进展。巴丹吉林沙漠位于中国西北干旱温带荒漠区的阿拉善高原,是中国第二大流动沙漠。此次入...

百年老街上的时尚面孔

百年老街上的时尚面孔

百年老街宁阳路焕发新活力,雨水难挡游客热情青岛,2024年——尽管今年夏季青岛的雨水较往年偏多,但丝毫未影响游客们前往宁阳路的热情。这座经过旧城改造的百年老街,以其独特的魅力吸引了众多游人前来游览和休闲。人们纷纷被改造成酒吧、餐饮、服装精品店等的老街、老院、老屋所吸引,举起手机和相机,记录下这美好的...

当年背过的课文,还记得吗

当年背过的课文,还记得吗

国风音乐助力古文记忆,你还在为背书发愁吗?近日,一对90后国风音乐人奇然和沈谧仁凭借将高考必备古文改编成歌曲而走红网络。他们创作的《琵琶行》、《出师表》、《爱莲说》等60多首古文歌曲,以其独特的曲调和唯美的唱腔,吸引了大量粉丝。这种新颖的学习方式不仅让背诵变得轻松愉快,还帮助许多学生增强了记忆。回忆...

从无人知晓到明星物种,貉在上海成名只花了5年

从无人知晓到明星物种,貉在上海成名只花了5年

上海“明星物种”貉:从消失到回归,城市野生动物的新生近年来,城市中出现野生动物的新闻屡见不鲜,从南京的野猪到北京的黄鼠狼,而在上海,一种名为貉的动物正悄然回归。这种国家二级保护动物,外形介于浣熊、小狗和狐狸之间,因其广泛的食谱和聪明机敏的性格,逐渐适应了城市生活。据2023年上海市“貉口普查”报告,...

Coatue重磅报告解读:空间大模型与通用机器人

Coatue重磅报告解读:空间大模型与通用机器人

Coatue重磅报告:空间大模型与通用机器人能否引领未来?全球顶级对冲基金Coatue近日发布了一份关于“具身智能”的深度报告,揭示了AI机器人行业的现状与前景。报告指出,尽管机器人行业面临商业化难题,但通过空间大模型实现通用机器人的可能性正在增加。同时,机器人训练数据的缺乏是一个重大挑战,但远程操...

史上最贵ST股,戴不起DPU王冠

史上最贵ST股,戴不起DPU王冠

左江科技:DPU光环下的兴衰之路左江科技(300799.SZ)在A股市场的命运即将画上句号。这只曾被誉为“史上最贵ST股”的公司,因其子公司号称研发出对标英伟达的DPU(数据处理芯片)产品,股价曾在一年多时间内暴涨超过800%。然而,在被实施“退市风险警示”后,其股价一度接近300元/股,并在202...