今日,字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL ,向更优智能体迈步 。
据介绍,Seed1.5-VL在超过3Ttokens的多模态数据上进行预训练,具备更强的通用多模态理解和推理能力,且推理成本显著降低。
目前在多模态大模型领域 ,谷歌最新推出的大模型Gemini 2.5 Pro表现出色,已支持图像 、视频、音频与代码的统一理解,且在多个基准测试(如MME、Math Bench)中领先于GPT-4.0。
字节团队表示 ,尽管Seed1.5-VL的激活参数仅有20B,但其性能可达到与Gemini 2.5 Pro相当的水平,在60个公开评测基准中的38个上取得SOTA(最新最优性能 ,state-of-the-art performance)表现,包括19项视频基准测试中的14项,以及7项GUI代理任务中的3项:
1、视觉能力突出
Seed 1.5-VL在视觉推理 、图像问答、图表理解与问答、视觉定位/计数 、视频理解、GUI智能体等任务中均表现突出。其中 ,在以Agent(智能体)为中心的任务(如GUI控制和游戏)中,Seed 1.5-VL在7个GUI智能体任务中的3个取得了SOTA成绩 。
2、交互性更强
精简的架构设计显著降低了推理成本和计算需求,使模型更适合交互式应用。比如该模型增强了GUI(图形用户界面)定位性能 ,可在PC端 、手机端等不同环境中完成复杂交互任务,包括收集处理信息、在开放游戏中推理和行动等。
字节团队表示,Seed 1.5-VL进一步提升了视觉理解和推理能力,并向VLM(视觉语言模型)的通用性能力更近一步 。但仍存在一定的局限性。
首先 ,在细粒度视觉感知方面,模型在处理目标计数、图像差异识别以及复杂空间关系解释时仍面临挑战,主要在目标排列不规则 、颜色相似或部分遮挡等极端情况下;其次 ,在高层次推理任务中,如解决华容道谜题、导航迷宫或遵循复杂指令时,有时模型会引入无根据的假设或产生不完整的响应 ,表现仍有提升空间。此外,在视频推理方面,模型尚难以准确识别动作的先后顺序或从物体的前后状态推断顺序 。
目前 ,Seed 1.5-VL已在火山引擎上开放API供用户体验。
多模态指的是能够处理和理解来自多种不同来源和形式的信息的系统,如文本、图像 、音频、视频等。多模态技术使机器学习模型能够更全面地理解和表达复杂的真实世界场景,国内大模型厂商纷纷竞逐多模态 。
5月6日谷歌DeepMind团队发布多模态大语言模型Gemini 2.5 Pro ,在多个指标上登顶AI排行榜LMArena。
北京时间4月17日,OpenAI发布o系列多模态推理大模型o3与o4-mini。该系列模型在大规模强化学习与图像思维链整合技术的加持下,多模态推理能力显著增强,工具应用能力大幅提升 。
应用方面 ,近期多款大厂的AI应用实现多模态功能更新,如文小言升级语音大模型、图片问答能力;腾讯元宝上线10张图片同时处理的功能;豆包文生图功能实现升级,新版深度思考开启测试。
平安证券称 ,近期包括OpenAI、豆包在内发布的新模型,解题思路在此前思维链CoT基础上,更多体现对模型原生Agent能力(即工具使用)以及多模态推理能力的重视。全球大模型领域的竞争依然白热化 ,坚定看好AI主题的投资机会,当前Agent在企业端落地进度较为靠前,AI应用建议关注OA/ERP/编程/办公等领域;算力方面 ,Agent将带来更多的推理端应用需求,从而拉动推理端算力乃至整体算力需求向上。
开源证券日前发布研报称,国产模型近期在多模态 、推理能力上持续突破 ,多款达到全球顶尖水平,加之头部模型开源,大模型厂商持续发力Agent,将继续推动AI应用深入落地 ,拉动推理算力需求,建议继续布局AI 。
中国股票配资网平台官网:配资知名股票配资门户-港股上市首日大涨 宁德时代“新动力”何在?曾毓群详谈零碳科技布局
配资一流证券配资门户:配资股票的合法平台有什么-央行:丰富“互换通”产品类型 促进中国金融市场高水平对外开放
杭州股票配资门户:炒股的杠杆平台-6个半小时带货5500万元 数字人罗永浩首战告捷 百度能否用AI打开电商新世界?
杠杆配资:五倍股票杠杆-OpenAI、字节跳动宣布上新、降价! 奥尔特曼:未来AI成本或收敛至电力成本
配资可信股票配资门户:配资平台官网配资-中国人民银行与巴西央行签署金融战略合作谅解备忘录并续签双边本币互换协议
香港配资公司:股票配资导航网-谷歌I/O大会:搜索进入多模态AI时代 首款AR眼镜由中国品牌操刀
启盈配资-山东炒股配资开户提示:文章来自网络,不代表本站观点。
启盈配资-山东炒股配资开户=加杠杆炒股票,尽在正规股票配资平台!提供安全可靠的杠杆交易服务,支持手机版下载,随时随地掌握市场动态。精选优质股票配资平台排行,助您快速找到适合的投资工具,轻松实现财富增值。专业保障资金安全,操作便捷高效,让投资更简单!
随着全球贸易战以及美国经济衰退风险不断加剧,近期华尔街投行密集下调了标普500指数的目标价。仅本周一(4月7日)...
宏观要闻两部门发文加强高等职业教育医养照护与管理专业建设工作据教育部网站周三发布消息,教育部、国家卫生健...
界面新闻记者|安震4月17日...
记者辛圆猪价近期呈现疲弱态势。农业农村部监测数据显示,2月份全国猪肉价格连续4周下降。另据中国养猪网数...
记者辛圆据新华社周一发布消息,中共中央、国务院印发的《加快建设农业强国规划(2024-2035年)》(...