多模态

【四维图新：鉴智机器人的PhiGo Max端到端全域城区领航智驾方案预留了通往L3级的升级空间】 四维图新12月23日在互动平台表示，公司与L3试点获批的两家车企在座舱、智能驾驶解决方案、车规级芯片等方向均有订单落地；此外，公司旗下的鉴智机器人的PhiGo Max端到端全域城区领航智驾方案，基于多模态认知推理和世界模型，搭载了两颗高性能旗舰算力芯片，总算力超1000Tops，预留了通往L3级的升级空间。

时间：2025-12-23 08:54:49 市场： A股

关联：四维图新机器人多模态

【机构：算力需求将持续高企】 近期，摩尔线程、沐曦股份等国内GPU企业密集上市。此外，文本基座模型和多模态模型的两大独角兽智谱、Minimax通过港交所上市聆讯，有望于2026年上市。国投证券指出，智谱为国内较早启动大模型研究工作的团队，研发出基于自回归填空的全国产预训练架构GLM系列模型，适配了40余款国产芯片，为业内通用性最高的模型之一；Minimax“模型—多模态—应用”全栈生态布局完善。大模型领域技术迭代与产品创新正不断提速，算力需求将持续高企。中信建投认为，AI大模型仍在持续迭代升级，竞争远未结束，算力需求旺盛，继续看好AI算力板块。北美链继续看好之外，国内链也建议重视，一方面国内链公司前期调整较多，而北美链光模块公司近期已纷纷新高，另一方面随着国产GPU能力及供给量的提升以及H200的放开，有望加速国内AI算力基础设施的部署节奏。（券商中国）

时间：2025-12-22 15:23:16 市场： A股综合

关联：摩尔线程沐曦股份多模态港交所创新中信建投

【豆包生视频功能升级，可同步生成声音和画面】 近日，豆包App视频生成能力升级，支持Seedance1.5 Pro模型，可一键生成声音和画面相匹配的有声视频。打开豆包App对话框，选择“照片动起来”，上传图片并输入提示词，选择“1.5 Pro”模型，即可体验。据字节跳动Seed官网介绍，Seedance 1.5 Pro是其新一代音视频创作模型，依托原生音视频联合架构与精细化后训练，Seedance 1.5 pro 较好地实现了对多模态指令的遵循。（新浪科技）

时间：2025-12-19 12:59:28 市场： A股

关联：多模态

【从“能回应”到“会共情” 首个虚拟数字人国家标准发布】 我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范空白，为客服型虚拟数字人的研发、生产和应用提供了统一的技术要求和评估标准。该标准构建了全链条技术规范体系，明确了客服型虚拟数字人系统的参考框架，涵盖形象生成、视觉交互、语音交互、情感交互、形象驱动和运营维护等模块。从基础的形象呈现到复杂的情感反馈，标准对不同类型、不同场景的数字人都提出了明确要求。在形象生成方面，标准规定2D数字人形象需保证五官细节完整清晰，3D超写实数字人模型面数不低于20万，在交互功能上，要求数字人支持语音、手势、肢体动作等多模态交互，同时具备关键词维护、语料更新等运营维护能力，确保服务持续优化。

时间：2025-12-18 09:42:17 市场： A股

关联：数字人多模态

【四维图新：投资鉴智机器人成为其第一大股东重组后的“新鉴智”将成为旗下智驾业务平台】 四维图新(002405.SZ)发布投资者关系活动记录表，公司以2.5亿元及所持图新智驾100%股权认购鉴智机器人发行的股份。本次投资完成后，公司合计持有鉴智机器人39.14%股份，成为鉴智机器人第一大股东。重组后的“新鉴智”将成为四维图新旗下智驾业务的平台，将作为Tier2为四维图新提供基于地平线与高通的双平台研发与量产能力。该交易增加四维图新合并报表投资收益约为15亿元。本次投资已在12月10日顺利完成。鉴智机器人提供从低阶到高阶、极具差异化及先发优势的产品矩阵，包括PhiGoMax端到端全域城区领航方案基于多模态认知推理和世界模型预测推演的一段式端到端范式，搭载两颗高性能旗舰算力芯片，总算力超1000Tops，预留了通往L3级的升级空间。目前该方案已获得头部新能源主机厂量产定点。

时间：2025-12-16 18:18:04 市场： A股

关联：四维图新投资机器人高通多模态新能源

【深圳地铁智能导盲犬上线服务】 12月13日上午，深圳地铁首次在黄木岗交通枢纽试点启用智能导盲犬“小蒜”，为视障人士地铁出行提供新型科技便利，这在全球轨道交通行业尚属首例。在黄木岗枢纽智能导盲犬示范应用现场，这款融合了多模态3D体素神经网络复合传感技术、室内外一体化规控技术和视觉语言大模型等人工智能成果的智能导盲犬，根据视障乘客的口头指令，即可自主完成路径规划、精准导航、智能避障、盲道循迹、语音互动、视觉识别等核心功能，引导乘客自主到达目的服务点，尽显科技创新下的深圳温度。（深圳特区报）

时间：2025-12-13 14:35:36 市场： A股

关联：多模态人工智能创新

【阿里巴巴宣布图片生成及编辑模型Qwen-Image更新】 阿里巴巴宣布图片生成及编辑模型Qwen-Image更新。新模型在图像编辑中维持了更高的一致性，并在多视角转换、多图像融合、多模态推理等方面取得突破进展。目前，新版本Qwen-Image已首发接入千问App，用户可无限次免费使用。此前，Qwen-Image基础版在用于通用图像生成的GenEval、DPG和OneIG-Bench，以及用于图像编辑的GEdit、ImgEdit和GSO等多个基准测试中均取得了最先进的性能，展现出其在图像生成与图像编辑方面的强大能力。（新浪科技）

时间：2025-12-02 11:09:32 市场： A股

关联：阿里巴巴多模态

【阿里Qwen-Image官宣更新，千问App首发接入】 阿里巴巴宣布图片生成及编辑模型Qwen-Image更新。新模型在图像编辑中维持了更高的一致性，并在多视角转换、多图像融合、多模态推理等方面取得突破进展。目前，新版本Qwen-Image已首发接入千问App，用户可无限次免费使用。此前，Qwen-Image基础版在用于通用图像生成的GenEval、DPG和OneIG-Bench，以及用于图像编辑的GEdit、ImgEdit和GSO等多个基准测试中均取得了最先进的性能，展现出其在图像生成与图像编辑方面的强大能力。（新浪科技）

时间：2025-12-02 11:09:05 市场： A股

关联：阿里阿里巴巴多模态

【我国航空遥感领域多项数据成果发布】 记者从中国科学院空天信息创新研究院获悉，在昨天（29日）举行的第二十三届中国遥感大会上，高分辨率机载多维度合成孔径雷达（SAR）地物分类数据集、多波段全极化机载SAR农作物精细分类数据集、机载多角度光学图像与激光点云数据集、典型场景高分光学与SAR全极化多模态特性数据集等典型数据集发布。这些数据集兼具多模态、高分辨率、高精度等属性，将在地物分类、三维重建、图像生成及修复等领域发挥重要作用。

时间：2025-11-30 13:32:48 市场： A股

关联：国航创新多模态

【腾讯混元OCR模型宣布开源】 11月25日，腾讯混元推出全新开源模型HunyuanOCR，参数仅为1B，依托于混元原生多模态架构打造，获得多项业界OCR应用榜单SOTA（最先进水平）成绩。

时间：2025-11-25 14:26:54 市场： A股

关联：腾讯新开源多模态

多模态

赞助商广告位