模型介绍今天,面壁智能正式发布端侧MiniCPM 4.0 模型,实现了端侧可落地的系统级软硬件稀疏化的高效创新。面壁推出的MiniCPM 4.0系列LLM模型拥有 8B 、0.5B 两种参数规模,针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B 采用「高效双频换挡」机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算

AI PC新突破 端侧首次支持128K上下文窗口 实现2.2倍推理优化
面壁智能正式发布并开源了「面壁小钢炮」端侧系列最新力作——MiniCPM 4.0 模型,实现了端侧可落地的系统级软硬件稀疏化的高效创新。英特尔与面壁智能从模型开发阶段就紧密合作,实现了长短文本多重推理效率的提升,端侧AI PC在Day 0全面适配,128K长上下文窗口等多方面突破。 双方开展了深度技术协同,基于英特尔硬件架构定制投机解码配置。通过硬件感知的草稿模型优化策略,结合英特尔加速套件与KV

在数字化与智能化激流涌动的今天,高速发展的生成式人工智能(Generative AI, GenAI)正以前所未有的力量重塑千行百业,为企业带来创新与发展机遇。但与此同时,复杂的技术方案、高昂的部署成本、专业的人才获取,以及可扩展性等方面的挑战也在阻碍企业进一步发挥生成式AI的潜能。 为助力企业跨越这些障碍,英特尔正积极通过开源的发展、开放生态的建设来为企业提供更多、更好、更易用的“一站式工具**”

OpenCV工作流引擎SDKOpenCV低代码开发工作流引擎SDK,支持C++、C#、Python,实现80%的OpenCV开发工作零代码,OpenCV开发效率提升十倍。OpenCV低代码开发工作流引擎支持找点、找边、找线段、找圆、找轮廓、支持图像预处理、图像增强、形态学习处理、边缘模板匹配、卡尺测量,最新版本赖于OpenCV4.10。同时C++版本已经支持YOLO11全系模型推理,三行代码实现模

OpenVINO2025+QWen2.5-VL多模态大模型应用演示
模型下载与转换 QWen-VL是主要是由QWen LLM、Vision Encoder、MLP-based Vision-Language Merger 三个组件组合完成的架构,完整的QWen-VL的架构图示如下: 当前支持Qwen/Qwen2.5-VL-3B-Instruct与Qwen/Qwen2.5-VL-7B-Instruct两个模型可供下载 huggingface-cli download
