登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
通过MCP(Model Context Protocol) 和A2A(Agent-to-Agent) 协议协作多个专用智能体(酒店搜索、机票搜索、图片描述),并且用OpenVINO™ 模型服务器(OVMS) 在本地高效运行优化后的推理。
Xeon platform with 2x, 4x or 8x Arc Pro B60, and setup power for each GPU.
本文分享一个真实跑通的案例:在AI PC上,使用 Unsloth 进行 LoRA 微调,对 meta-llama/Llama-3.2-3B-Instruct 进行训练,让模型具备 Function Calling(工具调用) 能力,并完成推理与评测。
通义千问团队正式发布了 Qwen3-ASR 系列模型,包含 1.7B 和 0.6B 两个版本。作为 Qwen 语音家族的最新成员,它在多语言识别和处理复杂声学环境方面展现了卓越的性能。
继语音识别(ASR)之后,阿里巴巴通义团队再次发力,推出了全新的 Qwen3-TTS 系列模型。
OpenVINO™ 已完成 PaddleOCR-VL-1.5 的 Day 0 适配,并在英特尔® 酷睿™ Ultra 3系列上部署端到端文档解析流水线。
本文会通过实时语音翻译示例,带你一步步了解如何通过 Intel® OpenVINO™ 工具,把这两个模型优化成更轻量、推理更快、部署更灵活的版本,从而在 AIPC 上获得理想的性能。
如需获取适配的 Archive 版本库文件,可访问官方文档地址(https://openvinotoolkit.github.io/openvino.genai/docs/getting-started/installation),根据自身操作系统及版本下载对应的归档包;目前,开发者需要自行下载该项目,将其源代码中的 src 文件夹复制到自己的代码当中,以便更好地利用 OpenVINO™ Java
Z-Image-Turbo是阿里巴巴通义实验室最新发布的高性能文生图模型。它基于先进的Diffusion Transformer架构,拥有60亿参数,核心特性在于仅需极少的推理步数(通常8至10步)即可快速生成细节丰富、质感逼真的高质量图像。Z-Image-Turbo模型非常适配AI PC场景,目前已针对搭载Intel Core Ultra处理器的平台进行优化,能够充分利用其内置的CPU与GPU进
本文更聚焦于 “落地实用性”:手把手教你如何借助 OpenVINO™ 工具,将这款优秀的翻译模型成功部署在 Intel 平台上实现高效推理。