登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
EAGLE-3作为新一代投机解码(speculative decoding)技术的重要突破,其核心价值在于突破了传统投机解码依赖完全独立草稿模型的技术局限。
欢迎体验 OpenVINO™本年度的首个版本发布!
通过MCP(Model Context Protocol) 和A2A(Agent-to-Agent) 协议协作多个专用智能体(酒店搜索、机票搜索、图片描述),并且用OpenVINO™ 模型服务器(OVMS) 在本地高效运行优化后的推理。
Xeon platform with 2x, 4x or 8x Arc Pro B60, and setup power for each GPU.
本文分享一个真实跑通的案例:在AI PC上,使用 Unsloth 进行 LoRA 微调,对 meta-llama/Llama-3.2-3B-Instruct 进行训练,让模型具备 Function Calling(工具调用) 能力,并完成推理与评测。
通义千问团队正式发布了 Qwen3-ASR 系列模型,包含 1.7B 和 0.6B 两个版本。作为 Qwen 语音家族的最新成员,它在多语言识别和处理复杂声学环境方面展现了卓越的性能。
继语音识别(ASR)之后,阿里巴巴通义团队再次发力,推出了全新的 Qwen3-TTS 系列模型。
OpenVINO™ 已完成 PaddleOCR-VL-1.5 的 Day 0 适配,并在英特尔® 酷睿™ Ultra 3系列上部署端到端文档解析流水线。
本文会通过实时语音翻译示例,带你一步步了解如何通过 Intel® OpenVINO™ 工具,把这两个模型优化成更轻量、推理更快、部署更灵活的版本,从而在 AIPC 上获得理想的性能。
如需获取适配的 Archive 版本库文件,可访问官方文档地址(https://openvinotoolkit.github.io/openvino.genai/docs/getting-started/installation),根据自身操作系统及版本下载对应的归档包;目前,开发者需要自行下载该项目,将其源代码中的 src 文件夹复制到自己的代码当中,以便更好地利用 OpenVINO™ Java