XPU

2025年11月6日
分类于技术方案, Devpi, Pytorch, XPU, 零成本

生产运维黑科技：零成本搭建 Devpi 私有 Pypi 镜像服务，PyTorch XPU 加速全攻略

想象一下：团队正在部署一个 PyTorch XPU 项目，兴冲冲地运行 pip install torch --index-url https://download.pytorch.org/whl/xpu，结果却卡在下载，进度条慢得让人抓狂。几小时后，安装终于完成，但第二天另一个同事重复同样流程，又是漫长等待。更糟的是，内网带宽有限，频繁从外网（如 https://download.pytorch.org/whl/xpu）拉取大体积 XPU 包，简直是效率杀手。你是否也遇到过这种“依赖地狱”？这正是我们今天要解决的痛点！

2025年7月12日
分类于技术方案, XPU, Qwen4, Ollama

分享：Ubuntu 环境下如何在 Intel xpu 上运行 ollama 驱动 Qwen3

随着人工智能技术的迅猛发展，特别是大语言模型（LLM）在企业级应用中的潜力日益凸显，如何在本地硬件上高效、安全地部署这些模型已成为开发者关注的焦点。英特尔作为AI硬件领域的领导者，通过其Core Ultra处理器（集成NPU和Arc GPU）以及IPEX-LLM（Intel Extension for PyTorch Large Language Models）优化库，提供了强大的端侧加速能力。结合轻量级的Ollama框架，我们可以在Ubuntu环境下，利用Intel XPU（特别是Arc系列GPU）实现Qwen3等开源大模型的本地化推理。

本文将详细分享一种基于Docker容器的部署实践：通过Intel官方的IPEX-LLM镜像，在Intel硬件上快速启动Ollama服务，并驱动Qwen3:8b模型运行。这种方式不仅充分利用了Intel GPU的异构计算优势，实现低延迟、高吞吐的推理，还确保了数据隐私和离线可用性，特别适用于企业AI解决方案的创新探索（如本次英特尔平台企业AI解决方案创新实践赛的项目开发）。

通过以下步骤，你将能轻松复现一个高效的本地LLM环境，开启端侧AI的新篇章。