指定网站建设前期规划方案建筑设计网站免费
2026/3/12 10:19:07 网站建设 项目流程
指定网站建设前期规划方案,建筑设计网站免费,自建网站餐饮服务提供者应在通信主管部门备案后,网站建设公司不给ftp本次部署模型Qwen-Image。 1. vllm-Omni vLLM 最初是为了支持文本自动回归生成任务的大型语言模型而设计的。vLLM-Omni 是一个框架#xff0c;它扩展了对全模态模型推理和服务的支持 全模态#xff1a;文本、图像、视频和音频数据处理非自回归架构#xff1a;将 vLLM 的 A…本次部署模型Qwen-Image。1. vllm-OmnivLLM 最初是为了支持文本自动回归生成任务的大型语言模型而设计的。vLLM-Omni 是一个框架它扩展了对全模态模型推理和服务的支持全模态文本、图像、视频和音频数据处理非自回归架构将 vLLM 的 AR 支持扩展到 Diffusion Transformers (DiT) 和其他并行生成模型异构输出从传统的文本生成到多模态输出2.环境准备vllm环境准备使用vllm-ascend镜像本例使用quay.io/ascend/vllm-ascend:v0.12.0rc1-openeuler镜像下载地址Quayvllm-omni环境准备github上下载vllm-omni代码仓库git clone https://github.com/vllm-project/vllm-omni.git cd vllm-omni pip install -e -v . 。。。 Successfully installed accelerate-1.12.0 aiofiles-24.1.0 antlr4-python3-runtime-4.9.3 brotli-1.2.0 cache-dit-1.1.8 diffusers-0.36.0 ffmpy-1.0.0 gradio-5.50.0 gradio-client-1.14.0 groovy-0.1.2 importlib_metadata-8.7.1 omegaconf-2.3.0 orjson-3.11.5 pillow-11.3.0 pydantic-2.12.3 pydantic-core-2.41.4 pydub-0.25.1 resampy-0.4.3 ruff-0.14.10 safehttpx-0.1.7 semantic-version-2.10.0 tomlkit-0.13.3 vllm-omni-0.12.0rc1 zipp-3.23.0安装成功版本查看vllm 0.12.0empty /vllm-workspace/vllm vllm_ascend 0.12.0rc1 /vllm-workspace/vllm-ascend vllm-omni 0.12.0rc1模型下载Qwen-Image · 模型库3.服务启动2.1 启动vllm 模型推理服务export ASCEND_RT_VISIBLE_DEVICES0,1 export VLLM_WORKER_MULTIPROC_METHODspawn vllm serve /opt/models/Qwen-Image/ --omni --port 10027 ... Loading safetensors checkpoint shards: 100% Completed | 9/9 [01:0100:00, 7.35s/it] Loading safetensors checkpoint shards: 100% Completed | 9/9 [01:0100:00, 6.85s/it] [Stage-0] INFO 12-29 15:15:08 [diffusers_loader.py:214] Loading weights took 61.97 seconds [Stage-0] INFO 12-29 15:15:09 [npu_worker.py:79] Model loading took 53.7445 GiB and 91.143213 seconds [Stage-0] INFO 12-29 15:15:09 [npu_worker.py:84] Worker 0: Model loaded successfully. [Stage-0] INFO 12-29 15:15:09 [npu_worker.py:118] Worker 0: Scheduler loop started. [Stage-0] INFO 12-29 15:15:09 [gpu_worker.py:229] Worker 0 ready to receive requests via shared memory [Stage-0] INFO 12-29 15:15:09 [scheduler.py:46] SyncScheduler initialized result MessageQueue [Stage-0] INFO 12-29 15:15:09 [async_omni_diffusion.py:83] 。。。 INFO: Started server process [1118] (APIServer pid1118) INFO: Waiting for application startup. (APIServer pid1118) INFO: Application startup complete.服务测试测试脚本 openai_chat_t2i.py​ python openai_chat_t2i.py \ --prompt A beautiful landscape painting \ --output output.png \ --server http://127.0.0.1:10027 \ --seed 21 \ --height 224--width 224 ​2.2 启动图形界面服务​ python gradio_demo.py --server http://127.0.0.1:10027 --port 10029 ​使用浏览器打开界面http://127.0.0.1:100294.加速方法3.1 TeaCachevllm serve /opt/models/Qwen-Image/ --omni --port 10027 \ --cache-backend tea_cache \ --cache-config {rel_l1_thresh: 0.2}3.2 Cache-DiTvllm serve /opt/models/Qwen-Image/ --omni --port 10027 \ --cache-backend cache_dit \ --cache-config {Fn_compute_blocks: 1, Bn_compute_blocks: 0, max_warmup_steps: 4, residual_diff_threshold: 0.12}3.3 效果对比prompt生成一个ultraman, ref_images0, params{height: 384, width: 512, num_inference_steps: 10, true_cfg_scale: 4, num_outputs_per_prompt: 1部署方式e2e时延倍率baseline89951TeaCache83940.933Cache-Dit86880.966

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询