Xinference通过docker方式启动Reranker模型-配置已成功应用至dify
使用xprobe/xinference:latest镜像1.拉取镜像拉取最新稳定版 Xinference 镜像dockerpull xprobe/xinference:latest验证镜像是否拉取成功显示 xprobe/xinference 即生效dockerimages|findstr xinference2.运行镜像-PowerShellWindows CMD 命令复制直接运行dockerrun -d ^ --name xinference-server ^ -p9997:9997 ^ -v %USERPROFILE%\.xinference:/root/.xinference ^ xprobe/xinference:latest ^ xinference-local --host0.0.0.0 --port9997若用 PowerShell替换为(目前在win10上运行成功)dockerrun -d--name xinference-server-p9997:9997-v $env:USERPROFILE\.xinference:/root/.xinferencexprobe/xinference:latest xinference-local --host0.0.0.0 --port9997参数说明–name xinference-server给容器命名方便后续管理-p 9997:9997映射容器 9997 端口到主机外部可访问-v %USERPROFILE%.xinference:/root/.xinference挂载主机的模型缓存目录重启容器后模型不丢失–host 0.0.0.0允许容器外部访问 Xinference 服务。3.验证容器与服务是否启动成功进入 xinference-server 容器的命令行dockerexec-it xinference-serverbash示例在容器内加载 bge-reranker-v2-m3 重排序模型xinference launch --model-name bge-reranker-v2-m3 --model-type rerank --repository-id BAAI/bge-reranker-v2-m34.Xinference缓存模型缓存成功的结果展示已运行的模型缓存模型的设定等待缓存完成即可。5.Xinference运行模型6.dify配置Xinference中的模型7.智能体编排中使用Reranker模型知识库设置完成后记得发布。附DSL内容-另存为yml即可直接用与difyapp:description:icon:icon_background:#FFEAD5mode:advanced-chatname:运维规章制度use_icon_as_answer_icon:falsedependencies:-current_identifier:nulltype:marketplacevalue:marketplace_plugin_unique_identifier:langgenius/openai_api_compatible:0.0.256c02d20ecf7eba40234be5201f25c2b6ea918ec09e0f8eb2a333efb495947d02version:nullkind:appversion:0.5.0workflow:conversation_variables:[]environment_variables:[]features:file_upload:allowed_file_extensions:-.JPG-.JPEG-.PNG-.GIF-.WEBP-.SVGallowed_file_types:-imageallowed_file_upload_methods:-local_file-remote_urlenabled:falsefileUploadConfig:audio_file_size_limit:50batch_count_limit:5file_size_limit:15image_file_size_limit:10video_file_size_limit:100workflow_file_upload_limit:10image:enabled:falsenumber_limits:3transfer_methods:-local_file-remote_urlnumber_limits:3opening_statement:你好 我是运维管理员retriever_resource:enabled:truesensitive_word_avoidance:enabled:falsespeech_to_text:enabled:falsesuggested_questions:[]suggested_questions_after_answer:enabled:falsetext_to_speech:enabled:falselanguage:voice:graph:edges:-data:sourceType:llmtargetType:answerid:llm-answersource:llmsourceHandle:sourcetarget:answertargetHandle:targettype:custom-data:isInLoop:falsesourceType:starttargetType:knowledge-retrievalid:1771985974968-source-1771986921623-targetsource:1771985974968sourceHandle:sourcetarget:1771986921623targetHandle:targettype:customzIndex:0-data:isInLoop:falsesourceType:knowledge-retrievaltargetType:llmid:1771986921623-source-llm-targetsource:1771986921623sourceHandle:sourcetarget:llmtargetHandle:targettype:customzIndex:0nodes:-data:desc:请输入需要了解的制度内容selected:falsetitle:用户输入type:startvariables:-default:hint:label:请输入您的问题max_length:48options:[]placeholder:required:truetype:text-inputvariable:input_textheight:136id:1771985974968position:x:-250.08913350951966y:324.99999999999994positionAbsolute:x:-250.08913350951966y:324.99999999999994selected:falsesourcePosition:righttargetPosition:lefttype:customwidth:242-data:context:enabled:truevariable_selector:-1771986921623-resultdesc:大模型model:completion_params:temperature:0.7mode:chatname:Qwen3-32Bprovider:langgenius/openai_api_compatible/openai_api_compatibleprompt_template:-id:2ee916cc-893c-43bd-a02d-975bc50446ffrole:systemtext:角色\n您是一个运维管理员熟悉所有的运维管理规范\n任务\n请根据智慧运维知识库的所有内容并提取核心观点最后生成一段简短的摘要\ \ \n要求 \n1、 阅读索引文件并进行总结语言简洁不超过200字。 \n2、使用列表形式展示核心观点。\n3、仅使用知识库内容回答问题。\nselected:falsestructured_output_enabled:falsetitle:LLMtype:llmvision:enabled:falseheight:115id:llmposition:x:391.05956484547767y:353.7284936842676positionAbsolute:x:391.05956484547767y:353.7284936842676selected:falsesourcePosition:righttargetPosition:lefttype:customwidth:242-data:answer:{{#llm.text#}}/selected:falsetitle:直接回复type:answervariables:[]height:102id:answerposition:x:754.7621681354833y:378.51301645002985positionAbsolute:x:754.7621681354833y:378.51301645002985selected:falsesourcePosition:righttargetPosition:lefttype:customwidth:242-data:dataset_ids:-I96tLXkjt6ZmRKEH/mjSSzrEXpBR1mpvo9tbogayCnZr22fSmIh2J1nJoaSpWnJmultiple_retrieval_config:reranking_enable:truereranking_mode:reranking_modelreranking_model:model:models--baai--bge-reranker-v2-m3provider:langgenius/openai_api_compatible/openai_api_compatiblescore_threshold:nulltop_k:4weights:keyword_setting:keyword_weight:0.3vector_setting:embedding_model_name:qwen3-embedding:8bembedding_provider_name:langgenius/ollama/ollamavector_weight:0.7weight_type:customizedquery_variable_selector:-1771985974968-input_textretrieval_mode:multipleselected:truetitle:知识检索type:knowledge-retrievalheight:89id:1771986921623position:x:66.20826320047445y:353.7284936842676positionAbsolute:x:66.20826320047445y:353.7284936842676selected:truesourcePosition:righttargetPosition:lefttype:customwidth:242viewport:x:247.65853216270784y:10.441073703044367zoom:1.0000000000000009rag_pipeline_variables:[]

相关新闻

互联网大厂校招:自研招聘系统如何应对千万级简历的筛选与流程协同?

互联网大厂校招:自研招聘系统如何应对千万级简历的筛选与流程协同?

博主介绍: 所有项目都配有从入门到精通的安装教程,可二开,提供核心代码讲解,项目指导。 项目配有对应开发文档、解析等 项目都录了发布和功能操作演示视频; 项目的界面和功能都可以定制,包安装运行&#xf…

2026/7/3 12:20:10 阅读更多 →
《周易》伏羲八卦演变过程

《周易》伏羲八卦演变过程

《周易》伏羲八卦演变过程(经典梳理 图解版,2026视角) 《周易系辞传》开篇就记载了八卦的起源与演化: “古者包牺氏之王天下也,仰则观象于天,俯则观法于地,观鸟兽之文与地之宜,近取…

2026/5/17 6:55:17 阅读更多 →
【Linux】screen 命令创建会话 保持后台运行

【Linux】screen 命令创建会话 保持后台运行

【Linux】screen 命令:创建会话 保持后台运行完整指南 (2026年最新实用版,适用于 CentOS / Ubuntu / Debian / Rocky 等主流发行版) screen 是 Linux 最经典的终端多路复用器,核心价值就是:即使 SSH 断开…

2026/5/17 6:55:17 阅读更多 →

最新新闻

【Java从入门到入土】45:性能调优实战:从理论到实践

【Java从入门到入土】45:性能调优实战:从理论到实践

【Java从入门到入土】45:性能调优实战:从理论到实践 在Java后端开发中,性能问题是绕不开的“拦路虎”——线上服务突然CPU飙升、内存占用持续走高、GC频繁导致接口响应超时、线程死锁引发服务卡死……这些问题不仅影响用户体验,严…

2026/7/4 4:54:21 阅读更多 →
STM32F103C8T6的USB—CDC虚拟端口组件(HAL)

STM32F103C8T6的USB—CDC虚拟端口组件(HAL)

常见的STM32USB端口是Micro-USB,Type-C,USB-BT型口,USB-B方口我们最常见的32最小系统板上的USBD和D-就接到了PA11和PA12单片机I/O端口上新一版的小篮板STM32F103C8T6用的是Type-C,旧一版用的是Micro-USB,需要准备对应的线。我们主…

2026/7/4 4:54:21 阅读更多 →
Windows平台Appium 2.0自动化测试环境搭建与真机连接实战指南

Windows平台Appium 2.0自动化测试环境搭建与真机连接实战指南

1. 项目概述与核心价值如果你是一名移动端测试工程师、自动化开发或者对手机应用自动化感兴趣的技术爱好者,那么“在Windows上搭建一套完整的Appium 2.0 Android SDK环境,并成功连接真机”这件事,大概率是你职业生涯中绕不开的“第一道坎”。…

2026/7/4 4:52:21 阅读更多 →
PM的游戏思维

PM的游戏思维

游戏思维:拥抱挑战,转化低估不怕事的思维,还有个关键,就是游戏心态。人生本来就是来体验的,项目管理亦是,就像游戏一样,没必要内耗。每一次挫折都是升级打怪,每个难题都是通关的谜题…

2026/7/4 4:52:21 阅读更多 →
Java计算机毕设之智能化商超收银折扣核算管理系统的设计与实现 基于 SpringBoot 的商场动态折扣更新管理系统(完整前后端代码+说明文档+LW,调试定制等)

Java计算机毕设之智能化商超收银折扣核算管理系统的设计与实现 基于 SpringBoot 的商场动态折扣更新管理系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/7/4 4:50:20 阅读更多 →
文心5.0高分低能?真实业务场景下的能力压力测试报告

文心5.0高分低能?真实业务场景下的能力压力测试报告

1. 项目概述:一场关于大模型能力边界的务实讨论“文心5.0正式版是不是高分低能?”——这句话在技术社区、产品团队和内容创作者圈子里,最近两个月被反复提起。它不是一句情绪化吐槽,而是一个带着实测数据、业务反馈和落地卡点的真…

2026/7/4 4:48:20 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻