一、背景在一次语音对话链路中,系统出现“偶发超时”告警。表象是用户仍能听到部分回复,但后台出现错误日志,影响了部分请求的完整性和稳定性。本文基于一次真实排障过程整理,已对项目名称、设备标识、接口地址、密钥、会话 ID 等信息做脱敏处理。二、问题现象(脱敏)1)业务侧表现某次语音请求正常完成了:VAD 检测ASR 识别主 LLM 响应分段 TTS 合成与下发但同时间窗口内,出现“二次 LLM”失败告警。2)关键日志(脱敏示例)WARN ... CozeLikeLLMProvider - 等待会话可用超时: conversationID=conv_xxx, 等待时间=10009ms ERROR ... LLMStreamHelper - (二次)LLM error OnError: java.lang.RuntimeException: 等待会话可用超时: conversationID=conv_xxx at ...CozeLikeLLMProvider.streamBotChatFlux(...:603) at ...LLMStreamHelper.handleSecondLLMCall(...:425)