专注于大语言模型应用落地、模型部署、统一网关与微调实践。
- GitHub: @shell-nlp
- 博客: CSDN
- 方向: LLM 服务化部署、OpenAI 兼容接口、模型微调、RAG 与多模态应用
我主要围绕 NLP 与大语言模型做工程化实践,重点关注可用、可部署、可扩展的应用方案:
- 大模型推理部署与性能优化
- OpenAI 兼容接口封装与统一路由
- LoRA / PEFT 微调训练流程
- 检索增强生成与知识问答
- 语音与多模态能力集成
-
gpt_server
提供 OpenAI 兼容接口的大模型服务,便于本地或服务器侧统一对外提供推理能力。 -
openai_router
面向多模型、多服务商场景的统一路由层,用一套接口管理不同模型来源。 -
LLMs_finetuning
开源大模型微调示例与训练实践,覆盖常见适配方法与工程流程。
Python FastAPI Transformers PyTorch vLLM LoRA PEFT RAG ASR TTS
如果你也在做大模型基础设施、企业 AI 应用或模型部署相关工作,欢迎通过 GitHub 或博客交流。




