Skip to content
View shell-nlp's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report shell-nlp

Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
shell-nlp/README.md
🇨🇳 中文 | 🇬🇧 English

Yu Liu

专注于大语言模型应用落地、Agent 框架、模型部署与微调实践。

  • GitHub: @shell-nlp
  • 博客: CSDN
  • 邮箱: 506610466@qq.com
  • 方向: Agent 框架、LLM 服务化部署、RAG 知识库、模型微调、多模态应用

关于我

我主要围绕 NLP 与大语言模型做工程化实践,重点关注可用、可部署、可扩展的应用方案:

  • Agent 框架设计与多工具智能体编排(LangGraph / MCP / Human-in-the-Loop)
  • RAG 知识库构建(向量检索 + 关键词检索 + 图检索混合方案)
  • 大模型推理部署与性能优化(vLLM / OpenAI 兼容接口)
  • 多渠道接入与统一路由(飞书 / 钉钉 / 微信 ClawBot)
  • 多用户沙箱隔离与容器化执行环境
  • LoRA / PEFT 微调训练流程

代表项目

  • DeepClaw 开源 Agent / RAG 全栈脚手架,将通用 Agent、RAG 知识库、技能管理、多渠道接入、MCP 配���与前端 UI 整合到同一 FastAPI 服务中。支持 LangGraph Agent 编排、Elasticsearch 混合检索、OpenSandbox 多用户容器隔离、Human-in-the-Loop 审批流、AG-UI 协议,以及飞书/钉钉/微信 ClawBot 渠道路由。

  • gpt_server 提供 OpenAI 兼容接口的大模型推理服务,支持本地与服务器侧统一对外提供推理能力,内置模型热加载与多路并发调度。

  • openai_router 面向多模型、多服务商场景的统一路由网关,用一套 OpenAI 兼容接口管理不同模型来源,支持负载均衡与故障转移。

  • LLMs_finetuning 开源大模型微调实践,覆盖 LoRA / QLoRA / PEFT 等适配方法与完整训练工程流程。

技术栈

Python FastAPI LangGraph LangChain Transformers PyTorch vLLM LoRA PEFT Elasticsearch RAG MCP Docker OpenSandbox ASR TTS SSE AG-UI

GitHub 统计

GitHub Stats

Top Langs

GitHub Streak

联系方式

如果你也在做 Agent 框架、大模型基础设施、企业 AI 应用或模型部署相关工作,欢迎通过 GitHub 或博客交流。

Pinned Loading

  1. gpt_server gpt_server Public

    gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR、TTS、文生图、图片编辑和文生视频的开源框架。

    Python 254 22

  2. openai_router openai_router Public

    OpenAI Router 轻量级、持久化、零配置的 OpenAI API 统一网关

    Python 24 4

  3. deepclaw deepclaw Public

    deepclaw,一个开源的 agent/rag 脚手架

    Python 8

  4. LLMs_finetuning LLMs_finetuning Public

    致力于用简洁的代码实现对现有大模型(chatGLM1/2、BaiChuan、QWen、Internlm、Llama等)的训练、推理和部署。

    Python 5

  5. ML-NLP ML-NLP Public

    Jupyter Notebook 1