李元博
GenAI Specialist Solution Architect @ AWS
专注于大语言模型推理优化、AI应用平台和检索增强生成,服务头部互联网客户
研究方向
LLM Inference 2025 – present
研究 AWS 上部署运行 DeepSeek 等开源大模型的最佳实践,SGLang 等推理引擎在 AWS GPU 实例上的性能评测,多机型性价比评测。
- Video 大模型推理-深入浅出系列
- Blog Claude Code 接入自建开源模型:企业私有化与降本实践
GenAI Platform - Dify on AWS 2024 – 2025
Dify Top Contributor,打造 Dify 中的 AWS 生态,使 Bedrock 成为 Dify 支持最好的模型供应商,支持 SageMaker 私有化部署的 5 类 GenAI 模型接入 Dify。
LLM Translation 2024 – 2025
大模型翻译场景最佳实践:专词映射、RAG优化、Finetune、工作流构建。发布翻译技术白皮书,在上海 Summit 对外发布。
RAG 检索增强生成 2023 – 2024
GCR RAG 知识问答解决方案的主要维护者。
书籍翻译
- 生成式AI入门与AWS实战 (Generative AI on AWS), 豆瓣 8.8, 译者之一, 2024 年度影响力译者奖