跳过正文

李元博

GenAI Specialist Solution Architect @ AWS

专注于大语言模型推理优化、AI应用平台和检索增强生成,服务头部互联网客户

Email: ybalbert@amazon.com

微信公众号: AI猿智慧 (1,209 关注)

B站: 前滩猿神 (349 粉丝)

研究方向

LLM Inference 2025 – present

研究 AWS 上部署运行 DeepSeek 等开源大模型的最佳实践,SGLang 等推理引擎在 AWS GPU 实例上的性能评测,多机型性价比评测。

GenAI Platform - Dify on AWS 2024 – 2025

Dify Top Contributor,打造 Dify 中的 AWS 生态,使 Bedrock 成为 Dify 支持最好的模型供应商,支持 SageMaker 私有化部署的 5 类 GenAI 模型接入 Dify。

书籍翻译