学习资料
- Microsoft 的 LangChain4j for Beginners
- 大型语言模型入门,作者 Andrej Karpathy
- Short Courses,来自 DeepLearning.AI
- 关于构建 LLM 应用一年后的经验总结:Part 1 Part 2 Part 3
- 书籍 Understanding LangChain4j,作者 Antonio Goncalves
本地 LLM
评测
- 你的 AI 产品需要评测
- 如何构建能产生业务价值的 LLM-as-a-Judge
- RAG Pipeline 评测实战指南(Part 1:检索)
- RAG Pipeline 评测实战指南(Part 2:生成)
- Golden Dataset 对 LLM 评测到底有多重要?
- 案例研究:RAG Pipeline 的无参考与有参考评测
- 如何评估复杂 GenAI 应用:一种更细粒度的方法
- 生成合成数据以测试 LLM 应用
智能体
构建高效 Agents,来自 Anthropic
排行榜
语言模型
- LMSYS Chatbot Arena
- SEAL Leaderboards
- 按质量、速度、价格等比较模型
- 幻觉:Vectara、Hallucinations
- 代码生成:BigCode
- Tools / Functions:Gorilla、Nexus、Toolbench
- 性能(延迟、吞吐、内存等)
- 企业场景