Generative AI Engineer 系列二
進階 RAG 檢索增強生成 工作坊
此為進階課程,針對 LLM-based AI 應用中的 Retrieval Augmentation Generation (RAG) 檢索增強生成需求,打造基於知識庫的聊天應用,並實際製作出 HTTP Web API 和前端測試網頁。
若您對這門課有興趣,歡迎填寫以下表單,告訴我你對這門課程的期待,若成功開課會優先通知您報名,非常感謝。
課程大綱(規劃中)
Prompt Engineering 提示工程
  • 如何做系統化的 Evaluation (評估)
  • 如何用 LLM-as-Judge 做評估
  • 自動 Prompt 最佳化(Automatic Prompt Engineering)
檢索增強生成 RAG
  • RAG 不只是向量搜尋,相似性不等於相關性
  • 詞嵌入 Embedding 語意搜尋,如何選擇 Embedding 模型
  • 如何做 RAG 的 Evaluation (評估),包括 Recall 和 Precision 指標,以及 Answer Relevance, Context Precision, Context Recall 等等
  • 如何根據文本合成評估 RAG 需要的測試資料 (Synthetic data)
  • 向量資料庫 Vector Stores 簡介: Chroma, LanceDB, PGVector
  • 各種進階 RAG 技巧
  • Indexing 策略
  • Chunking 技巧,如何選擇 Chunking 策略
  • Multi-Vector 策略,使用摘要、Hypothetical Questions、子文件
  • 如何正確檢索圖片、PDF 和 Tabular 資料
  • Query Understanding 階段
  • Multi-Query
  • Sub Questions
  • Rewrite-Retrieve-Read
  • HyDE
  • Metadata Filters: 如何擷取和使用文件 Metadata
  • 各種 Context Enrichment 和 Small-to-big Retrieval 策略
  • Hybrid Search 策略
  • 壓縮 Contextual Compression
  • 二階段檢索 Re-Ranking 和 Reciprocal Rank Fusion
  • 多模態 Multimodal Embeddings 應用
打造實戰應用
  • 如何整合關聯式資料庫 SQL
  • 使用 Dynamic(kNN) Few-Shot Prompting 提升分類性能
  • 長文本 Q&A with RAG
  • RAG-Powered Chatbot
  • Multi-hop RAG Agent
  • 實作 RAG-based 的 Agent 應用
  • 實作購物車結帳 Chatbot
  • Multi-Agents 架構
Agentic Workflow
  • Self-Reflection 反思
  • Reflexion 反思結合搜尋
  • Self-Reflective RAG 反思結合 RAG
  • 實作多層客服機器人Chatbot 架構
實戰 API 開發部署
  • 使用 Python 的 FastAPI 提供後端 HTTP API 服務
  • 可定期執行的 ETL 流程,將非結構化文件進行索引存入知識庫
  • 使用 AI 協助開發獨立的前端測試頁面
FAQ
Q: 與市面上現有的知識庫工具,例如 ChatGPT GPTs、Coze、Dify、Azure AI 搜尋等平台等相比,這門課程有何不同?
本課程提供從零開始(from scratch)的解決方案,使您能夠完全掌握底層原理,並擁有最大的靈活性進行調整和修改。不同於平台提供的通用解決方案往往不透明,結果的好壞難以掌控,無法進一步最佳化。我們強調的是數據驅動的評估流程、根據具體需求 case by case 最佳化。如果您的文件量較少且需求較為簡單,希望快速建立知識庫應用,那麼平台的通用解決方案可能更適合您。但若您需要打造的是專業應用,文件數量龐大且情境複雜,這門課程將是您所需的最佳選擇。
Q: 使用什麼程式語言和工具?
課程主要使用 Python 程式語言,以及向量資料庫 LanceDB。不依賴任何特定框架,例如 LangChain 或 Llamaindex。因此,無論您使用何種程式語言,都可以輕鬆將所學轉換到其他語言進行實作。
從框架學習的缺點在於,往往只學會了如何呼叫使用 API 組件,而沒有真正理解何時何地應該使用這些招式。就像學習武功招數,雖然掌握了固定的招式,但在實戰中卻缺乏靈活應對的能力。我們強調的是融會貫通每種技術,達到「無招勝有招」的境界。這樣您能夠活學活用,靈活運用所學知識,不論面對何種資料跟場景,都能自信出手,應對自如。
Q: 需要具備什麼課前知識?
您需要具備能夠使用程式碼串接 OpenAI API 的能力,包括 Function Calling 的使用,且了解 Prompt Engineering 基本概念 CoT。如果您尚未掌握這些知識,建議先參加 LLM 工作坊課程。
愛好資訊科技有限公司
統一編號:42970112
Copyright 2018-2024 AIHAO Information Technology Co.