私募基金的盡職調查 Copilot

私募基金的每一筆交易，最後幾乎都卡在同一個瓶頸：在簽字之前，讀完資料室裡的每一份合約。分析師有能力判斷風險，但人工逐頁翻找的速度，撐不起交易的時程。我們與一家私募基金合作，把這道瓶頸交給一套以 RAG 驅動的盡職調查 Copilot——它不取代判斷，而是讓判斷有據可查。

挑戰

這家基金的每一個案子，往往牽涉數百份合約文件。團隊得在簽字前的最後幾天逐條確認、交叉比對附件，標記任何影響估值的風險。問題不在於分析師不夠專業，而在於文件的量與交易的時程，先天就互相衝突。

兩個痛點尤其明顯。其一是時間：一輪完整的審查往往耗上數天，正落在交易最敏感的時刻。其二是可稽核性——法遵要求每個結論都能回溯到具體條款出處，而不是「分析師說可以」，而關鍵字搜尋與人工筆記給不了這種證據鏈。他們評估過通用 AI 工具，但既不能把含重大未公開資訊的文件上傳到外部服務，也不能容忍模型編造出虛構條款。

我們的做法

我們從一場為期一週的工作坊切入。工程師與分析師、法遵人員一起拆解過去的案子，盤點他們實際會讀哪些文件、哪些判斷牽動決策。結論很清楚：需求不是「幫我摘要文件」，而是「幫我找到那條條款，並告訴我它出自哪裡」。

由於文件受 NDA 與保密義務約束，整套系統部署在基金自己的 VPC／地端，文件都不離開他們的環境。選型維持 model-neutral：最敏感的環節走自架模型，政策允許處再以 Anthropic／OpenAI 作為可替換選項，不把客戶綁死在單一供應商。建置期間工程師全程駐點——交付的不只是程式碼，而是能力：客戶團隊學會維護擷取流程、自行調整審核閘門。

解決方案

我們建造的是一套帶來源的盡調 Copilot，關鍵元件包括：

文件擷取與切分： 解析 PDF、Word 與掃描合約，OCR 後以保留條款邊界的方式切分，不把一條條款拆斷在兩段裡。
向量檢索： embeddings 存於 pgvector，採關鍵字與語意混合檢索。
可點擊的來源段落： 每個結論都附上出處，點下去就跳回原始文件的確切段落——這正是讓輸出可稽核的核心。
Human-in-the-loop 審核閘門： 結論先進審查佇列，由分析師確認或退回；沒有人簽核就沒有「定稿」，法遵全程看得到完整軌跡。Copilot 也絕不無中生有：找不到出處，就回「找不到依據」。

成果

首版在 5 週內上線——這不是又一個無止盡的 PoC，而是團隊能直接拿去跑真實案子的系統。

上線後，文件整理的工時下降 70%：分析師不必再耗在翻找與歸類，而能專注在真正需要人判斷的地方，審查週期也從數天壓縮到數小時。最關鍵的是，輸出 100% 可稽核——每個結論都能回溯到具體來源段落，法遵可稽核整條推理鏈。

「我們終於能在簽字前的 24 小時內完成一輪完整的文件審查，而不是三天。」 — 某私募基金合夥人

挑戰

我們的做法

解決方案

成果

AI 工作流，長在你的營運裡

AI 工作流，
長在你的營運裡