
5 週
首版上線
70%
文件整理工時下降
100%
輸出可稽核
私募基金的每一筆交易,最後幾乎都卡在同一個瓶頸:在簽字之前,讀完資料室裡的每一份合約。分析師有能力判斷風險,但人工逐頁翻找的速度,撐不起交易的時程。我們與一家私募基金合作,把這道瓶頸交給一套以 RAG 驅動的盡職調查 Copilot——它不取代判斷,而是讓判斷有據可查。
挑戰
這家基金的每一個案子,往往牽涉數百份合約文件。團隊得在簽字前的最後幾天逐條確認、交叉比對附件,標記任何影響估值的風險。問題不在於分析師不夠專業,而在於文件的量與交易的時程,先天就互相衝突。
兩個痛點尤其明顯。其一是時間:一輪完整的審查往往耗上數天,正落在交易最敏感的時刻。其二是可稽核性——法遵要求每個結論都能回溯到具體條款出處,而不是「分析師說可以」,而關鍵字搜尋與人工筆記給不了這種證據鏈。他們評估過通用 AI 工具,但既不能把含重大未公開資訊的文件上傳到外部服務,也不能容忍模型編造出虛構條款。
我們的做法
我們從一場為期一週的工作坊切入。工程師與分析師、法遵人員一起拆解過去的案子,盤點他們實際會讀哪些文件、哪些判斷牽動決策。結論很清楚:需求不是「幫我摘要文件」,而是「幫我找到那條條款,並告訴我它出自哪裡」。
由於文件受 NDA 與保密義務約束,整套系統部署在基金自己的 VPC/地端,文件都不離開他們的環境。選型維持 model-neutral:最敏感的環節走自架模型,政策允許處再以 Anthropic/OpenAI 作為可替換選項,不把客戶綁死在單一供應商。建置期間工程師全程駐點——交付的不只是程式碼,而是能力:客戶團隊學會維護擷取流程、自行調整審核閘門。
解決方案
我們建造的是一套帶來源的盡調 Copilot,關鍵元件包括:
- 文件擷取與切分: 解析 PDF、Word 與掃描合約,OCR 後以保留條款邊界的方式切分,不把一條條款拆斷在兩段裡。
- 向量檢索: embeddings 存於 pgvector,採關鍵字與語意混合檢索。
- 可點擊的來源段落: 每個結論都附上出處,點下去就跳回原始文件的確切段落——這正是讓輸出可稽核的核心。
- Human-in-the-loop 審核閘門: 結論先進審查佇列,由分析師確認或退回;沒有人簽核就沒有「定稿」,法遵全程看得到完整軌跡。Copilot 也絕不無中生有:找不到出處,就回「找不到依據」。
成果
首版在 5 週內上線——這不是又一個無止盡的 PoC,而是團隊能直接拿去跑真實案子的系統。
上線後,文件整理的工時下降 70%:分析師不必再耗在翻找與歸類,而能專注在真正需要人判斷的地方,審查週期也從數天壓縮到數小時。最關鍵的是,輸出 100% 可稽核——每個結論都能回溯到具體來源段落,法遵可稽核整條推理鏈。
「我們終於能在簽字前的 24 小時內完成一輪完整的文件審查,而不是三天。」 — 某私募基金合夥人
