AI 升級的專利概要 (Patent Summary) :百倍解析度帶來的提升

July 17th, 2024 ‧ 12 min read

自 2023 年 4 月以來,我們推出了專利概要 (Patent Summary) 功能,利用我們專有的專利分群技術、自然語言處理(NLP)和生成式 AI,可以對最多 10 萬件專利進行分類和摘要。這項功能最初整合到 Patentcloud 的 Due Diligence 應用中,使用戶能夠理解分析報告中數據背後的技術創新,提供對專利組合的全面了解。

目錄

生成式 AI 帶來的變革:讓 Patentcloud 更加強大

認識到專利概要功能和生成式 AI 的潛力,我們發現專利概要可以將傳統的線性專利檢索過程轉變為廣度優先檢索 (Breath-First-Search, BFS) 行為。用戶可以不斷對專利進行分類,根據摘要選擇相似的類別,並重新分類,快速從大量專利中找出相關專利,無需逐一驗證。

在 2023 年 10 月,我們在 Quality Insights 應用中增強了這項功能,加速了先前技術搜索,並使用戶能夠迅速識別最相關的先前技術。市場反饋顯示,專利概要的自動分類和詳細摘要超越了依賴關鍵字細節層次的傳統軟件。看到它在專利地圖和自由營運 (Freedom-to-Operate, FTO) 檢索中的潛力,我們在 2024 年 2 月將專利概要整合到我們進階專利組合管理和分析產品 Patent Vault 中。這一整合提供了自動 1-3 層專利自動分類和矩陣圖表,清晰展示競爭對手的專利布局。

截至 2024 年 7 月,我們在專利概要背後的分類算法上取得了突破,進一步提高了分類的準確性。

100 倍解析度帶來的轉變

專利概要功能通過將專利根據語義相似性進行分組,提取每個類別的關鍵技術內容,然後使用生成式 AI 對這些關鍵點進行摘要,最後由我們進行最終檢查。直接根據語義相似性對 10 萬件專利進行分群是不現實的,因為計算複雜度高,這可能導致分類過多,影響可用性和準確性。

為了解決這個問題,我們採用了兩步驟的方法。首先,我們根據特定的相似性標準將專利分成許多小組,稱為「基礎建立」,形成高度相似的分類基礎。然後,根據這些小組彼此間的相似度進行最終分類,稱為「分類架構構建」,以形成符合使用場景的分類架構。假設有 10 萬件專利,我們可能在基礎建立中得到上千個小組,過濾雜訊後,使用這些小組根據彼此的關聯度進行分組,最終形成 30 個分類,每個分類由 1 到上百個小組構成。

圖 1:專利概要兩步驟分群方法示意圖

然而,相似性標準可能引入偏差,導致某些類別的集中。用戶經常需要進一步細分這些集中類別,使過程變得繁瑣。為了解決這個問題,我們最新一代的模型在預處理過程中引入了多個標準,確保每個組內具有更高的同質性。這樣最終分類時會有更多的小組,就像通過提高影像識別的解析度和維度來增強識別效果一樣。

圖 2:解析度對影像識別的影響,例如右側高解析度下很清楚的森林,在左側低解析度下就有可能被當作是山峰和雲朵的邊界。

具體來說,這項增強對 10 萬件專利的解析度平均提高了 100 倍,顯著提高了準確性。我們的測試顯示,專利及其新穎性先前技術分類在不同類別中的失誤率相比之前減少了多達 50%。

這一突破確保了更清晰的分類,減少了手動重新分類的需求。從 1,000 到接近 10 萬件專利的抽樣顯示,手動重新分類需求減少了 100%。用戶現在可以體驗到更快更準確的專利搜索,使專利概要成為不可或缺的專利分析工具。

對專利分類的改良:前後對比

在本節中,我們將通過 Nvidia 和 Masimo 的專利分析案例在增強前後的專利分類差異來體現技術效果。每個結果都將以圖表展示專利數量的分佈,強調差異。

Nvidia 專利概要:提高準確性的細化分類

對於 AI 領域領先的公司 Nvidia,以前的模型顯示,接近 80% 的專利集中在兩個主要類別:“media processing and graphics framework for efficient data utilization”和“automatic adjustment of floating point output images”。這需要用戶進一步探索這些類別。當前模型則將其分為四個詳細類別:“hybrid differentiable rendering for light transport simulation systems and applications”、“optimized design verification of an electronic circuit”、“advanced techniques for dynamic neural network optimization and configuration”和“facilitating workload migration in data centers using virtual machine management”。

圖 3:Nvidia 專利分類:前後對比,來源:Patentcloud

這種細分得到了 Nvidia 專利分類的驗證,該分類中新穎性先前技術在同一組中的配對成功率從 77% 提高到 86%,錯誤率降低了 40%。

Masimo 專利概要:即便是小的專利組合也能產生深入的洞見

對於近兩年來與 Apple 的專利訴訟導致部分 Apple 產品被禁售的醫療器械公司 Masimo,其美國的專利組合僅有 1,003 件。以前的模型將 686 件(近 70%)歸類於“pulse recognition and blood oxygen saturation systems and methods”。當前模型進一步細分了類別,特別是那些專注於監測機制的類別。

以前的模型對 Masimo 的專利及其新穎性先前技術的配對成功率為 100%,主要來自最大的類別。當前模型保持了這一準確性,但將專利分佈於每類 70-90 件專利中,以更細的分類達到了相同的準確性。當前模型還更清晰地區分了光學和聲學感測原理。

圖 4:Masimo 專利分類:前後對比,來源:Patentcloud

這些案例研究展示了升級版專利概要功能如何提高細化程度和準確性,為用戶提供更詳細和可行的見解。

敬請試用升級版的專利概要

升級版的專利概要功能在專利分類方面展現了顯著的改進,提供更高的細緻度和準確性。Nvidia 和 Masimo 的案例研究展示了我們的先進算法如何提供更詳細且可行的見解,即使是較小的專利組合也不例外。

親自體驗這些改進。立即聯繫我們,試用升級版的專利概要,看看它如何改變您的專利分析流程。

Related Posts
The IP world moves fast

Subscribe to receive the latest insights right in your inbox.

By submitting your contact information, you understand and agree to our GDPR, Terms of Use and Privacy Policy