從掃描到語音:Google 如何重新定義醫療保健 AI

簡要摘要

Google 更新了其開源醫療 AI MedGemma,新增解讀 CT 和 MRI 等掃描的能力,並釋出開放的 MedASR 語音轉文字工具。

Google’s MedGemma Upgrade Signals New Era For AI-Driven Medical Diagnosis

科技公司 Google 宣布對其 MedGemma AI 模型進行升級,強化對醫學影像應用的支援

新版 MedGemma 1.5 4B 模型整合了開發者社群的反饋,更好地支援多種醫學影像模態,包括高維度掃描如 CT 和 MRI、組織病理圖像、長期影像如胸部 X 光時間序列,以及解剖定位任務

它也提升了醫療文件理解能力,能從實驗室報告中提取結構化資料。與先前的 MedGemma 1 4B 相比,1.5 4B 版本在文字、醫療記錄和 2D 影像的準確度上有所提升,同時保持體積緊湊,能離線運行

對於較複雜的文字應用,開發者仍可使用較大的 27B 參數 MedGemma 模型。完整細節與基準測試可參考 MedGemma 1.5 模型卡。

MedGemma 最初設計為多模態系統,以反映醫學的複雜資料環境,早期版本支援解讀二維醫學影像,如胸部 X 光、皮膚科圖像、視網膜掃描和組織病理樣本。最新版本 MedGemma 1.5 擴展了這些能力,加入高維度醫學影像,包括三維 CT 和 MRI 以及全切片組織病理。開發者現在可以建立同時處理多張影像切片或區塊並配合任務特定提示的應用,實現更進階的診斷與分析用途。

根據內部評估,MedGemma 1.5 在多個領域展現出顯著的性能提升,包括 CT 和 MRI 發現的分類、組織病理分析、胸部 X 光的解剖定位、長期影像審查,以及從實驗室報告中提取結構化資料。模型在醫學文字理解與電子健康記錄問答方面也取得了實質進展,反映視覺與語言能力的整體進步。

這些擴展功能建立在 Google 早期的 CT 基礎工具之上,代表首批公開的多模態模型之一,能處理高維度醫學資料,並同時支援傳統文字與 2D 圖像。雖然這些功能仍在發展中,Google 預期開發者能透過領域微調取得進一步改善,並提供針對 CT 和組織病理應用的教程與資源,已在 Hugging Face 和 Model Garden 上釋出。

Google 推出 MedASR 以強化醫療語音辨識與 AI 臨床流程

此外,Google 釋出 MedASR,一款專為醫療口述而微調的自動語音辨識模型,能將語音轉為文字,並與 MedGemma 搭配進行高階推理任務

雖然文字仍是大型語言模型的主要介面,口語交流在臨床實務中扮演核心角色,從醫師口述到即時病患諮詢,準確的語音辨識成為關鍵能力。

MedASR 專為醫療語言設計,能更可靠地轉錄專業術語,並作為 MedGemma 的自然輸入方式。在與通用的 Whisper large-v3 模型進行比較測試中,MedASR 展現出顯著較高的準確率,在胸部 X 光口述和涵蓋多個醫學專科與說話者的內部基準測試中,錯誤率明顯較低。

所有 HAI-DEF 模型,包括 MedGemma 1.5、MedASR 和 MedSigLIP 影像編碼器,皆可免費用於研究與商業用途,可在 Hugging Face 取得或整合到 Vertex AI 的可擴展應用中。

MedGemma 在全球醫療系統與研究人員擴展 AI 採用中獲得關注

根據 Google,MedGemma 的採用正逐步擴展至全球的醫療科技新創公司與研究團隊,模型越來越多被用來加速多種醫療應用的開發

在馬來西亞,Qmed Asia 將 MedGemma 整合到 askCPG,一個旨在提供超過 150 項國家臨床實踐指南的對話系統。馬來西亞衛生部表示,該界面提升了這些指南在日常臨床決策中的可用性,早期試點計畫也對 MedGemma 支援的多模態醫學影像功能給予了特別正面的反饋。

在台灣,國家健康保險署已將 MedGemma 用於分析肺癌手術的術前評估。透過從數萬份病理報告及其他非結構化臨床資料中提取結構化見解,此計畫支援大規模統計分析,旨在提供政策決策依據並改善手術規劃與病患結果。

自今年早些時候推出以來,MedGemma 也在學術醫學 AI 研究中被廣泛引用,展現出在醫學文字理解、多專科臨床決策支援與乳房攝影報告等任務中的強大表現。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)