連結:https://github.com/tsinghuac3i/ultramedical
UltraMedical專案旨在開發生物醫學領網網域的專業通用模型,這些模型旨在回答與考試、臨床場景和研究問題相關的問題,同時保持廣泛的通用知識基礎,以有效處理跨領網網域問題。透過使用先進的對齊技術,包括監督微調(SFT)、直接偏好最佳化(DPO)和賠率比偏好最佳化(ORPO),訓練大型語言模型在UltraMedical資料集上,以建立強大且多功能的模型,有效服務於生物醫學社群的需求。
需求人群:
- UltraMedical模型適合生物醫學領網網域的研究人員、醫生和學生使用,因為它可以提供與考試、臨床場景和研究問題相關的專業答案,同時具備廣泛的通用知識基礎,幫助他們更有效地處理跨領網網域的醫學問題。
使用場景示例:
- 醫學考試中的問題解答。
- 臨床場景下的專業諮詢。
- 生物醫學研究問題的專業分析。
產品特色:
- 構建大規模、高質量的生物醫學指令資料集UltraMedical。
- 使用合成資料和人工資料混合以及偏好註釋來增強資料多樣性和複雜性。
- 採用先進的對齊技術,如監督微調(SFT)、直接偏好最佳化(DPO)和賠率比偏好最佳化(ORPO)。
- 提供不同規模的語言模型,包括7B級別和70B級別的模型。
- 在多個醫學基準測試中取得了優異的平均結果。
- 計劃在未來的研究中解決模型的侷限性,如幻覺問題和潛在的偏見。
使用教學:
訪問UltraMedical的GitHub頁面以獲取專案資訊和資源。
閱讀專案文檔以瞭解模型的架構和功能。
下載或訪問模型訓練的資料集UltraMedical。
根據需要選擇合適的語言模型規模進行實驗或應用。
在生物醫學問題上測試模型的效能和準確性。
根據反饋和結果調整模型的使用方式或引數。