連結:https://huggingface.co/IndexTeam/Index-1.9B-Chat
Index-1.9B-Chat是一個基於19億引數的對話生成模型,它透過SFT和DPO對齊技術,結合RAG實作fewshots角色扮演定製,具有較高的對話趣味性和定製性。該模型在2.8T中英文為主的語料上預訓練,並且在多個評測基準上表現領先。
需求人群:
- Index-1.9B-Chat模型適合需要生成高質量對話內容的開發者和企業,如聊天機器人開發者、內容創作者等。它可以幫助使用者快速生成有趣、自然的對話,提高產品互動性和使用者體驗。
使用場景示例:
- 聊天機器人使用Index-1.9B-Chat生成自然對話,提升使用者滿意度
- 內容創作者利用該模型生成對話劇本,豐富作品內容
- 企業客服系統整合該模型,自動生成回答,提高服務效率
產品特色:
- 支援多種對話場景的生成,具有高趣味性
- 基於大量中英文語料進行預訓練,具有廣泛的語言理解能力
- 透過SFT和DPO技術進行模型對齊,最佳化對話生成效果
- 引入RAG技術實作角色扮演定製,提供個性化對話體驗
- 適配llamacpp和Ollama,具有較好的硬體相容性
- 提供詳細的技術報告和GitHub資源,方便使用者學習和使用
使用教學:
1. 安裝必要的Python庫,如transformers和PyTorch。
2. 匯入AutoTokenizer和pipeline模組。
3. 設定模型路徑和設備型別。
4. 使用AutoTokenizer.from_pretrained載入模型的tokenizer。
5. 透過pipeline建立text-generation的pipeline。
6. 準備系統訊息和使用者查詢,構建model_input數組。
7. 使用generator生成對話,設定引數如max_new_tokens、top_k等。
8. 列印生成的對話結果。