連結:https://cohere.com/research/aya
Aya是一個尖端模型和資料集,透過開放科學推進101種語言的多語言AI。Aya模型能夠理解並按照101種語言的指令執行任務,是迄今為止最大的開放科學機器學習專案之一,重新定義了研究領網網域,透過與全球獨立研究人員合作,實作了完全開源的資料集和模型。
需求人群:
Aya模型適合需要處理多語言資料的研究人員、開發者和企業使用者。它特別適用於語言資源較少的語言,幫助這些語言在自然語言處理領網網域獲得更好的理解和應用。
使用場景示例:
研究人員使用Aya模型進行多語言文本的自然語言理解研究。
開發者利用Aya模型開發支援多種語言的聊天機器人。
企業使用Aya模型最佳化其多語言客戶服務系統。
產品特色:
支援101種語言的指令理解和執行。
擁有513百萬條提示和完成的多語言指令微調薪料集。
開源資料集,包括來自世界各地流利說話者的稀有人工註釋。
在多個多語言基準測試中達到最先進的效能。
提供了Aya 23 – 8B和Aya 23 – 35B兩種不同引數規模的模型。
為自然語言理解、摘要和翻譯任務提供了基礎。
支援下載模型並在本地進行訓練和部署。