Link:magi
magi是一個用於自動為漫畫生成文字記錄的模型,它能夠檢測漫畫中的角色、文字塊和麵板,並將它們按照正確的順序排列。此外,該模型還能夠聚類角色,將文字與其對應的說話者匹配,並執行OCR以提取文字。
需求人群:
"適用於需要自動化漫畫文字記錄的研究人員、開發者和漫畫愛好者。"
使用場景示例:
使用magi為漫畫書生成文字記錄
自動化漫畫內容的數字化和索引
輔助漫畫翻譯和本地化工作
產品特色:
自動檢測漫畫中的角色、文字塊和麵板
對漫畫面板進行排序
聚類漫畫角色
匹配文字與說話者
執行OCR以提取文字