magi:為漫畫自動生成文字記錄:檢測漫畫角色、文字塊和麵板,對面板進行排序,聚類角色,匹配文字與其說話者,並執行光學字元識別(OCR)

Link:magi
magi是一個用於自動為漫畫生成文字記錄的模型,它能夠檢測漫畫中的角色、文字塊和麵板,並將它們按照正確的順序排列。此外,該模型還能夠聚類角色,將文字與其對應的說話者匹配,並執行OCR以提取文字。

需求人群:

"適用於需要自動化漫畫文字記錄的研究人員、開發者和漫畫愛好者。"

使用場景示例:

使用magi為漫畫書生成文字記錄

自動化漫畫內容的數字化和索引

輔助漫畫翻譯和本地化工作

產品特色:

自動檢測漫畫中的角色、文字塊和麵板

對漫畫面板進行排序

聚類漫畫角色

匹配文字與說話者

執行OCR以提取文字

返回頂端