Python

Crawlee:Python 網路爬蟲和瀏覽器自動化庫

Crawlee 是一個用於構建可靠爬蟲的 Python 網路爬蟲和瀏覽器自動化庫,提取資料用於AI、LLMs、RAG或GPTs。它提供了統一的接口來處理 HTTP 和無頭瀏覽器爬取任務,支援自動並行爬取,基於系統資源進行調整。Crawlee 用 Python 編寫,包含型別提示,增強了開發體驗並減少了錯誤。它具備自動重試、整合代理輪換和會話管理、可配置的請求路由、持久化 URL 佇列、可插拔的儲存選項等功能。

Comic Translate:自動翻譯漫畫的桌面應用

Comic Translate 是一個桌面應用程式,旨在自動翻譯各種格式的漫畫,包括BD、Manga、Manhwa、Fumetti等,支援多種語言。它利用了GPT-4的強大翻譯能力,特別適用於翻譯那些其他翻譯器難以準確翻譯的語言對,如韓語、日語到英語的翻譯。該應用支援多種檔案格式,如影象、PDF、Epub、cbr、cbz等,為使用者提供了一種便捷的方式來享受不同語言的漫畫內容。

Great Tables:Python中建立精美表格的庫

Great Tables是一個Python庫,用於建立美觀且功能豐富的表格。它支援Pandas或Polars DataFrame作為資料來源,提供了多種格式化選項和自訂功能,非常適合資料分析和報告生成。該庫由Rich Iannone和Michael Chow主要維護,採用MIT許可證,強調簡潔而強大的設計哲學。

DataDreamer:生成合成資料,訓練和對齊模型的工具

DataDreamer是一個強大的開源Python庫,用於提示、生成合成資料和訓練工作流。它旨在簡單易用,極其高效,且具有研究級質量。DataDreamer支援建立提示工作流、生成合成資料集、對齊模型、微調模型、指令調優模型和模型蒸餾。它具有簡單、研究級、高效、可復現的特點,並簡化了資料集和模型的共享。

NewsNerd HackerBot:Hacker News技術資訊聊天機器人

NewsNerd HackerBot是您在Hacker News上獲取最新科技資訊的終極夥伴!它能夠獲取Hacker News的熱門、最佳、最新、問答、展示和招聘類別的故事。您還可以透過關鍵詞對故事進行篩選,比如“給我20個關於Sam Altman和OpenAI的故事”。未來,我們計劃新增工具來分析故事的評論以及分析URL內容(例如部落格帖子等)。

NLTK:Python自然語言處理工具包

NLTK是一個領先的Python平臺,用於處理人類語言資料。它提供了易於使用的介面,用於訪問50多個語料庫和詞彙資源,如WordNet,並提供了一套文書處理庫,用於分類、標記、解析和語義推理。它還提供了工業級NLP庫的封裝,並有一個活躍的討論論壇。NLTK適用於語言學家、工程師、學生、教育者、研究人員和行業使用者。NLTK可以免費使用,並且是一個開源的社區驅動專案。

CHATGPT AI:AI模型寫作摘要

CHATGPT AI是一款基於AI和Python模型的寫作摘要工具。它可以根據輸入的Arxiv論文連結和選擇的AI/Python模型,生成相應的摘要。CHATGPT AI提供高質量的自動摘要服務,幫助使用者快速瞭解論文內容。

PyCaret:低程式碼的python機器學習庫

PyCaret是一個開源的、低程式碼的Python機器學習庫,它可以自動化機器學習工作流程。PyCaret 可以讓你花費更少的時間編寫程式碼,更多的時間用於分析。PyCaret模組化設計,每個模組封裝了特定的機器學習任務。PyCaret中一致的函式集可以在工作流中執行任務。PyCaret中有許多資料預處理功能可供選擇,從縮放到特徵工程。有大量有趣的教程可以幫助你學習PyCaret,你可以從我們的官方教程開始。PyCaret使機器學習變得簡單有趣。

返回頂端