gptpdf:使用GPT解析PDF為Markdown
gptpdf是一個利用大型視覺語言模型(如GPT-4o)將PDF檔案解析為Markdown格式的工具。它透過PyMuPDF庫辨識非文本區網域,並使用OpenAI API進行內容解析,幾乎可以完美地處理排版、數學公式、表格、圖片和圖表等。平均成本為每頁0.013美元,具有高效和低成本的特點。
gptpdf是一個利用大型視覺語言模型(如GPT-4o)將PDF檔案解析為Markdown格式的工具。它透過PyMuPDF庫辨識非文本區網域,並使用OpenAI API進行內容解析,幾乎可以完美地處理排版、數學公式、表格、圖片和圖表等。平均成本為每頁0.013美元,具有高效和低成本的特點。