Docfetcher 與 Anytxt searcher 內容搜索比較與補救方法

因為使用 Cudatext 編輯純文字的文檔和代碼,所以就需要一款好的內容搜索軟體來輔助檔管理。Docfetcher 與 Anytxt searcher 都提供了免費、無廣告的搜索,起碼滿足基本要求,作為評測的物件。

Docfetcher (免費版)Anytxt searcher
中文支援⭐⭐⭐⭐⭐⭐⭐⭐
免費、無廣告⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
穩定性⭐⭐⭐⭐⭐⭐⭐
索引更新的及時性⭐⭐⭐⭐⭐⭐
索引規則設置難度⭐⭐⭐⭐⭐
介面美觀、可定制⭐⭐⭐⭐⭐⭐⭐⭐
內容預覽⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
搜索速度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
記憶體佔用⭐⭐⭐⭐⭐⭐⭐⭐
CPU佔用⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
按搜索相關性排序⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

下面解釋扣分項:

中文支援

兩個軟體都支援中文搜索,但 Docfetcher 的中文支持是有一些問題的,如果不會用,很多詞根本搜索不出來,例如 連結、小抄 等詞。原因嘛,就是分詞功能弱,用的是結巴分詞,沒有調優。更可惡的是, Docfetcher pro 版本至今還遠全不支持中文,原因還是分詞演算法沒搞定。

Anytxt searcher 中文搜索沒什麼問題,但英文搜索明顯弱一點,如處理單詞的各種變形,搜一個得全部方面,不如 docfetcher 做得好。

Docfetcher 補救方法: (1) 將搜索不到的詞拆成單字用空格隔開試試。例如: Docfetcher 雖然搜索不到 “連結” 這個詞,但卻可以搜索 “鏈、接” 這兩個字。搜索中文的時候,如果發現結果為0。 (2)用英文寫重要的關鍵字,用於搜索

穩定性

Docfecther

Linux 上的 Docfetcher非常穩定(5星)。如果你用 Linux,就沒有任何穩定方面的問題。

Windows 上的 Docfecther安裝版本有些小問題(2星),在Windows 11 中使用 docfetcher 時,一般會有這三個問題: (1)同一個檔會在命中結果中重複出現;(2) 預覽檔的時候,程式出錯,得重啟;(3) 經常命中已刪除的檔 。

但是,在 Windows 上Docfecher 的 portable 版本很穩定。

最後,Docfetcher 免費版本已停止支持了,目前 Docfetcher Pro 收費版是主者主力維護的版本。

anytxt searcher

anytxt searcher 的穩定性很詭異。前些天一直很穩定。新版本出來一些天后,我沒有立即更新。然後,舊版本突然總是莫名其妙的卡死。這些軟體不穩定是因為 Windows 系統造成的嗎?

Docfetcher 補救方法: 在 Windows 上就用 portable 版本吧。

建立索引規則的難度

因為我的需求是搜索指定的不同位置的資料夾(N個)下指定類型檔(如 txt, markdown, rst 等),而不是全盤搜索,所以此處的評價只以此方便性為標準。為什麼我要用這個規則? 主要是要提高搜索速度和準確性,不想大海撈針, 搜索操聲太多。

Docfetcher

Docfetcher 新建索引可以把人整吐血。你要為每個目錄分別設置一次,需要設置排除的類型,特別添加的類型。考慮到有 N 個目錄,每個目錄要設置 M 種類型(有的排除,有的添加),設置工作量是 N*M。如果設置錯了,對不起,這個目錄的設置要全部重新再來。每次重新打開 Docfetcher,它還是預設選中對全部類型搜索,如果不是你想要的,那體驗就不那麼好了。

Docfetcher 補救方法: 將 N 個有相同需求的目錄統一放在一個總的目錄下,只需設置一次。

anytxt searcher

anytxt searcher是預設全硬碟搜索,但你也可以把全盤索引先給他停止(如何停止?我不知道)並刪除,再重新添加索引規則:指定類型 txt, md, rst 等乖,然後選擇只包含資料夾,添加 N 個資料夾。這樣的設置工作量只有 N。即使增加一個新的目錄,新增工作量為1。

但是 anytxt searcher預設是全盤索引,初次使用的使用者可能會被索引時的電腦卡死而嚇走。我覺得anytxt 可以在第一次啟動時是不是給兩個選擇更好?更蠢的是我一旦升級 anytxt,之前的所有設置都沒有了,又給我來全盤索引,電腦卡死。這個問題帶來的體驗真糟。

索引更新及時性

在新增檔或檔改名時,Docfetcher 幾乎都是立即能搜索出來。 5 星。

anytxt 不適合索引經常變化的內容。一般是數小時重新索引一次,除非手動更新,否則不能立即生效。而且重新索引所需要的時間還比較長,似乎並未監測檔的變化。

內容預覽

兩者都能較好地從軟體內直接預覽結果,並且高亮顯示命中的關鍵字。區別是:

Docfetcher 可以設置預覽的字體和字型大小,雖然效果不顯著。補救方法: 安裝並使用等寬字體(如:MS Yahei consolas hybrid)後,可以使用更大的字型大小。而anytxt 完全沒有設置可選,希望後期升級時能夠提供。

記憶體佔用

在我只索引20個資料夾下的 txt 的條件下, Docfetcher 佔用為 0.6M + 0.5 M (其實還有一個 100多M 的Java 運行時)。 anytxt 佔用為20M GUI + 240 M後臺。有時候 240M 後臺(索引服務)會變為1 M 左右。

總結

docfetcher 的易用性也許會隨著 docfetcher pro 的推出而改善。 如果進一步改善中文分詞的準確性,它一定會吸引比目前更多的中文用戶。另外,對行內容經常變化的使用者, docfetcher 簡直就是剛需。

anytxt searcher 因為對中文搜索更有優勢,雖然不能即時更新索引,但也還比較適合固定不變的內容的搜索。

返回頂端