詞頻統計工具特別版是一款可以處理多種文檔格式的詞頻統計軟件,我們可以將Word文檔、網頁文件等各種文件內出現的英語單詞和中文詞語進行統計,從而計算出它們總共出現了多少次。
全量統計方式,即統計給定多個文檔中的所有詞匯的出現詞頻;
指定統計方式,只統計指定的某些特殊詞匯的出現詞頻。
可以選擇只統中文詞匯、英語詞匯或標點符號。
1、可以自定義對指定的某個詞進行統計
2、不指定詞匯進行全量統計,詞頻統計工具特別版即統計給定多個文檔中的所有詞匯的出現詞頻;
3、支持中文詞匯、英語詞匯或標點符號。
4、支持對統計結果的輸出與排序
5、以統計一批Word文檔(.doc;.docx)、網頁文件(.htm;.html)或文本文件(.txt)
問:詞頻分析結果是什么樣的?比如我想把一篇文檔進行分詞,統計出高頻詞匯,這樣能做到嗎?分詞是單個字,還是一個詞語?
答:把一篇文檔進行分詞,統計出高頻詞匯,這就是這個軟件的功能。分詞是按語言學上的詞語,比如“中化人民共和國”算一個詞語。而且,對于一些新詞,或特殊定義的詞匯,如“新浪微博”這類新產生的詞匯,軟件提供了“自定義詞匯表”功能,您只要把它添加到自定義的詞匯表中,就可以作為一個詞來進行統計。
詞頻統計工具 v3.51更新:
新版本修正了一個小Bug。
詞頻統計工具 v3.3更新:
新版本優化了字頻統計功能對Uni code編碼文件的支持。