隨手寫 September 19, 2024 at 01:26PM

Python 產生文字雲時,除了使用 Jieba 斷詞,也會搭配 Keywords 和 Stopwords 兩個清單用以顯示正確關鍵詞與阻擋不必要的贅詞。

贅詞多半為介係詞、代詞,累積詞彙的過程就能思考這個問題,「為什麼這個詞不能當關鍵詞呢?」

初步心得是「如果詞彙在無前後文的狀況下就失去意義,本身就不足以當作關鍵詞」。

小泉

喜愛用文字說明自己眼中所見的一切

張貼留言

較新的 較舊

نموذج الاتصال