Python 產生文字雲時,除了使用 Jieba 斷詞,也會搭配 Keywords 和 Stopwords 兩個清單用以顯示正確關鍵詞與阻擋不必要的贅詞。
贅詞多半為介係詞、代詞,累積詞彙的過程就能思考這個問題,「為什麼這個詞不能當關鍵詞呢?」
初步心得是「如果詞彙在無前後文的狀況下就失去意義,本身就不足以當作關鍵詞」。
贅詞多半為介係詞、代詞,累積詞彙的過程就能思考這個問題,「為什麼這個詞不能當關鍵詞呢?」
初步心得是「如果詞彙在無前後文的狀況下就失去意義,本身就不足以當作關鍵詞」。
Tags
隨手寫