Japanese stopwords package for npm, bower and plaintext
Note: This post is over 11 years old. The information may be outdated.
Japanese stopwords, available for npm, bower, plaintext. 日本のストップワード
Source
Github source: https://github.com/stopwords/japanese-stopwords
Using
- Nodejs package via npm
npm install --save japanese-stopwords
app.js
var stopwords = require('japanese-stopwords');
console.log(stopwords);
// ["これ","それ","あれ","この","その", ...]
- Browser via bower
bower install --save japanese-stopwords
- Via javascript
Related Posts
[Slide] Sentiment Analysis
Mình vừa có bài nói về Sentiment Analysis trong NLP bao quát, xin phép chia sẻ lại slide tại đây.
Phân lớp SVM với Word2vec
Trong chuỗi bài viết này mình sử sử dụng thuật toán SVM để phân lớp sentiment (cảm xúc) cho văn bản, kết hợp với ứng dụng Word2vec để biểu diễn các text dưới dạng vector.
Duckling - phân tích văn bản sang dữ liệu có cấu trúc
Duckling là một thư viện của Haskell, phát triển bởi Facebook, rất hay để phân tích (parses) dữ liệu text sang dạng có cấu trúc (structured data). Công cụ này rất hữu ích trong các ứng dụng phân tích văn bản trong NLP và nhất là lĩnh vực chatbot.
Doc2vec trong Sentiment Analysis
Doc2vec, ngoài từ (word), ta còn có thể biểu diễn các câu (sentences) thậm chí 1 đoạn văn bản (document). Khi đó, bạn có thể dễ dàng vector hóa cả một đoạn văn bản thành một vector có số chiều cố định và nhỏ, từ đó có thể chạy bất cứ thuật toán classification cơ bản nào trên các vector đó.
