TL;DR - Random Forest thay vì Neural Network
Note: This post is over 6 years old. The information may be outdated.
Neural networks đã chứng tỏ rằng nó hiệu quả hơn một số thuật toán Machine Learning ở nhiều lĩnh vực khác nhau. Tuy nhiên, một neural network sẽ phải cần 1 lượng tham số (variables) nhiều đến nổi chúng ta không thể kiểm soát được để hiểu hết. Thứ hai, với NN nếu chúng ta chỉ quan tâm đến kết quả dự đoán thì ổn, nhưng trong môi trường công nghiệp, chúng ta (hay lãnh đạo của chúng ta) cần một model giải thích được ý nghĩa của feature/variable đó.
Điểm khác biệt giữa Random Forest và Neural Networks là Random Forest sử dụng công nghệ của Machine Learning, Neural Networks thì lại dành cho Deep Learning.
Tại sao nên sử dụng Random Forest
- Lý do cơ bản khi sử dụng Random Forest thay vì Decision Tree (DT) là vì RF kết hợp từ nhiều cây DT vào một model để cho kết quả tốt hơn. Hiệu quả đã được chứng minh từ thực nghiệm.
- Kết quả mô hình có tính giải thích.
- Ngoài ra RF cũng giúp giảm thiểu overfitting.
Khi nào nên sử dụng Random Forest thay vì Neural Networks
- Random Forest sử dụng ít tính toán hơn và không cần sử dụng GPU.
- Neural Networks cần rất nhiều dữ liệu, đồng thời có cũng tạo ra nhiều features để tăng hiệu năng nhưng không mang nhiều ý nghĩa đối với con người.
- Nếu bạn giàu, có nhiều máy, không cần tính giải thích chỉ cần kết quả, hãy sử dụng Neural Networks
- Nếu bạn cần tính giải thích của các biến số, dễ dàng tinh chỉnh, hãy sử dụng Random Forest.
References
Related Posts
Deep Learning là gì?
Thế giới đã chứng kiến sự phát triển vượt bậc sau khi con người phát minh ra các công nghệ: động cơ hơi nước, điện, máy vi tính, internet. Công nghệ tiếp theo sẽ có sự tác động mạnh mẽ như vậy chính là trí thông minh nhân tạo (Artificial Intelligence - AI)
Papers with Code: A Fantastic GitHub Resource for Machine Learning
Papers with code. Sorted by stars. Updated weekly.
Deploy Deep Learning model as a web service API
Trong bài này mình sẽ hướng dẫn deploy 1 model Deep learning, cụ thể là Keras dưới dạng một web service API. Sử dụng Flask framework python và Redis server như một Messeage Queue.
TensorFlow.js
Với TensorFlow.js, không những có thể chạy models machine learning, mà chúng ta còn có thể training trực tiếp ngay trên browser. Trong bài viết ngắn gọn này, mình sẽ giới thiệu cách sử dụng cơ bản và nhanh nhất để bắt đầu với Tensorflow.js.