LogoDuyệtSr. Data Engineer
HomeAboutPhotosInsightsCV

Footer

Logo

Resources

  • Rust Tiếng Việt
  • /archives
  • /series
  • /tags
  • Status

me@duyet.net

  • About
  • LinkedIn
  • Resume
  • Projects

© 2026 duyet.net | Sr. Data Engineer | 2026-02-27

Sách hay (Engineering)

Note: This post is over 7 years old. The information may be outdated.

Ghi lại mấy cuốn sách hay (Engineering) đã đọc qua.

Sentiment Analysis: Mining Opinions, Sentiments, and Emotions

Quyển sách survey tất tần tật về Sentiment Analysis (opinions, sentiments, emotions, and attitudes), các kỹ thuật nhận diện cảm xúc hiện nay đang có (document level, aspect level, ...), tác giả còn nói đến các vấn đề trong thực tế khi ứng dụng Sentiment. Một quyển sách nên đọc khi bắt đầu vào lĩnh vực Sentiment Analysis này.

Slide
Machine Learning cơ bản
Sách rất hay và mua rất đáng tiền, nội dung như tên gọi của sách. Tác giả tiếp cận các thuật toán trong Machine Learning theo hướng toán và tối ưu (Optimization). Đa số nội dung sách đều có thể đọc trên trang machinelearningcoban.com của tác giả.
Mua sách
Learning Spark: Lightning-Fast Big Data Analysis
Giới thiệu về Apache Spark (Spark SQL, Spark Streaming, setup, and Maven coordinates). Sách giúp bạn làm vài bài tập từ batch jobs đến stream processing và machine learning. Đây là quyển đầu tiên mình đọc lúc mới dùng Spark (mặc dù không đọc được hết) và đang học trên Databricks. Tới giờ có thể đã outdated một tí vì Spark trong sách là 1.6
PDF
Introduction to Information Retrieval
Sách về Information Retrieval (IR), cực kỳ chi tiết về các kỹ thuật trong tìm kiếm thông tin, nổi bật như Vector Space Model, đánh giá hệ thống IR, Feedback, Text classification, Web search, ...
Homepage PDF
Sep 17, 2019·6 years ago
|Data Engineering|
DataData EngineeringRead
|Edit|

Related Posts

Đánh giá hệ thống Information Retrieval (tiếp theo)

Tiếp theo về các chỉ số đánh giá các hệ thống Information Retrieval, bài này sẽ bàn về đánh giá hệ thống tìm kiếm với Ground truth là non-binary (không phải nhị phân), và đánh giá hệ thống large scale.

Oct 9, 2019·6 years ago
Read more

Đánh giá hệ thống Information Retrieval

Trong bài này chúng ta sẽ tìm hiểu về cách đánh giá các hệ thống Information Retrieval, thách thức của việc đánh giá và các độ đo phổ biến như Precision/Accuracy, Recall, R-precision, F-measure, MAP, ...

Aug 31, 2019·6 years ago
Read more

Information Retrieval - Vector Space Model

Hệ thống tra cứu thông tin - Information Retrieval. Một hệ thống tìm kiếm thông tin (Information Retrieval - IR) là một hệ thống tra cứu (thường là các tài liệu văn bản) từ một nguồn không có cấu trúc tự nhiên (thường là văn bản), chứa đựng một số thông tin nào đó từ một tập hợp lớn. Một trong những kỹ thuật phổ biến trong Information Retrieval đó là Vector Space Model.

Aug 30, 2019·7 years ago
Read more

Airflow - một số ghi chép

Một số ghi chép, tips & tricks của mình trong quá trình sử dụng Apache Airflow.

Aug 27, 2019·7 years ago
Read more