(+84) 24-7303-9996

vti.techblog@vti.com.vn

VTI Tech Blog - Machine Learning

Khám phá các góc nhìn công nghệ, chia sẻ kinh nghiệm và cập nhật xu hướng mới nhất từ những người trực tiếp tạo ra giải pháp tại VTI.

Bài viết mới nhất

su.nguyentien

Dự báo nhu cầu với Machine Learning

Chào mọi người, mình là SuNT, đến từ team AI, VTI VN, và bài viết này sẽ không có code.       Nhu cầu khách hàng là chỉ số quan trọng mà mọi doanh nghiệp cần xem xét trước khi bắt đầu thực hiện, hay mở rộng bất cứ một lĩnh vực…

Lập trình & Phát triển
1238
su.nguyentien

Ai sẽ là người nghỉ việc ???

Tiếp tục bàn về câu chuyện nhân viên nghỉ việc, và đây là phần 2. Còn mình là SuNT, đến từ team AI, VTI VN. Trong phần 2 này, chúng ta sẽ cùng nhau xây dựng một ML model để dự đoán xem liệu một nhân viên nào đó có…

Góc nhìn doanh nghiệp
1409
su.nguyentien

XGBoost – Bài 14: Tuning Subsample

Chào mọi người! Mình là SuNT, đến từ team AI – VTI VN! Đây là bài viết cuối cùng trong chuỗi bài về thuật toán XGBoost (danh sách toàn bộ bài viết trong chuỗi, các bạn có thể xem tại đây). Trong quá trình training, XGBoost thường xuyên phải thực…

Lập trình & Phát triển
1870
Division9

XGBoost – Bài 13: Tuning Learning_Rate và số lượng của Decision Tree

Chào mọi người! Mình là SuNT, đến từ team AI – VTI VN! Trước đây, mình có ý định viết một chuỗi các bài về XGBoost, một thuật toán rất mạnh mẽ trong Machine Learning (danh sách các bài viết đã public, các bạn có thể xem tại đây). Nhưng…

Lập trình & Phát triển
1800
Division9

XGBoost – Bài 12: Điều chỉnh số lượng và kích thước của Decision Tree

Ý tưởng cơ bản của thuật toán Gradient Boosting là lần lượt thêm các decision trees nối tiếp nhau. Tree thêm vào sau sẽ cố gắng giải quyết những sai sót của tree trước đó. Câu hỏi đặt ra là bao nhiêu trees (weak learner hay estimators) là đủ? Trong…

Lập trình & Phát triển
1951
Division9

XGBoost – Bài 9: Cấu hình Early_Stopping cho XGBoost model

Overfitting vẫn luôn là một vấn đề làm đau đầu những kỹ sư AI. Trong bài viết này chúng ta sẽ cùng tìm hiểu cách thức monitor (giám sát) performance (hiệu năng) của XGBoost model trong suốt quá trình train. Từ đó cấu hình early stopping để quyết định khi…

Lập trình & Phát triển
2498
Division9

XGBoost – Bài 8: Lựa chọn features cho XGBoost model

Quay lại với chủ để XGBoost, hôm nay chúng ta sẽ tìm hiểu cách thức lự chọn features cho XGBoost model. Feature selection hay lựa chọn features là một bước tương đối quan trọng trước khi train XGBoost model. Lựa chọn đúng các features sẽ giúp model khái quát hóa…

Lập trình & Phát triển
2270
Division9

XGBoost – Bài 7: Lưu và sử dụng XGBoost model

Giả sử bạn đã train xong một XGBoost model đạt được độ chính xác rất cao. Câu hỏi đặt ra là làm sao lưu lại model đó để sử dụng về sau (không phải mất công train lại model mỗi khi cần sử dụng)? Trong bài viết này, chúng ta…

Lập trình & Phát triển
2660
Division9

XGBoost – Bài 6: Trực quan hóa XGBoost model

Ta đã biết, XGBoost thực chất là tập hợp gồm nhiều decision tree. Việc thể hiện mỗi decision tree đó trên đồ thì sẽ giúp chúng ta hiểu sâu sắc hơn quá trình boosting khi đưa vào một tập dữ liệu. Trong bài này, hãy cùng tìm hiểu cách thức…

Lập trình & Phát triển
2110
Division9

XGBoost – Bài 5: Đánh giá hiệu năng của XGBoost model

Mục đích của việc phát triển mô hình dự đoán là tạo ra một mô hình có độ chính xác cao khi kiểm tra trên bộ dữ liệu độc lập với dữ liệu train (gọi là unseen data). Trong bài viết này, chúng ta cùng tìm hiểu hai phương pháp…

Lập trình & Phát triển
2432
Division9

XGBoost – Bài 4: Chuẩn bị dữ liệu cho XGBoost model

XGBoost là một thuật toán thuộc họ Gradient Boosting. Những ưu điểm vượt trội của nó đã được chứng minh qua các cuộc thi trên kaggle. Dữ liệu đầu vào cho XGBoost model phải ở dạng số. Nếu dữ liệu không ở dạng số thì phải được chuyển qua dạng…

Lập trình & Phát triển
1616
Division9

XGBoost – Bài 2: Toàn cảnh về Ensemble Learning – Phần 2

Tiếp tục phần 2 của loạt bài tìm hiểu toàn cảnh về Ensemble Learning, trong phần này ta sẽ đi qua một số thuât toán thuộc nhóm Bagging và Boosting. Các thuật toán thuộc nhóm Bagging bao gồm: Bagging meta-estimator Random forest Các thuật toán thuộc họ Boosting bao gồm:…

Lập trình & Phát triển
7436

banner-vtian
VTIan

Bạn là VTIan?

Khám phá cơ chế nhuận bút khi đóng góp bài viết ngay tại đây!