Vui lòng đăng nhập để khám phá toàn bộ các bài viết hấp dẫn tại VTI Tech Blog
Khám phá các góc nhìn công nghệ, chia sẻ kinh nghiệm và cập nhật xu hướng mới nhất từ những người trực tiếp tạo ra giải pháp tại VTI.
Quay lại với chủ để XGBoost, hôm nay chúng ta sẽ tìm hiểu cách thức lự chọn features cho XGBoost model. Feature selection hay lựa chọn features là một bước tương đối quan trọng trước khi train XGBoost model. Lựa chọn đúng các features sẽ giúp model khái quát hóa…
Tạm dừng loạt bài viết về XGBoost model, lần này sẽ là một bài nhẹ nhàng hơn, không có code kiếc gì cả! 😀 Bạn thường nghe nói Data Scientist là nghê sexy nhất thế kỷ 21, với mức lương cao ngất ngưởng, tạo ra những sản phầm có tầm…
Giả sử bạn đã train xong một XGBoost model đạt được độ chính xác rất cao. Câu hỏi đặt ra là làm sao lưu lại model đó để sử dụng về sau (không phải mất công train lại model mỗi khi cần sử dụng)? Trong bài viết này, chúng ta…
Ta đã biết, XGBoost thực chất là tập hợp gồm nhiều decision tree. Việc thể hiện mỗi decision tree đó trên đồ thì sẽ giúp chúng ta hiểu sâu sắc hơn quá trình boosting khi đưa vào một tập dữ liệu. Trong bài này, hãy cùng tìm hiểu cách thức…
Mục đích của việc phát triển mô hình dự đoán là tạo ra một mô hình có độ chính xác cao khi kiểm tra trên bộ dữ liệu độc lập với dữ liệu train (gọi là unseen data). Trong bài viết này, chúng ta cùng tìm hiểu hai phương pháp…
XGBoost là một thuật toán thuộc họ Gradient Boosting. Những ưu điểm vượt trội của nó đã được chứng minh qua các cuộc thi trên kaggle. Dữ liệu đầu vào cho XGBoost model phải ở dạng số. Nếu dữ liệu không ở dạng số thì phải được chuyển qua dạng…
Tiếp tục phần 2 của loạt bài tìm hiểu toàn cảnh về Ensemble Learning, trong phần này ta sẽ đi qua một số thuât toán thuộc nhóm Bagging và Boosting. Các thuật toán thuộc nhóm Bagging bao gồm: Bagging meta-estimator Random forest Các thuật toán thuộc họ Boosting bao gồm:…
1. Giới thiệu về Ensemble Learning Giả sử chúng ta có một bài toán phân loại sản phẩm sử dụng ML. Team của bạn chia thành 3 nhóm, mỗi nhóm sử dụng một thuật toán khác nhau để train model trên tập train set. Sau đó đánh giá độ chính…
Trong số các thuật toán ML, XGBoost rất được quan tâm gần đây vì những ưu điểm vượt trội của nó so với các thuật toán khác. Hầu hết những người chiến thắng trong các cuộc thi trên Kaggke đều sử dụng XGBoost trong các giải pháp của họ. Vì…
XGBoost là một thuật toán rất mạnh mẽ, tối ưu hóa về tốc độ và hiệu năng cho việc xây dựng các mô hình dự đoán. Một thống kê chỉ ra rằng, hầu hết những người chiến thắng trong các cuộc thi trên Kaggle đều sử dụng thuật toán này.…
Trong bất kỳ dự án nào, đứng ở góc độ của nhà đầu tư và người quản lý, họ đều muốn biết được mốc thời gian dự án có thể được hoàn thành trước khi thực sự bắt đầu dự án. Bởi vì thông tin này giúp cho họ đưa…
Vui lòng đăng nhập để khám phá toàn bộ các bài viết hấp dẫn tại VTI Tech Blog