Vui lòng đăng nhập để khám phá toàn bộ các bài viết hấp dẫn tại VTI Tech Blog
Khám phá các góc nhìn công nghệ, chia sẻ kinh nghiệm và cập nhật xu hướng mới nhất từ những người trực tiếp tạo ra giải pháp tại VTI.
Quay lại với chủ để XGBoost, hôm nay chúng ta sẽ tìm hiểu cách thức lự chọn features cho XGBoost model. Feature selection hay lựa chọn features là một bước tương đối quan trọng trước khi train XGBoost model. Lựa chọn đúng các features sẽ giúp model khái quát hóa…
Tạm dừng loạt bài viết về XGBoost model, lần này sẽ là một bài nhẹ nhàng hơn, không có code kiếc gì cả! 😀 Bạn thường nghe nói Data Scientist là nghê sexy nhất thế kỷ 21, với mức lương cao ngất ngưởng, tạo ra những sản phầm có tầm…
Giả sử bạn đã train xong một XGBoost model đạt được độ chính xác rất cao. Câu hỏi đặt ra là làm sao lưu lại model đó để sử dụng về sau (không phải mất công train lại model mỗi khi cần sử dụng)? Trong bài viết này, chúng ta…
Ta đã biết, XGBoost thực chất là tập hợp gồm nhiều decision tree. Việc thể hiện mỗi decision tree đó trên đồ thì sẽ giúp chúng ta hiểu sâu sắc hơn quá trình boosting khi đưa vào một tập dữ liệu. Trong bài này, hãy cùng tìm hiểu cách thức…
Mục đích của việc phát triển mô hình dự đoán là tạo ra một mô hình có độ chính xác cao khi kiểm tra trên bộ dữ liệu độc lập với dữ liệu train (gọi là unseen data). Trong bài viết này, chúng ta cùng tìm hiểu hai phương pháp…
XGBoost là một thuật toán thuộc họ Gradient Boosting. Những ưu điểm vượt trội của nó đã được chứng minh qua các cuộc thi trên kaggle. Dữ liệu đầu vào cho XGBoost model phải ở dạng số. Nếu dữ liệu không ở dạng số thì phải được chuyển qua dạng…
Tiếp tục phần 2 của loạt bài tìm hiểu toàn cảnh về Ensemble Learning, trong phần này ta sẽ đi qua một số thuât toán thuộc nhóm Bagging và Boosting. Các thuật toán thuộc nhóm Bagging bao gồm: Bagging meta-estimator Random forest Các thuật toán thuộc họ Boosting bao gồm:…
I. Lời nói đầu: Gần đây các hệ thống áp dụng Dev/Ops đã dần trở nên phổ biến. Các thao tác test cơ bản như unit test, integration test đã được thực hiện một cách tự động hóa hoàn toàn. Đối với từng ngôn ngữ khác nhau, chúng ta có…
1. Giới thiệu về Ensemble Learning Giả sử chúng ta có một bài toán phân loại sản phẩm sử dụng ML. Team của bạn chia thành 3 nhóm, mỗi nhóm sử dụng một thuật toán khác nhau để train model trên tập train set. Sau đó đánh giá độ chính…
Mở đầu Internet nếu biết cách sẽ biến bạn trở thành người "trên thông thiên văn, dưới tường địa lý", nếu không biết cách thì bạn sẽ bị nó nhấn chìm bởi sự hổ lốn, thật giả lẫn lộn của nó. Để cuộc sống này trở nên dễ thở Để…
Trong số các thuật toán ML, XGBoost rất được quan tâm gần đây vì những ưu điểm vượt trội của nó so với các thuật toán khác. Hầu hết những người chiến thắng trong các cuộc thi trên Kaggke đều sử dụng XGBoost trong các giải pháp của họ. Vì…
Ngày nay, chúng ta không còn xa lạ với các thiết bị gia dụng: Tủ lạnh, lò vi song, lò nướng,… Các thiết bị văn phòng: máy photocopy, máy fax, máy in, máy scan,… Các thiết bị y tế: máy thẩm thấu, máy điều hòa nhịp tim,… Các thiết bị…
Vui lòng đăng nhập để khám phá toàn bộ các bài viết hấp dẫn tại VTI Tech Blog