Craw dữ liệu các trường đại học để dự báo số lượng tuyển sinh  ngành CNTT năm 2020?

  1. Trí tuệ nhân tạo

Em chào cả nhà ạ.

Em xin được tư vấn chút ạ. Hiện tại em đang làm bài tập lớn về dự báo số lượng tuyển sinh nhóm ngành CNTT cho tất cả các trường đại học vào năm 2020. 

Em đang ở bước craw data nhưng mất thời gian quá tại em đang làm bằng cơm ạ. Quý thầy cô, anh chị có phương pháp nào craw nhanh nhanh chỉ em với ạ, hay ai có data cho em xin với ạ, em chỉ dùng với mục đích hoàn thành bài tập lớn. Em cần các thông tin về tổng số lượng tuyển sinh và số lượng tuyển sinh của ngành CNTT vào những năm gần đây (2014,2015,2016,2017,2018) và các thông tin liên quan như cơ sở vật chất, số lượng giảng viên trình độ giảng viên, chuyên ngnafh giảng viên ạ

Và nữa em chưa biết chọn phương pháp gì để huấn luyện mong được các anh chị chỉ giúp ạ.

em cảm ơn anh/chị/bạn. Chúc cả nhà cuối tuần vui vẻ đặc biệt quý chị em có ngày lễ ý nghĩa.

Từ khóa: 

crawling

,

ai

,

tech

,

trí tuệ nhân tạo

Nếu chưa chốt đề tài & không có `tay trong` để có được dữ liệu thì anh nghĩ em nên đổi đề tài khác. Vì các loại dữ liệu này không được công khai & thu thập cũng rất khó, có khi cả 1 kì đồ án ra trường cũng chưa chắc có đủ thông tin như em muốn. Em có thể chọn những bài trên kaggle, hoặc những bài khác đã có dataset.

Về mô hình: mô hình càng phức tạp thì càng cần nhiều dữ liệu, mô hình em chọn phải cân bằng với dữ liệu em có nữa.

Trả lời

Nếu chưa chốt đề tài & không có `tay trong` để có được dữ liệu thì anh nghĩ em nên đổi đề tài khác. Vì các loại dữ liệu này không được công khai & thu thập cũng rất khó, có khi cả 1 kì đồ án ra trường cũng chưa chắc có đủ thông tin như em muốn. Em có thể chọn những bài trên kaggle, hoặc những bài khác đã có dataset.

Về mô hình: mô hình càng phức tạp thì càng cần nhiều dữ liệu, mô hình em chọn phải cân bằng với dữ liệu em có nữa.

Đề bài này mình không thấy make sense lắm vì dữ liệu trên trang của trường và số lượng tuyển sinh dường như ít liên quan tới nhau.

Dữ liệu này có lẽ Bộ giáo dục là đơn vị n.m rõ nhất và độc quyền dữ liệu/

Hi bạn. Thường thì số lượng tuyển sinh sẽ được đăng lên trang chủ của trường. Bạn có thể viết đoạn script Javascript để get value trên DOM hoặc bạn dùng Selenium nhé

Bạn muốn dự đoán số lượng tuyển sinh ngành CNTT cho từng trường, hay cả nước?