Ứng dụng AI: Dự đoán sự chấp thuận của trường đại học
Theo
Vào khoảng thời gian này năm ngoái, tôi đã rất bận rộn trên chiếc bàn phím máy tính của mình để ứng tuyển vào các trường đại học trên toàn cầu. Có cơ số các ứng dụng trước đó, khi đó tôi điền thông tin của mình vào các ứng dụng và tôi nhận ra rằng điều này hoàn toàn không hiệu quả với bản thân mình và có thể nguy hiểm khiến tôi mất mát thông tin cá nhân của mình.
Mỗi năm, có hơn 2 triệu đơn xin vào các trường đại học, và mỗi người đều có một yếu tố về mặt cơ hội nhất định để có thể được chấp thuận vào trường hay không. Ngay cả những sinh viên có năng lực, thành tích học tập cao nhất cũng được áp dụng yếu tố ngẫu nhiên và thường phải đối mặt với những rủi do nhất định.
Chắc chắn là có rất nhiều yếu tố ảnh hưởng đến việc tuyển chọn của các trường đại học, nhưng không có gì là bí mật khi hai yếu tố được xem là quan trọng nhất trong việc xác định sự chấp thuận của trường đại học đó là điểm GPA và điểm SAT/ACT. Mặc dù các yếu tố khác cũng được cân nhắc nhưng về mặt thống kê và trên thực tế, không thể phủ nhận rằng hai số liệu trên có tầm quan trọng đáng kinh ngạc đối với mỗi sinh viên - mặc dù không ai thực sự biết làm thế nào chúng được đánh giá và lọc bởi những tiêu chí nào.
Xét cho đến cuối cùng thì hai số điểm kể trên là những số liệu có thể dễ dàng đánh giá bằng cách sử dụng dữ liệu để phân tích xu hướng và mối quan hệ. Chính vì vậy mà một người cực kỳ thiếu kiên nhẫn như tôi đã quyết định cố gắng dự đoán sự chấp thuận của các trường đại học hơn là chờ quyết định từ họ. Và tôi đã sử dụng Machine Learning để dự đoán thay vì các phương pháp thống kê phân tích xu hướng khi làm bài test GPA trước đây.
Machine Learning (ML) là một lĩnh vực rộng lớn với nhiều giải pháp và ứng dụng, nhưng bản thân tôi đặc biệt chú ý đên mạng nhân tạo (Artificial Neural Networks - ANN). Đầu vào hoàn toàn là những con số và đầu ra sẽ được mã hóa như one-hot (0 là bị từ chối, 1 là được chấp thuận) và ANN làm việc khá độc đáo.
Sau khi triển khai kiến trúc mạng của mình trong Tensorflow, tôi đã train mạng của mình trên một tập dữ liệu được thu thập cho Carnegie Mellon (chỉ là một ví dụ nhỏ với khoảng 90 điểm dữ liệu). Sau khoảng 150.000 lần lặp (khoảng 1 phút chạy trên GeForce 1060 GPU). Tôi đã đạt được độ chính xác trong khoảng 75-80%. Trong khi điều này có vẻ không chính xác, nó đủ quan trọng để rút ra một số kết luận, và chắc chắn hoạt động tốt hơn các mô hình tuyến tính khác,
Từ commandline tôi đã có thể thu thập một số kết quả về dự đoán chấp thuận đại học:
Sử dụng random điểm GPA và SAT cao.
Và để dễ sử dụng, tôi đã thiết kế giao diện đơn giản với Bootstrap 3:
Sau tất cả, ứng dụng đã làm chứng minh một chút hữu ích của nó, không chỉ làm dịu sự lo lắng của tôi, lọc các bản đăng ký đến các trường của tôi để hạn chế tôi nộp vào những trường không khả thi đối với bản thân mình.
Tất cả nguồn code thì có sẵn trên Github
Cảm ơn các bạn đã theo dõi!
Tham khảo: Predicting College Acceptance with AI