Data science là gì?

  1. Công nghệ thông tin

Em có bạn trai học lập trình máy tính, khi nói chuyện bạn hay kể về nào là Data Science, nào là Big Data và vạch ra tương lai lương ngàn đô. Em nghe mà không hiểu gì. Cho em hỏi data science là gì?

Từ khóa: 

công nghệ thông tin

Data science gần như là chủ đề mà bọn con trai học về lập trình, khoa học dữ liệu các kiểu hay chém gió. Mình cũng biết chút đỉnh nên chia sẻ với bạn, có gì bạn tìm thêm tài liệu mà đọc nhen.

Data science (khoa học dữ liệu) bắt nguồn từ mục đích sử dụng trong công nghiệp thông qua những nghiên cứu hàn lâm, do vậy, những nhà khoa học dữ liệu phải có kiến thức rất sâu rộng về toán học, khoa học máy tính, biểu diễn và phân tích dữ liệu

Khoa học dữ liệu trong công nghiệp hướng đến việc thu thập, phân tích và áp dụng những thông tin về khách hang, người tiêu dung, mong muốn, nhu cầu, bối cảnh, hành vi. Nguồn dữ liệu có thể được thu thập bởi rất nhiều cách khác nhau như thông qua mạng xã hội, khảo sát, quan sát hành vi khách hàng trên internet. 

“Mọi thứ đều phải dựa vào dữ liệu”. Từ rất sớm, các hãng công nghệ lớn như google, facebook… đã bắt đầu theo dõi hành vi, dữ liệu người dùng, và người ta có thể cho rằng facebook có thể biết bạn yêu ai, quan tâm ai còn hơn chính bản thân bạn. Cuộc chiến của doanh nghiệp bây giờ không chỉ còn là cuộc cạnh tranh về kỹ thuật mà còn là về dữ liệu người dùng, từ đó sinh ra một khái niệm mới là data-driven.

Nói cho dễ hiểu thì những người học Data Science được gọi là Data Scientist. Data Scientist là nghề sexy nhất của thế kỉ 21, theo Harvard Business Review nhận định. Với skillset chuyên sâu và trải dài trên nhiều lĩnh vực, các Data Scientist (nhà khoa học dữ liệu) cũng được ví “quý hiếm như kỳ lân”. 

Data Scientist là người tạo ra giá trị từ data, với hai nhiệm vụ chính là:

Thu thập, xử lý dữ liệu để tìm ra những insight giá trị.

Ví dụ, dựa trên thông tin thu thập được từ các post/comment/status trên mạng xã hội, Data Scientist có thể tìm ra được: cứ gần đến ngày Valentine thì tần suất xuất hiện của thương hiệu ABC cao hơn hẳn.

Đây là một insight giá trị mà bộ phận Marketing có thể sử dụng cho các chiến dịch quảng cáo trong mùa Valentine.

Giải thích, trình bày những insight đó cho các bên liên quan, để chuyển hóa insight thành hành động.

Ví dụ, khi tìm ra được insight giá trị từ data, bạn cần làm report/presentation, hay visualization để biểu diễn, giải thích cho các bên liên quan hiểu được: 1) Insight đó là gì, có ý nghĩa gì? 2) Có thể ứng dụng cụ thể như thế nào để đem lại lợi ích cho doanh nghiệp/sản phẩm/người dùng.

Tuy nhiên, Data Scientist là nghề rất mới, nên định nghĩa về nó còn khá mơ hồ, nhập nhằng (ngay cả trên thế giới). Vì vậy, tùy theo từng công ty mà mô tả công việc, yêu cầu skillset, thậm chí job title có thể khác nhau đôi chút.

Mình trình bày như vậy hông biết bạn có hiểu nổi không hen ^^

(Nguồn tham khảo: itviec.com)

Trả lời

Data science gần như là chủ đề mà bọn con trai học về lập trình, khoa học dữ liệu các kiểu hay chém gió. Mình cũng biết chút đỉnh nên chia sẻ với bạn, có gì bạn tìm thêm tài liệu mà đọc nhen.

Data science (khoa học dữ liệu) bắt nguồn từ mục đích sử dụng trong công nghiệp thông qua những nghiên cứu hàn lâm, do vậy, những nhà khoa học dữ liệu phải có kiến thức rất sâu rộng về toán học, khoa học máy tính, biểu diễn và phân tích dữ liệu

Khoa học dữ liệu trong công nghiệp hướng đến việc thu thập, phân tích và áp dụng những thông tin về khách hang, người tiêu dung, mong muốn, nhu cầu, bối cảnh, hành vi. Nguồn dữ liệu có thể được thu thập bởi rất nhiều cách khác nhau như thông qua mạng xã hội, khảo sát, quan sát hành vi khách hàng trên internet. 

“Mọi thứ đều phải dựa vào dữ liệu”. Từ rất sớm, các hãng công nghệ lớn như google, facebook… đã bắt đầu theo dõi hành vi, dữ liệu người dùng, và người ta có thể cho rằng facebook có thể biết bạn yêu ai, quan tâm ai còn hơn chính bản thân bạn. Cuộc chiến của doanh nghiệp bây giờ không chỉ còn là cuộc cạnh tranh về kỹ thuật mà còn là về dữ liệu người dùng, từ đó sinh ra một khái niệm mới là data-driven.

Nói cho dễ hiểu thì những người học Data Science được gọi là Data Scientist. Data Scientist là nghề sexy nhất của thế kỉ 21, theo Harvard Business Review nhận định. Với skillset chuyên sâu và trải dài trên nhiều lĩnh vực, các Data Scientist (nhà khoa học dữ liệu) cũng được ví “quý hiếm như kỳ lân”. 

Data Scientist là người tạo ra giá trị từ data, với hai nhiệm vụ chính là:

Thu thập, xử lý dữ liệu để tìm ra những insight giá trị.

Ví dụ, dựa trên thông tin thu thập được từ các post/comment/status trên mạng xã hội, Data Scientist có thể tìm ra được: cứ gần đến ngày Valentine thì tần suất xuất hiện của thương hiệu ABC cao hơn hẳn.

Đây là một insight giá trị mà bộ phận Marketing có thể sử dụng cho các chiến dịch quảng cáo trong mùa Valentine.

Giải thích, trình bày những insight đó cho các bên liên quan, để chuyển hóa insight thành hành động.

Ví dụ, khi tìm ra được insight giá trị từ data, bạn cần làm report/presentation, hay visualization để biểu diễn, giải thích cho các bên liên quan hiểu được: 1) Insight đó là gì, có ý nghĩa gì? 2) Có thể ứng dụng cụ thể như thế nào để đem lại lợi ích cho doanh nghiệp/sản phẩm/người dùng.

Tuy nhiên, Data Scientist là nghề rất mới, nên định nghĩa về nó còn khá mơ hồ, nhập nhằng (ngay cả trên thế giới). Vì vậy, tùy theo từng công ty mà mô tả công việc, yêu cầu skillset, thậm chí job title có thể khác nhau đôi chút.

Mình trình bày như vậy hông biết bạn có hiểu nổi không hen ^^

(Nguồn tham khảo: itviec.com)

Data Science là 1 ngành học có tương lai nhưng phải giỏi mới có tương lai nha chứ không phải cứ học xuề xoà là được đâu . Data science được định nghĩa là 1 nhà khoa học về dữ liệu , tức là bạn sẽ làm về phân tích dữ liệu , giống như Excel vậy , nó kết hợp 2 mảng là Analyst và Program lại , thì em sẽ nhìn vào 1 cái biểu đồ hoặc 1 cái dữ liệu người ta đưa ra để phân tích các con số, các thống kê trong đó, ngành này đặc thù phải cực giỏi toán, nhất là toán cao cấp chứ không phải chỉ có lập trình đâu . Phân tích data là trong ngành nào? Đầu tiên là trong kinh tế, thứ 2 là trong các cơ sở dữ liệu, thứ 3 là các ngành về khoa học, vì cả 3 đều là những ngành có lượng data rất khủng nên hầu như cần những nhà khoa học dữ liệu là vậy đó