Các công nghệ sử dụng trong Big Data là gì?

  1. Công nghệ thông tin

Theo em hiểu là Big Data là dữ liệu lớn - để ứng dụng được nó thì phải có các công nghệ để phân tích thì mới ứng dụng được.

Vậy các công nghệ sử dụng trong Big Data nói chung (trên thế giới) là gÌ? Mình ở tầm nào so với thế giới rồi ạ ^_^

Từ khóa: 

công nghệ thông tin

"Ngày xửa ngày xưa" trên thế giới có 2 hướng phát triển chính cho việc giải các bài toán số lớn, tính toán phức tạp đó là:

  • High performance computing (HPC): Tính toán hiệu năng cao. Làm sao để chế tạo ra 1 siêu máy tính có khả năng tính toán cực mạnh, cực khủng.
  • Grid computing: Tính toán lưới. Làm sao để bắt nhiều máy tính cùng tính toán, cùng làm một việc.

Tính toán lưới là tư tưởng nền móng ban đầu cho BigData về sau. Trong tính toán lưới sẽ có rất nhiều bài toán con như:

  • Chia việc ntn cho đều, phù hợp năng lực từng máy
  • Tổng hợp kết quả cuối cùng như thế nào, khi có cái xong trước, xong sau, hoặc không hoàn thành.
  • Phân vai thế nào: ai là người chia việc, ai là người thực hiện, ai là người tổng hợp kết quả, ai là giám sát ..
  • Khi xảy ra đỗ vỡ, một vài máy chết thì sao
  • Bảo mật, tính toàn vẹn, tính sẵn sàng ..
  • ...

Trong bigdata thì sẽ có thêm các bài toán khá như: tổ chức dữ liệu, tìm kiếm dữ liệu, sắp xếp, phân nhóm, truyền nhận dữ liệu ...

Công nghệ là gì? Đó là các sự cải tiến trong cách làm việc hoặc các công cụ, sản phẩm được sáng tạo ra giúp giải quyết 1 vấn đề theo cách tốt hơn. PowerPoint là 1 công nghệ trình chiếu, trình bày ý tưởng.

Công nghệ trong bigdata thì có rất nhiều, đó là hàng loạt những phần mềm, bộ giải pháp phần mềm, platform để giải quyết các bài toán của bigdata. Danh sách thì có thể tham khảo bài viết của Nam.

Trả lời

"Ngày xửa ngày xưa" trên thế giới có 2 hướng phát triển chính cho việc giải các bài toán số lớn, tính toán phức tạp đó là:

  • High performance computing (HPC): Tính toán hiệu năng cao. Làm sao để chế tạo ra 1 siêu máy tính có khả năng tính toán cực mạnh, cực khủng.
  • Grid computing: Tính toán lưới. Làm sao để bắt nhiều máy tính cùng tính toán, cùng làm một việc.

Tính toán lưới là tư tưởng nền móng ban đầu cho BigData về sau. Trong tính toán lưới sẽ có rất nhiều bài toán con như:

  • Chia việc ntn cho đều, phù hợp năng lực từng máy
  • Tổng hợp kết quả cuối cùng như thế nào, khi có cái xong trước, xong sau, hoặc không hoàn thành.
  • Phân vai thế nào: ai là người chia việc, ai là người thực hiện, ai là người tổng hợp kết quả, ai là giám sát ..
  • Khi xảy ra đỗ vỡ, một vài máy chết thì sao
  • Bảo mật, tính toàn vẹn, tính sẵn sàng ..
  • ...

Trong bigdata thì sẽ có thêm các bài toán khá như: tổ chức dữ liệu, tìm kiếm dữ liệu, sắp xếp, phân nhóm, truyền nhận dữ liệu ...

Công nghệ là gì? Đó là các sự cải tiến trong cách làm việc hoặc các công cụ, sản phẩm được sáng tạo ra giúp giải quyết 1 vấn đề theo cách tốt hơn. PowerPoint là 1 công nghệ trình chiếu, trình bày ý tưởng.

Công nghệ trong bigdata thì có rất nhiều, đó là hàng loạt những phần mềm, bộ giải pháp phần mềm, platform để giải quyết các bài toán của bigdata. Danh sách thì có thể tham khảo bài viết của Nam.

Để giải thích về BigData cho bạn thì không nói trong 1 hai câu là xong được,tuy nhiên có thề nhìn từ những thách thức của BigData là bạn thấy được nó là gì, dùng công nghệ nào, đó là:

+ Thu thập (Capturing)

+ Lưu trữ (Storage)

+ Truyền dẫn (Transfer)

+ Tìm kiếm (Search)

+ Truy vấn (Querying)

+ Phân tích (Analysis)

+ Cập nhật (Updating)

+ Trực quan hóa (Visualization)

+ Chia sẻ (Sharing)

+ Bảo mật thông tin (Information Privacy)

Về công nghệ, bạn tham khảo từ BigData EcoSystem , theo link này nhé:

https://www.google.com.vn/search?q=Big+Data+ecosystem&source=lnms&tbm=isch&sa=X&ved=0ahUKEwiUiNnovovXAhXCJpQKHTNGBE0Q_AUICigB&biw=1920&bih=950

Câu hỏi này quá khó để trả lời, vì thực sự không biết chính xác điều người hỏi muốn hỏi là gì :)