Big Data là gì?Big Data xuất hiện ra sao?
kiến thức chung
Có thể nói đến nay vẫn chưa có một định nghĩa chính thức và đầy đủ cho Big Data. Một cách tổng quát, Big Data là tên gọi một loạt dữ liệu với kích thước lớn chưa từng có và rất phức tạp về cấu trúc cũng như là hình thức nếu so sánh với các công cụ lưu trữ - xử lý cùng thời điểm. Dữ liệu ở đây rất đa dạng, nó có thể ở dạng tin nhắn, hình ảnh, tín hiệu GPS từ điện thoại cá nhân chẳng hạn…
Thời đại Big Data ý muốn nói đến giai đoạn những dữ liệu xung quanh chúng ta đã “lớn” đến mức chưa từng có tiền lệ. Trong thời đại này, những thách thức mới liên quan đến khả năng lưu trữ, xử lý và truy cập thông tin. Tuy nhiên, cùng với thách thức luôn là những cơ hội – Nhờ khai thác nó mà chúng ta có thể “đo lường mọi thứ”!
Dường như những câu hỏi trước đây chưa từng được trả lời thì nay lại có thể giải quyết rất dễ dàng.Sự phát triển của công nghệ khi mà mọi thứ đều có thể được số hóa với một tốc độ chóng mặt đẫn đến sự bùng nổ thông tin. Khả năng lưu trữ và truy cập vô hạn dựa trên nền tảng điện toán đám mây [The Cloud].
Các thiết bị di động như điện thoại thông minh, máy tính bảng rồi thậm chí là đồng hồ thông minh… có mặt ở mọi nơi mọi lúc trao cho con người khả năng chưa từng có trong việc tạo ra “dữ liệu” một cách vô tình hoặc có chú ý.
Họ có thể chụp ảnh, quay phim, ghi âm, "check in" hay có thể chỉ cần bấm nút “Like” của Facebook hoặc gửi một “tweet” qua mạng xã hội Twitter. Mọi thông tin đó không biến mất khỏi internet [Cloud] mà tiếp tục “trôi nổi” tạo ra một dòng thông tin ngày càng lớn trên “đám mây internet”. Mọi thứ một cách ngẫu nhiên đã tạo ra một lượng thông tin khổng lồ, đa dạng lẫn đa chiều.
Để dễ hình dung chúng ta hãy xem một số thông tin liên quan đến bùng nổ thông tin sau:
- Các thành viên của Facebook bấm “Like” hoặc bình luận trung bình 3 tỷ lượt mỗi ngày tạo ra lượng dấu vết khổng lồ nhằm biết được sở thích của người sử dụng.
- Với 800 triệu người dùng, cứ mỗi cái chớp mắt Youtube có thêm khoảng một giờ video tài nguyên cho mình do các người dùng tải lên trang này.
- Twitter – một mạng xã hội có tốc độ tăng trưởng người dùng 200% mỗi năm, có hơn 400.000.000 “tweet” mỗi ngày. Và đó là con số cách đây hơn 2 năm trước rồi!
- Vào năm 2012, khoảng 2,5 exabytes dữ liệu được tạo ra trong 1 ngày. Và sau 40 tháng, con số này tăng gấp đôi. Mỗi giây, Internet lại lưu trữ một lượng dữ liệu lớn hơn của 20 năm về trước.
Nội dung liên quan
Nội dung sắp xếp theo thời gian
Hoàng Tuyết Xuân