chọn Storm, Samza, Spark hay Flink để xử lý streamming?
Minh có nhu cầu xử lý 1 lượng lớn các log event trong hệ thống ở mức near realtime. Vậy mình nên chọn framework nào nhỉ?
trí tuệ nhân tạo
Spark stream là mini-batch nên độ trễ tương đối cao,
Storm cộng đồng lớn, có độ matured,
Flink tương đối mới.
Nội dung liên quan
trungtv
Spark stream là mini-batch nên độ trễ tương đối cao,
Storm cộng đồng lớn, có độ matured,
Flink tương đối mới.
Bác nông dân
So với 2 framework còn lại thì Spark có lượng contributors lớn nhất, có tổ chức khá mạnh chống lưng là DataBricks.
Nếu không phải là xử lí quá realtime, chấp nhận > 1000ms thì chọn Spark Streaming là lựa chọn tương đối hợp lí vì.
Flink ra đời sau nên thừa hưởng hầu hết mọi ưu điểm của Spark và bổ sung thêm rất nhiều tính năng hay, tuy nhiên cũng cần một thời gian nữa để đạt độ chín.
Nam Tran
Dữ liệu của bạn là Near Realtime, vậy cứ Storm,Samza đi bạn.