Giáo trình Phân tích dữ liệu lớn căn bản
Nguyễn Tu Trung (ch.b.), Hoàng Thị Minh Châu, Trần Mạnh Tuấn
- H. Khoa học và Kỹ thuật 2022
- 83 tr. hình vẽ 27 cm
Thư mục: tr. 79-82
Giới thiệu tổng quan về dữ liệu lớn và phân tích dữ liệu lớn. Trình bày hệ thống lưu trữ dữ liệu lớn, hệ thống lưu trữ dữ liệu phân tán HDFS. Mô hình phân tích dữ liệu lớn với trọng điểm là mô hình Mapreduce và bài toán kinh điển WordCount. Một số công cụ phân tích dữ liệu lớn được sử dụng phổ biến như Hadoop và Spark…