Tóm tắt sách "Effective Data Analysis"
Nếu bạn là người mới vào nghề data analyst hoặc đã đi làm một thời gian nhưng vẫn cảm thấy mình đang thiếu một mảnh ghép nào đó giữa kỹ năng kỹ thuật và khả năng deliver giá trị thật sự, thì đây là cuốn sách đáng đọc.
Có một khoảng cách mà hầu hết ai bước vào nghề phân tích dữ liệu đều từng cảm nhận được, nhưng ít người nói ra. Đó là khoảng cách giữa việc biết chạy một câu SQL, biết dùng t-test, biết vẽ biểu đồ bằng matplotlib — và việc thực sự giao được một sản phẩm phân tích có nghĩa cho người cần nó. Bạn học xong thống kê, học xong Python, rồi ngày đầu tiên đi làm, một stakeholder hỏi bạn một câu mà bạn không biết nên bắt đầu đo từ đâu. Không phải vì bạn thiếu kỹ năng kỹ thuật, mà vì chưa ai dạy bạn cách đặt đúng câu hỏi trước khi mở laptop.
Effective Data Analysis là cuốn sách viết cho khoảng trống đó. Tác giả không dạy lại SQL hay pandas từ đầu — cuốn sách giả định bạn đã có nền tảng rồi. Thay vào đó, nó tập trung vào những thứ mà giáo trình truyền thống thường bỏ qua: làm sao để biến một câu hỏi mơ hồ của sếp thành một giả thuyết có thể kiểm chứng được, làm sao để chọn đúng phép thống kê cho đúng loại dữ liệu, làm sao để thiết kế metric mà cả team thực sự dùng được chứ không phải chỉ đẹp trên dashboard rồi không ai nhìn.
Nếu bạn là người mới vào nghề data analyst hoặc đã đi làm một thời gian nhưng vẫn cảm thấy mình đang thiếu một mảnh ghép nào đó giữa kỹ năng kỹ thuật và khả năng deliver giá trị thật sự, thì đây là cuốn sách đáng đọc. Nó không thay thế một khoá học Python hay một cuốn sách thống kê, nhưng nó bổ sung đúng thứ mà những tài liệu đó không cover — và đó thường là thứ quyết định bạn chỉ là người chạy query hay là người thực sự giải quyết vấn đề.
Slides