Công việc thực sự của kỹ sư khoa học dữ liệu chính là kể chuyện

 

Mỗi buổi sáng đến nơi làm việc, máy tính công ty đều chào đón chúng tôi bằng một báo cáo với hơn 350 triệu điểm dữ liệu theo dõi hiệu suất của doanh nghiệp. Cái khó của kỹ sư khoa học dữ liệu là làm sao để biến những thông tin này thành chỉ dẫn cho nhân viên để họ đưa ra quyết định đúng, cho dù đó là về việc lựa chọn tiêu đề để gửi mail đến khách hàng (chúng tôi có nên yêu cầu nhân viên của mình “gửi ngay” hay “cần nghiên cứu thêm”?) hoặc xác định mục tiêu của chiến dịch tình nguyện hè (xe quyên góp thực phẩm hay chiến dịch tái chế?).

Tóm lại, chúng tôi có nhiệm vụ chuyển đổi dữ liệu thành các chỉ dẫn, và việc phân tích chỉ thực sự hiệu quả khi các số liệu đầu ra đem lại thông tin giúp người đọc hiểu hơn về tình trạng của doanh nghiệp. Nói cách khác, chúng tôi “nhân hóa” dữ liệu bằng xây dựng một câu chuyện về hiệu suất doanh nghiệp từ những số liệu khô khan kia.

 

Ky Su Khoa Hoc Du Lieu

 

Trong bối cảnh chi phí thu thập và lưu trữ dữ liệu đang giảm dần, lượng dữ liệu thô mà một tổ chức đang sở hữu đang có thể ở mức quá tải. Nếu xét tất cả dữ liệu hiện có trên toàn hệ thống, 90% trong số được tạo ra trong 2 năm qua. Do đó, các tổ chức bị chìm ngập trong đống dữ liệu có thể sẽ không phân biệt được thông tin nào quan trọng về mặt thống kê, và thông tin nào quan trọng cho quá trình đưa ra quyết định.

Hệ thống Big Data, nếu muốn sử dụng hiệu quả, thì cần có sự diễn giải của con người và được đặt trong bối cảnh phù hợp, dù đối tượng phân tích nhân viên hay khách hàng mục tiêu của doanh nghiệp. Nếu không đặt vào hệ quy chiếu của con người, cụ thể là hình ảnh hay câu chữ nhằm khơi gợi cảm xúc, thì dữ liệu chỉ khiến mọi thứ trở nên rối hơn, và dĩ nhiên, sẽ không giúp doanh nghiệp đưa ra những hành động, quyết định hiệu quả.

 

Dữ liệu giúp trả lời câu hỏi what, nhưng chính chúng ta mới hiểu được phần why.

Doanh nghiệp đưa ra các quyết định đúng đắn là nhờ vào hiểu biết mang tính trực giác và insight từ dữ liệu. Khai thác dữ liệu theo cách này giúp doanh nghiệp của bạn xây dựng hệ thống kiến ​​thức và thúc đẩy sáng tạo, với nền tảng vững chắc là insight dựa trên dữ liệu.

 

Đối với doanh nghiệp của chúng tôi, việc lập bản đồ dữ liệu truyền thông đem đến một góc nhìn toàn cảnh về các đối tượng truy cập trang. Chúng tôi hiện có hơn 1,5 triệu người dùng, và mỗi người dùng sẽ có hàng trăm điểm dữ liệu. Những điểm này cho chúng tôi biết nội dung và cách họ phản hồi khi nhận được thông tin về cơ hội tình nguyện qua email hoặc tin nhắn. Bên dưới là cách chúng tôi biến 350 triệu điểm dữ liệu hành động để cải tiến doanh nghiệp. Đây cũng có thể xem là một hướng tham khảo dành cho các doanh nghiệp đang xử lý khối lượng dữ liệu tương tự:

 

  • Chỉ tìm kiếm dữ liệu ảnh hưởng đến các chỉ số (metric) chính của doanh nghiệp: Với DoSomething.org, mục tiêu của chúng tôi là kêu gọi nhiều thanh thiếu niên tham gia vào hoạt động tình nguyện. Vì vậy, sau khi nghiên cứu kỹ các dữ liệu vào mua thu năm ngoái để xác định cách cải thiện chỉ số, chúng tôi đã bắt đầu với những câu hỏi đơn giản: Ai hiện tham gia tình nguyện nhiều nhất, và làm thế nào chúng tôi có thể tìm được những đối tượng như vậy? Nhờ đó, chúng tôi có thể lược bỏ lượng lớn dữ liệu không liên quan đến câu hỏi và chỉ tập trung vào những thông tin quan trọng.

 

  • Trình bày dữ liệu để mọi người có thể hiểu được insight:

Lưu ý, đừng bao giờ dùng biểu đồ hồi quy hoặc vẽ đồ thị trong R. Đối với chúng tôi, các phần trình bày hoàn chỉnh không có nhiều các con số, mà thay vào đó,  tập trung kể một câu chuyện rõ ràng bằng các slide và hình ảnh đơn giản. Sau khi phân tích hồi quy để tìm ra các biến quan trọng, chúng tôi đã trực quan hóa dữ liệu để tìm xu hướng. Ngay cả các nhà phân tích dữ liệu cũng phát hiện ra các xu hướng địa lý (hoặc dân số) quan trọng trên bản đồ tốt hơn nhiều so với biểu đồ hồi quy, đặc biệt là khi có nhiều xu hướng quan trọng mà mối tương quan giữa chúng không rõ ràng.

 

Khi trình bày dữ liệu một cách trực quan, toàn bộ nhân viên có thể nhanh chóng hiểu và đóng góp ý kiến. Mọi người đều có thể thấy được các hoạt động có tỷ lệ tham gia ít nhiều ra sao. Từ đó, chúng tôi đã tìm được một insight quan trọng: Một nhân viên không thuộc nhóm phân tích đã chỉ ra rằng thành viên ở các thị trấn biên giới Texas tham gia nhiều hơn thành viên ở các thành phố ven biển Tây Bắc.

 

  • Quay lại phân tích dữ liệu với các câu hỏi mới:

Sau khi biết được thành viên nào tham gia nhiều nhất, chúng tôi quay lại phân tích dữ liệu để xem những thành viên đó thích chiến dịch nào nhất; nói cách khác, lý do họ tham gia là gì. Câu trả lời hóa ra là các chiến dịch về cải thiện sức khỏe cộng đồng vì đây là vấn đề có tác động rất lớn đối với các nhóm thiểu số. Thông tin này giúp chúng tôi điều chỉnh tốt hơn các chiến dịch tình nguyện trong tương lai để thu hút thêm thành viên mới, tìm kiếm đối tác phù hợp cho các chiến dịch đó và biết thêm được một nhóm đối tượng tiềm năng khác, đó là các bạn sinh viên nam da trắng ở Tây Bắc.

Mặc dù các kỹ sư khoa học dữ liệu muốn tin rằng dữ liệu sẽ cung cấp đầy đủ câu trả lời, nhưng điều quan trọng nhất trong công việc của họ chính là các yếu tố định tính: đặt câu hỏi, đưa ra chỉ dẫn dựa trên dữ liệu và kể câu chuyện dữ đó sao cho thuyết phục.

 

Đây là những nội dung hữu ích được chia sẻ bởi Jeff Bladt và Bob Filbin, được viết vào năm 2013. Nội dung trên đã được Nora lược dịch với hy vọng sẽ giúp mọi người có những thông tin hữu ích hơn về việc kể chuyện dữ liệu trong doanh nghiệp.

 

NORA ACADEMY, học viên giao tiếp và kể chuyện doanh nghiệp luôn nỗ lực mang đến cho học viên nguồn tài nguyên phong phú và vô cùng tiện lợi: từ Sách, Mobile App học tập, Biểu mẫu, Video, Podcast, Bài viết,… tất cả hoàn toàn có đầy đủ trên nora.edu.vn. Giờ đây học viên có thể học tập tại bất kỳ đâu cùng học viện NORA. Đây cũng chính là giá trị đầy tự hào NORA muốn mang đến cho Học viên cũng như Quý Doanh nghiệp.

Doanh nghiệp có nhu cầu tìm hiểu thêm về dịch vụ, tư vấn cũng như hợp tác, vui lòng liên hệ:

Hotline: 0909 428 647 hoặc email: hello@nora.edu.vn

Trân trọng cảm ơn,

NORA ACADEMY – Business Storytelling & Communication

 

Chia sẻ: