Nhiều dữ liệu hơn chưa chắc phân tích đã tốt hơn
Đề cập đến tư duy về dữ liệu tại Diễn đàn thúc đẩy chuyển đổi số quốc gia vừa diễn ra, ông Thái Trí Hùng gây bất ngờ với mở đầu rằng “tôi không biết tư duy dữ liệu là gì”. Dù cho MoMo là đơn vị ứng dụng dữ liệu khác thành công và Thái Trí Hùng là người viết những dòng code đầu tiên cho "kỳ lân công nghệ" này.
Dẫn chứng cho chia sẻ trên, ông Hùng dẫn một khái niệm về tư duy dữ liệu từ... ChatGPT và cho rằng đây là ví dụ về vấn đề của sử dụng dữ liệu. ChatGPT tổng hợp thông tin trên mạng và biến thành thông tin trả lời người hỏi, nhưng vấn đề những thông tin này chưa chắc đã chính xác.
Theo ông Hùng, dữ liệu, trí tuệ nhân tạo hay công nghệ nào cũng chỉ là công cụ để giải quyết các vấn đề cụ thể của công ty, tổ chức và không nên được xem là mục tiêu hướng đến của tổ chức. Dẫn ví dụ tại MoMo, ông Hùng cho rằng lý do sự tồn tại của MoMo là thông qua công nghệ, tạo nên các sản phẩm giải quyết các nhu cầu khách hàng.
“Dữ liệu có trách nhiệm nắm bắt nhu cầu của khách hàng và thậm chí cần dự báo trước khi khách hàng có nhu cầu”, ông Hùng nói và dẫn ví dụ, khách hàng vừa mở app MoMo và chưa làm gì hết thì MoMo đã dự đoán được khách hàng định làm gì tiếp theo và chuẩn bị tất cả những gì tốt nhất để trải nghiệm của khách hàng trở nên tốt hơn.
Giám đốc công nghệ MoMo cho hay, khi có dữ liệu thì khả năng phân tích tốt hơn, phân tích tốt sẽ tạo ra sản phẩm tốt hơn, dẫn đến có thêm người tiêu dùng, và khi có thêm người tiêu dùng thì lại có thêm dữ liệu. Khi bánh xe này càng quay nhanh thì càng thành công. Tuy nhiên, nhiều “bánh xe” chỉ quay được một số vòng rồi mất động lực.
“Nhưng khi bánh xe này quay nhanh cũng sẽ dẫn đến nhiều khó khăn khi dữ liệu ngày càng lớn và nhiều dữ liệu hơn không đồng nghĩa với việc phân tích sẽ tốt hơn. Mặt khác, dẫn đến không có niềm tin vào kết quả phân tích, thiếu kiên nhẫn trong việc đầu tư; mất nhiều thời gian cho việc thu thập, phân tích, xây dựng; insights nghèo nàn, thiết kế sai, dẫn đến mất người dùng.
Ngoài ra, theo ông Hùng, như các công nghệ khác, công cụ dữ liệu chỉ phù hợp với một số bài toán nhất định và phải có khả năng kiểm chứng được dữ liệu. Một số doanh nghiệp họ cảm thấy làm tốt về dữ liệu, về chuyển đổi số, nhưng họ không “đo” được sự thành công từ công nghệ.
“Với những bài toán quá phức tạp, kể cả có đầy đủ dữ liệu thì các bạn cũng chưa chắc đã giải quyết được, ví dụ dự báo chính xác thị trường chứng khoán lên hay xuống chẳng hạn trong thời gian ngắn chẳng hạn”, ông Hùng nói.
Ông Hùng cho hay, dữ liệu nhiều lên sẽ tạo ra một “đầm lầy dữ liệu” với tốt xấu lẫn lộn vào nhau và “nước” từ “đầm lầy” đó không thể uống được. Chúng ta vẫn hay nghĩ cứ có thêm dữ liệu thì chúng ta phân tích được tốt hơn, nhưng thực tế, không phải kết luận nào đúc rút từ dữ liệu ra cũng có được sự đồng thuận cao, thậm chí ngược lại. Do đó, để thành công, mọi người phải nghĩ ngược lại, đặt câu hỏi ngược lại”, ông Hùng nói.
Từ bài học xương máu của MoMo
Theo ông Thái Trí Hùng, nếu không xác định được dùng dữ liệu để làm gì, tức đích đến thì dữ liệu thu thập được sẽ vô nghĩa.
Ông Hùng cũng chia sẻ “bài học xương máu” của MoMo từ việc sử dụng dữ liệu. Quy trình sử dụng dữ liệu để làm sản phẩm nhiều khi tốn thời gian gấp 3-4 lần bình thường.
"Thông thường, tại MoMo chỉ mất từ 2 tuần để tạo ra sản phẩm mới. Nhưng khi sử dụng dữ liệu, chúng ta cần 2 tuần để xây dựng sản phẩm, mất thêm 2 tuần nữa để có dữ liệu khi người dùng bắt đầu dùng. Chúng ta cần thêm 2 tuần nữa để từ dữ liệu đó đúc rút ra một điều gì đó. Sau đó, rồi đội ngũ lại ngồi tranh luận xem từ giai đoạn dữ liệu thô đến hiện tại có chỗ nào sai hay không? Vòng này nhiều khi lặp 3-4 lần", ông Hùng chia sẻ.
Ngoài ra, ông Hùng cho rằng, “chúng ta nghe quá nhiều sự thành công của dữ liệu, nhưng thực sự không có mô hình nào đề cập đến lợi nhuận”.
Ví dụ, chi phí cho hệ thống xử lý giao dịch của MoMo khoảng 1-2 triệu USD/năm, trong khi chi phí cho hệ thống lưu trữ và xử lý dữ liệu cho hệ thống giao dịch đó lên đến 4-6 triệu USD/năm.
“Nếu lãi trên mỗi giao dịch 1 đồng chẳng hạn, thì khi đưa dữ liệu vào, phải tính toán làm sao để tiền lãi trên mỗi giao dịch phải gấp 3-4. Nếu không xác định đúng mục tiêu sẽ càng làm càng lỗ”, ông Hùng nói.
Cũng theo ông Hùng, việc sử dụng dữ liệu thường không tạo ra kết quả nhanh, thậm chí không chính xác, cần thời gian thu thập, lưu trữ và xử lý. Nó phụ thuộc rất lớn vào năng lực của con người. Thậm chí, rất nhiều người có xu hướng “thiên kiến dữ liệu”.
Ngoài ra, theo ông Hùng, về nhân lực cũng là thách thức. Lý do là quy trình liên tục phải quay, nhưng một nhân lực khi “cứng” nghề có thể được doanh nghiệp khác chiêu mộ, trong khi “bánh xe” dữ liệu vẫn phải quay, không thể dừng lại.
Vì vậy, theo ông Hùng, tư duy “data first” (dữ liệu đi đầu) nên được hiểu là thiết kế sản phẩm hướng đến tạo ra nhiều dữ liệu có chất lượng nhất trên từng điểm chạm, chứ không phải tạo ra sản phẩm dựa trên dữ liệu. “Sau khi có dữ liệu thì chúng ta sử dụng trên tình huống nào? Theo tôi, chỉ nên dùng dữ liệu khi các giải pháp truyền thống không cho câu trả lời thoả đáng”.
“Dữ liệu có thể thiếu về chất lượng và thừa về số lượng, nên cần cố gắng xác định chủng loại/chất lượng dữ liệu cần để tạo ra insight trước khi thu thập. Dựa hoàn toàn vào dữ liệu có thể làm chúng ta “tê liệt” trong hành động. Nhiều dự án phải dừng lại để “chờ đợi” vì không có dữ liệu. Vì vậy, doanh nghiệp đừng kỳ vọng quá nhiều vào giải pháp dữ liệu cho biết điều gì đang diễn ra và tại sao. Chúng ta phải tập trung vào kết quả, đừng tập trung vào dữ liệu”, ông Hùng nói.
Ông Hùng cũng chia sẻ một vấn đề quan trọng là đạo đức về dữ liệu.
“Mỗi người phải ý thức rằng không bao giờ được dùng dữ liệu của khách hàng để làm hại khách hàng của mình. Phải bảo vệ dữ liệu đó như là tài sản của công ty, như niềm tin mà khách hàng đang dành cho mình. Để làm được việc đó, MoMo thiết kế một hệ thống bảo vệ gồm nhiều lớp, trong đó gồm có công nghệ, hệ thống giáo dục con người, quy trình chính xác”, ông Hùng nhấn mạnh.