Trong kinh tế học cơ bản, các yếu tố sản xuất gồm đất đai (land), lao động (labor) và vốn (capital). Đây là những yếu tố cơ bản cho bất cứ nền kinh tế nào. Tuy vậy, với sự phát triển, việc sản xuất ra của cải vật chất không chỉ diễn ra trên ruộng đồng hay công xưởng, mặt khác, sản phẩm không chỉ là vật chất hữu hình (máy cày, xe cộ) mà còn là thông tin, phần mềm. Trong những năm gần đây, người ta nói đến một yếu tố sản xuất mới, đó là dữ liệu (data). Dữ liệu ngày càng đóng vai trò quan trọng trong nền kinh tế cũng như ở cấp độ doanh nghiệp hiện đại.

Mười năm trước,dữ liệu lớn (big-data) là chủ đề hot (giờ vẫn còn). Các bài báo trên Forbes, Financial Times lần lượt xuất bản các bài phân tích của các công ty tư vấn về tầm quan trọng của dữ liệu. Câu hỏi đặt ra cho lãnh đạo các công ty: quyết định theo trực giác hay theo dữ liệu? Financial Times đưa ra các ví dụ các lãnh đạo vĩ đại theo cả hai hướng. Steve Job theo trực giác thiên tài của ông chứ không phải dữ liệu nghiên cứu thị trường (lúc đó ai đã biết gì về iPhone), Nhưng Jeff Bezos thì nổi tiếng về quyết định dựa trên dữ liệu với câu nói nổi tiếng khắc trong phòng “Tôi tin Chúa, còn lại hãy đưa ra dữ liệu”. Lại có những quyết định dựa theo dữ liệu dẫn đến thảm bại, ví dụ Coca-cola tin rằng khách hàng sẽ mê mệt công thức mới (theo khảo sát) nhưng khi sản phẩm bán ra thì lại chẳng ai mua. Hành vi con người khó đoán hơn rất nhiều. Tuy vậy, với công nghệ tính toán ngày càng hiệu quả cộng với lượng dữ liệu ngày càng phong phú,dữ liệu sẽ phục vụ hiệu quả hơn cho việc ra quyết định (dù theo trực giác hay theo dữ liệu thì sử dụng thông có được từ dữ liệu sẽ làm cho quyết định hiệu quả hơn). Do đó, trong khảo sát của Capgemini(2012), hơn chín mươi phần trăm lãnh đạo các tập đoàn tin rằng dữ liệu chính là yếu tố sản xuất thứ 4.
Ở cấp độ quốc gia, các nước đều đã và đang xây dựng các chính sách vừa để kiểm soát các công ty công nghệ làm mưa làm gió, vừa bảo vệ dữ liệu nước mình, vừa muốn khai thác dữ liệu để phát triển kinh tế. Năm ngoái, Trung Quốc chính thức khẳng định dữ liệu chính là yếu tố sản xuất mới trong chính sách của mình. Tuy vậy, việc tiến lên nhanh hay chậm phụ thuộc nhiều yếu tố trong bản thân mỗi quốc gia và các công nghệ mà họ nắm giữ hoặc có thể tiếp cận.
4V trong Dữ liệu
Cũng hơi liên quan nên nói qua một chút, không phải cứ nhiều dữ liệu là ‘big data’. Ở đây, người ta hay nói đến 4V: Volume, Variety, Veracity, Velocity.
Volume (dung lượng)
Dĩ nhiên rồi, dữ liệu trước hết liên quan đến dung lượng. Big data là nói đến lượng dữ liệu khổng lồ.
Variety (Đa dạng)
Dữ liệu có thể đến từ nhiều nguồn, chủng loại khác nhau. Cơ bản dữ liệu được phân làm hai loại: Có cấu trúc (như kiểu bảng biểu excel) và Không cấu trúc (video, audio, hình ảnh…). Trong thực tế, dữ liệu không cấu trúc là chủ yếu.
Veracity (xác thực)
Nghĩa là độ tin cậy của dữ liệu hay là chất lượng của dữ liệu. Dữ liệu không thể tin cậy thì nhiều hay ít cũng ko để làm gì.
Velocity (tốc độ)
Tốc độ xử lý dữ liệu nhanh đến mức nào. Có đầy đủ dữ liệu, mà xử lý lâu quá thì cũng không hiệu quả.
Tóm lại, thay vì đặt ra các giả thuyết khi ra quyết định, người ta sẽ lao vào khai thác dữ liệu (data minning) để xem các “mẫu” tìm thấy là gì. Nếu dữ liệu cho họ các thông tin quan trọng về cơ hội hay rủi ro thì họ sẽ hành động trên kết luận đó. Thêm nữa, khai thác dữ liệu hiệu quả sẽ giúp tự động hóa việc ra quyết định cho rất nhiều việc mà trước đây phải làm thủ công, qua đó giải phóng nhiều nguồn lực của doanh nghiệp (hay cá nhân). Cuối cùng, với nhà quản lý, việc khai thác dữ liệu còn giúp tự kiểm nghiệm kết quả của việc ra quyết định của mình trước đó hiệu quả hay không hiệu quả đến mức nào.
Giáp Văn Vỹ
Aug-2021