Bạn đang cảm thấy khó hiểu với các thuật ngữ? Không biết cross-channel là gì? Choáng váng với những từ như Big Data hay Cấu trúc dữ liệu (Data Structured)?

Thực ra không quá ngạc nhiên khi trong mảng Data & Analytics thì có rất nhiều những thuật ngữ hay cụm từ phức tạp. Nó có thể khiến cho cả những người am hiểu về digital hay những nhà quản trị web/business information cũng cảm thấy bối rối khi thấy được những thứ mà website của họ thu thập được nhiều năm qua.

Đừng quá lo lắng, trong phạm vi bài viết này chúng tôi sẽ giúp bạn giải thích các thuật ngữ phức tạp hay “khó hiểu” thành những thứ dễ hiểu và dành kể cả cho những người chưa biết gì về những khái niệm hay những cụm từ đó. Bài viết này dành cho tất cả mọi người kể cả những bạn chuyên về digital marketing hay quản trị website, những bạn làm BA/DA hiện đang làm việc với Google Analytics hay Dashboard của WordPress.

 

Analytics – Phân Tích

Bắt đầu với khái niệm Analytics hay còn gọi là Phân Tích. Phân tích là khả năng để hình dung, làm rõ, khái niệm hóa cả các vấn đề phức tạp và đơn giản bằng cách đưa ra các quyết định hợp lý cho các thông tin sẵn có.

 

Khi chúng tôi nói là “Sử dụng analytics” điều đó có nghĩa chúng tôi nói về việc sử dụng một nền tảng hay ứng dụng cụ thể nào đó chuyên về xử lý dữ liệu như : Google Analytics hay Omnatio – những nền tảng được xây dựng để đo lưu lượng truy cập đến các trang web của chúng tôi. Nó có thể cho chúng ta biết có bao nhiêu lưu lượng truy cập đến, nơi nó đến từ đâu, khách truy cập dành bao lâu cho các trang cụ thể và liệu họ có rời đi ngay lập tức giữa nhiều thông tin chi tiết khác hay không.

Chẳng hạn, bạn có thể ứng dụng phân tích một cách chiến thuật bằng cách xem thời gian lưu lượng truy cập nhiều nhất trên trang web của bạn, bạn sẽ biết được thời gian nào là tốt nhất để xuất bản bài viết.

data analytics

 

Behavioural Analytics – Phân tích hành vi người dùng

Điều này thì thiên về việc hiểu tính cách hay hành vi người dùng hơn. Về cơ bản, xem xét các phân tích hành vi giúp chúng ta xây dựng một bức tranh lớn hơn về cách thức và hành vi của người dùng trực tuyến bằng cách phân tích các điểm dữ liệu tưởng chừng như không liên quan.

Chẳng hạn, các tương tác trên phương tiện truyền thông xã hội, số tiền chi cho trang web, nơi khách hàng điều hướng đến, bước họ làm tiếp theo, tất cả có thể được xem xét cùng nhau như toàn bộ trải nghiệm của một người dùng. Do đó, bạn có thể hiểu ý định của khách truy cập và dự đoán các hành động hoặc xu hướng trong tương lai.

data behaviour

Big Data – Dữ liệu lớn

Sẽ hơi buồn cười nếu như dịch nguyên văn Big Data thành “Dữ Liệu Lớn”, các bạn có thể giữ nguyên cụm từ Big Data khi trao đổi cũng được. Trong ngành Data & Analytics hiện nay thì khi nhắc tới Big Data thường người ta sẽ nghĩ tới những khối lượng dữ liệu khổng lồ đến từ những hệ thống khách hàng lớn, có nhiều giao dịch, nhiều tương tác hàng ngày đến từ hàng triệu người dùng.

Hãy liên tưởng đến Amazon, các bạn thử nghĩ xem một ngày có bao nhiêu lưu lượng truy cập trên Website Amazon. Sau đó hãy nghĩ thử xem rằng Amazon không chỉ thấy những giao dịch đó mà còn có thể có được bất kỳ thông tin cá nhân từng khách hàng trong hàng trăm triệu khách hàng mà họ có trên website bao gồm những thông tin như: Tên, Địa chỉ, Lịch sử mua hàng, Lịch sử trình duyệt,…v.v. Bây giờ dữ liệu mà Amazon sở hữu lớn tới mức họ cần tới hơn 3 cơ sở dữ liệu Linux lớn nhất thế giới để lưu trữ và duy trì hoạt động. Và Amazon cũng không bỏ qua việc khai thác những dữ liệu đó vào việc tối ưu cũng như tăng thêm trải nghiệm của người dùng, tùy chỉnh và nâng cấp những tính năng giúp cho người dùng cảm thấy thoải mái khi mua sắm trên Amazon hơn hoặc giúp cho các nhà cung cấp sản phẩm biết cách tiếp thị tới những khách hàng tiềm năng một cách tốt nhất.

big data

 

Bounce rate – Tỷ lệ thoát trang

Tỷ lệ khách hàng truy cập vào website của bạn sau đó là rời đi thay vì tiếp tục ở lại xem các trang khác của bạn trên website

Tỷ lệ thoát càng thấp thì càng tốt, điều đó có nghĩa là nội dung của bạn hữu ích để người dùng ở lại lâu hơn.

data bounce rate

 

Cross-channel Analytics – Phân tích kênh chéo

Khả năng phân tích dữ liệu từ nhiều kênh khác nhau (trang web, mạng xã hội, email, ứng dụng di động, v.v.), thường có thể được đặt ở những nơi khác nhau (hoặc ‘im lặng’ nếu bạn không muốn gây phiền nhiễu), để hiểu rõ hơn về trải nghiệm khách hàng như một tổng thể hoàn chỉnh.

data cross channel

 

Data cleansing – Làm sạch dữ liệu hoặc lọc dữ liệu

Quá trình phát hiện và loại bỏ các thông tin không chính xác khỏi cơ sở dữ liệu của bạn. Dữ liệu này có thể không chính xác, không đầy đủ, trùng lặp hoặc chỉ là dữ liệu cũ và lỗi thời.

Sai lầm có thể được gây ra bởi một cái gì đó đơn giản như lỗi của con người. Ai đó quên mã bưu điện, ai đó đánh sai địa chỉ email của họ. Một số dữ liệu không chính xác có thể bị xóa bằng cách sử dụng một công cụ tự động, chẳng hạn như trùng lặp dữ liệu hoặc địa chỉ email không hợp lệ.

Data Quality – Chất lượng dữ liệu

Độ tin cậy của dữ liệu. Có chính xác, đầy đủ, cập nhật và có thể truy cập sử dụng được không? Nếu không thì nó sẽ không tốt chút nào và không có tính hữu dụng.

data cleaning

 

Data visualisation – Trực quan hoá dữ liệu

Một cách để biến những dòng dữ liệu dạng text (chữ/số) khô khan đó là dùng cách trực quan hoá dữ liệu. Bạn sẽ không còn thấy những con số hay chữ nữa mà thay vào đó là các biểu đồ, hình ảnh minh hoạ để giúp bạn cảm thấy dễ dàng phân tích hay tiếp nhận thông tin. Tất nhiên là vẫn phải dựa trên số liệu của hệ thống ban đầu bạn đưa vào, đảm bảo tính chính xác và minh bạch.

data visual

 

Direct traffic – lưu lượng truy cập trực tiếp

Khách truy cập vào trang web của bạn đã nhập chính xác URL website của bạn hoặc nhấp vào bookmark website của họ. Lưu lượng truy cập trực tiếp cho biết có bao nhiêu khách truy cập đã biết trang web hoặc thương hiệu của bạn và là một dấu hiệu tốt về khách hàng trung thành có thể nhớ chính xác website của bạn (họ phải làm động tác đó nhiều lần).

data direct traffic

 

Machine learning – Học máy

Đây là quá trình cho phép một hệ thống phân tích dữ liệu và tìm hiểu hành động cần thực hiện, trái ngược với việc lập trình một máy tính để thực hiện một chức năng cụ thể. Nó thường được sử dụng để giải quyết các vấn đề bằng cách tìm ra các mẩu đối tượng hoặc hành vi nhất định rồi từ đó sẽ để máy tính học và nhân bản ra các nhóm đối tượng có hành vi tương tự. Điều này không hề đơn giản vì nó cần những chuyên gia Data Scientist – Deep learning làm được điều này, và càng ngày máy tính của bạn càng trở lên thông minh. Đôi khi bạn không cần nói mệnh lệnh ra thì chúng vẫn có thể hiểu được bạn muốn gì và cần gì.

data machine learning

 

Search data – Tìm kiếm dữ liệu

Tất cả dữ liệu bạn có trên cụm từ tìm kiếm mọi người sử dụng trên các công cụ tìm kiếm (Google, Bing, Yahoo search,…), dẫn đến việc mọi người nhấp vào trang web của bạn từ trang kết quả.

Thật không may, thông tin này ngày càng khó truy cập do đảm bảo quyền bảo mật và riêng tư cho người dùng.

search data

 

Search traffic – Lưu lượng tìm kiếm

Lưu lượng truy cập truy cập trang web của bạn sau khi nhấp vào URL của bạn từ trang kết quả của công cụ tìm kiếm (SERP).

Đây có thể là lưu lượng truy cập không phải trả tiền: khách truy cập nhấp vào kết quả của công cụ tìm kiếm tự nhiên không được trả tiền (SEO)

Hoặc nó có thể là lưu lượng truy cập phải trả tiền: khách truy cập nhấp vào danh sách trả tiền của bạn (PPC)

Trong ví dụ trên, bạn có thể thấy các kết quả đã được trả tiền để được đặt ở đó thông qua một chiến dịch PPC hoặc tương tự vì chúng có một biểu tượng ‘quảng cáo nhỏ màu vàng.

data search traffic

 

Structured data – Dữ liệu được cấu trúc 

Đây là dữ liệu tuân theo một bộ quy tắc nhất định. Dữ liệu này có thể dễ dàng được đọc bởi các chương trình, trình duyệt hoặc trình thu thập công cụ tìm kiếm khác nhau.

 

Dữ liệu có cấu trúc nằm trong một tệp cố định, chẳng hạn như cơ sở dữ liệu hoặc bảng tính và tùy thuộc vào loại mô hình của bạn sẽ có các tham số rất cụ thể về loại dữ liệu có thể được nhập (số, chữ cái, tên, địa chỉ) và liệu nó có bị hạn chế không đến những thứ khác như số lượng ký tự hoặc tiền tố nhất định như Mr, Ms hoặc Dr. Dữ liệu có cấu trúc có thể dễ dàng nhập, lưu trữ và phân tích.

structed data

 

Unstructured data – Dữ liệu phi cấu trúc

Dữ liệu phi cấu trúc không có mô hình, tổ chức được xác định trước, rất khó để tìm kiếm, lưu trữ và phân tích.

 

Một ví dụ về dữ liệu phi cấu trúc là email. Mặc dù hộp thư đến có thể được sắp xếp theo ngày hoặc thời gian hoặc người gửi, nhưng nó không bao giờ có thể được sắp xếp chính xác theo nội dung chính xác. Bạn không biết là bạn đã xoá đi bao nhiêu trong những cái email bạn gửi và nhận. Nội dung đa phương tiện cũng giúp tạo dữ liệu phi cấu trúc. Một thư mục duy nhất có thể chứa hỗn hợp video, hình ảnh, âm thanh và slide.

unstructed data

 

Và nếu bạn muốn tìm hiểu thêm về Data thì Nordic Coder khoá học Data Analysis với Python có giá cực ưu đãi.  Giúp cho bạn có thêm kiến thức và kỹ năng về việc phân tích dữ liệu với Python. Ngoài ra bạn có thể đăng ký thêm các khoá học lập trình online và offline tại Nordic Coder – Trung tâm dạy lập trình uy tín và chuyên nghiệp. Đồng thời, Nordic Coder còn là cầu nối nghề nghiệp IT giữa học viên và với các công ty công nghệ hàng đầu Việt Nam sau các khoá học lập trình.