0
Blog

11 ví dụ Data Visualization sáng tạo trên Python, R, Tableau và D3.js

05/06/2020

Trong bài viết này, mục tiêu của tôi là cho bạn thấy sức mạnh đáng kinh ngạc của data visualization. Tổng cộng có 11 ví dụ về data visualization bao quát nhiều chủ đề khác nhau.

Và để cho thấy rằng bạn có thể làm điều này trong bất kỳ công cụ nào bạn chọn, Nordic Coder sẽ đề cập đến những data visualization này trong Python, R, Tableau cũng như D3.js.

data visualization

Data Visualization với R

Việc tạo ra thư viện ggplot2 đã biến R thành công cụ chuyển đổi data visualization (ít nhất là cho các lập trình viên!). Khi bạn bắt đầu hành trình khoa học dữ liệu của riêng mình bằng R và ngay lập tức bị mê hoặc bởi vẻ đẹp và sức mạnh của ggplot.

Visualization phong cách, instant insights, mô hình không rõ ràng – tất cả điều này chỉ trong một vài dòng code. Nó không có gì ngạc nhiên khi ngay cả các lập trình viên Python khó tính cũng nhập ggplot2 vào sổ ghi chép Jupyter của họ.

Create BBC-Style Visualizations với R

data visualization

 

Đây không phải là một data visualization, điều đó chắc chắn không phải là vấn đề, phải không? Bảng điều khiển trên là sự kết hợp các visualization được phát hành bởi nhóm dữ liệu của BBC, đây là một bản phát hành được hoan nghênh.

Nhóm dữ liệu của BBC đã thực sự phát triển và phát hành gói R và sách dạy nấu ăn R để tạo visualization như ở trên. Gói R được gọi là bbplot. Nó cung cấp các chức năng để tạo và xuất visualization được thực hiện trong ggplot theo kiểu được sử dụng bởi nhóm dữ liệu của BBC.

Có thể tham khảo thêm thông tin tại đây:

Interactive Plots với R

data visualization

Ai không thích thưởng thức các interactive plots? Chúng là một trong những khía cạnh hấp dẫn nhất của một bài thuyết trình (nếu được sử dụng đúng cách). Hình dung này cho chúng ta thấy tuổi thọ đã thay đổi như thế nào trong những năm qua ở các châu lục khác nhau so với GDP bình quân đầu người.

Quá nhiều thông tin ở trong một không gian nhỏ như vậy. Các gói được sử dụng để tạo visualization trên? gganimate! Không có gì ngạc nhiên khi thấy rằng sức mạnh của ggplot mở rộng sang một loại data visualization tuyệt vời khác.

Xem hướng dẫn tại đây để xây dựng các interactive plots trong R:

Sankey Diagrams với R

data visualization

Đây là một ví dụ cổ điển của sơ đồ Sankey. Về cơ bản, nó cho thấy luồng thông tin, trong đó chiều rộng của mũi tên tỷ lệ thuận với lượng dòng chảy. Hình dung trên cho thấy mức độ liên quan của quảng cáo danh sách tùy chỉnh của Facebook.

Visualization này được tạo ra bằng cách sử dụng gói ggalluvial trong R. Nó kết hợp phong cách và tính linh hoạt của gói alluvial thông thường với sức mạnh của tidyverse.

Đầy đủ code, chỉ là một vài dòng, có thể được tìm thấy ở đây.

Data Visualization với Tableau

“In good information visualization, there are no rules, no guidelines, no templates, no standard technologies, no stylebooks. You must simply do what it takes.” – Edward Tufte

Edward Tufte là người tiên phong trong lĩnh vực data visualization. Tôi cảm thấy trích dẫn này thực sự áp dụng cho các visualization mà chúng tôi tạo ra bằng Tableau. Rất nhiều tính năng và tùy chỉnh mà Tableau cung cấp gần như vô song.

Nếu bạn có hứng thú với việc bắt đầu với Tableau! Dưới đây là một loạt các bài viết để giúp bạn chuyển từ người mới bắt đầu Tableau sang một chuyên gia:

The World’s Largest Vote – India’s Elections Visualized

data visualization

 

Đây là một visualization thực sự tuyệt đẹp. Đây chỉ là một phần của bảng điều khiển đầy đủ. Phạm vi của visualization này và lượng dữ liệu được bảo hiểm là đáng kinh ngạc và thực sự hữu ích cho bất cứ ai quan tâm đến loại phân tích này.

Mỗi điểm data thể hiện chi tiết về từng chỗ ngồi, bao gồm tên người chiến thắng, tiểu bang, đảng và khu vực bầu cử). Nhìn vào visualization này gọn gàng như thế nào, mặc dù đóng gói trong một thông tin. Đây là điều mà tất cả chúng ta đều mong muốn trong báo cáo hàng ngày / hàng tuần / hàng tháng của mình, phải không?

Dưới đây là bảng điều khiển Tableau đầy đủ mà bạn có thể tải xuống.

Monitor Sales Performance sử dụng Tableau

data víualization

Đây là một phân tích dữ liệu bán hàng để đo khoảng cách từ quota ban đầu. Tôi đặc biệt thích tab ngang đầu tiên tóm tắt gọn gàng các số liệu chính mà khách hàng hoặc các bên liên quan cần biết.

Sổ làm việc đầy đủ của Tableau chứa năm bảng điều khiển toàn diện, xem xét các số liệu bán hàng này từ các quan điểm khác nhau. Tôi thực sự cảm thấy bạn nên sử dụng điều này như một tài liệu tham khảo nếu bạn làm việc trong lĩnh vực bán hàng hoặc tiếp thị.

Film Genre Popularity – 1910-2018

data visualization

Với những bạn mê phim ảnh nên việc visualization này sẽ ngay lập tức thu hút sự chú ý trên phòng trưng bày công cộng Tableau. Hãy nhớ rằng đây là sự phổ biến của các thể loại phim theo thời gian. Mỗi thể loại có một phạm vi trục khác nhau do đó nhìn chúng từ ống kính đó (thay vì so sánh một so với một so sánh).

Điều nổi bật với tôi là bạn có thể coi đây là bảng điều khiển với nhiều điểm dữ liệu được trình bày. Bạn có thể nghĩ về một trường hợp sử dụng tương tự trong cuộc sống chuyên nghiệp của bạn, nơi một bảng điều khiển như vậy sẽ có ích?

Bạn có thể tải xuống toàn bộ bảng tính và chơi xung quanh nó trong Tableau.

Data Visualization với D3.js

Nếu bạn muốn tạo visualization hoạt hình, D3.js nên là công cụ tiếp theo của bạn. Đây là một thư viện mạnh mẽ cho phép bạn xây dựng các data visualization tùy chỉnh cho bất kỳ loại kể chuyện nào bạn có thể tưởng tượng cho web.

Bạn nên cân nhắc mạnh mẽ việc thêm D3.js vào bộ kỹ năng của mình, đặc biệt nếu bạn muốn làm việc với data visualization thường xuyên.

Dưới đây là hai bài viết phổ biến về cách bắt đầu với D3.js:

Concept Map – Relationship Between Concepts

data visualization

Sử dụng một bản đồ khái niệm để có thể dễ dàng mô tả mối quan hệ giữa các khái niệm hoặc điểm kiến thức khác nhau. Như Wikipedia nói, Bản đồ khái niệm thường biểu thị các ý tưởng và thông tin dưới dạng hộp hoặc vòng tròn, nó kết nối với các mũi tên được gắn nhãn trong cấu trúc phân cấp phân nhánh đi xuống.

Bạn sẽ thấy nó hữu ích cho việc lập bản đồ các quyết định kinh doanh, sơ đồ quy trình, thiết kế thông tin, visualization kiến thức, trong số những thứ khác. Nó là một công cụ hữu ích nhưng được đánh giá thấp trong kho vũ khí của bạn.

Bản đồ khái niệm này rất tương tác và bạn cũng có thể dùng với các nút khác nhau.

Sequences Sunburst Visualization với D3.js

data visualization

Visualization này cho thấy cách sử dụng khái niệm sunburst với dữ liệu mô tả chuỗi sự kiện.

Hãy suy nghĩ về nó – bạn có thể hình dung hành trình khách hàng của bạn bằng cách sử dụng điều này. Thay vì một kênh tĩnh, bạn có thể thấy tất cả các đường dẫn có thể sử dụng trực quan hóa này. Đội ngũ tiếp thị của bạn sẽ yêu bạn vì đã thực hiện điều này.

Mã code D3.js đầy đủ để tạo ra chuỗi các chuỗi này nằm ở đây.

Visualizing the Interaction Between Game of Thrones Characters

data visualization

Bạn có phải là fan hâm mộ của Game of Thrones không? Sau đó, bạn sẽ yêu thích hình dung này. Nó đại diện cho tầm ảnh hưởng của mỗi nhân vật dựa trên số lần tương tác của anh ấy / cô ấy xuất hiện trong cuốn sách Một cơn bão kiếm.

Lưu ý rằng các nút đại diện cho các ký tự và các liên kết tương tác giữa chúng. Kích thước của nút và tên đại diện cho ảnh hưởng của nhân vật. Không có gì ngạc nhiên khi thấy Tyrion có ảnh hưởng lớn nhất, phải không?

Bạn có thể xây dựng hình ảnh Game of Thrones của riêng mình bằng hướng dẫn này.

Data Visualization với Python

Chúng ta thường nghĩ về Python là ngôn ngữ lập trình cuối cùng cho khoa học dữ liệu. Chúng tôi liên kết nó với việc làm sạch dữ liệu, xây dựng các mô hình dự đoán và thậm chí một số nhiệm vụ kỹ thuật dữ liệu nhất định. Nhưng bạn có biết rằng Python thực sự khá hữu ích để tạo data visualization?

Điều đó đúng – Python đi kèm với hai thư viện độc quyền để visualization – matplotlib và seaborn. Bạn có thể kiểm tra bài viết này để biết thêm về các thư viện này và xem chúng hoạt động.

A Geologic Map of Mars

data visualization

 

Thật không thể tin được bản đồ địa chất này trên sao Hỏa được tạo ra bằng Python (với một chút trợ giúp từ Adobe Illustrator). Kinh ngạc!

Các thư viện Python được sử dụng để tạo visualization tuyệt vời này là:

  • Matplotlib
  • NumPy
  • Pandas
  • Cartopy

Nếu phông chữ quá nhỏ để đọc hoặc bạn muốn in nó ra dưới dạng poster – hãy lấy hình ảnh có độ phân giải cao đầy đủ ở đây. Và bạn có thể lấy mã Python cho trực quan hóa này ở đây. Kho GitHub có hướng dẫn đầy đủ để bạn bắt đầu.

Plotting Geostationary Satellites với Python

Bạn sẽ bị mê hoặc bởi nghiên cứu mà cộng đồng khoa học dữ liệu của chúng tôi đang thực hiện trên dữ liệu vệ tinh. Các hành tinh mới được phát hiện, hình ảnh trên mặt đất được tái tạo, NASA dự đoán động đất, trong số những thứ khác.

Gói PyEphem đã được sử dụng để tạo cốt truyện ấn tượng này trong Python. PyEphem về cơ bản cho phép chúng tôi thực hiện các thuật toán thiên văn trong Python.

Khá nhiều người đam mê khoa học dữ liệu đã thử sức với âm mưu trực quan này và bạn có thể tìm thấy tất cả các tài nguyên ở đây.

Kết luận:

Qua bài viết trên bạn có thể thấy được sự hữu dụng của Data Visualization đáp ứng trong cuộc sống của chúng ta. Vì vậy, bỏ thời gian để bồi bổ kiến thức và phát triển bản thân để theo kịp với thời đại là một điều hiển nhiên, không thể bỏ qua? Đến với Nordic Coder – trung tâm đào tạo lập trình viên chuẩn Quốc Tế, bạn sẽ có được những kiến thức cơ bản về Data Visualization với những giảng viên đầy kinh nghiệm và nhiệt huyết, đảm bảo kiến thức và không ngừng cập nhật kiến thức để đáp ứng nhu cầu thực tế, tham khảo tại đây