Nếu bạn đang quan tâm tới việc phát triển nghề nghiệp mảng Data science (khoa học dữ liệu) thì xin được chúc mừng bạn! Đó là một sự lựa chọn thông minh, khi mà càng ngày càng có nhiều hơn những cơ hội việc làm ở mảng công nghệ thông tin nhiều hơn so với những ngành nghề truyền thống. Dữ liệu người dùng càng ngày càng lớn và trở lên phức tạp hơn rất nhiều để hiểu, để đo lường những hành vi, thói quen của họ. Còn đối với các đơn vị sở hữu những dữ liệu lớn đó thì cũng khó khăn trong việc tìm kiếm được những vị trí phù hợp với yêu cầu. Có rất nhiều vị trí công việc trong mảng Data này như: Analysts, scientists, engineers, gurus, AI trainers, robot whisperers,…

Đứng giữa nhiều ngành nghề để lựa chọn vậy thì nhiều người và ngay kể cả bạn cũng không biết nên bắt đầu từ đâu? Để giúp bạn sáng tỏ điều này, chúng ta sẽ so sánh 2 công việc phổ biến nhất trong ngành khoa học dữ liệu (Data science) đó là Data Analyst và Data scientist. Đây là hai trong số những công việc nóng nhất trong ngành công nghệ và được trả lương khá cao. Thậm chí 2 ngành này còn được tạp chí Harvard Business Review trao tặng cho 1 cái tên rất gợi cảm – The sexiest job of the 21st century.

Sự khác biệt giữa Data Analyst và Data Scientist Nordic Coder

Mặc dù có 2 cái tên na ná nhau nhưng giữa 2 ngành nghề này cũng có nhiều điểm khác biệt đáng kể. Trong thế giới của Khoa Học Dữ Liệu thì có kha khá điểm giống và khác nhau giữa Data analyst ( nhà phân tích dữ liệu) & Data scientist (Nhà khoa học dữ liệu). Thực tế thì khá nhiều người nhầm lẫn về công việc của 1 Data Scientist và luôn luôn nhầm lẫn họ với những người làm việc với Big Data khác. Đây là điều khó tránh khỏi vì với công ty quy mô lớn thì họ có thể thuê được nhiều người với nhiều vị trí chuyên môn hóa cao còn với những công ty vừa và nhỏ thì họ lại thuê ít người hơn và người đó phải đảm đương nhiều công việc, vị trí khác nhau.

Có nhiều người từ vị trí Data Analysis chuyển qua Data Science để tập trung về chuyên môn hóa xử lý dữ liệu bậc cao. Những nhân sự làm Data scientist thường có bằng cấp cao và nhiều người xuất phát điểm là Data analyst phát triển lên, họ có thể làm công việc của một nhà phân tích dữ liệu nhưng cũng có thể làm việc trong môi trường cần machine learning, có kỹ năng lập trình nâng cao và có thể tạo ra các mô hình – thuật toán để xử lý dữ liệu.

Để biết được câu trả lời cho sự khác biệt giữa Data scientist và Data analyst cần trả lời các câu hỏi sau:

  • Họ là ai và họ làm công việc gì trong tổ chức ?
  • Họ cần bằng cấp hay nền tảng kiến thức nào ?
  • Mức lương trung bình trên thị trường là bao nhiêu?

Danh mục các vị trí Data analyst, data scientist, data engineer

1/ Data Analyst

a/ Data Analyst – nhà phân tích dữ liệu là ai, họ làm công việc gì trong tổ chức?​

Trong một tổ chức, Data Analyst – nhà phân tích dữ liệu đóng vai trò giải quyết các công việc như: khai thác dữ liệu, làm sạch dữ liệu, thăm dò dữ liệu

và trực quan hóa dữ liệu.

Người làm Data analysis sẽ dùng trí tưởng tượng và sự tò mò của mình để thu thập được càng nhiều insight từ Data càng tốt. Nhà phân tích không chỉ giới hạn trong việc thực hiện các nhiệm vụ mà còn có vai trò tìm ra dữ liệu phù hợp để đáp ứng yêu cầu của khách hàng cá nhân cũng như khách hàng doanh nghiệp

Hơn nữa, người làm data analysis cần có cái nhìn chi tiết cũng như kinh doanh để xây dựng lên các báo cáo dữ liệu khác nhau để làm rõ hơn bức tranh kinh doanh, giúp người làm kinh doanh hoặc CEO đưa ra được những quyết định sáng suốt..

Khác biệt giữa Data scientist và Data analyst - Nordic Coder

Kỹ năng của Data Analyst được chia làm 2 nhánh chính là Descriptive Analytics và Predictive Analytics. Đối với Descriptive Analytics, chủ yếu Analyst cần phải trình bày báo cáo một cách khoa học bằng các visualization của Data. Đối với Predictive Analytics, Analyst cần hiểu được các thuật toán dự báo, đọc các tham số trả về để điều chỉnh các thuật toán nhằm dự đoán được kết quả chính xác nhất. Tuy nhiên Data Analyst cũng chưa phải là nghề được trả lương cao nhất trong lĩnh vực Big Data. Thực tế, Data Analyst áp dụng các thuật toán có sẵn được built in sẵn trong code hoặc phần mềm. Còn người đưa ra thuật toán, là bộ não của Big Data doanh nghiệp đó chính là Data scientist.

b/ Họ cần bằng cấp hay nền tảng kiến thức gì?

Ở các nước phương tây, thì ở vị trí Data Analyst thì thường yêu cầu người làm phải có bằng STEM hoặc bằng cử nhân/ kỹ sư trong lĩnh vực thống kê hay khoa học máy tính. Hoặc các kiến thức, bằng cấp của các trung tâm đào tạo liên quan đến lĩnh vực này cũng là một lợi thế. Tuy nhiên ứng viên cũng cần phải có kỹ năng mạnh về toán, khoa học, lập trình, cơ sở dữ liệu, mô hình và phân tích dự đoán.

  • Toán học, thống kê hoặc kinh tế, trọng tâm là phân tích
  • kinh nghiệm làm việc với các ngôn ngữ như Python, R, SQL, CQL
  • Có kỹ năng phân tích, dự đoán và nhạy bén trong báo cáo.
  • Hiểu biết tốt về mặt kỹ thuật khai thác dữ liệu, công nghệ mới nổi (mapReduce, Spark, Big Data, Machine learning, IoTs, AI) và chủ động tiếp cận vấn đề, khả năng quản lý đồng thời nhiều task.
  • Thành thạo các công cụ như: excel, SQL, Tableau, Qlikview, Power BI,.. là lợi thế

c/ Mức lương và nhu cầu thị trường hiện nay

Theo nghiên cứu gần đây của PWC tại Mỹ thì ước tính sẽ có khoảng 2,7 triệu tin đăng tuyển việc làm cho vị trí Data Analyst. Nghiên cứu này cũng cho thấy rằng các ứng cử viên phải có kiến thức tổng quản nghĩa là họ không chỉ có những kỹ năng và kỹ thuật phân tích mà còn có các kỹ năng mềm như giao tiếp, sáng tạo và làm việc theo nhóm. Theo Glassdoor, mức lương trung bình cho một nhà phân tích dữ liệu ở mức khoảng 84.000 USD. Tuy nhiên, giống như tất cả các công việc, lương phân tích dữ liệu khác nhau tùy theo ngành.

Còn ở Việt Nam thì Data Analysis đa được nhiều bạn trẻ tìm kiếm và theo học với mong muốn tìm được cơ hội phát triển nghề nghiệp với mức lương cao. Hiện tại thì mức lương cho vị trí Data Analyst rơi vào khoảng 1000$/tháng tùy vào từng doanh nghiệp, và cao hơn tới 2000$/tháng nếu doanh nghiệp đó sở hữu Big Data hoặc dữ liệu người dùng lớn.

2/ Data scientist

a/ Data scientist – nhà khoa học dữ liệu là ai, họ làm công việc gì trong tổ chức?​

Trước khi trả lời câu hỏi data scientist là gì? Trước hết hãy trả lời data science là gì?

Data science là một quá trình phân tích dữ liệu bằng cách sử dụng các cách sáng tạo và sử dụng công nghệ phát triển thuật toán để tìm giải pháp cho các vấn đề phức tạp.

Data scientist – Nhà khoa học dữ liệu. Vâng, đây chính là bộ não của Big Data, họ là những người được nhận lương cao nhất trong lĩnh vực này. Mức lương khởi điểm của 1 Data Scientist có thể lên tới hơn 100k USD một năm

Công việc của họ chính là phát triển những thuật toán cho các Data Analyst sử dụng. Bộ kỹ năng của nhà khoa học dữ liệu bao gồm các phép đo thống kê, phân tích, kỹ năng lập trình và sự nhạy bén trong kinh doanh. Hầu hết các nhà khoa học dữ liệu có một nền tảng vững chắc về toán học hoặc các lĩnh vực khoa học khác và sở hữu bằng tiến sĩ cũng là một khả năng khác biệt.

Không có Data scientist thì những giá trị to lớn của dữ liệu lớn sẽ không được khai thác. Vì vậy ngày nay, tất cả các doanh nghiệp trên thế giới đều đang có nhu cầu rất lớn trong việc chuyển đổi dữ liệu thành các thông tin có giá trị cho mình. Do đó, hiểu các khái niệm cơ bản về data science, bạn sẽ trở nên thông thái hơn trong một thế giới định hướng dữ liệu như bây giờ.

Data scientist Venn Diagram

b/ Họ cần bằng cấp hay nền tảng kiến thức gì?

Glassdoor khuyến nghị các bằng cấp sau đây cho một Data scientist :

  • Thạc sĩ hoặc tiến sĩ trong thống kê, toán học hoặc khoa học máy tính
  • Kinh nghiệm sử dụng các ngôn ngữ máy tính thống kê như R, Python, SQL, v.v.
  • Có kinh nghiệm về các kỹ thuật khai thác dữ liệu và thống kê, bao gồm mô hình / hồi quy tuyến tính tổng quát, rừng ngẫu nhiên, tăng tốc, cây, khai thác văn bản , phân tích mạng xã hội
  • Kiến thức về các kỹ thuật học máy như phân cụm, học cây quyết định và mạng lưới thần kinh nhân tạo
  • Kiến thức về các kỹ thuật và khái niệm thống kê nâng cao, bao gồm hồi quy , tính chất của phân phối và kiểm tra thống kê
  • 5-7 năm kinh nghiệm thao tác các bộ dữ liệu và xây dựng các mô hình thống kê
  • Kinh nghiệm phân tích dữ liệu từ các nhà cung cấp bên thứ ba, bao gồm Google Analytics, Catalyst, Coremetrics, AdWords, Crimson Hexagon, Facebook Insights, v.v.
  • Kinh nghiệm với các công cụ xử lý dữ liệu : Heatmap, Hadoop, Hive, Spark, Gurobi, MySQL, v.v.
  • Kinh nghiệm trực quan hóa, trình bày dữ liệu cho các bên liên quan bằng cách sử dụng: Periscope, Business Object, D3, ggplot, v.v.

c/ Mức lương và nhu cầu thị trường hiện nay

Theo Glassdoor , mức lương trung bình hàng năm cho một data scientist là 162.000 USD/năm. Trở thành một data scientist không phải là dễ dàng, nhưng nhu cầu về Data science tiếp tục tăng lên. Theo Báo cáo lực lượng lao động tháng 8 năm 2018 của LinkedIn , tình trạng thiếu hụt data scientist có mặt ở hầu hết các thành phố lớn của Mỹ. Trên toàn quốc, thiếu hụt 151.717 nhân lực, với sự thiếu hụt đặc biệt nghiêm trọng ở các trung tâm công nghệ như New York, Khu vực Vịnh San Francisco và Los Angeles.

Còn ở Việt Nam thì Data scientist là một nghề nghiệp rất mới và những công ty có điều kiện lắm mới có thể tuyển dụng được vị trí Data scientist với mức lương trung bình trên 3000$/tháng.

Bạn muốn trở thành lập trình viên chuyên nghiệp trong thời gian ngắn nhất? Bạn muốn có việc làm IT mức lương khủng sau khoá học? Hãy đăng ký các khoá học lập trình online và offline tại Nordic Coder – Trung tâm dạy lập trình uy tín và chuyên nghiệp. Ngoài ra, Nordic Coder còn là cầu nối nghề nghiệp IT giữa học viên và với các công ty công nghệ hàng đầu Việt Nam sau các khoá học lập trình.