Những thuật ngữ cơ bản mà Data Analyst cần phải biết (Phần 3)

Data-Analyst

Trong bài viết này, NextCRM sẽ tiếp tục giới thiệu đến các bạn một số thuật ngữ cơ bản mà mọi data analyst cần phải biết để chinh phục công việc phân tích khó nhằn này.

Những thuật ngữ cơ bản mà Data Analyst cần phải biết

Data validation (xác thực dữ liệu)

Đây là một quá trình để đảm bảo việc cung cấp các dữ liệu sạch và rõ ràng đối với các chương trình, ứng dụng và dịch vụ sử dụng nó. Các nhà phân tích dữ liệu – data analyst cần sử dụng những dữ liệu hợp lệ để phân tích. Trong excel, công cụ data validation có tác dụng cố định dữ liệu ở một ô. Khi dữ liệu đã được cố định, chúng ta chỉ có thể nhập được các dữ liệu đã được cố định cho ô đó. Không nhập được các dữ liệu khác.

thuật ngữ Data Analyst

Data visualization (Trực quan hóa dữ liệu)

Là việc trình bày dữ liệu và thông tin dưới dạng biểu đồ, sơ đồ, hình ảnh. Hoặc bảng để dễ dàng truyền đạt thông tin.

Database (cơ sở dữ liệu)

Là tập hợp dữ liệu có liên quan tới nhau được lưu trữ trong hệ hệ quản trị cơ sở dữ liệu.

Dataset (tập dữ liệu)

Tập hợp dữ liệu có thể được xử lý hoặc phân tích thành một bộ dữ liệu. Trong trường hợp dữ liệu dạng bảng, tập dữ liệu tương ứng với một hoặc nhiều bảng cơ sở dữ liệu. Trong đó mỗi cột của bảng đại diện cho một biến cụ thể. Mỗi hàng tương ứng với một bản ghi nhất định của tập dữ liệu được đề cập.

thuật ngữ cơ bản

Descriptiveanalytics (phân tích mô tả)

Là việc giải thích dữ liệu lịch sử để hiểu rõ hơn những thay đổi xảy ra trong một doanh nghiệp. Phân tích mô tả sử dụng một loạt các dữ liệu lịch sử để rút ra so sánh.

Embedded analytics (phân tích nhúng)

Là quá trình nhúng phân tích và báo cáo khả năng trong một hệ thống thiết bị hoặc thông tin. Cung cấp dữ liệu và khả năng phân tích quy trình tự nhiên vào hệ thống thông tin cơ bản.

Machine learning (máy học)

ML là một nhánh của trí tuệ nhân tạo (AI). Nó là một lĩnh vực nghiên cứu cho phép máy tính có khả năng cải thiện chính bản thân chúng dựa trên dữ liệu mẫu (training data). Hoặc dựa vào kinh nghiệm, những gì đã được học. Machine learning có thể tự dự đoán hoặc đưa ra quyết định mà không cần được lập trình cụ thể.

Formula (công thức)

Formula trong data analysis là một tập hợp các hướng dẫn được sử dụng để thực hiện phép tính bằng cách sử dụng dữ liệu trong bảng tính.

Function là lệnh đặt trước. Tự động thực hiện một quy trình hoặc tác vụ bằng cách sử dụng dữ liệu trong bảng tính.

Gap analysis (phân tích khoảng trống)

Là quá trình các doanh nghiệp đánh giá hiệu suất hiện tại cũng như hiệu suất mong muốn của doanh nghiệp. Phương pháp phân tích này sẽ giúp công ty xác định được liệu họ có đáp ứng các mục tiêu đề ra hay không, liệu họ đã sử dụng tài nguyên hiệu quả hay chưa.

Observation (dòng số liệu)

Các thuộc tính mô tả một phần dữ liệu có trong một hàng của bảng.

Predictive Analytics (phân tích dự đoán)

Là việc việc sử dụng số liệu thống kê và mô hình để xác định hiệu suất trong tương lai dựa trên dữ liệu hiện tại và quá khứ. Cho phép các doanh nghiệp và nhà đầu tư điều chỉnh việc phân phối nguồn lực để tận dụng các sự kiện có thể xảy ra trong tương lai.

Query (truy vấn)

Là yêu cầu cung cấp thông tin. Trong lập trình máy tính, query đề cập tới việc yêu cầu dữ liệu hoặc thông tin từ cơ sở dữ liệu.

Query language (ngôn ngữ truy vấn) việc viết một truy vấn yêu cầu một bộ mã được xác định trước để làm cho cơ sở dữ liệu hiểu được lệnh, bộ mã này được gọi là ngôn ngữ truy vấn. Bên cạnh ngôn ngữ cơ sở để quản lý cơ sở dữ liệu là Structured Query Language (SQL), còn có những ngôn ngữ truy vấn hỗ trợ việc giao tiếp với cơ sở dữ liệu như AQL , Datalog, DMX.

Root cause hay Root Cause Analysis (phân tích nguyên nhân gốc rễ)

Quá trình tìm hiểu nguyên nhân của một vấn đề trong chuỗi nhân quả và có khả năng giải quyết được. Việc này giúp khắc phục những sự cố cơ bản, ngăn chặn những sự cố có thể xảy ra bắt nguồn từ nguyên nhân đó.

Stakeholders (các bên liên quan)

Là thuật ngữ các data analyst dùng để chỉ những cá nhân, nhóm người hay tổ chức đầu tư thời gian và nguồn lực vào một dự án và quan tâm đến kết quả của dự án đó.

Statistic

Statistics (thống kê)

Đây là công việc nghiên cứu về số liệu và các phương pháp để thu nhập, xem xét và phân tích số liệu. Thông qua Statistic, bạn có thể tổng hợp để rút ra các kết luận chuẩn xác nhất.

Structured data (dữ liệu được cấu trúc)

Là dữ liệu tuân theo một bộ quy tắc nhất định. Dữ liệu này có thể dễ dàng được đọc bởi các chương trình, trình duyệt. Hoặc trình thu thập công cụ tìm kiếm khác nhau. Dữ liệu có cấu trúc nằm trong một tệp cố định. Chẳng hạn như cơ sở dữ liệu hoặc bảng tính.

Technical mindset (tư duy kỹ thuật)

Khả năng chia nhỏ mọi thứ thành các bước hoặc phần nhỏ hơn, hỗ trợ làm việc một cách có trật tự và hợp lý.

Unstructured data (dữ liệu phi cấu trúc)

Dữ liệu phi cấu trúc không có mô hình, tổ chức được xác định trước. Rất khó để tìm kiếm, lưu trữ và phân tích. Một ví dụ về dữ liệu phi cấu trúc là email. Mặc dù hộp thư đến có thể được sắp xếp theo ngày hoặc thời gian hoặc người gửi. Nhưng nó không bao giờ có thể được sắp xếp chính xác theo nội dung chính xác.

Hy vọng những kiến thức mà phần mềm quản lý dữ liệu khách hàng NextCRM vừa tổng hợp trong series “những thuật ngữ cơ bản về Data Analyst” này có thể giúp ích cho các bạn trong quá trình tìm hiểu về phân tích tích dữ liệu! Xem thêm thông tin phần mềm tại đây

Nguồn: unitrain

Nếu bạn đang quan tâm tới phần mềm CRM NextCRM bạn có thể đăng ký dùng thử miễn phí TẠI ĐÂY

Tổng đài tư vấn và hỗ trợ khách hàng: 1900 638056https://nextcrm.vn/phan-mem-cham-soc-khach-hang

Hotline: 090 224 3822  (24/7)

Website: https://nextcrm.vn/

Facebook: https://www.facebook.com/nextcrm.vn

Chuyên mục : https://nextcrm.vn/giai-phap-crm

Xem thêm: Vai trò & tầm ảnh hưởng của các chuyên viên phân tích kinh doanh trong tổ chức

Rate this post

BÀI VIẾT LIÊN QUAN
BÀI VIẾT LIÊN QUAN

BÀI VIẾT LIÊN QUAN
CÓ THỂ BẠN QUAN TÂM