Khoa học dữ liệu

TỔNG QUAN VỀ PREDICTIVE ANALYTICS (PHÂN TÍCH DỰ BÁO) (PHẦN 2)

Trở lại với chủ đề bài viết về phân tích dự báo – Predictive analytics, ở phần 1, đã giới thiệu đến các bạn thế nào là phân tích dự báo, phân biệt nó với Data analytics, Descriptive analytics (phân tích mô tả) và Prescriptive analytics (phân tích đề xuất), còn phần 2 lần này chúng tôi sẽ đi vào trình bày một cách tổng quan về bản chất, cách thức vận hành, quy trình, và các thuật toán hay kỹ thuật phân tích được sử dụng trong Predictive analytics.

TỔNG QUAN VỀ PREDICTIVE ANALYTICS (PHÂN TÍCH DỰ BÁO) (PHẦN 2)

Xem tiếp...

THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES

Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.

THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES

Xem tiếp...

Phân tích dữ liệu (Data analytics)

Phân tích dữ liệu (tiếng Anh: Data analytics) là quá trình phát hiện, giải thích và truyền đạt các mô hình có ý nghĩa trong dữ liệu. Đặc biệt có giá trị trong các lĩnh vực có nhiều thông tin được ghi lại, phân tích dựa vào sự ứng dụng đồng thời của số liệu thống kê, lập trình máy tính và nghiên cứu hoạt động để định lượng hiệu suất.

Phân tích dữ liệu (Data analytics)

Xem tiếp...

BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO

Tìm hiểu về mối quan hệ giữa Big Data và Cloud

Việc tận dụng và khai thác Big Data để phục vụ cho mục đích cải thiện hiệu quả hoạt động kinh doanh ở mỗi công ty ngày càng trở nên quan trọng và đem lại lợi ích cực kỳ to lớn. Big Data được xem là tài sản cực kỳ chủ lực không thuộc tài chính và nhân lực, nên tài nguyên này cũng cần được quản lý và sử dụng đúng cách.

BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO

Xem tiếp...

LỢI ÍCH CỦA CHATBOT TRONG VIỆC KHAI THÁC BIG DATA

Vào năm 2016, khi Facebook cho ra mắt nền tảng trò chuyện Facebook Messenger với phiên bản nâng cấp cho phép các công ty, các nhà phát triển có thể xây dựng các Chatbot của riêng mình để phục vụ cho các mục đích khác nhau. Chính vì vậy, kể từ đó, sự phổ biến của thuật ngữ “Chatbot” được lan rộng, mặc dù ngày nay nhiều người cũng chỉ mới lần đầu nghe đến nhưng đối với các chuyên gia, nhà quản lý của các tập đoàn công nghệ thế giới, Chatbot hay bất kỳ công nghệ AI (Artifical Intelligence Trí tuệ nhân tạo) có thể hiểu và tương tác với khách hàng từ lâu đã trở thành xu hướng mạnh mẽ, lan rộng , cách mạng hóa các hoạt động kinh doanh.
LỢI ÍCH CỦA CHATBOT TRONG VIỆC KHAI THÁC BIG DATA
Xem tiếp...

LỢI ÍCH CỦA PREDICTIVE ANALYTICS TRONG THƯƠNG MẠI ĐIỆN TỬ

Ở các bài viết trước về ứng dụng của Big Data trong lĩnh vực E-commerce hay thương mại điện tử, Big Data Uni đã đề cập đến những dữ liệu các công ty triển khai E-commerce cần khai thác và giá trị chúng đem lại, đặc biệt là giới thiệu sơ về lợi ích Predictive Analytics. Lần này, chúng ta sẽ đi sâu hơn và bàn luận về tầm quan trọng của phân tích dự báo trong từng trường hợp cụ thể. Nhưng trước hết, chúng ta cùng tìm hiểu một chút về định nghĩa phân tích dự báo.

LỢI ÍCH CỦA PREDICTIVE ANALYTICS TRONG THƯƠNG MẠI ĐIỆN TỬ

Xem tiếp...

Tặng dữ liệu các hố khoan địa chất công trình

Chuyên thu thập thông tin về địa chất trên toàn lãnh thổ Việt Nam và các nước lân cận, với mục đích chia sẻ các thông tin về địa tầng khu vực, tính chất cơ lý các lớp đất, mặt cắt địa chất công trình. Cung cấp các tài liệu địa chất và báo cáo khảo sát địa chất, số liệu địa chất tham khảo ... dành cho nghành xây dựng, các giảng viên, sinh viên cần tài liệu để phục vụ cho việc nghiên cứu và học tập trong lĩnh vực địa chất công trình.

Xem tiếp...

TỔNG QUAN VỀ CHATBOT (PHẦN 2): CHATBOT HOẠT ĐỘNG NHƯ THẾ NÀO?

Ở bài viết trước, chúng tôi đã giới thiệu sơ lược về Chatbot về khái niệm cũng như cách thức vận hành đơn giản nhất của Chatbot. Lần này, chúng tôi sẽ cung cấp cho các bạn về các phương pháp, thuật toán là cơ sở hoạt động của Chatbot hay nói cách khác Chatbot hoạt động ra sao?

TỔNG QUAN VỀ CHATBOT (PHẦN 2): CHATBOT HOẠT ĐỘNG NHƯ THẾ NÀO?

Xem tiếp...

QUẢN LÝ DỮ LIỆU LÀ CƠ HỘI TẠO GIÁ TRỊ KINH DOANH

Không có gì phải nghi ngờ, khi tất cả các doanh nghiệp hiện tại đều bị thôi thúc bởi lợi ích của việc khai thác dữ liệu (data) – thu thập, quản lý, xử lý, phân tích và diễn giải. Điều đó đòi hỏi mỗi tổ chức cần có một cơ sở dữ liệu (database) mới, tiên tiến để đáp ứng với môi trường kinh doanh hiện đại do các database cũ không thể bắt kịp tốc độ thay đổi về hình thức và khối lượng dữ liệu.

QUẢN LÝ DỮ LIỆU LÀ CƠ HỘI TẠO GIÁ TRỊ KINH DOANH

Xem tiếp...

Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ

Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).

Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ

Xem tiếp...

Phần mềm hiện thị dữ liệu, phân tích dữ liệu

Một câu nói nổi tiếng của William Glasser, chuyên gia tâm thân học Mỹ:

Chúng ta học….

10% của những gì ta đọc được

20% của những gì ta nghe thấy

30% của những gì ta nhìn thấy

50% của những gì ta nghe và nhìn thấy

70% của những gì ta thảo luận

80% của những gì ta trải nghiệm

95% của những điều ta dạy người khác

Phần mềm hiện thị dữ liệu, phân tích dữ liệu

Xem tiếp...

TÁC ĐỘNG BIG DATA ĐẾN XU HƯỚNG SOCIAL MEDIA MARKETING

Ở phần 1 “Sự bùng nổ của social media và xu hướng marketing mới”, chúng ta đã tìm hiểu về social media và xu hướng marketing tập trung vào social media trong thời đại công nghệ phát triển. Tiếp theo của chủ đề bài viết, chúng ta sẽ tìm hiểu về tác động của Big data và lợi ích của nó đến social media marketing.

TÁC ĐỘNG BIG DATA ĐẾN XU HƯỚNG SOCIAL MEDIA MARKETING

Xem tiếp...

Dữ liệu thứ cấp là gì?

Khái niệm dữ liệu thứ cấp

Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình thu thập, đã công bố nên dễ thu thập, ít tốn thời gian, tiền bạc trong quá trình thu thập nhưng là loại tài liệu quan trọng trong việc nghiên cứu tiếp thị cũng như các ngành khoa học xã hội khác.

Dữ liệu thứ cấp là gì?

Xem tiếp...

Dữ liệu

Nói chung, dữ liệu bao gồm những mệnh đề phản ánh thực tại. Một phân loại lớn của các mệnh đề quan trọng trong thực tiễn là các đo đạc hay quan sát về một đại lượng biến đổi. Các mệnh đề đó có thể bao gồm các số, từ hoặc hình ảnh.

Dữ liệu

Xem tiếp...

Dữ liệu lớn dẫn đến quyết định lớn. Cách nêu bật ý nghĩa của phân tích dữ liệu & bảng tính

Bạn đã đọc các blog mới nhất. Bạn đã tham dự cuộc hội thảo. Dữ liệu lớn đã tự liên kết như là một phần cốt lõi trong các chiến lược của nhiều công ty vì giá trị rộng lớn của dữ liệu trong môi trường cạnh tranh ngày nay. Dữ liệu lớn có thể mang lại thông tin chuyên sâu có tiềm năng để thực hiện hoặc dừng kinh doanh và điều đó không còn là một bí mật của người dùng nội bộ nữa.

Dữ liệu lớn dẫn đến quyết định lớn. Cách nêu bật ý nghĩa của phân tích dữ liệu & bảng tính

Xem tiếp...

Phương pháp thu thập dữ liệu sơ cấp trong nghiên cứu các hiện tượng kinh tế xã hội

Thu thập dữ liệu là một giai đoạn có ý nghĩa vô cùng quan trọng đối với quá trình nghiên cứu các hiện tượng kinh tế xã hội. Tuy nhiên việc thu thập dữ liệu lại thường tốn nhiều thời gian, công sức và chi phí; do đó cần phải nắm chắc các phương pháp thu thập dữ liệu để từ đó chọn ra các phương pháp thích hợp với hiện tượng, làm cơ sở để lập kế hoạch thu thập dữ liệu một cách khoa học, nhằm để đạt được hiệu quả cao nhất của giai đoạn quan trọng này.

Phương pháp thu thập dữ liệu sơ cấp trong nghiên cứu các hiện tượng kinh tế xã hội

Xem tiếp...

CHUYÊN GIA PHÂN TÍCH DỮ LIỆU – SỰ THÀNH CÔNG TRONG TƯƠNG LAI

1. Xu hướng nghề nghiệp trong tương lai

Hiện tại, chúng ta đang sống trong giai đoạn đầu của thời kỳ cách mạng công nghiệp lần thứ 4. Triết lý của cuộc cách mạng công nghiệp 4.0 là chúng ta phải sử dụng công nghệ thông tin để tăng được năng suất lao động, từ đó tiết kiệm được chi phí, mang lại lợi ích cho người tiêu dùng.

CHUYÊN GIA PHÂN TÍCH DỮ LIỆU – SỰ THÀNH CÔNG TRONG TƯƠNG LAI

Xem tiếp...

ỨNG DỤNG CỦA BIG DATA TRONG MỌI LĨNH VỰC

Big Data được ứng dụng trong rất nhiều lĩnh vực khác nhau như đã giới thiệu ở bài viết “Big Data – Tên gọi gợi lên khái niệm”. Bài viết tiếp theo dưới đây sẽ nói chi tiết hơn về các ứng dụng của Big data trong từng trường hợp cụ thể, và trong từng lĩnh vực đặc thù. Qua đó chúng ta sẽ thấy được tầm quan trọng trong việc thu thập và phân tích dữ liệu Big data.

ỨNG DỤNG CỦA BIG DATA TRONG MỌI LĨNH VỰC

Xem tiếp...

TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)

Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.

TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)

Xem tiếp...

TỔNG QUAN VỀ DATA MINING (P2): ỨNG DỤNG TRONG CÁC LĨNH VỰC

Trở lại với chủ đề về Data mining, ở phần 1 đã giới thiệu đến các bạn về khái niệm, tầm quan trọng, lợi ích chính và thách thức của Data mining, tiếp tục với phần 2, sẽ đi vào phân tích các ứng dụng của Data mining trong các lĩnh vực một cách chi tiết hơn. Nhưng trước tiên chúng ta cùng điểm qua các loại thông tin và loại dữ liệu được thu thập và phân tích bằng các công cụ Data mining.

TỔNG QUAN VỀ DATA MINING (P2): ỨNG DỤNG TRONG CÁC LĨNH VỰC

Xem tiếp...

Sử dụng số liệu trong kinh doanh thời đại số

Quyển sách mới ra “hiểu số để tăng số – Sexy little number” của Dimitrix Maex & Paul B.Brown đưa ra một góc nhìn tổng hợp trong việc sử dụng số liệu để thực hiện tiếp thị marketing trong thời đại công nghiệp số hoá, dữ liệu lớn. Trong bài này chúng tôi sẽ tóm tắt 1 số ý chính từ quyển sách cho bạn không có thời gian đọc hết quyển sách này.

Sử dụng số liệu trong kinh doanh thời đại số

Xem tiếp...

THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)

Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.

THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)

Xem tiếp...

Chọn nghề phân tích dữ liệu?

Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.

Chọn nghề phân tích dữ liệu?

Xem tiếp...