วันพฤหัสบดีที่ 21 ธันวาคม พ.ศ. 2560

ถอดบทเรียน Big Data ใหญ่ขนาดไหนกัน

(ถอดบทเรียนจากการอบรม 13 ธ.ค. 60)
Big Data คือ กระบวนการวิเคราะห์ข้อมูลขนาดใหญ่ แล้วคำว่า “ใหญ่” จะต้องใหญ่ขนาดไหนกัน การทำ Big Data ไม่สำคัญว่าข้อมูลจะใหญ่ขนาดไหน สำคัญที่คุณค่าของการนำข้อมูลไปใช้ โดยมีองค์ประกอบทั้งหมด 4 ข้อ คือ 1) Data 2) Strategic Thinking 3) องค์ความรู้ในการวิเคราะห์ (Domain Knowledge) ได้แก่ statistics, Data Mining, Machine Learning, Deep Learning และ 4) Tool ได้แก่ manual  machine เช่น software ในการอบรมใช้ซอฟต์แวร์ Power BI และมีการสาธิตใช้ Python
สิ่งสำคัญอีกอย่างหนึ่ง คือ การหาโจทย์ (Question) ในการมาวิเคราะห์ ซึ่งสามารถหาได้ ดังนี้
1.      ปัญหา (Problem) เช่น ปัญหาที่เกิดขึ้นบ่อย หรือ ปัญหาที่เกิดขึ้นนานทีแต่ไม่หนัก
2.      KPI
3.      คู่แข่ง
4.      นโยบายของผู้บริหาร

สถิติ, เวิร์ดเพรส, เว็บ, ข้อมูล, ซม, เว็บไซต์

ตัวอย่าง
11. Question เอามาจาก KPI อัตราการลาออกไม่เกิน 2%
22. Data   ได้แก่
-          Profile บุคลากร
-          ผลการประเมินองค์กร> พนักงาน
-          ผลการประเมินพนักงาน>องค์กร
-          ปริมาณงาน (Work Load)
-          รายได้บุคลากร
33. Strategic thinking หรือ strategic Question (สามารถนำไปตั้งเป็นวัตถุประสงค์วิจัยได้)
-          เปอร์เซ็นต์ของคนที่ลาออก>Descriptive
-          ปัจจัยอะไรที่มีผลต่อการลาออก>Diagnose
-          ทำนายคนที่กำลังจะลาออกได้หรือไม่>Predict
-          แนวทางการธำรงรักษาบุคลากร>Prescriptive
44. ขั้นตอนการวิเคราะห์ข้อมูล
4.1 เตรียมข้อมูลดิบ
4.2 ทำความสะอาดข้อมูล
4.3 สำรวจข้อมูล
4.4 สร้างโมเดล จากรูปแบบความสัมพันธ์ของข้อมูล
4.5 แปลผล

เพิ่มเติม วิทยากรได้แนะนำในส่วนซอฟต์แวร์และเว็บไซต์
1)     Zoom It ซอฟต์แวร์ใช้ในการย่อขยายการนำเสนองาน
2)     www.Kaggle.com เว็บไซต์เกี่ยวกับ Big Data

3)     www.gps-coordinates.net เว็บไซต์หาพิกัด GPS

ไม่มีความคิดเห็น:

แสดงความคิดเห็น