3. 4 THE POWER OF BIG DATA FOR A NEW ECONOMY
ค�ำนิยม
พันเอก ดร. เ ร ฐพงค์ มะลิ ุ รรณ
ประธานกรรมการกิจการโทรคมนาคม
รองประธานกรรมการกิจการกระจายเ ียง
กิจการโทรทั น์ และกิจการโทรคมนาคมแ ่งชาติ
ความก้าวหน้าของเทคโนโลยีดิจิทัลอย่างก้าวกระโดด ท�าให้หลายประเทศ
ก�าหนดให้ “Data-driven Economy” เป็นยุทธศาสตร์ในการขับเคลื่อนเศรษฐกิจ
ของศตวรรษที่ 21 ซึ่งแนวทางส�าคัญประการหนึ่งคือระบบวิเคราะห์ข้อมูล หรือที่
เรียกว่า Big Data Analytics และนั่นเป็นความท้าทายที่จะท�าให้เกิดพลังอ�านาจทาง
เศรษฐกิจในระดับประเทศ ในขณะที่ระดับองค์กรทั้งภาครัฐและเอกชนจะได้รับผล
ของแรงผลักดันที่สะท้อนถึงการพัฒนาทั้งระบบนิเวศอย่างที่ไม่เคยปรากฏขึ้นมาก่อน
ทั้งข้อมูลที่เกิดขึ้นใหม่ ข้อมูลที่มีอยู่ในรูป Structured, Unstructured และ
Semi-structured Data ก็ตาม เป็นหัวใจของการน�าไปต่อยอดในโครงการพัฒนา
เศรษฐกิจและสังคมทั้งสิ้น
หนังสือ “THE POWER OF BIG DATA FOR A NEW ECONOMY หลอมรวม
ข้อมูลสู่การวิเคราะห์-พยากรณ์-สะท้อนอนาคต” ได้ถ่ายทอดถึงการจัดท�าโครงการ
Big Data เพื่อให้ได้ข้อมูลเชิงวิเคราะห์ที่ดี ซึ่งผมเชื่อว่า “เป็นประโยชน์ต่อผู้อ่าน
ทั้งระดับผู้บริหาร นักปฏิบัติ นักการตลาด และนักพัฒนา เป็นอย่างยิ่ง”
4. 5THE POWER OF BIG DATA FOR A NEW ECONOMY
หนึ่งในวาระแห่งชาติด้าน Big Data จะเป็นกลไก
ขับเคลื่อนแผนการพัฒนาประเทศโดยรวม เพื่อให้เกิด
การวางแผนและแก้ปัญหาจากข้อมูลจริง ที่ไม่ได้คิด
หรือประมวลจากความน่าจะเป็นแนวทางนี้จะเป็นการ
พัฒนาที่ถูกจุดและหยุดปัญหาได้ แต่กว่าจะถึงจุดนั้น
ต้องเข้าใจและรู้จริง
หนังสือเล่มนี้ได้อธิบายเรื่อง Big Data ตั้งแต่
รากฐาน “นิยาม” ไปจนถึงการใช้งาน วิธีการเลือก
เครื่องมือ การตั้งโจทย์เพื่อวิเคราะห์และการพยากรณ์
ที่สามารถน�าไปปรับใช้ต่อได้
ดร. ักดิ์ เ กขุนทด
ผู้อ�าน ยการ �านักงานพัฒนารัฐบาลดิจิทัล
(องค์การม าชน)
ค�ำนิยม
5. 6 THE POWER OF BIG DATA FOR A NEW ECONOMY
ค�ำนิยม
ผมรู้จัก รศ.ดร. ธนชาติ นุ่มนนท์ มาเกือบยี่สิบปี และนับถือท่านมาตั้งแต่แรกพบ
ได้รู้จักว่าท่านเป็นคนหนึ่งที่รักการท�างานอย่างจริงจังโดยหวังประโยชน์ส่วนรวม
ระยะยาว จึงยินดีมากที่จะเขียนค�านิยมให้กับหนังสือฉบับนี้ ซึ่งผมอ่านแล้วได้
ความรู้เพิ่มขึ้นอย่างมากในเรื่องของ Big Data
กลยุทธ์ส�าคัญประการหนึ่งเพื่อก้าวไปสู่ยุค Industrial 4.0 คือ Big Data เพราะ
เป็นจุดเริ่มต้นของการพัฒนาองค์กรให้ปรับเปลี่ยนเรียนรู้แนวทางของ Digital
Transformation ซึ่งหนังสือเล่มนี้ไม่ได้มีเพียงทฤษฎีที่ถูกต้อง แต่ยังแนะน�าข้อมูล
เชิงเปรียบเทียบของเครื่องมือต่างๆ และแบบทดสอบที่จะท�าให้ผู้อ่านได้เรียนรู้
มากกว่าความเข้าใจเรื่องทฤษฎีเท่านั้น
โลกก�าลังเปลี่ยนไปอย่างรวดเร็วแบบยกก�าลังในทุกสาขาของเทคโนโลยีดูได้จาก
ข้อมูลที่มีการเก็บให้ใช้งานได้ 90% เกิดขึ้นในสองปีที่ผ่านมานี้เอง และก�าลังเร็วขึ้น
เรื่อยๆ จากการที่มี Internet of Things สร้างข้อมูลอย่างมหาศาลในทุกประเภทงาน
ซึ่งเป็นไปไม่ได้ที่จะใช้วิธีการจัดการกับข้อมูลอย่างที่เราเคยท�ากันในยุคฐานข้อมูล
(DatabaseหรือDataWarehouse)สมัยก่อนซึ่งได้มาถึงจุดจ�ากัดที่ไม่สามารถท�างาน
ในปริมาณข้อมูลที่มีขนาดใหญ่มากได้
ดร. รอม ิรัญพฤก ์
กรรมการ ในคณะกรรมการระบบการช�าระเงิน
แ ่งประเท ไทย ธนาคารแ ่งประเท ไทย
6. 7THE POWER OF BIG DATA FOR A NEW ECONOMY
การท�างานยุคใหม่ต้องประมวลผลแบบขนานกับข้อมูลซึ่งกระจายอยู่หลายๆแห่ง
และต้องมีวิธีการที่อาศัยวิชาการใหม่ของ Data Science ในการท�าการวิเคราะห์ที่
ไม่ใช่แค่การประมวลผลสถิติแบบก่อน แต่กลายเป็นเรื่องของ Big Data Analytics
ผสานกับการใช้ Artificial Intelligence ในด้าน Machine Learning มาช่วยท�าให้
สามารถวิเคราะห์ข้อมูลมหาศาลที่พูดกันเป็น10TBขึ้นไปในงานหลากหลายประเภท
ให้สามารถคาดการณ์หรือพยากรณ์สถานการณ์เชิงธุรกิจที่จะน�ามาใช้ประโยชน์ได้
หนังสือ THE POWER OF BIG DATA FOR A NEW ECONOMY เล่มนี้ได้
หลอมรวมข้อมูลสู่การวิเคราะห์-พยากรณ์-สะท้อนอนาคต ให้ส�าหรับผู้สนใจอยากรู้
ว่า Big Data คืออะไร ใช้อย่างไร ต้องเรียนรู้อะไรบ้างจึงจะใช้ได้ และในอีกมุมหนึ่ง
จะได้เรียนรู้การจัดการโครงการ Big Data ให้ประสบความส�าเร็จว่า.....ควรจะต้อง
ท�าอย่างไร
หนังสือเล่มนี้ยังชี้ให้เห็นความจ�าเป็นของการสร้างบุคลากรชนิดใหม่ที่เป็น
Data Scientist ซึ่งไม่ใช่คนเขียนโปรแกรม และไม่ใช่เป็นแค่นักสถิติแบบยุคก่อน
แต่เป็นการเปลี่ยนวิสัยทัศน์ของผู้บริหารให้เข้าใจประโยชน์ระยะยาวที่เกิดมากับ
BusinessTransformationกับความสามารถที่จะวิเคราะห์ไม่ใช่แค่ “Whathappen?”
แต่ต้องให้รู้ได้ว่า “What will happen?”
7. 8 THE POWER OF BIG DATA FOR A NEW ECONOMY
ค�ำนิยม
ผ .ดร. ภุชงค์ อุทโยภำ
รองอธิการบดีฝ่าย าร นเท
ม า ิทยาลัยเก ตร า ตร์
BigDataจัดเป็นเรื่องหนึ่งที่ก�าลังเปลี่ยนแปลงโลกเนื่องจากในขณะนี้เรามีข้อมูล
อยู่ทุกหนทุกแห่งรอบตัวเรา แต่ข้อมูลเหล่านี้ส่วนใหญ่ถูกทิ้งเสียเปล่าเนื่องจากขาด
วิธีการที่มีประสิทธิภาพในการจัดเก็บและประมวลผล นอกจากนั้นความขาดแคลน
ก�าลังคนด้านนี้ที่เกิดขึ้นทั่วโลก ท�าให้ปัญหาในการน�าข้อมูลมาใช้ยิ่งรุนแรงมากขึ้น
ดังนั้นผมจึงมีความยินดีมากที่ท่านรศ.ดร.ธนชาตินุ่มนนท์ผู้อ�านวยการสถาบันIMC
ได้กรุณาสละเวลาเขียนหนังสือเล่มนี้ขึ้นมาจากประสบการณ์ของท่าน ท�าให้หนังสือ
เล่มนี้เขียนเนื้อหาไว้อย่างครบถ้วนทุกด้านส่วนหนึ่งได้บอกเส้นทางอาชีพใหม่ๆที่จะ
เกิดขึ้นจาก Big Data ท�าให้เห็นโอกาสใหม่ในภาคการศึกษา ซึ่งผู้เขียนมีความเข้าใจ
ทั้งสองส่วนเป็นอย่างดี คือ เส้นทางอาชีพ และการพัฒนาบุคลากรในภาคการศึกษา
ที่ท่านเคยเป็นอาจารย์ในมหาวิทยาลัยมาก่อน จึงท�าให้เกิดโครงการพัฒนาบุคลากร
ที่เกื้อหนุนประโยชน์ต่อภาคการศึกษา โดยด�าเนินการภายใต้สถาบัน IMC ไม่ว่าจะ
เป็นโครงการ Train the Trainer น�าอาจารย์ระดับมหาวิทยาลัยไปสอนและถ่ายทอด
ต่อเพื่อสร้างบุคลากรให้ประเทศ และโครงการ Big Data School การจัดอบรมเข้มข้น
ให้นักศึกษาปี 3และ4เพื่อให้มีความพร้อมในการก้าวสู่โลกแห่งการท�างานที่ต้องการ
8. 9THE POWER OF BIG DATA FOR A NEW ECONOMY
ความรู้ด้าน Big Data เป็นพื้นฐาน กิจกรรมเหล่านี้เป็นสิ่งที่น่าชื่นชมที่สร้างโอกาส
ให้เยาวชนไทยได้เรียนรู้เทคโนโลยีใหม่ หรือ Emerging Technology เยาวชนได้
ค้นพบศักยภาพของตัวเอง มองเห็นเส้นทางอาชีพที่จะเติบโตในอนาคต ไม่ว่าจะเป็น
นักวิเคราะห์ข้อมูล (Data Analyst) นักวิทยาศาสตร์ข้อมูล (Data Scientist) ผู้บริหาร
สูงสุดด้านข้อมูล (Chief Data Officer) จากการที่ได้ท�างานร่วมกับท่านผู้เขียน
มานานนับสิบปี ได้เห็นความมุ่งมั่นของท่านที่จะพัฒนาวงการไอทีของประเทศไทย
ให้รุดหน้าออกไป ผมจึงยินดีที่ท่านสละเวลาถ่ายทอดความคิดออกมาเป็นหนังสือ
เล่มนี้ ซึ่งผมคิดว่าจะเป็นประโยชน์อย่างมากส�าหรับผู้อ่านทุกท่านต่อการมองแนวทาง
ในอนาคตในโลกที่เกิดการเปลี่ยนผ่านสู่ยุค Digital ซึ่งทุกนาที Digital Disruption
ท�าให้เกิดนวัตกรรมใหม่ๆ ที่เปลี่ยนแปลงชีวิตเราอย่างรวดเร็ว
ขอให้ผู้อ่านทุกท่านมีความสนุกสนานกับการอ่านและคิดตามหนังสือเล่มนี้นะครับ
9. 10 THE POWER OF BIG DATA FOR A NEW ECONOMY
ค�ำนิยม
ผมคิดว่า“THEPOWEROFBIGDATAFORANEW
ECONOMY หลอมรวมข้อมูลสู่การวิเคราะห์-พยากรณ์-
สะท้อนอนาคต” เป็นหนังสือ Big Data เล่มแรกของ
เมืองไทยที่ถ่ายทอดความรู้ไว้ทุกมิติทั้งด้านทักษะบุคลากร
ด้านกลยุทธ์ แนวทางปฏิบัติ และกรณีศึกษา
ส�าหรับด้านกลยุทธ์ ต้องบอกว่าเป็นแนวทางที่ท�าให้
ผู้ที่ก�าลังจะเริ่มต้นท�า Big Data รู้ว่าควรจะต้องท�าอย่างไร
ไม่หลงทาง และมีแนวทางที่ชัดเจน ซึ่งจะช่วยให้ประสบ
ความส�าเร็จได้ง่ายและเร็วขึ้น
ในโอกาสนี้ผมขอฝากแง่คิดว่า สิ่งหนึ่งที่ควรตระหนัก
อย่างยิ่งคือ กลยุทธ์ทางธุรกิจจะเป็นโจทย์ข้อแรกที่ต้องท�า
ซึ่งในหนังสือเล่มนี้ให้ความรู้ไว้ชัดเจน
ผ .ดร. จิรพันธ์ แดงเดช
Executive Technical Consultant, No Magic Asia Ltd.
10. 11THE POWER OF BIG DATA FOR A NEW ECONOMY
ำรบัญ
เปิดใจผู้เขียน 13-14
Section I : Big Data Transformation 15
บทที่ 1 Big Data แน ทาง ร้าง Digital Disruption ในองค์กร 16-20
บทที่ 2 ระดับการ ัดค าม ามารถในการน�า Big Data ไปใช้ในองค์กร 21-24
บทที่ 3 The Future of the Database ย้อนประ ัติ
มองอนาคตเทคโนโลยีฐานข้อมูล 25-28
บทที่ 4 การคาดการณ์แน โน้ม Big Data 29-33
บทที่ 5 ค ามพร้อมด้าน Big Data ในไทย ต้องใ ้เ ลาอีกระยะ 34-37
บทที่ 6 Open Government Data กับการปฏิรูปประเท ไทย 38-43
Section II : Strategic Thinking 44
บทที่ 7 นโยบาย 3 ด้าน านกลยุทธ์ Big Data ประเท ไทย 45-48
บทที่ 8 รู้จักกับ Big Data ใ ้ถูกต้อง 49-52
บทที่ 9 Big Data กับค ามจ�าเป็นต่อการลงทุนด้านเทคโนโลยี 53-55
บทที่ 10 นับ นึ่งที่การ างแผนกลยุทธ์ นับ องด้ ยการเลือกเทคโนโลยี 56-59
บทที่ 11 ไขประเด็นเริ่มต้น Big Data ได้อย่างร ดเร็ 60-65
บทที่ 12 Big Data และเทคโนโลยี Hadoop
กับการพัฒนาองค์กรด้าน ิเคราะ ์ข้อมูล 66-69
บทที่ 13 เทคโนโลยีด้าน Big Data: Hadoop-NoSQL-NewSQL-MPP 70-73
บทที่ 14 เทคโนโลยีด้าน เก็บข้อมูล-ประม ลผล ตามแน ทาง Big Data 74-78
Section III : Best Practices 79
บทที่ 15 Big Data as a Service ทางเลือกที่ท�าได้ทันที ไม่ต้องลงทุน 80-84
บทที่ 16 Big Data on Cloud ตอนที่ 1: Hadoop as a Service 85-90
บทที่ 17 Big Data on Cloud ตอนที่ 2: BI/Analytics as a Service 91-96
บทที่ 18 Big Data บน Public Cloud 97-100
11. 12 THE POWER OF BIG DATA FOR A NEW ECONOMY
บทที่ 19 รู้จักกับเทคโนโลยีเพื่อการประม ลผล Big Data 101-104
บทที่ 20 Hadoop Ecosystem �า รับการพัฒนา Big Data 105-110
บทที่ 21 เปรียบเทียบการติดตั้ง Hadoop Distribution ใช้ง่าย รือมีข้อจ�ากัด 111-114
บทที่ 22 ได้เ ลาลงมือทดลองใช้งาน Hadoop Distribution 115-117
บทที่ 23 Azure HDInsight นึ่งในกลยุทธ์ที่เปลี่ยนไปของ Microsoft 118-121
บทที่ 24 Hadoop Application Architecture 122-125
บทที่ 25 Data Lake: Redefine Data Warehouse 126-129
บทที่ 26 Data Lake จุดเริ่มต้น ู่ Big Data 130-135
Section IV : Insight Big Data Skills 136
บทที่ 27 Big Data Analytics กับค ามต้องการ Data Scientist
ต�าแ น่งงานที่น่า นใจในปัจจุบัน 137-142
บทที่ 28 Data Scientist กับเทคโนโลยี Big Data:
บนเครื่องมือ Hadoop-Spark- R-Mahout 143-146
บทที่ 29 ถาบัน IMC มุ่งมั่น ร้างคนด้าน Big Data อย่างต่อเนื่อง 147-150
บทที่ 30 การพัฒนาบุคลากร Big Data เพื่อรองรับค ามต้องการในอนาคต 151-154
บทที่ 31 ค ามต้องการบุคลากรด้าน Big Data 155-158
บทที่ 32 Big Data School อบรมนัก ึก า
ร้างบุคลากร- อนปฏิบัติ ที่ ถาบันไอเอ็มซี 159-164
บทที่ 33 ร ม ลัก ูตร Big Data ประจ�าปี 2018
ถาบัน IMCพัฒนาต่อเนื่อง 165-169
Section V : Showcases 170
บทที่ 34 Big Data ต้องเริ่มต้นจากการ ิเคราะ ์ Transactional Data 171-174
บทที่ 35 เปิดมุม Big Data Use Cases ในอุต า กรรมที่มีข้อมูลขนาดใ ญ่ 175-180
บทที่ 36 ประยุกต์ใช้ Big Data ในภาครัฐรับประโยชน์ทั่ ถึง 181-185
บทที่ 37 Mini Project ลงมือปฏิบัติใน ลัก ูตร Big Data Certification 186-189
บทที่ 38 Big Data School อนนัก ึก าติดตั้ง
Hadoop Distributions ร้างคู่มือ ่งต่อ าธารณะ 190-193
บทที่ 39 Hortonworks เทียบกับ Hadoop Distribution อื่น 194-197
บทปิดท้าย ขั้นตอนการท�าโครงการ Big Data 198-201
ประ ัติผู้เขียน ร .ดร. ธนชาติ นุ่มนนท์ 202-207
กิจกรรมเกี่ย กับ Big Data ของ ถาบัน IMC 208-210
12. 13THE POWER OF BIG DATA FOR A NEW ECONOMY
ในฐานะของคนไอทีช่วง20ปีที่ผ่านมาพบว่าเทคโนโลยีมีการเปลี่ยนแปลงตลอด
จนท�าให้เกิดความรู้สึกว่า“เราต้องเรียนรู้อะไรใหม่ๆมากมายตลอดเวลาเพื่อให้อยู่รอด
ในวิชาชีพไอที เพราะหากนิ่งเฉยอยู่กับเทคโนโลยีเดิมๆ ไม่เรียนรู้สิ่งใหม่ๆ เท่ากับ
ว่าเป็นการล้าหลังไปเรื่อยๆ” จึงมีความสงสัยว่า ในสายวิชาชีพอื่นเป็นเช่นนี้หรือไม่
หากมองย้อนกลับไปในช่วง 20 ปีที่ผ่านมา เราจะเห็นการเปลี่ยนแปลงตลอด
เวลา ผมเองต้องเรียนรู้และก้าวให้ทันกับสิ่งใหม่ๆ เสมอ เริ่มจากสมัยเรียน ผมเรียนรู้
คอมพิวเตอร์มาจากยุคเจาะบัตรด้วยภาษาFortarnIVต่อมาได้ใช้ไมโครคอมพิวเตอร์
ยุคที่ยังไม่มีฮาร์ดดิสก์ และเชื่อว่าคนในอุตสาหกรรมไอทีอีกหลายท่านที่มาจากยุค
เก่ากว่าผมคงเข้าใจเรื่องนี้
กระทั่งเมื่อ 17-18 ปีก่อน จ�าได้ว่าขณะนั้นภาษา Java ก�าลังมาแรง ผมเองก็ต้อง
ขวนขวายเสียเงินทองไปเรียนและสอบ Certified Java Programmer พอมาถึงยุค
Web Server/App Server ก็ต้องศึกษา Java EE เรียนรู้ Enterprise Application
ท�าให้เข้าใจ IT Architecture มากขึ้น จากนั้นวิวัฒนาการของไอทีได้ก้าวต่อเนื่อง
เข้าสู่ยุค Smart Mobile ที่มีรุ่นแรกเข้ามาเมื่อกว่าสิบปีก่อน ผมก็ยังคงเรียนรู้ต่อไป
ในเรื่องJavaMEเขียนโปรแกรมบนNokia7650และตระเวนไปอบรมคนทั่วประเทศ
ต่อจากนั้นมีการกล่าวถึง Web Services ก็ต้องเรียนกันใหม่โดยมองเรื่อง Cross
Platform และเรื่อง Application Programming Interfaces (APIs) ซึ่งขณะนั้นมีการ
กล่าวถึง Service Oriented Architecture (SOA) ซึ่งองค์กรขนาดใหญ่อิมพลีเมนต์
ไปหลายแห่ง จากนั้นเริ่มมอง Programming Language ที่หลากหลายขึ้น ไม่ว่า
จะเป็น Python, Ruby และต้องศึกษาเรื่อง Web Framework ต่างๆ
เ ้นทำงกำรเรียนรู้ไม่มี ัน ยุด
ร .ดร. ธนชำติ นุ่มนนท์
ก ่ำจะเป็นผู้เชี่ย ชำญ Big Data
เปิดใจผู้เขียน
13. 14 THE POWER OF BIG DATA FOR A NEW ECONOMY
เส้นทางการศึกษาเรียนรู้ของผมตลอด 20 ปีที่ผ่านมานั้นไม่เคยได้หยุด
การเรียนรู้สิ่งใหม่ๆ เนื่องจากเทคโนโลยีไอทีมีการเปลี่ยนแปลงต่อเนื่อง
ตลอดเวลา
เช่นกันกับเมื่อราว 7-8 ปีที่ผ่านมา Cloud Computing อุบัติขึ้น ผมก็เป็นคนไทย
คนแรกๆ ที่บรรยายเรื่องนี้ และลงมือใช้งานจริงบน Cloud Platform ต่างๆ ทั้ง IaaS,
SaaS และ PaaS เพื่อสร้างการรับรู้ให้คนไอทีตระหนักถึงทางเลือกใหม่อย่าง Cloud
โดยขณะนั้นผมอยู่ในต�าแหน่งผู้อ�านวยการเขตอุตสาหกรรมซอฟต์แวร์ประเทศไทย
(Software Park) ได้ท�าการจัดสัมมนาและร่วมกลุ่มพันธมิตรทางด้าน Cloud
Computing เพื่อชี้ให้เห็นว่าCloudComputingTransformsITอย่างไรอุตสาหกรรม
ซอฟต์แวร์บางส่วนเริ่มขึ้นในยุคที่ผมเป็นผู้อ�านวยการ
นอกจาก Cloud Computing ในยุคนั้น ยังมีเรื่อง Mobile เกิดขึ้น เพราะเชื่อว่า
Devices ก�าลังเปลี่ยนไปสู่ยุคของ Smartphone/Tablet ซึ่งในขณะนั้นคนในแวดวง
ไอทีมองผมเป็นสัญลักษณ์ Cloud และ Mobile
ทันทีที่ผมก่อตั้งสถาบันIMCเมื่อห้าปีก่อนผมเริ่มต้นด้วยการจัดอบรมBigData
และได้จัดสัมมนาด้านนี้มาโดยตลอด เพราะเล็งเห็นถึงความส�าคัญและประโยชน์
ของ Big Data จึงวางแนวทางเพื่อสร้างบุคลากรทางด้านนี้ โดยเน้นเรื่องเทคโนโลยี
Hadoop ที่สามารถเก็บ Unstructured Data ได้มหาศาล ปัจจุบันสถาบัน IMC ได้
อบรมด้าน Big Data ไปมากกว่าพันคน ซึ่งเชื่อว่าสถาบันมีส่วนส�าคัญที่ช่วยท�าให้
คนเข้าใจเทคโนโลยี Big Data มากขึ้น
14. 15THE POWER OF BIG DATA FOR A NEW ECONOMY
Big Data
Transformation
มองแนวโน้ม ถ่ายโอนความสำาคัญ จาก
ระบบเดิมเชื่อมโยงไปยังเทคโนโลยีใหม่
เปลี่ยนแปลงเป็นองค์กร 4.0
Section I
15. 16 THE POWER OF BIG DATA FOR A NEW ECONOMY
1บทที่
Big Data แน ทำง ร้ำง
Digital Disruption
ในองค์กร
16. 17THE POWER OF BIG DATA FOR A NEW ECONOMY
การใช้ชีวิตประจ�าวันของผู้คนทั้งการท�างานและเรื่องส่วนตัว ล้วนแล้วแต่เป็น
การสร้างข้อมูลใหม่ขึ้นมา ตั้งแต่ตื่นนอนอาจมีการบันทึกเวลาตื่น ทานอาหารที่ใด
เดินทางไปที่ใดบ้าง ส่วนการท�างานมีการบันทึกข้อมูลตลอดเวลาทุกกระบวนงาน เช่น
การส่งเอกสาร เขียนข้อความ สั่ง-ส่งสินค้า บันทึกยอดขาย เป็นต้น หน่วยงานทุกแห่ง
ล้วนมีข้อมูลจ�านวนมากจากการท�างาน การติดต่อลูกค้า และการท�าธุรกรรมต่างๆ
แต่ในอดีตข้อมูลเหล่านี้ไม่ถูกบันทึกในรูปแบบของดิจิทัลทั้งหมดทั้งนี้เพราะมีข้อจ�ากัด
ในเรื่องเทคโนโลยี
การเข้ามาของเทคโนโลยีใหม่อย่างInternetofThingsหรืออุปกรณ์ต่างๆประกอบ
กับเทคโนโลยีด้านการเก็บข้อมูลมีการเปลี่ยนแปลงและราคาที่ถูกลงรวมถึงคอมพิวเตอร์
มีประสิทธิภาพสูงขึ้น ท�าให้ปัจจุบันสามารถบันทึกข้อมูลต่างๆ ในการท�างาน การใช้
ชีวิตประจ�าวันเป็นไปได้มากขึ้นกระทั่งเกิดเป็นข้อมูลขนาดใหญ่(BigData)ที่แตกต่าง
จากการเก็บข้อมูลเพียงแค่ฐานข้อมูลแบบเดิมที่เป็นDatabaseหรือDataWarehouse
เช่นในอดีตที่จะต้องเลือกเก็บข้อมูลบางอย่างเท่านั้น ซึ่งไม่ใช่ Big Data ที่ควรจะเป็น
เมื่อหน่วยงานมี Big Data ที่สามารถรวบรวมข้อมูลจ�านวนมากลงมาในรูปแบบ
ของ Data Lake จึงเกิดความท้าทายขึ้นมาว่า จะน�าข้อมูลเหล่านั้นมาวิเคราะห์ให้เกิด
ประโยชน์อย่างไร?ส�าหรับการท�าBigDataAnalyticsหลายหน่วยงานเข้าใจแต่เพียง
ว่าคือการน�ามาสร้างรายงานให้เห็นข้อมูลต่างๆ ในรูปแบบของ Business Intelligence
และอาจยังเข้าใจว่าการท�าDigitalTransformationของหน่วยงานเป็นการน�าเทคโนโลยี
ดิจิทัลมาใช้ แล้วน�ารายงานที่ได้จาก Big Data มาใช้ประโยชน์
17. 18 THE POWER OF BIG DATA FOR A NEW ECONOMY
ความเป็นจริงทุกวันนี้ที่มักจะกล่าวถึง Digital Disruption และ Industry 4.0
โดยมองว่า Robot หรือ Artificial Intelligent/Machine Learning ก�าลังเข้ามา และเห็น
ธุรกิจหลายด้านก�าลังเปลี่ยนแปลงไป แต่คิดว่าเป็นการใช้ดิจิทัล การหาซอฟต์แวร์
เข้ามาใช้งาน หลายหน่วยงานมีความพยายามจะปรับฝ่ายไอทีในองค์กร หานักพัฒนา
ซอฟต์แวร์ ลงทุนฮาร์ดแวร์เพิ่ม ด้วยความเข้าใจว่า “ต้องท�า Digital Transformation
หรือพยายามจะเกาะกระแส Industry 4.0/Thailand 4.0 อย่างไม่เข้าใจ
ธุรกิจหลายแห่งที่ก�าลังท�าให้เกิด Digital Disruption ไม่ว่าจะเป็น Amazon.com,
Alibaba,Uber,AirBnb,eBayหรือFacebookล้วนแต่เกิดจากการน�าBigDataองค์กร
ที่ได้จากการบันทึกข้อมูลการท�างานมาใช้ เช่น ข้อมูลการท�าธุรกรรมของลูกค้าน�ามา
ท�าการวิเคราะห์หน่วยงานเหล่านี้ต่างมีแผนกDataScienceซึ่งมีทีมจ�านวนมากที่คอย
คิดว่าจะน�าBigDataมาเปลี่ยนแปลงธุรกิจได้อย่างไรน�ามาสร้างรูปแบบธุรกิจใหม่ๆได้
อย่างไรและมีผลท�าให้โลกเกิดการเปลี่ยนแปลงอย่างมากโดยธุรกิจที่ไม่มีการวิเคราะห์
ข้อมูลอาจแข่งขันไม่ได้อีกต่อไป
ดังนั้นการรู้จักน�า Big Data มาใช้ในองค์กร ประเด็นส�าคัญคือ การรู้จักใช้
หลักการของ Data Science มาเพื่อท�าการคาดการณ์ธุรกิจ ซึ่งนอกเหนือจากจะท�าให้
เพิ่มประสิทธิภาพในการท�างานแล้ว Big Data อาจท�าให้เกิด Digital Disruption เห็น
โอกาสทางธุรกิจใหม่ๆ ที่เกิดขึ้นจากการวิเคราะห์ โดยใช้หลักการของ Machine
Learningหรือการน�าข้อมูลมาใช้โดยทีมDataScientistน�าไปสู่โอกาสและความสามารถ
ทางการแข่งขันที่ดีกว่า
อย่างไรก็ตาม Big Data ไม่ได้เป็นเพียงแค่เรื่องของ Business Intelligence
ไม่ใช่งานแบบเดิมๆ ของหน่วยงานอย่าง Data Warehouse และไม่ใช่การใช้ทักษะ
ของนักพัฒนาโปรแกรมหรือคนดูแลฐานข้อมูล แต่เป็นงานของคนกลุ่มใหม่ที่องค์กร
จะต้องกล้าและต้องสร้างทีมใหม่ขึ้นมา สิ่งส�าคัญ Big Data ไม่ใช่ Quick Win หรือ
โปรเจ็กต์ระยะสั้น แต่เป็นการลงทุนเพื่ออนาคต ลงทุนด้านคน เทคโนโลยีใหม่ ที่ต้อง
หวังผลระยะยาว อาจเป็นการตั้งต้นว่าผู้บริหารระดับสูงจะกล้าเสี่ยงหรือไม่ เพื่อให้เกิด
Digital Disruption ขององค์กรอย่างแท้จริง
18. 19THE POWER OF BIG DATA FOR A NEW ECONOMY
ในที่นี้จึงสรุปประเด็นที่ควรท�าในเรื่อง Big Data ไว้ ดังนี้
1. Big Data คือ หลักการของ Data Lake ที่จะสร้างความเปลี่ยนแปลงองค์กร
หากต้องการพัฒนาในแนวทางนี้จ�าเป็นต้องรวบรวมDataต่างๆที่มีอยู่ทั้งภายใน
และภายนอกองค์กรในลักษณะข้อมูลดิบ(RawData)มาเก็บไว้ในDataLakeเพื่อ
น�าข้อมูลต่างๆ มาใช้วิเคราะห์และประมวลผลต่อไป กล่าวคือ Big Data จะเริ่มต้น
ด้วยการเก็บรวบรวมข้อมูลแล้วค่อยตั้งค�าถามต่างๆ ในอนาคต
2. Big Data ไม่ได้เริ่มต้นด้วยการท�า Data Warehouse หรือการท�า Business
Intelligence (BI) แบบเดิม แต่ Data Warehouse และ BI คือส่วนหนึ่งของ Big
Data สิ่งที่จะต้องค�านึงถึงคือการท�า Data Cleansing และการท�ารายงานเป็น
ครั้งๆ ไป โดยการท�า Data Cleansing และ Load Data เข้าสู่ Data Warehouse
จะท�าให้ Information หลายๆ อย่างในข้อมูลดิบจ�านวนมากถูกลดทอนไปเพื่อท�า
รายงาน และเมื่อต้องการท�ารายงานใหม่ๆ ก็อาจจะท�าการ Load Data ชุดใหม่
เข้ามา ท�าให้เสียเวลาในการท�างาน
3. องค์กรจะต้องมีการลงทุนโครงสร้างพื้นฐานส�าหรับ Big Data ซึ่งควรจะเป็นการ
ลงทุนด้าน Data Lake เช่น การจัดหา Hadoop มาใช้ในองค์กร ดังแสดงใน
ภาพตัวอย่าง และไม่ควรลงทุนไปกับ Data Warehouse ด้วยอุปกรณ์หรือ
ซอฟต์แวร์ที่ราคาสูงเกินไปเพราะDataLakeจะมีราคาที่ถูกกว่าสามารถOffload
ข้อมูลจาก Data Warehouse ลงมาได้ ดังนั้นการท�า Big Data Project คือการ
เริ่มต้นจากการท�า Data Lake
4. องค์กรที่สามารถใช้ Public Cloud ได้ อาจพิจารณาการท�า Big Data โดยใช้
Big Data as a Service ที่อยู่บน Platform ต่างๆ เช่น AWS, Google Cloud
หรือ Microsoft Azure ซึ่งจะมีบริการ Cloud Storage และ Hadoop as a Service
5. คุณค่าของ Big Data คือการท�า Predictive Analytics ซึ่งต้องการทีมงานที่มี
ความรู้ทาง Data Science และมีแนวคิดที่แตกต่างจากกลุ่ม Data Warehouse
และ BI องค์กรควรจะสร้างทีมขึ้นมาใหม่เป็นผู้มีความรู้ด้าน Data Science
แยกออกมาจากกลุ่มคนเดิม โดยทีม Data Science จ�าเป็นอย่างยิ่งที่ต้องมีคน
ที่เข้าใจธุรกิจขององค์กรดังนั้นการสร้างทีมจากภายในจะเป็นเรื่องที่ดีกว่าโดยอาจ
ผสมผสานกับคนใหม่ที่มาจากภายนอก ทั้งนี้การเลือกคนท�าต้องเน้นความเข้าใจ
เรื่องคณิตศาสตร์และสถิติ มากกว่าคนไอทีที่เน้นการพัฒนาโปรแกรม
19. 20 THE POWER OF BIG DATA FOR A NEW ECONOMY
6. องค์กรควรจะมีการพัฒนาบุคลากรในทุกระดับให้เข้าใจหลักการของBigDataและ
ประโยชน์ที่จะได้รับ เข้าใจว่า Big Data จะมา Disrupt ธุรกิจอย่างไร
7. การท�า Big Data Analytics แต่ละเรื่องจ�าเป็นต้องใช้เวลาในการศึกษาข้อมูล
หา Algorithm ที่เหมาะสม ผู้บริหารไม่ควรคาดหวังว่าจะได้ผลลัพธ์ภายในระยะ
เวลาอันสั้น ซึ่งแตกต่างจากการขอรายงานที่ได้จาก BI ที่พนักงานสามารถ
จัดท�าได้รวดเร็ว
8. อย่าเริ่มต้นการท�า Big Data ด้วยการลงทุนขนาดใหญ่ และโครงการ Big Data
ที่ดีไม่ควรเริ่มจากฝ่ายไอทีตามล�าพัง
ตัวอย่างของ Data Lake Architecture โดยใช้ Hadoop
ทั้งหมดนี้คือข้อคิดสั้นๆ ที่สถาบัน IMC ต้องการแนะน�า เพื่อให้องค์กรเริ่มท�า
โครงการ Big Data ในแนวทางที่เหมาะสมและถูกวิธี