Data Science Machine Learning

สรุปเนื้อหาคอร์สเรียน AI For Everyone – ตอนที่ 1/4

บทความวันนี้แอดเขียนสรุปเนื้อหาสัปดาห์แรกของคอร์สออนไลน์ AI For Everyone สอนโดย Andrew Ng บนเว็บไซต์ coursera โรงเรียนออนไลน์ที่ใหญ่ที่สุดในโลก (Andrew เป็นผู้ก่อตั้ง coursera อีกเช่นกัน)

ถ้าใครยังไม่รู้จัก Andrew Ng เค้าคือ AI Pioneer คนแรกๆของโลก เป็นอดีตผู้ก่อตั้งทีม Google Brain และ VP & Chief Scientist ของ Baidu บริษัท search engine ที่ใหญ่ที่สุดในประเทศจีน ส่วนตัวแอดยกให้เค้าเป็นอาจารย์สอน data science ที่คูลที่สุดในโลกนี้ มีนักเรียนสมัครเรียนกับเค้าทั่วโลกเป็นแสนคน

AI คือพลังงานไฟฟ้ารูปแบบใหม่ ที่ขับเคลื่อนโลกในศตวรรษที่ 21

AI For Everyone เป็นความตั้งใจล่าสุดของ Andrew ที่จะส่งต่อความรู้ด้านนี้ให้คนทั่วไปได้เข้าใจมากขึ้น เนื้อหาแบ่งออกเป็น 4 บท (สัปดาห์) ใช้เวลาเรียนทั้งคอร์สประมาณ 4-5 ชั่วโมง นั่งเรียนกันไปยาวๆ

  1. AI คืออะไร?
  2. การสร้างโปรเจ็ค AI
  3. วิธีสร้างทีม AI ในบริษัทของเรา
  4. AI และผลกระทบต่อสังคม

เนื้อหาสัปดาห์แรกอธิบายคำศัพท์และเทคนิคที่สำคัญของ AI พร้อมยกตัวอย่างง่ายๆให้นักเรียนเห็นภาพ

What is AI?

AI ย่อมาจากคำว่า Artificial Intelligence เป็นสาขาหนึ่งของ computer science ที่ศึกษาเกี่ยวกับความฉลาดของเครื่องจักร (รวมไปถึงหุ่นยนต์ automation แบบต่างๆ) Andrew สรุปว่า AI ในสื่อตอนนี้จะมีอยู่สองแบบ

  • ANI – Artificial Narrow Intelligence คือ AI ที่เก่งเฉพาะทาง เช่น ขับรถได้ เล่นโกะได้ จัดการ spam email ได้ แต่ทำทั้งหมดพร้อมกันไม่ได้
  • AGI – Artificial General Intelligence คือ AI แบบในหนัง sci-fi เลย เช่น Terminator ที่หุ่นยนต์วางแผนทำลายโลก เป็น AI ที่ทำได้หลายๆอย่างพร้อมกัน เดิน วิ่ง ยิงปืน ขับรถ เป็นต้น

AI ที่เราเห็นในสื่อตอนนี้จะเป็นแบบ ANI ทั้งหมดเลย Andrew บอกว่ากว่าที่เราจะสร้าง AGI ได้อาจต้องใช้เวลาเป็นสิบปี หรืออาจเป็นร้อยปี ฉะนั้นอย่าเพิ่งไปกลัวว่า Skynet i.e. Terminator จะเป็นจริงในเร็ววันนี้

Venn diagram แสดงความสัมพันธ์ระหว่าง CS AI และ DS

เครื่องมือสำคัญที่ใช้ในงานวิจัย AI คือ Machine Learning เรียกสั้นๆว่า ML ในคอร์สนี้ Andrew จะใช้คำสลับไปมาระหว่าง AI – ML ส่วนเทคนิคที่เรียกว่า deep learning (หรือ deep neural networks) เป็นหนึ่งใน ML algorithms ที่ใช้กันอย่างแพร่หลายใน AI projects ทุกวันนี้

แล้ว Data Science คืออะไร? DS เป็นศาสตร์ที่เราใช้หา insight ในข้อมูล นิยามของศาสตร์นี้ยังไม่ได้ถูกกำหนดชัดเจน แต่แน่นอนว่ามันกว้างกว่าเรื่อง AI มาก เพราะมันรวมไปถึงเทคนิคการวิเคราะห์ข้อมูลอื่นๆ เช่น สถิติ, domain knowledge รวมถึงการทำ financial model ด้วย spreadsheet (Andrew มีเอ่ยถึงการใช้ Excel เวลาต้องคำนวณ value ที่บริษัทจะได้ถ้าลงทุนในโปรเจ็ค AI)

ML vs. DS

Andrew สรุปความแตกต่างระหว่าง ML vs. DS ได้น่าสนใจมาก

  • ML – final product ส่วนใหญ่จะออกมาเป็น software เช่น speech recognition ที่อยู่ในโทรศัพท์มือถือหรือ spam classifier ใน gmail/ outlook เป็นต้น
  • DS – final product ส่วนใหญ่จะออกมาเป็น slide presentation ส่งต่อให้กับผู้บริหารและหน่วยงานอื่นๆ data scientist เป็นคนปั่นข้อมูลและให้คำแนะนำเชิงกลยุทธ์ที่ช่วยให้ธุรกิจทำงานได้ดีขึ้น ได้กำไรมากขึ้น สร้างลูกค้าได้มากขึ้น – in short, data scientist improves business

Insight นี้ตรงมาก !! เพราะในหลายๆบริษัท data scientist ต้องเข้าประชุมสำคัญๆกับ users ไปจนถึง CEO เสมอเพื่อรับโจทย์หรือ business requirements ต่างๆ แต่ scope งานของ DS และ ML ในหลายๆประเทศค่อนข้างทับซ้อนกันเยอะ สำหรับประเทศไทย DS ต้องทำได้ทุกอย่าง ตั้งแต่สร้างโมเดล ปั่น report ทำ dashboard ประชุมกับผู้บริหาร 555+ (ในเลขห้ามีน้ำตาซ่อนอยู่)

Machine Learning

Arthur Samuel (1959) นักวิทยาศาสตร์คอมพิวเตอร์ของ IBM ให้นิยามคำว่า machine learning ไว้ดังนี้ “การสอนคอมพิวเตอร์ให้เรียนรู้ได้ด้วยตัวเองโดยไม่ต้องเขียนโปรแกรมสั่งมันตรงๆ”

Related image
Arthur Samuel เขียนโปรแกรมคอมพิวเตอร์ที่สามารถเรียนรู้การเล่นหมากรุก (chekers) ที่พัฒนาการเล่นได้ด้วยตัวเอง

ในคอร์สนี้ Andrew เน้นอธิบาย ML แบบที่เราเรียกว่า supervised learning คือการ map input เป็น output ด้วยฟังชั่น เขียนเป็นสมการง่ายๆได้แบบนี้ output = f(input)

Field of study that gives computers the ability to learn without being explicitly programmed

Arthur Samuel (1959)

ตัวอย่างของ supervised learning ง่ายๆคือ การบอกว่ารูปนี้เป็นแมว (1 = cat) หรือว่ารูปนี้ไม่ใช่แมว (0 = not cat) ในเชิงเทคนิคเราเรียกปัญหานี้ว่า classification ลองดูตัวอย่าง application อื่นๆในตารางด้านล่าง

Input (A)Output (B)ตัวอย่าง Application
emailspam (0/1)spam filtering
audiotext transcriptspeech recognition
EnglishChinesemachine translation
ad, user infoclick (0/1)online advertising
imageposition of other carsself-driving car

(Deep) artificial neural networks คือชื่อ supervised algorithm ที่เป็นกระดูกสันหลังของ AI projects ทั่วโลก ได้รับแรงบันดาลใจมาจากการทำงานของสมองมนุษย์ (แต่จริงๆไม่ได้เกี่ยวกันเลย) เหตุผลหลักที่ทำให้โมเดลนี้เป็นที่นิยมมากคือเรื่อง performance ที่เหนือกว่า ML algorithms ทั่วไป รวมถึงการนำ algorithm นี้ไปใช้แก้ปัญหา perceptual ต่างๆ เช่น computer vision, NLP และ speech recognition เป็นต้น

Image result for neural network
ที่มา – Artificial Neural Network Beginning of the AI revolution (Hacker Noon)

Technical note – deep learning ช่วยให้งานของ data scientist เบาลงเยอะเพราะไม่ต้องทำ feature engineering เอง เราแค่เตรียมข้อมูล input ใส่ไปในโมเดลแล้วนั่งรอดู output ได้เลย ส่วนข้อจำกัดของโมเดลนี้คือการอธิบายผลทำได้ค่อนข้างยากเป็น black box algorithm และใช้ทรัพยากรในการเทรนโมเดลมาก

AI Company

บริษัทที่มีการใช้ deep learning ใน pipeline ไม่ได้แปลว่าเป็นบริษัท AI จริงๆ Andrew อธิบายลักษณะสำคัญของบริษัทที่ทำวิจัยด้าน AI อย่างจริงจัง เช่น Google, Facebook, Amazon ต้องมีกลยุทธ์เหล่านี้

  • strategic data acquisition – มีกลยุทธ์การเก็บข้อมูลใหม่จำนวนมาก
  • unified data warehouse – มีศูนย์กลางการเก็บข้อมูลของทั้งบริษัท
  • pervasive automation – เห็นโอกาสและชอบทำพวก automation
  • new roles and division of labor – มีแผนกและตำแหน่งใหม่ๆในองค์กร เช่น machine learning engineer, research scientist, data engineer ฯลฯ

สรุปสั้นๆคือ AI company ต้องผ่านการ transform ธุรกิจตัวเอง เปลี่ยนวิธีการทำงานโดยนำ AI เข้ามาใช้ในจุดที่เหมาะสมที่ช่วยเพิ่มความสามารถในการแข่งขัน – AI creates value and business impact

AI Transformation

Andrew ให้แนวทางการปรับเปลี่ยนองค์กรให้กลายเป็น AI driven company มี 5 ขั้นตอนดังนี้ (สามารถดาวน์โหลด AI Transformation Playbook ของ Andrew ได้ฟรีที่นี่)

  1. ลองทำ pilot AI projects เพื่อสร้าง momentum ให้กับบริษัท
  2. สร้างทีม in-house AI ของตัวเอง
  3. มีการเทรนนิ่งอย่างต่อเนื่องให้กับทุกคนในบริษัท
  4. มีกลยุทธ์ด้าน AI โดยเฉพาะเรื่อง data acquisition และ data warehouse
  5. มีแผนการสื่อสารทั้งภายในและภายนอกองค์กรให้คนรู้ว่าเราเอาจริงเรื่อง AI

เนื้อหาแบบละเอียดของ AI Transformation จะอยู่ในสัปดาห์ที่สาม

What AI Can and Cannot Do

ขอบคุณรูปสวยๆจาก Unsplash

ถ้าอะไรที่มนุษย์ทำได้ใน 1 วินาที AI น่าจะทำสิ่งนั้นได้เหมือนกัน Andrew เรียกกฏนี้ว่า “1 second of thought” เป็น (rough) Rule of Thumb ที่ Andrew ใช้เวลาเลือกหัวข้อโปรเจ็ค AI

ปัจจัยที่จะทำให้ AI/ ML ทำงานได้ดี มีสองข้อหลักๆคือ

  1. learning simple concept – เรียนรู้คอนเซปต์ง่ายๆ เช่น spam email (ต้องมี word อะไรบ้าง) หรือ แมวต้องมีหน้าตายังไง? (ตาสองดวง หู หนวด มีขนด้วย)
  2. lots of data available – มีข้อมูลจำนวนมากไว้ใช้เทรนโมเดล ข้อมูลเยอะๆไม่เคยทำร้ายเรา นอกจากค่า storage และ processing power ที่เพิ่มขึ้น 555+

สิ่งที่เราควรหลีกเลี่ยงคือเอา AI ไปเรียนรู้ concept ยากๆ (ที่ตัวเราเองยังอธิบายไม่ได้) เทรนด้วยข้อมูลที่จำกัด และเอาไปใช้กับข้อมูลประเภทใหม่ที่แตกต่างจากตอนเทรน แบบนี้อย่าหวังว่า AI จะทำงานได้ดีเลย!

Key Takeaway Week 1

  • AI ทุกวันนี้คือ Artificial Narrow Intelligence ที่ทำได้เฉพาะอย่าง
  • Machine learning คือเครื่องมือสำคัญในการเรียนรู้ของ AI
  • AI company ต้องทำมากกว่าการเขียนโมเดล deep learning
  • AI/ ML จะทำงานได้ดีกับ simple concept และเวลาที่เรามีข้อมูลเยอะๆป้อนให้มัน

ติดตามอ่านสรุป week 2 ได้ในบทความต่อไป / แอดทอย

6 comments

  1. ขอบคุณครับ รออ่าน week 2 เลยสรุปเข้าใจ่างยมาก

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.