fbpx
4 เทคโนโลยี Search ที่มาแข่งกับ Google เรียนรู้จดจำคน สัตว์ สิ่งของด้วยตัวเองกับ “Deep Learning” 13 - Artificial Intelligence

4 เทคโนโลยี Search ที่มาแข่งกับ Google เรียนรู้จดจำคน สัตว์ สิ่งของด้วยตัวเองกับ “Deep Learning”

เมื่อพูดถึง search engine ทุกคนก็จะนึกถึง google ที่คุ้นเคยกันเป็นอย่างดี ใช้กันทุกวัน ใช้กันทุกครั้งที่เปิดคอมพิวเตอร์ ใช้ตั้งแต่ค้นหาคำตอบอะไรง่ายๆ ไปจนถึงขั้นทำรายงานส่งอาจารย์ และทุกวันนี้ google ก็สามารถค้นหาได้หลากหลายรูปแบบไม่ว่าจะเป็นการค้นหาจากคำค้นธรรมดา ไปจนถึงการเอารูปภาพจากเครื่องไปใส่ค้นหากับ google ก็สามารถทำได้แล้ว จนตอนนี้ผมก็จินตนาการไม่ออกแล้วว่า google จะพัฒนาไปด้านไหนได้อีก แต่วันนี้ผมก็มีเทคโนโลยีใหม่ที่จะมาพลิกโฉมวงการ search engine ที่เราคุ้นเคยไปตลอดกาล นั่นก็คือ Deep Learning

คอมพิวเตอร์ Deep Learning เป็นระบบการเรียนรู้ของหุ่นยนต์ สร้างขึ้นมาเพื่อเรียนรู้พฤติกรรมมนุษย์ หรือถ้าจะเอาให้เข้าใจง่ายๆ ก็คือ มนุษย์สร้าง Deep Learning มาเพื่อเลียนแบบความเป็นมนุษย์นั่นเอง สมองมนุษย์คิดอะไรได้ จดจำอะไรได้ แยกแยะอะไรได้ Deep Learning ก็จะต้องทำได้ไม่แตกต่างจากสมองมนุษย์ และวันนี้ผมขอเสนอ 4 แยกที่เทคโนโลยี Deep Learning พยายามที่จะก้าวข้ามผ่านไปให้ได้ในเร็ววัน

10

DP1 แยกคน

สิ่งใกล้ตัวที่สุดที่ Deep Learning มามีบทบาทในชีวิตประจำวันแล้วก็คือ การแยกใบหน้าใน Google+ และ Facebook เมื่อก่อนตอนอัพรูปครั้งหนึ่ง อยากจะแท็กเพื่อน ก็ต้องเข้าไปแท็กทีละรูป แต่สมัยนี้ Facebook สามารถแยกใบหน้าแต่ละคนได้อย่างแม่นยำพอสมควร เรียกว่าถ่ายด้านตรง ด้านข้าง แทบจะแยกได้ทั้งหมด แท็กทีเดียว เสร็จไปทั้งอัลบั้ม

11

หลักการแยกอันแม่นยำขนาดนี้มาจากการที่คอมพิวเตอร์จำความสัมพันธ์ แล้วก็แยกตามคนที่เราอาจจะรู้จัก มันจึงให้ความแม่นยำมากเกิน 70% อีก 30% อาจจะมาจากการถ่ายในมุมที่ไม่ชัดมากๆ หรือหัวเล็กจนไม่สามารถแยกได้ แต่แค่นี้ก็ฉลาดมากๆแล้ว แต่อนาคตคาดว่า แยกคนจะต้องมีความแม่นยำกว่านี้อีก ตอนนี้ถ่ายรูปพระพุทธรูป ยังแอบแท็กเป็นเพื่อนเราได้ ปัญหานี้ผมเชื่อว่าจะหมดไป ถ้า Deep Learning เสร็จสมบูรณ์พร้อมใช้จริงๆ

7-2

DP2 แยกวัตถุที่ไม่ใช่คนได้

ทีมพัฒนาของ Deep Learning มีจุดมุ่งหมายอีกหนึ่งอย่างคือ สามารถแยกวัตถุทั้งมีชีวิตและไม่มีชีวิตได้ อย่างเช่น เห็นแมว ไม่ว่าพันธุ์อะไร ก็ต้องรู้ว่ามันเป็นแมว จะเป็นคิดตี้ หรือแมวการ์ตูน ก็ต้องแยกได้ว่ามันคือแมว (เหมือนที่มนุษย์มองก็รู้ว่ามันคือแมว) แยกแมวจากสุนัข จากเสือ ถ้ามนุษย์เราสามารถแยกสิ่งเหล่านี้ออกจากกันได้ Deep Learning ก็สามารถทำได้
ไม่เพียงแต่สิ่งมีชีวิต สิ่งไม่มีชีวิตก็ต้องแยกได้ เช่นแยกโต๊ะออกจากเก้าอี้ เมื่อแยกแล้วก็ต้องบอกได้ด้วยว่าอันไหนโต๊ะ อันไหนเก้าอี้ ผมว่าเทคโนโลยีนี้เป็นประโยชน์มากทีเดียว
จริงๆ เทคโนโลยีนี้ได้มีการพัฒนาจนสามารถแยกได้แล้วจริงๆ โดยทำออกมาแล้วเป็น 2 ภาษาคือ จีนกับอังกฤษ โดยที่ยังไม่ได้ทำออกมาเป็นภาษาอื่น ผมเห็นว่าเป็นประโยชน์ต่อการเรียน การสอน โดยเฉพาะเรื่องภาษาได้อย่างมากทีเดียว

1

DP3 แยกเสียง แปลภาษา

นักพัฒนาถึงขั้นพูดออกมาเลยว่า เจ้า Deep Learning นี้แหละถ้าสำเร็จ มันจะฆ่า SIRI ในไอโฟนให้ไม่ได้ผุดได้เกิดเลยทีเดียว แนวคิดแรกคือ แค่เราพูดสำเนียงปกติของเรา ก็สามารถทำให้มันแปลเป็นภาษาเขียนได้ทันที ไม่ต้องออกเสียงให้ตรงสำเนียงเปะๆ เพราะเจ้าตัว Deep Learning จะมีการเรียนรู้จากฐานข้อมูลทั่วโลก ซึ่งเจ้าฐานข้อมูลที่ใช้ในการเรียนรู้ของ Deep Learning ก็คือเจ้าวีดีโอนับล้านในยูทูปนั่นเอง นั่นจึงทำให้สามารถเรียนรู้ไปพร้อมๆ กันได้ทั้งเสียงและภาพ

2-3

แนวคิดของเขาคือ ถ้ามีการสั่งด้วยเสียง มันจะต้องแยกได้ว่าเป็นเสียงใคร แนวคิดง่ายๆ คือ ถ้ามนุษย์สามารถแยกเสียงได้ว่าใครเป็นใคร Deep Learning ก็ต้องเรียนรู้และแยกได้เหมือนกัน ต่อไปนี้เวลาฟังเพลง เราไม่ต้องเอาเนื้อเพลงไปค้นหาใน google อีกแล้ว เราสามารถเอาเพลงมาให้เจ้านี่ฟัง แล้วมันจะบอกมาเองว่าใครร้อง จากฐานข้อมูลที่มีอยู่ทั่วโลก

DP4 แยกการแต่งกาย

คนพัฒนาบอกว่า เราสามารถถ่ายรูปตัวเรา แล้วค้นหาได้ว่า ใครแต่งตัวในสไตล์เดียวกับเราบ้าง ไม่ใช่ใส่ชุดเหมือนเรา สีเดียวกับเรา นะครับ แต่เรากำลังพูดถึงสไตล์การแต่งตัวที่เหมือนเรา โทนเดียวกับเรา และสามารถบอกได้ว่า เสื้อผ้าแนวที่เราใส่อยู่นี้ มันมีอยู่ที่ไหนบ้าง ฉลาดสุดๆ ซึ่งถ้ามันออกมาได้ ระบบการค้นหาด้วยรูปภาพของ google นี่ดูเด็กๆ ไปเลยนะครับเนี่ย แต่ก็ไม่รู้ว่าเทคโนโลยีนี้จะใช้เวลานานขนาดไหน ผมก็ประมาณไม่ได้ อาจจะไม่กี่ปี หรืออีก 10 ปี 20 ปี เราก็ต้องรอดูกันไป

machinelearning1

อนาคตกับเทคโนโลยี Deep Learning

เป้าหมายสูงสุดของ Deep Learning หลังจากที่เทคโนโลยีพัฒนาจนถึงขีดสุด เราน่าจะได้เพื่อนที่รู้ใจเพิ่มมาอีก 1 คน เพื่อนคนนี้จะรู้ว่าเราชอบอาหารแบบไหน แล้วจะหาร้านอาหารแบบนั้นได้ตรงไหน เราแต่งตัวยังไง แล้วเราต้องไปซื้อได้ที่ไหน ถ้าไปต่างประเทศ ถ้าเรายังไม่จองโรงแรม ก็จะบอกว่ามีโรงแรมอยู่ตรงไหนที่ว่าง แถวนั้นมีสนามกีฬาหรือฟิตเนสให้เข้าหรือเปล่า เรียกว่ารู้ใจกันยิ่งกว่าพ่อ แม่ ยิ่งกว่าแฟนซะอีก

และบริษัทหนึ่งที่ลงทุน ลงแรงปัฒนาผลิตภัณฑ์นี้อย่างหนักก็คือ Baidu บริษัทเซิร์ชเอ็นจิ้นยักษ์ใหญ่ของจีน โดยมีการจ้างนักวิจัยอย่างนาย Andrew Ng จาก Google เพื่อมาดูแลโครงการนี้โดยเฉพาะ เรียกว่าเอาจริงเอาจังมากเลยทีเดียว

ยอมรับครับว่า Baidu ในเมืองไทยมีภาพติดตาทุกคนจาก software ที่มีปัญหาไม่ว่าจะเป็น PC Faster หรือ hao123 ผมก็เป็นคนหนึ่งที่ประสบปัญหาไม่ต่างจากหลายคนที่เคยเจอ แต่เทคโนโลยีนี้เท่าที่ศึกษาดูผมเห็นว่ามีประโยชน์มากทีเดียว ถ้าสามารถทำออกมาได้แบบเต็มรูปแบบและแพร่หลายไปทั่วโลก เรามาตามดูกันว่า Baidu กับเทคโนโลยี Deep Learning จะไปได้ไกลขนาดไหน

ไป่ตู้ อาย (Baidu Eye) ดวงตาอัจฉริยะ เทคโนโลยีเหมือนภาพยนตร์จากโลกอนาคต

baidu-eye1

ถ้าหากจัดอันดับ search engine ในโลกนี้ นอกจาก Google ที่ทุกคนรู้จักแล้วในประเทศฝั่งเอเชียอย่างจีนก็มี Baidu เป็น search engine ที่มีผู้ใช้งานเยอะเป็นอันดับ 2 ของโลก และเป็นอันดับ 1 ในประเทศจีน ทำให้มีการพัฒนาเทคโนโลยีแข่งกันอยู่ตลอดเวลา โดยเฉพาะในยุคปัจจุบัน Wearable Device หรืออุปกรณ์ประเภทสวมใส่บนตัวผู้ใช้งานกำลังเป็นเทรนด์ที่เติบโตขึ้น อย่างที่ก่อนหน้านี้เราได้เห็น Google Glass ที่เป็นอุปกรณ์ของทางฝั่ง Google เปิดตัวไปเรียบร้อยแล้ว วันนี้เรารับหน้าที่มาแนะนำอุปกรณ์สวมใส่ของทางฝั่ง Search Engine มังกรจีนอย่าง Baidu บ้าง

baidu-eye2

ไปตู้ อาย (Baidu Eye) ไม่ใช่เทคโนโลยีที่อยู่แค่ในภาพยนตร์อีกต่อไป

ในภาพยนตร์หลายเรื่องที่ผ่านมา เราอาจเคยเห็นการโต้ตอบกันระหว่างคอมพิวเตอร์ช่วยหาข้อมูลของสายลับ หรือปฏิบัติการต่างๆ ที่ต้องคอยใช้ผู้ช่วยในการค้นหาข้อมูล ซึ่งในวันนี้มันจะไม่ได้อยู่แค่ในภาพยนตร์อีกต่อไป เพราะคุณภาพของการเชื่อมต่ออินเทอร์เน็ตที่ดีขึ้น และความฉลาดของอุปกรณ์อย่าง Baidu Eye ที่สามารถจะจับภาพสิ่งที่อยู่ตรงหน้าเรา ส่งข้อมูลไปวิเคราะห์ในฐานข้อมูลอัจฉริยะ เพื่อทำการประมวลผลกับมาให้ผู้ใช้งาน ทั้งทางเสียงและทาง Smartphone

baidu-eye3

แตกต่างเพื่อประสบการณ์ที่ดีขึ้น

แม้ Google Glass ออกโปรดักซ์มาก่อน แต่การแก้เกมของ Baidu น่าสนใจมากตรงที่เล่นกับ user experience ตรงที่การโต้ตอบกับ Google Glass ผู้ใช้จะต้องจ้องผ่านจอเล็กๆบนกระจกแว่น ซึ่งหลายคนก็รู้สึกว่า มันไม่ลำบากสายตา การออกแบบทางฝั่งของ Baidu Eye จึงไม่มีหน้าจอ แต่โต้ตอบกับผู้ใช้ด้วยเสียงในหูฟัง และการแสดงผลบนหน้าจอ Smartphone

ในส่วนระบบปฏิบัติการ การคำนวน ฐานข้อมูลทุกอย่าง แตกต่างกันอย่างสิ้นเชิง เพราะ Baidu เองก็มีวิศวกรที่เชี่ยวชาญมาก รวมถึงการประหยัดแบตเตอรี่ให้ใช้งานได้นานขึ้น เพราะไม่ต้องแสดงภาพตลอดเวลา

baidu-eye4

ลองชมวิดีโอของ Baidu Eye

https://www.youtube.com/watch?v=3JIGtCMjzxU