COVID-19 ที่ว่าแน่ (อาจจะ) ต้องแพ้ Cloud Computing

179
179

ถ้าถามว่าประโยชน์ของ Cloud Computing มีอะไรบ้าง ผู้เขียนคิดว่าหลาย ๆ  คนก็อาจจะตอบว่านำมาใช้งานในด้านธุรกิจหรือเทคโนโลยีที่เกี่ยวข้องกับชีวิตประจำวัน เช่น Computer vision, IoT & Smart home, Self-driving car แต่ในโลกของวิทยาศาสตร์ โดยเฉพาะด้านการแพทย์ ได้มีการนำ Cloud มาใช้ในการศึกษาลักษณะโปรตีนและสารพันธุกรรมของ COVID-19 ซึ่งช่วยให้เราเข้าใจถึงธรรมชาติและกลไกการทำงานของโรคไวรัสชนิดนี้ นำไปสู่การค้นหาโครงสร้างโมเลกุลของยาที่สามารถนำมาใช้ในการรักษาโรคได้ต่อไป

ในปีที่ผ่านมาถือว่าเป็นปีที่หนักที่สุดของมนุษยชาติเลยก็ว่าได้ นั่นก็เพราะการระบาดของโรค COVID-19 ได้ทำให้เกิดการเปลี่ยนแปลงครั้งยิ่งใหญ่ของเรานั่นก็คือการดำเนินชีวิตประจำวันที่ไม่เหมือนเดิม หลาย ๆ บริษัทก็มีการปรับเปลี่ยนรูปแบบการทำงานเป็น Work From Home (WFH) มากขึ้น การประชุมก็เปลี่ยนมาเป็นแบบออนไลน์ งานประชุมวิชาการก็เปลี่ยนมาเป็นการประชุมแบบทางไกล ซึ่งสิ่งต่าง ๆ เหล่านี้ก็ได้เริ่มกลายมาเป็นส่วนหนึ่งของชีวิตเราแล้ว หรือที่เราเรียกว่า New Normal

สำหรับการนำเทคโนโลยีการประมวลขั้นสูง (High performance computing หรือ HPC) มาใช้ในงานทางด้านวิทยาสตร์นั้น ผู้เขียนจะขอยกตัวอย่าง case study ที่น่าสนใจอันหนึ่งให้อ่านกันในบทความวันนี้ครับ ในช่วงปีที่ผ่านมานักวิจัยของมหาวิทยาลัยโตเกียว ประเทศญี่ปุ่น ได้ใช้คอมพิวเตอร์สมรรถนะสูงหรือ Supercomputer ที่ชื่อว่า Fugaku (ณ ตอนนี้ถือว่าเป็นเครื่องที่มีประสิทธิภาพมากที่สุดในโลกตามการจัดอันดับของ TOP500) ซึ่งพัฒนาร่วมกันโดย Riken และบริษัท Fujitsu ในการจำลองทางคอมพิวเตอร์ (Computer Simulation) เพื่อระบุสารประกอบยับยั้งโมเลกุลขนาดเล็ก ที่สามารถใช้เป็นยาที่มีศักยภาพในการรักษาโรค COVID-19 รวมถึงเป็นกุญแจที่จะช่วยไขความลับของกลไกการทำงานของโมเลกุลที่ช่วยยับยั้งการติดเชื้อ COVID-19 เพื่อนำไปสู่การป้องกันและเยียวยาการแพร่กระจายของเชื้อไวรัสอีกด้วย

Spike protein ในรูปแบบเปิด (Open conformation)
Image credit: Folding@Home

ในขณะเดียวกัน ได้มีคนเสนอไอเดียขึ้นมาว่าแทนที่เราจะใช้ Supercomputer แบบที่เป็น on-site ในการศึกษากลไกของ COVID-19 เพียงเครื่องเดียว ทำไมเราถึงไม่นำอุปกรณ์ไอทีของทุกคนในโลกนี้มารวมพลังกันเป็น Supercomputer เครื่องใหม่เลยหล่ะ นั่นคือไม่ว่าจะอยู่ที่ไหนในโลกนี้ ก็สามารถมีส่วนร่วมในงานวิจัยเพื่อค้นหาสารยับยั้งที่สามารถนำไปพัฒนาต่อเป็นตัวยาในการรักษาโรคได้ 

ในปัจจุบันนี้ มีอาสาสมัครมากกว่า 200,000 คนทั่วโลกที่กำลังเร่งกำลังการผลิตงานวิจัยที่เกี่ยวข้องกับการรักษาโรค COVID-19 ซึ่งทุก ๆ ที่เข้ามาช่วยกันนี้สามารถทำงานพร้อมกันได้ก็เพราะสิ่งที่เรียกว่าการประมวลผลแบบกระจายตัว (distributed computing) ซึ่งเป็นการที่แต่ละคนสามารถนำอุปกรณ์ไอทีที่ตัวเองใช้อยู่หรือมีอยู่ที่บ้านไม่ว่าจะเป็นคอมพิวเตอร์ส่วนตัว (PC) แลปทอป (Laptop) หรือแม้ว่าเครื่องจำลอง (Virtual machine) เข้ามาช่วยกันมีส่วนร่วมในการเพิ่มกำลังในการประมวลผล นั่นก็คือทุกคนกำลังช่วยกันสร้าง Supercomputer ที่ใหญ่ที่สุดในโลกนั่นเอง และในตอนนี้ได้มี project ที่ใช้แนวคิดดังกล่าวที่ใช้ชื่อว่า Folding@home (องค์กรไม่แสวงหาผลกำไร) ได้ริเริ่มการนำ distributed computing มาช่วยกันในการจำลองโปรตีนโดยใช้ฐานข้อมูล (database) ของ AWS Open Data Set ซึ่งเปิดโอกาสให้บุคคลที้สนใจเข้ามามีส่วนร่วมในการเพิ่มความเร็วในการประมวลผลหาโครงสร้างของตัวยาที่เหมาะสมที่สามารถรักษาโรค COVID-19 ได้นั้นเอง

ข้อมูลที่ทาง Foding@home ได้อัพโหลดเพิ่มเข้าไปในฐานข้อมูลประกอบไปด้วยข้อมูลทางโมเลกุลที่สามารถช่วยให้นักวิทศาสตร์นำไปพัฒนาวิธีการรักษาโรค COVID-19 ต่อไปได้ ซึ่งชุดข้อมูลเหล่านี้ได้ถูกสร้างขึ้นมาภายใต้ความร่วมมือของ Folding@home กับ COVID Moonshot (องค์กรไม่แสวงหาผลกำไรซึ่งเป็นกลุ่มนักวิจัย/นักวิทยาศาสตร์ทั่วโลกอีกกลุ่มหนึ่งซึ่งมาช่วยกันในการต่อสู้กับโรค COVID-19) โดย ณ ตอนนี้ Folding@home กำลังสนับสนุน COVID Moonshot ในด้านของขุมพลังในการคำนวณ (computing power) เพื่อรันแบบจำลองทางชีวเคมีเพื่อปรับปรุงและค้นหาโครงสร้างโมเลกุลที่เหมาะสมที่ถูกส่งเข้ามาจากนักวิทยาศาสตร์ทั่วโลก

ภาพนักวิจัยขณะกำลังวิเคราะห์โครงสร้างของ inhibitor ใน spike protein
Image credit: Folding@home

ทาง COVID Moonshot ได้รับข้อมูลโครงสร้างโมเลกุลเข้ามาแล้วมากกว่า 13,000 แบบจำลองจากนักวิทยาศาสตร์ทั่วโลกและได้มีการนำโครงสร้างของตัวยาที่ได้จากการจำลองเหล่านี้นำมาทดลองและทดสอบจริง ๆ แล้วว่า 1,000 ตัว ซึ่งนำไปสู่การค้นพบสารประกอบที่มีโอกาสที่นำมาพัฒนาเป็นตัวยาได้จริงประมาณ 60 ตัว นอกจากนี้ หนึ่งในเบื้องหลังของพลังในการคำนวณก็คือ Amazon Web Services (AWS) นั่นเอง ซึ่งช่วยในการรับมือกับข้อมูลที่ถูกส่งเข้ามาอย่างมหาศาล (ข้อมูลมีขนาดใหญ่กว่าหลายร้อย Terabytes) 

ความร่วมมือดังกล่าวในช่วงแรก (The first Folding@home sprint) ได้แล้วเสร็จไปเมื่อเดือนสิงหาคม ปี ค.ศ. 2020 โดยใช้ระยะเวลาประมาณ 3 สัปดาห์ในการประมวลผลโครงสร้างทั้งหมดที่ส่งเข้ามา แต่สำหรับในช่วงที่สองหรือ Sprint 2 นั้นมีความท้าทายเพิ่มมากขึ้นเพราะว่ามีนักวิจัยเข้ามาร่วมโครงการเพิ่มมากขึ้นจาก Sprint 1 หลายเท่าตัว แต่ว่า AWS นั้นได้ช่วยให้การคำนวณ inhibitors หรือโมเลกุลของสารยับยั้งกว่า 6,000 โครงสร้างแล้วเสร็จภายใน 2 สัปดาห์ และหลังจากนั้นก็ได้มีการดำเนินการ Sprint อีกหลายครั้ง สำหรับในส่วนของหลังบ้านหรือ Back end นั้น Sprint เหล่านี้ได้ถูก process โดยใช้ Amazon Elastic Compute Cloud (Amazon EC2) instance ซึ่งเป็น service ที่ช่วยในการสร้าง กระจาย จัดการ workload ที่เกิดขึ้น (16,000 work /  hour) และจากผลการจำลองในคอมพิวเตอร์ ได้มีการคัดเลือกโมเลกุลประมาณ 40 ตัวเพื่อมาสังเคราะห์และทดสอบจริงในห้องปฏิบัติการ เมื่อการสังเคราะห์เสร็จสิ้นแล้ว ข้อมูลของโมเลกุลชนิดใหม่จะถูกส่งต่อไปยังนักวิจัยทั่วโลกเพื่อทดสอบและประเมินประสิทธิภาพของโมเลกุลเหล่านั้นในการยับยั้ง SARS-CoV-2 ในเชิงชีวเคมีและไวรัสวิทยา เมื่อการตรวจสอบข้อมูลเสร็จสิ้นแล้ว ข้อมูลจะถูก deploy หรือส่งต่อแบบเปิดเผย (public) เข้าสู่ระบบฐานข้อมูลกลาง (database) แบบออนไลน์ต่อไป 

แผนภาพแสดง Algorithm ของ COVID-19 simulator
Image credit: https://aws.amazon.com

สำหรับคนที่สนใจ case study อื่น ๆ ที่ AWS ได้มีส่วนช่วยในการต่อสู้กับโรค COVID-19 สามารถอ่านเพิ่มเติมได้ เช่น ในช่วงปีที่ผ่านมา AWS ได้เปิดตัวการให้บริการเครื่องมือศึกษาโรค COVID-19 เพื่อทำนายจำนวนของผู้ติดเชื้อในอนาคตด้วย Machine Learning จากไดอะแกรมด้านบนแสดงสถาปัตยกรรม (architecture) ของระบบที่ได้ออกแบบไว้เพื่อทำการรับข้อมูล ประมวลผล สร้างพารามิเตอร์ที่เกี่ยวข้องกับจำนวนผู้ติดเชื้อ หลังจากนั้นพารามิเตอร์จะถูกนำมาวิเคราะห์ด้วยปัญญาประดิษฐ์แบบมีผู้สอน (Supervised Machine Learning) และสรุปผลจำนวนผู้ที่คาดว่าจะติดเชื้อและช่วงเวลาที่จะมีการติดเชื้อมากที่สุดในอนาคตต่อไป

เพื่อให้การทำนายสิ่งที่จะเกิดขึ้นในอนาคตมีความแม่นยำ ข้อมูลที่จะนำมาใช้เป็น Input จะต้องสอดคล้องกับการแพร่เชื้อ (transmission) โดยข้อมูลที่ถูกเลือกมาใช้ได้แก่

  1. Transmission rate: อัตราการแพร่เชื้อ
  2. Time (weeks) to reach the peak of the first wave of infection: ระยะเวลาจนถึงช่วงที่เกิดจุดที่มีการติดเชื้อมากที่สุด (peak) ของช่วงการระบาดหนักในช่วงแรก
  3. Transmission control: พารามิเตอร์ที่เกี่ยวกับการควบคุมการระบาด เช่น การออกมาตรการเพื่อลดการระบาด เช่น ปิดโรงเรียนหรือคำสั่งให้ทำงานที่บ้าน หรืออาจจะเรียกอีกอย่างว่าเป็นการแทรกแซงการระบาดของไวรัส (intervention)

จากตัวอย่างที่น่าสนใจที่ผู้เขียนยกมาข้างต้นนั้นทำให้เห็นว่า AWS มีบทบาทอย่างยิ่งในการเข้ามาช่วยขับเคลื่อนงานวิจัยทางด้านการแพทย์ ชีวเคมี โดยใช้ประโยชน์จาก Cloud Computing ควบคู่กับเทคโนโลยีของคอมพิวเตอร์และหน่วยประมวลที่ก้าวหน้า ถ้าหากผู้อ่านมีความสนใจใน AWS หรือมีโจทย์ที่แปลกใหม่และต้องการหาที่ปรึกษาทางด้าน Cloud solution สามารถติดต่อมาทาง Cloud HM ได้เลยครับ

รายละเอียดเพิ่มเติม
https://foldingathome.org
https://aws.amazon.com/blogs/machine-learning/introducing-the-covid-19-simulator-and-machine-learning-toolkit-for-predicting-covid-19-spread

— Cloud HM