Data Science Business Case Series #1 : Health Care
โรงพยาบาลมีการเก็บข้อมูล Big Data มากมาย และถูกเก็บอยู่ในหลายๆระบบ ทั้งในระบบคนไข้ ระบบจองคิว ระบบรับและจ่ายเงิน หรือ ระบบจ่ายยา ซึ่งหลายๆระบบยังไม่ได้เชื่อมต่อกัน อีกทั้งยังมีข้อมูลใน Medical Device อีกมากมายทั้งเครื่อง scan หัวใจ เครื่อง x-ray หรือ hospital app ที่หลายๆโรงพยาบาลมีไว้บริการคนไข้ จากข้อจำกัดดังกล่าวทำให้ โรงพยาล ต้องทำงานกับข้อมูลขนาดใหญ่ และ ประสบความท้าทายทั้งด้าน Volumn ที่มีมหาศาล และ Variety ของข้อมูลที่มีความหลายหลาย ทั้งที่มี โครงสร้าง และไม่มีโครงสร้าง
แต่วันนี้ Business Case Study ของเราจะไม่ใช่แค่เผชิญกับ Volumn + Variety เท่านั้นนะครับ จะมี Velocity หรือ ความรวดเร็วของข้อมูลด้วยครับ
โรงพยาบาล Assistance Publique-Hôpitaux de Paris:
โรงพยาบาล Assistance Publique-Hôpitaux de Paris ตั้งอยู่ในกรุงปารีสนะครับ โรงพยาบาล AP-HP เป็นทั้งโรงพยาบาล และ คณะแพทย์รวมอยู่ด้วย หรือ เป็น University Hospital เหมือนในหลายๆเมืองใหญ่ในโลก โดย เป็นโรงพยาบาลระดับต้นๆของยุโรป ซึ่งมีบริการทางการแพทย์ 44 สาขา มีพนักงาน 90,000 คน ซึ่งในจำนวนดังกล่าวมี แพทย์ประมาณ 15,800 คน โรงพยาบาลนี้ ประกอบด้วย โรงพยาลในเครือ 44 แห่ง และ มีคนไข้ปีหละประมาณ 5.8 ล้านคน
Challenges
แผนกฉุกเฉิน (Emergency Room) แผนกที่สำคัญแผนหนึ่งในโรงพยาบาล เป็นแผนกที่มีความวุ่นวาย และบางครั้งมีผู้ป่วยฉุกเฉินจำนวนมาก จนอาจจะทำให้ไม่สามารถ รักษาได้ทันท่วงที อีกทั้งการที่ไม่มีแพทย์ หรือ พยาบาลที่เพียงพอ อาจจะทำให้เกิด ปัญหาความรุนแรงในแผนฉุกเฉินอีกด้วย ความล้าช้าจะทำให้เกิดผลเสียกับชิวิตของคนไข้ทั้งในด้านการรอการรักษาและคุณภาพของการรักษาในกรณีที่เร่งด่วน
Proposed Solution:
สร้าง Patient Visit Prediction Model หรือแบบจำลองในการพยากรจำนวนคนไข้ที่จะเข้ามาในแผนกฉุกเฉินในแต่หละ วัน แต่หละชั่วโมง
Data Science Process

Data Source
ข้อมูลที่ใช้ในการวิเคราะห์ คือ ข้อมูลคนไข้ 470,000 encounters เวลา หรือ เข้าออกแผนก ER โดยเป็นข้อมูลที่ถูก De-identify ตัวตนของคนไข้เรียบร้อยแล้ว
Model Development
สำหรับโปรเจคนี้ เป็นแนวการทำนายในอนาคตซึ่งมีเวลาเข้ามาเกี่ยวข้อง ทางโปรเจคจึงเลือกทดลง 3 time series models และ final model เป็นการทำ ARIMAX และมีการ tuning หลายรอบ และใช้ Akaike Information Criteria (AIC) เป็นตัววัด Accuracy โดยรายละเอียดของการ experiment parameters เป็นดังรูปครับ
ตัวอย่างผลของโมเดล

Data Platform (Trusted Analytics Platform)
โปรเจคนี้ ใช้เทคโนโลยี opensource ทั้งหมด และในส่วนของ platform เรียกว่า Trusted Analytics Platform ที่มีการออกแบบเพื่อใช้สำหรับ Analytics และ optimize performance สำหรับ Big data
Summary
โปรเจคนี้เป็น โปรเจคเบื้องต้นสำหรับการทำ Prediction Models (และ platform) สำหรับโรงพยาบาล ที่ยังจะต้องมีการพัฒนาต่อยอดเพื่อให้สามารถนำมาใช้ในโรงพยาลได้อย่างมีประสิทธิภาพและแม่นยั
สำหรับเมืองไทย ก็สามารถนำการวิเคราะห์แบบเดียวกันมาใช้ได้เหมือนกัน โดยอาจจะเริ่มที่โรงพยาลไม่กี่แห่ง และ พัฒนาต่อยอดไปเรื่อยๆ ทั้งในด้านการสร้าง data platform และ การพัฒนาโมเดล
Reference Source: