یکی از چالشهای پژوهش در حوزه سلامت، دسترسی به دادههای واقعی بیماران است. در سالهای اخیر، برخی پایگاههای داده عمومی با هدف حمایت از تحقیقات علمی در اختیار پژوهشگران قرار گرفتهاند. دیتاست MIMIC-III یکی از مهمترین آنهاست که اطلاعات مربوط به بیماران بخش مراقبتهای ویژه (ICU) را در بر دارد و امکان تحلیلهای متنوع در حوزه علوم داده و سلامت را فراهم میکند.

دیتاست MIMIC_III چیست؟
دیتاست MIMIC-III (Medical Information Mart for Intensive Care) شامل اطلاعات بیماران بستری در ICU در بیمارستان Beth Israel Deaconess Medical Center بین سالهای ۲۰۰۱ تا ۲۰۱۲ است. این دیتاست توسط آزمایشگاه MIT Laboratory for Computational Physiology توسعه یافته و با هدف فراهمسازی دادههای واقعی برای پژوهشهای بالینی و دادهمحور منتشر شده است.
سیر توسعه دیتاست
پروژه MIMIC از اوایل دهه ۲۰۰۰ آغاز شد و در ابتدا نسخههای محدودی از دادهها در اختیار پژوهشگران قرار گرفت. در سال ۲۰۱۰، نسخه دوم (MIMIC-II) معرفی شد و در نهایت نسخه MIMIC-III در سال ۲۰۱۵ با بهبود چشمگیر در کیفیت و ساختار دادهها منتشر شد. این نسخه شامل اطلاعات بیش از ۶۰ هزار بیمار است و نقطه عطفی در انتشار دادههای بالینی بهصورت عمومی بهشمار میرود.
ساختار دادهها
MIMIC-III در قالب پایگاه داده رابطهای منتشر شده و شامل جداول متنوعی از اطلاعات بیمار، تشخیصها، درمان، آزمایشها و یادداشتهای بالینی است. چند جدول مهم این دیتاست عبارتاند از:
- PATIENTS: مشخصات جمعیتشناختی بیماران
- ADMISSIONS: اطلاعات مربوط به بستری
- ICUSTAYS: جزئیات مربوط به اقامت در ICU
- DIAGNOSES_ICD / PROCEDURES_ICD: تشخیصها و اقدامات درمانی طبق کدهای ICD-9
- PRESCRIPTIONS: داروهای تجویز شده
- CHARTEVENTS / LABEVENTS: علائم حیاتی، آزمایشها و ثبتهای بالینی
- NOTEEVENTS: یادداشتهای متنی پزشکان و پرستاران
- MICROBIOLOGYEVENTS: نتایج آزمایشهای میکروبی
این ساختار، مجموعهای جامع برای تحلیلهای ساختاریافته و تحلیلهای متنی فراهم میکند.
نحوه دسترسی
برای استفاده از این دیتاست، پژوهشگران باید:
- در وبسایت PhysioNet ثبتنام کنند.
- یک دوره آموزشی آنلاین در زمینه اخلاق پژوهش دادههای سلامت بگذرانند (مانند دوره CITI Program).
- شرایط استفاده را بپذیرند و پس از بررسی مدارک، دسترسی به فایلهای دیتاست برای ایشان فعال خواهد شد.
کاربردهای پژوهشی
دادههای MIMIC-III در پروژههای گوناگونی مورد استفاده قرار گرفتهاند:
تحلیلهای بالینی:
- بررسی روند درمان بیماران
- مقایسه نتایج درمانی بر اساس متغیرهای دموگرافیک یا کلینیکی
- تحلیل سیر بیماریها در ICU
علوم داده و یادگیری ماشین:
- پیشبینی مدت اقامت در ICU یا احتمال مرگ بیمار
- تحلیل سریهای زمانی (مانند علائم حیاتی)
- استخراج مفاهیم پزشکی از یادداشتهای متنی با استفاده از NLP
میزان استفاده در مقالات علمی
تحلیل ارجاعات علمی نشان میدهد که دیتاست MIMIC-III منبعی پرتکرار در پژوهشهای علمی بوده است. تا پایان سال ۲۰۲۳ بیش از ۳۵۰۰ مقاله علمی به آن ارجاع دادهاند. تخمینها نشان میدهد در سالهای ۲۰۲۴ و ۲۰۲۵ نیز به ترتیب حدود ۶۰۰ و ۷۰۰ مقاله جدید منتشر شدهاند که از این پایگاه استفاده کردهاند.
مزایا و محدودیتها
مزایا:
✅ دادههای واقعی و عمیق از بیماران ICU
✅ رایگان بودن و در دسترس بودن عمومی
✅ وجود مستندات دقیق برای استفاده و تحلیل
✅ قابلیت استفاده در پروژههای آموزشی، دانشگاهی و پژوهشی
محدودیتها:
⚠️ تمرکز فقط بر بیماران ICU
⚠️ استفاده از کدهای ICD-9 که در برخی کشورها منسوخ شدهاند
⚠️ وجود دادههای مفقود (Missing) که نیاز به پاکسازی دارند
نگاهی به آینده؛ MIMIC-IV
اگرچه MIMIC-III همچنان یکی از محبوبترین منابع داده در حوزه ICU است، نسخه جدیدتر آن یعنی MIMIC-IV در سالهای اخیر منتشر شده و ساختار بهروزتر، دامنه وسیعتر و دادههای تازهتری را پوشش میدهد. برای پژوهشگرانی که به دنبال تحلیلهای مدرنتر هستند، آشنایی با نسخه چهارم نیز توصیه میشود.
منابع علمی بیشتر
مقاله مرجع
MIMIC-III, a freely accessible critical care database
Alistair E. W. Johnson et al.
Scientific Data (2016)
DOI: 10.1038/sdata.2016.35
سخن پایانی
دیتاست MIMIC-III فرصتی نادر برای تحلیل دادههای بالینی واقعی و یادگیری در حوزه دادههای سلامت فراهم میکند. اگر در مسیر تحقیق، آموزش یا توسعه مدلهای هوشمند در پزشکی هستید، آشنایی با این پایگاه داده میتواند نقطه آغاز قدرتمندی برای شما باشد.