خانه

تقویم رویدادها

مجری ها

یکی از چالش‌های پژوهش در حوزه سلامت، دسترسی به داده‌های واقعی بیماران است. در سال‌های اخیر، برخی پایگاه‌های داده عمومی با هدف حمایت از تحقیقات علمی در اختیار پژوهشگران قرار گرفته‌اند. دیتاست MIMIC-III یکی از مهم‌ترین آن‌هاست که اطلاعات مربوط به بیماران بخش مراقبت‌های ویژه (ICU) را در بر دارد و امکان تحلیل‌های متنوع در حوزه علوم داده و سلامت را فراهم می‌کند.

دیتاست MIMIC_III چیست؟

دیتاست MIMIC-III (Medical Information Mart for Intensive Care) شامل اطلاعات بیماران بستری در ICU در بیمارستان Beth Israel Deaconess Medical Center بین سال‌های ۲۰۰۱ تا ۲۰۱۲ است. این دیتاست توسط آزمایشگاه MIT Laboratory for Computational Physiology توسعه یافته و با هدف فراهم‌سازی داده‌های واقعی برای پژوهش‌های بالینی و داده‌محور منتشر شده است.


سیر توسعه دیتاست

پروژه MIMIC از اوایل دهه ۲۰۰۰ آغاز شد و در ابتدا نسخه‌های محدودی از داده‌ها در اختیار پژوهشگران قرار گرفت. در سال ۲۰۱۰، نسخه دوم (MIMIC-II) معرفی شد و در نهایت نسخه MIMIC-III در سال ۲۰۱۵ با بهبود چشمگیر در کیفیت و ساختار داده‌ها منتشر شد. این نسخه شامل اطلاعات بیش از ۶۰ هزار بیمار است و نقطه‌ عطفی در انتشار داده‌های بالینی به‌صورت عمومی به‌شمار می‌رود.


ساختار داده‌ها

MIMIC-III در قالب پایگاه داده رابطه‌ای منتشر شده و شامل جداول متنوعی از اطلاعات بیمار، تشخیص‌ها، درمان، آزمایش‌ها و یادداشت‌های بالینی است. چند جدول مهم این دیتاست عبارت‌اند از:

  1. PATIENTS: مشخصات جمعیت‌شناختی بیماران
  2. ADMISSIONS: اطلاعات مربوط به بستری
  3. ICUSTAYS: جزئیات مربوط به اقامت در ICU
  4. DIAGNOSES_ICD / PROCEDURES_ICD: تشخیص‌ها و اقدامات درمانی طبق کدهای ICD-9
  5. PRESCRIPTIONS: داروهای تجویز شده
  6. CHARTEVENTS / LABEVENTS: علائم حیاتی، آزمایش‌ها و ثبت‌های بالینی
  7. NOTEEVENTS: یادداشت‌های متنی پزشکان و پرستاران
  8. MICROBIOLOGYEVENTS: نتایج آزمایش‌های میکروبی

این ساختار، مجموعه‌ای جامع برای تحلیل‌های ساختاریافته و تحلیل‌های متنی فراهم می‌کند.


نحوه دسترسی

برای استفاده از این دیتاست، پژوهشگران باید:

  1. در وب‌سایت PhysioNet ثبت‌نام کنند.
  2. یک دوره آموزشی آنلاین در زمینه اخلاق پژوهش داده‌های سلامت بگذرانند (مانند دوره CITI Program).
  3. شرایط استفاده را بپذیرند و پس از بررسی مدارک، دسترسی به فایل‌های دیتاست برای ایشان فعال خواهد شد.


کاربردهای پژوهشی

داده‌های MIMIC-III در پروژه‌های گوناگونی مورد استفاده قرار گرفته‌اند:

تحلیل‌های بالینی:

  1. بررسی روند درمان بیماران
  2. مقایسه نتایج درمانی بر اساس متغیرهای دموگرافیک یا کلینیکی
  3. تحلیل سیر بیماری‌ها در ICU

علوم داده و یادگیری ماشین:

  1. پیش‌بینی مدت اقامت در ICU یا احتمال مرگ بیمار
  2. تحلیل سری‌های زمانی (مانند علائم حیاتی)
  3. استخراج مفاهیم پزشکی از یادداشت‌های متنی با استفاده از NLP


میزان استفاده در مقالات علمی

تحلیل ارجاعات علمی نشان می‌دهد که دیتاست MIMIC-III منبعی پرتکرار در پژوهش‌های علمی بوده است. تا پایان سال ۲۰۲۳ بیش از ۳۵۰۰ مقاله علمی به آن ارجاع داده‌اند. تخمین‌ها نشان می‌دهد در سال‌های ۲۰۲۴ و ۲۰۲۵ نیز به ترتیب حدود ۶۰۰ و ۷۰۰ مقاله جدید منتشر شده‌اند که از این پایگاه استفاده کرده‌اند.


مزایا و محدودیت‌ها

مزایا:

✅ داده‌های واقعی و عمیق از بیماران ICU

✅ رایگان بودن و در دسترس بودن عمومی

✅ وجود مستندات دقیق برای استفاده و تحلیل

✅ قابلیت استفاده در پروژه‌های آموزشی، دانشگاهی و پژوهشی

محدودیت‌ها:

⚠️ تمرکز فقط بر بیماران ICU

⚠️ استفاده از کدهای ICD-9 که در برخی کشورها منسوخ شده‌اند

⚠️ وجود داده‌های مفقود (Missing) که نیاز به پاک‌سازی دارند


نگاهی به آینده؛ MIMIC-IV

اگرچه MIMIC-III همچنان یکی از محبوب‌ترین منابع داده در حوزه ICU است، نسخه جدیدتر آن یعنی MIMIC-IV در سال‌های اخیر منتشر شده و ساختار به‌روزتر، دامنه وسیع‌تر و داده‌های تازه‌تری را پوشش می‌دهد. برای پژوهشگرانی که به دنبال تحلیل‌های مدرن‌تر هستند، آشنایی با نسخه چهارم نیز توصیه می‌شود.


منابع علمی بیشتر

مقاله مرجع

MIMIC-III, a freely accessible critical care database
Alistair E. W. Johnson et al.
Scientific Data (2016)
DOI: 10.1038/sdata.2016.35


سخن پایانی

دیتاست MIMIC-III فرصتی نادر برای تحلیل داده‌های بالینی واقعی و یادگیری در حوزه داده‌های سلامت فراهم می‌کند. اگر در مسیر تحقیق، آموزش یا توسعه مدل‌های هوشمند در پزشکی هستید، آشنایی با این پایگاه داده می‌تواند نقطه آغاز قدرتمندی برای شما باشد.

آشنایی با دیتاست MIMIC-III؛ یک منبع ارزشمند برای پژوهش‌های داده‌محور در سلامت



نظرات کاربران