طی گزارشی که اخیرا در رسانهها منتشر شده، بیشتر الگوریتمهای پزشکی مورد استفاده در آمریکا از اطلاعات افراد تحت درمان در ایالتهای ماساچوست ، کالیفرنیا یا نیویورک ساخته شده است. طبق تحقیق منتشر شده در این هفته در مجله انجمن پزشکی آمریکا، این سه ایالت بیشترین درصد استفاده در مقاصد پزشکی را سهیم هستند و 34 ایالت دیگر به هیچ وجه دادهای ندارند. ساخت الگوریتم های پزشکی از داده های سه ایالت موردی عجیب است که در سخت افزار مگ به دلایل آن میپردازیم.
الگوریتمهایی که محققان در حال بررسی آن بودند برای تصمیم گیری پزشکی براساس دادههای بیمار طراحی شدهاند. هنگامی که محققان الگوریتمی را طراحی میکنند، میخواهند تشخیص بیمار و علاج آن را آسانتر کنند (مانند بررسی رادیوگرافی قفسه سینه و تصمیم گیری در مورد علائم ذات الریه) آنها نمونههای واقعی بیماران مبتلا و با شرایط مناسب را برای مقاصد خود استفاده میکنند. این موضوع قبلا ثابت شده است که تنوع جنسیتی و نژادی در این پارامترهای آموزشی مهم است: اگر الگوریتمی برای اشعه ایکس مردان طراحی میشود، ممکن برای خانمها موثر نباشد.
آمیت کاوشال، نویسنده و محقق دانشگاه استنفورد به استات نیوز گفت: “همه این موارد با جدیت دنبال میشوند تا در نهایت مجموعه دادهها پخته شوند و به نتایجی مناسب تبدیل شوند.”
کاوشال و تیم او، دادههایی که در 56 الگوریتم مورد استفاده قرار گرفتهاند را بررسی کردند. این الگوریتمها برای استفاده در زمینههایی مانند پوست، رادیولوژی و قلب طراحی شدهاند. البته مشخص نیست که چه تعداد از آنها در کلینیکها و بیمارستانها استفاده میشوند. از 56 الگوریتم، 40 مورد از دادههای بیماران از ماساچوست، کالیفرنیا یا نیویورک استفاده کردهاند.
اگرچه مراکز ساحلی مانند نیویورک از لحاظ جمعیتی و مشکلات اساسی بهداشتی از ایالتهای جنوب یا غرب میانه متفاوت هستند اما محققان میدانند که الگوریتمهایی که تنها تحت یک مجموعه شرایط یکسان میکنند، قطعا به مشکل بر خواهند خورد.
بسیاری از مراکز تحقیقاتی دانشگاهی که تحقیقات هوش مصنوعی و یادگیری ماشین انجام میدهند در مراکز بهداشتی مانند ماساچوست، کالیفرنیا و نیویورک قرار دارند. دادههای مربوط به کالیفرنیا، محل سیلیکون ولی در حدود 40 درصد الگوریتمها گنجانده شده است. این موضوع میتواند دلیل محکمی برای استفاده الگوریتم های پزشکی از داده های سه ایالت باشد. دسترسی محققان به داده های مسساتی غیر از محل زندگیشان دشوار است. به همین دلیل است که دادهها به این روش دسته بندی شدهاند. گسترش دامنه دادهها ممکن است چالش برانگیز باشد، اما در صحیح کار کردن این الگوریتمها موثر است.
دیدگاهتان را بنویسید