دادهها هم گویای همه واقعیت نیستند
قسمت پنجاه و پنجم

اما در آن روزها اعداد معنیشان را از دست داده بودند. در یکی از یکشنبههای اواسط ماه مارس ۲۰۲۰ تعداد مبتلایان جدید برای اولین بار کاهش پیدا کرد و همین مساله خیلیها را نسبت به فروکش کردن این بیماری امیدوار کرد و بعضی دولتها صحبت از شروع پایان کووید- ۱۹ به میان آوردند.
اما این اعداد کاهشی سرابی بیش نبودند، چرا که خیلی زود تعداد مبتلایان رو به افزایش رفت و مشخص شد که علت کاهش آمار مبتلایان در آن یکشنبه این بوده که آمار و ارقام مربوط به مبتلایان آخر هفته به خاطر تعطیلات گزارش نشده بود و آمار واقعی روز یکشنبه دو روز بعد اعلام شد که عدد بسیار بالایی بود. علت اصلی مشکل این بود که مقامهای بهداشتی به صورت روزانه اقدام به جمعآوری آمار و ارقام مبتلایان آن روز میکردند و به این دلیل که در تعطیلات آخر هفته بسیاری از کارکنان در محل کارشان حضور نداشتند، امکان تجمیع و اعلام تمام آمار مبتلایان آن روز فراهم نبود.
در اینجا ممکن است از خود بپرسید که پس دادههای بزرگ به چه دردی میخورند و چرا این قدر مورد توجه قرار گرفتهاند؟ در پاسخ به این سوال باید گفت دادههای بزرگ فقط زمانی به کار میآیند که اولا ما دادههای معتبری در اختیار داشته باشیم و تئوریهای خوبی هم برای هدایت تحقیقات به مسیر درست وجود داشته باشد و دوم و مهمتر اینکه شرایط و موقعیتها هم ثابت و بدون تغییر باشند و خبری از دگرگونی و نوسان و ابهام نباشد.
پایش مبتنی بر پیشبینی با استفاده از دادههای بزرگ
پایش مبتنی بر پیشبینی، از بسیاری جهات یک نوآوری فوقالعاده و جادویی محسوب میشود، بهطوریکه مجله تایم در سال ۲۰۱۱ پایش مبتنی بر پیشبینی را به عنوان یکی از ۵۰ اختراع سال معرفی کرد. این نوع پایش و کنترل پلیسی بر مبنای تکنولوژی دادههای بزرگ کار میکند. طراحان آن مدعی هستند که الگوریتمهای قدرتمندی را به وجود آوردهاند که میتوانند محل و زمان وقوع جرائم در آینده را پیشبینی کنند و افرادی را که احتمال ارتکاب جرمشان بالاست شناسایی کرده و آنها را تحتنظر بگیرند. اگر این ادعا درست باشد دیگر نیازی به این نیست که نیروهای پلیس در خیابانها پرسه بزنند تا در صورت وقوع جرم وارد عمل شوند، بلکه کافی است در پاسگاه پلیس بنشینند و بررسی کنند که برنامه پایش و کنترل مبتنی بر پیشبینی چه میگوید. در سال ۲۰۱۲ ادارات پلیس در شهرهای شیکاگو و لس آنجلس شروع به استفاده گسترده از این برنامه کردند و در نتیجه یک بانک اطلاعاتی بزرگ حاوی اطلاعات مربوط به بیش از ۴۰۰ هزار نفر که احتمال ارتکاب جرمشان از طرف نرمافزار پایش مبتنی بر پیشبینی، بالا یا بسیار بالا ارزیابی شده بود تهیه شد. اما بعد از چند سال مشخص شد که بخش زیادی از پیشبینیهای ارائه شده توسط این نرمافزار اشتباه از آب درآمده و در عمل این نرمافزار قادر به پیشبینی زمان و مکان ارتکاب جرائم نبود. علاوه بر این، مشخص شد که این نرمافزار دارای سوگیری زیادی است، به طوری که ۸۹درصد کسانی که از طرف این نرمافزار به عنوان افراد دارای احتمال بالای ارتکاب جرم و جنایت معرفی شده بودند، افراد رنگین پوست بودند و به خاطر افشای همین مشکلات و نواقص بود که استفاده از نرمافزار پایش مبتنی بر پیشبینی در سال ۲۰۱۹ متوقف شد.
حال سوال اینجاست که چرا برنامه پایش مبتنی بر پیشبینی ناکام ماند و نتوانست آنچنان که باید و شاید به کار آید؟ بعضیها پاسخ این سوال را به محدود بودن دادههای مورد استفاده برای پیشبینیهای انجام شده توسط این برنامه نسبت میدادند و معتقد بودند که با افزودن به حجم دادههای مورد استفاده نرمافزار پایش مبتنی بر پیشبینی میتوان بر دقت و درستی پیشبینیهای آن افزود. اما واقعیت این است که مشکل و مانع اصلی پیش روی این نرمافزار، وجود ابهام و نامعلوم بودن رفتارهای مجرمانه انسان بود، بهطوریکه مشخص شد فقط با استناد به رفتارهای گذشته افراد و پروندههای قبلی نمیتوان رفتارها و پروندههای آینده را پیشبینی کرد. علاوه بر این، احتمال آلوده شدن و جهتدار شدن اطلاعات و دادهها بهواسطه وجود سوگیریهای نژادی و قومیتی و مذهبی نیز وجود دارد.
یکی از گزینههای جایگزینی برنامههایی مانند پایش مبتنی بر پیشبینی که با الگوریتمهای پیچیدهای کار میکنند که در برابر ابهامات دچار درماندگی میشوند، هوش مصنوعی روانشناسانه است. هوش مصنوعی روانشناسانه از الگوریتمهای سادهتر اما کاربردیتری بهره میبرد و میکوشد تا با بهرهگیری از دادههای بزرگ به شکلی شفاف و با جامعنگری بیشتر به کمک پلیس بیاید؛ هر چند که شائبههایی مانند وجود سوگیری و تبعیضهای نژادی و جنسیتی در مورد هوش مصنوعی روانشناسانه نیز وجود دارد.
منبع: کتاب The age of AI: and our human future