نیویورک تایمز گزارش داده است که سرویس درآمد داخلی یکی از دقیق ترین انواع حسابرسی های خود را به جیمز بی کومی، مدیر سابق اف بی آی، و اندرو جی. مک کیب، معاون سابق او داده است.
این سؤالات کاملاً منطقی زیادی را برانگیخته است، که اکثر آنها انواعی از این موارد را دارند: شانس چیست؟ همانطور که مقاله اشاره کرد، احتمال اینکه دو دشمن سیاسی بلندپایه رئیس جمهور دونالد جی. ترامپ به طور تصادفی حسابرسی شوند بسیار ناچیز است.
اما کوچک صفر نیست.
اگر بخواهیم باور کنیم که این یک تصادف است، چقدر غیر محتمل است؟ در اینجا، ما سعی می کنیم تا آنجا که می توانیم این احتمال را به طور جدی تخمین بزنیم.
اول، حقایق: هر دو مرد برای ممیزی تحت برنامه تحقیقات ملی (NRP)، زیرمجموعه کوچکی از همه ممیزی هایی که IRS هر سال انجام می دهد، انتخاب شدند. این ممیزیها نمونهای از اظهارنامهها را برای جمعآوری دادههای مربوط به رعایت مالیات بررسی میکنند.
طبق گزارش IRS، حدود 5000 ممیزی از این دست در سال 2017، 4000 مورد در سال 2018 و 8000 مورد در سال 2019 وجود داشته است که از بین حدود 154 میلیون اظهارنامه مالیاتی فردی در هر سال انتخاب شده اند. آقای. حسابرسی کومی برای اظهارنامه مالیاتی 2017 او بود. آقای. مک کیب برای بازگشت او در سال 2019 بود.
بسیاری از جنبه های NRP محاسبات ما را پیچیده می کند، از جمله روش نمونه گیری حسابرسان IRS و سال های مختلف خود ممیزی ها. بعداً به این مسائل باز خواهیم گشت. در حال حاضر، فرض می کنیم همه مالیات دهندگان شانس برابری برای حسابرسی دارند و هر دو مرد در سال 2017 حسابرسی شده اند.
اگر این مشکل در یک کتاب درسی در مورد احتمال ظاهر شود، ممکن است به صورت زیر خوانده شود:
اگر 154 میلیون تیله (تعداد تقریبی اظهارنامه های مالیاتی که در هر سال ارائه می شود) در یک کوزه غول پیکر وجود داشته باشد و تعداد کمی از آنها قرمز باشد (کسانی که نماینده آقای کومی و آقای مک کیب در میان آنها هستند)، چه شانسی دارید که شما اگر به طور تصادفی چند هزار تیله قرمز از کوزه بکشید (تعداد ممیزی در آن سال) دو یا چند تیله قرمز می کشد؟
ممکن است پیچیده به نظر برسد، اما یک مسئله نسبتاً مطالعه شده است، چیزی که بسیاری از رشته های ریاضی یا آمار در دوره های دانشگاهی خود با آن مواجه می شوند. مردم قبلاً معادلاتی را برای تخمین این احتمالات با نام هایی مانند توزیع فوق هندسی که کاربردهایی مانند حسابرسی انتخابات و شمارش کارت دارد، استخراج کرده اند.
ما به سادگی می توانیم تخمین های خود را برای تعداد کل تیله ها، تعداد تیله های قرمز و تعداد قرعه کشی ها وارد کنیم و یک احتمال به دست می آوریم. اگر باور داشته باشیم که فقط دو تیله قرمز وجود دارد – یعنی اگر تمرین را به محدود کنیم فقط آقای. مک کیب و آقای کومی – این معادله احتمال تقریباً یک در 950 میلیون را به دست می دهد.
این شانس بسیار تندتر از شانس شما برای برنده شدن پاوربال است. همچنین یک نتیجه تقریباً بی معنی است. در بهترین حالت، این پاسخ درست به سوال اشتباه است.
برای درک اینکه چرا این امر مستلزم اذعان به یک پوچی ذاتی در تمرین ما است: برای بهترین برآورد احتمال وقوع یک رویداد غیرمحتمل، باید این واقعیت را کنار بگذاریم که می دانیم قبلاً اتفاق افتاده است. (احتمال این اتفاق 100 درصد است.)
جردن النبرگ، استاد دانشگاه ویسکانسین که کتاب هایی در مورد ریاضیات و استدلال نوشته است، آن را اینگونه توصیف کرد: “در برخی از جهان های خلاف واقع، احتمال اینکه این چیزی که قبلاً در جهان ما اتفاق افتاده است چقدر است؟”
ممکن است عجیب به نظر برسد، اما همین مسائل حتی در تمرینهای احتمالاتی به همان ابتداییتر کردن یک سکه مطرح میشوند.
اگر یک سکه را 20 بار ورق بزنید، دنباله خاص سر و دم شما فوق العاده نادر است، حدود یک در میلیون، اما این اتفاق افتاد. سوگند – دشنام مقداریدنباله ای از تلنگر همیشه اتفاق می افتد. این تصادفی شگفتانگیز است تنها در صورتی که این دنبالهای باشد که قبل از ورق زدن میخواهید انجام دهید.
به همین ترتیب، نادرست است که جستجوی خود را فقط به Mr. کومی و آقای. مک کیب، زیرا به احتمال زیاد اگر آن دو را یاد بگیریم، این احتمالات را بررسی خواهیم کرد دیگر به جای این دو نفر، دشمنان سیاسی قابل توجه یک دولت حسابرسی شدند.
سوال بهتر این است: احتمال دو یا چند نفر چقدر است پسندیدن آقای. کومی و آقای. مک کیب در این مدت حسابرسی می شود؟
آیا این گروه از افراد باید شامل هر دو مقام ارشد FBI باشد؟ آیا دو مقام ارشد وزارت دادگستری وجود دارد؟ این چارچوب بندی – یک تصمیم ذهنی به جای یک تصمیم واقعی – است که بیشتر هر گونه تخمین احتمالی را هدایت می کند، بیش از هر انتخاب توزیع آماری یا وزن نمونه.
در اینجا نموداری از احتمالی است که معادله ما در انتخابهای مختلف برای تعداد تیلههای قرمز به دست میآورد، از دو (آقای کومی و آقای مک کیب و هیچکس دیگر) تا 400 (تخمین محافظهکارانه از تعداد آمریکاییهای آقای ترامپ). از زمان شروع نامزدی خود برای ریاست جمهوری، در توییتر به نام توهین شده است).
این احتمال با انتخاب اینکه چه کسی باید در کنار Mr. کومی و آقای. مک کیب
نکته تصمیم گیری در مورد یک عدد نیست، بلکه درک این موضوع است که انتخاب اندازه گروه ما چیزی است که پاسخ ما را هدایت می کند. اگرچه برخی حدس ها مطمئناً بهتر از سایرین هستند، بسیاری از انتخاب ها قابل دفاع هستند.
پرداختن به جزئیات
اکنون بیایید سعی کنیم چیزی را تا حدی واقع بینانه تر محدود کنیم و به برخی از مواردی که در تفسیر ساده خود از این مشکل نادیده گرفته ایم بازگردیم.
اول اینکه این دو مرد در همان سال حسابرسی نشدند. با گسترش دامنه ما برای پوشش بازه سه ساله از 2017 تا 2019، احتمالات ما به طور قابل توجهی افزایش می یابد. این ساده است: اگر فردی شانس خاصی برای حسابرسی شدن در یک سال معین داشته باشد، سال های بیشتر به معنای فرصت های بیشتری برای حسابرسی است.
دوم، ما فقط به احتمال انتخاب حداقل دو نفر علاقه مندیم. ما این احتمال را در نظر نخواهیم گرفت که یک شخص دو بار انتخاب شود. به گفته آقای با توجه به اینکه ممیزی ها می تواند بیش از یک سال طول بکشد، بعید به نظر می رسد. حساب کومی توجه داشته باشید که ما به احتمال انتخاب حداقل دو نفر نگاه میکنیم، نه دقیقاً دو نفر، زیرا اگر سه یا چند نفر از یک گروه انتخاب شوند نیز بسیار مهم است.
در نهایت، IRS افراد را به صورت تصادفی انتخاب نمی کند. در عوض، آژانس تمایل دارد برخی از انواع مالیات دهندگان، از جمله افراد با درآمد بالا را بیشتر از سایرین انتخاب کند. برای سال مالیاتی 2001، نمونه NRP شامل بازده افرادی در حدود صدک 90 درآمد با حدود 1.7 برابر نرخی بود که انتظار می رفت بازدهی مستقل از درآمد انتخاب شود. این نرخ در بالاترین رتبههای درآمدی افزایش یافت، به طوری که احتمال حضور افراد با درآمد در 0.5 درصد بالا، بیش از 10 برابر بیشتر از افراد نزدیک به درآمد متوسط در نمونه بود.
احتمالاً می توانیم فرض کنیم که هر گروهی از آقای. درآمد دشمنان ترامپ بیشتر از یک نمونه تصادفی آمریکایی است. اما ما نمی توانیم به طور واقع بینانه درآمد کامل همه افراد گروه خود را در هر سال تخمین بزنیم. همچنین می دانیم که سازمان امور مالیاتی عوامل دیگری را در نمونه گیری خود در نظر گرفته است، مانند نوع اظهارنامه هایی که مالیات دهندگان ارائه می کنند و روش های نمونه گیری می تواند سال به سال تغییر کند. این امر ما را در راه راهنمایی برای نحوه مطابقت با روش های IRS باقی می گذارد. به این ترتیب، ما برآوردهای خود را بدون وزن میگذاریم. به عنوان یک تمرین پشت پاکت، اگر نگران این هستید که چگونه درآمد بر این نتایج تأثیر میگذارد، اگر فکر میکنید که اعضای یک گروه درآمد بسیار بالایی دارند، میتوانید احتمال حاصل را دو برابر کنید و اگر فکر میکنید آنها را در 10 ضرب کنید. فوق العاده ثروتمند هستند
قرار دادن همه آنها در کنار هم
با ترکیب این گزینه ها، جدول زیر برخی از احتمالات تخمین زده شده را بسته به اندازه گروه در نظر گرفته ارائه می دهد.
از طرف دیگر، اگر انتخاب های ما رضایت بخش نبود، ما یک ماشین حساب ساده برای شما ایجاد کردیم تا احتمالات خود را بسازید:
بنابراین کدام تخمین “درست” است؟
اکثر خروجی های واقع بینانه این معادله را می توان با دقت به عنوان “بسیار نادر” یا حتی “فوق العاده نادر” توصیف کرد، اما هیچ کدام دلیلی بر انجام اشتباه نیست.
اندرو گلمن، استاد آمار و علوم سیاسی در دانشگاه کلمبیا، هنگامی که به صورت چکیده در مورد این تمرین گفته شد، گفت: “این کمی شبیه نیروی مقاومت ناپذیر و جسم غیرقابل حرکت است.” “از یک طرف، شما می گویید این کاملا تصادفی است. از طرف دیگر، شما مشکوک هستید که اینطور نیست.”
آقای. گلمن، مانند هر آماردان دیگری که با تایمز در مورد این مشکل صحبت کرد، گفت که بزرگترین مانع هیچ یک از جزئیات نیست، بلکه تعریف خود سوال است.
زمانی که سعی می کنیم احتمال یک رویداد معین را محاسبه کنیم زیرا ما گمان می کنیم که ممکن است تصادفی نباشد، در نهایت در موقعیت پیچیده ای قرار می گیریم که سعی می کنیم تصور کنیم که چگونه احتمال وقوع رویداد را پیش بینی می کردیم. قبل ازدیوید اشپیگلهالتر گفت که این اتفاق افتاد. او رئیس مرکز ارتباط ریسک و شواهد وینتون در دانشگاه کمبریج است، سازمانی که به بهبود روش استفاده از شواهد کمی در جامعه اختصاص دارد.
او گفت که ریاضیات آسان است، اما فرمولبندی این سؤال دشوار است، و در حد “بی معنی” است، تا حد زیادی به این دلیل که تعیین گروه مورد علاقه ما چقدر سخت است.
“” شانس این اتفاق چقدر است؟ بیانیه ای آسان است.» “این یک جمله آشنا است. اما، در واقع، پاسخ به این سوال بسیار دشوار است.»
ریاضی محدودیت هایی دارد. نکته تلاش برای تخمین احتمالی مانند این، آقای. گلمن گفت، این نیست که مقدار زیادی در اعداد قرار دهید، بلکه اجازه دهید نتیجه شما را وادار کند تا بیشتر بدانید.
در این مورد، بهترین سوال، سوالی نیست که بتوان آن را در کتاب آمار جستجو کرد.
در عوض، آقای گلمن گفت، سوالی که باید مطرح کرد این است: “چه خبر است؟”
متیو کالن گزارش کمک کرد