CART (Classification and Regression Tree)

درخت تصمیم طبقهبندی و رگرسیون
الگوریتم CART (Classification and Regression Tree) یکی از الگوریتمهای مدلسازی درخت تصمیم است که میتواند برای مسائل طبقهبندی و رگرسیون به کار رود. این الگوریتم دادهها را بر اساس شرایط تصمیم (متغیرها) تقسیم میکند و نموداری شبیه درخت ایجاد میکند؛
هر گره (node) آن نشاندهنده یک معیار تصمیمگیری و شاخهها نشاندهنده نتایج ممکن آن معیار است. در انتهای شاخهها (گرههای برگ) مقدار پیشبینی (برچسب کلاس یا مقدار عددی) قرار میگیرد.به این ترتیب، درخت ایجادشده همه نتایج ممکن را از شرایط اولیه نمایش میدهد و میتوان از آن برای طبقهبندی دادههای جدید یا پیشبینی استفاده کرد.
فرض کنید بخواهیم مشتریان را بر اساس درآمد و سن به دو گروه مشتریان پرمصرف یا کممصرف تقسیم کنیم. الگوریتم CART ابتدا یک معیار مثل درآمد > 50 میلیون تومان را بررسی میکند و نمونهها را به دو شاخه تقسیم میکند، سپس در هر شاخه شرط بعدی (مثلاً سن) را بررسی میکند و به این صورت تا رسیدن به برچسب نهایی (پر مصرف یا کممصرف) پیش میرود.