СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРИМЕНЕНИЯ РЕШАЮЩИХ ДЕРЕВЬЕВ И РЕГРЕССИИ LASSO
- Авторы: Леонов В.Ю.1, Норокеску М.М.1
-
Учреждения:
- ФИЦ ИУ РАН
- Выпуск: № 5 (2025)
- Страницы: 86-95
- Раздел: КОМПЬЮТЕРНЫЕ МЕТОДЫ
- URL: https://medjrf.com/0002-3388/article/view/693826
- DOI: https://doi.org/10.31857/S0002338825050072
- ID: 693826
Цитировать
Полный текст



Аннотация
Рассматривается вопрос сравнения двух способов анализа взаимосвязей между наборами натуральных чисел, упорядоченных по возрастанию: решающих деревьев и регрессии Lasso. Проводится сравнительный анализ положительных и отрицательных сторон применения обоих способов. Оценивается простота вычислений, наглядность полученной модели и ее информативность. В завершение даны рекомендации по выбору способа анализа корреляций между наборами натуральных чисел.
Об авторах
В. Ю. Леонов
ФИЦ ИУ РАН
Автор, ответственный за переписку.
Email: m.nor@ro.ru
Москва, Россия
М. М. Норокеску
ФИЦ ИУ РАН
Email: m.nor@ro.ru
Москва, Россия
Список литературы
- Задачи и технологии анализа данных [электронный ресурс] // Задачи и технологии анализа данных АНАЛИТИКА ПЛЮС. Режим доступа: https://analytikaplus.ru/zadachi-i-tehnologii-analiza-dannyh/ (дата обращения: 17.12.2024).
- Саадалов Т.Ы., Мырзаибраимов Р.М., Абдуллаева Ж.Д. Методика расчета коэффициента корреляции фехнера и пирсона, и их области применения // Бюллетень науки и практики. 2021. №10. URL: https://cyberleninka.ru/article/n/metodika-rascheta-koeffitsienta-korrelyatsii-fehnera-i-pirsona-i-ih-oblasti-primeneniya (дата обращения: 03.12.2024).
- Кузовлев В.И., Орлов А.О. Метод выявления аномалий в исходных данных при построении прогнозной модели решающего дерева в системах поддержки принятия решений // Машиностроение и компьютерные технологии. 2012. №09. URL: https://cyberleninka.ru/article/n/metod-vyyavleniya-anomaliy-v-ishodnyh-dannyh-pri-postroenii-prognoznoy-modeli-reshayuschego-dereva-v-sistemah-podderzhki-prinyatiya (дата обращения: 03.12.2024).
- Чернавин П.Ф., Чернавин Н.П., Чернавин Ф.П. Управление качеством моделей регрессии на основе задач математического программирования // Автоматизация и моделирование в проектировании и управлении. 2023. №2 (20). URL: https://cyberleninka.ru/article/n/upravlenie-kachestvom-modeley-regressii-na-osnove-zadach-matematicheskogo-programmirovaniya (дата обращения: 03.12.2024).
- Евдокимов И.А., Солодовников В.И., Филипков С.В. Использование деревьев решений для интеллектуального анализа данных и извлечения правил из нейронных сетей // Новые информационные технологии в автоматизированных системах. 2012. №15. URL: https://cyberleninka.ru/article/n/ispolzovanie-dereviev-resheniy-dlya-intellektualnogo-analiza-dannyh-i-izvlecheniya-pravil-iz-neyronnyh-setey (дата обращения: 03.12.2024).
- Абрамов Р. Что такое дерево решений и где его используют? [электронный ресурс] // Habr. Режим доступа: https://habr.com/ru/users/Productstar/ (дата обращения: 17.04.2024).
- Использование деревьев решений в задачах прогнозной аналитики [электронный ресурс] // Компания “Форсайт”. Режим доступа: https://www.fsight.ru/blog/ispolzovanie-derevev-reshenij-v-zadachah-prognoznoj-analitiki/ (дата обращения: 17.04.2024).
- Толмачев А., Классен Н. Для чего начинающим аналитикам нужны деревья решений [электронный ресурс] // Дерево решений: что это, в чем суть, виды, преимущества метода - структура деревьев, этапы построения. Режим доступа: https://practicum.yandex.ru/blog/chto-takoe-derevo-reshenii-kak-ego-postroit/ (дата обращения: 17.04.2024).
- Пшеничнов А. 5 алгоритмов регрессии в машинном обучении, о которых вам следует знать [электронный ресурс] // Habr. Режим доступа: https://habr.com/ru/companies/vk/articles/513842/ (дата обращения: 17.04.2024).
- What is lasso regression? [электронный ресурс] // IBM. Режим доступа: https://www.ibm.com/think/topics/lasso-regression (дата обращения: 17.04.2024).
- Ивин Е.А., Артамонов Н.В., Курбацкий А.Н. Методическое пособие по эконометрике: для социально-экономических специальностей. Вологда: ИСЭРТ РАН, 2016. 184 с.
- Кремер Н.Ш., Путко Б.А. Эконометрика: учебник для студентов вузов. 3-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА, 2010. 328 с.
- Кремер Н.Ш., Путко Б.А. Эконометрика. М.: Юнити-Дана, 2003–2004. 311 с.
- Синицин Ф., Соколов Е. Линейные модели от линейной до логистической регрессии. Регуляризация, работа с категориальными признаками, многоклассовая классификация [электронный ресурс] // Учебник по машинному обучению. Режим доступа: https://education.yandex.ru/handbook/ml/article/linear-models (дата обращения: 10.05.2025).
- Jamal I. Daoud. Multicollinearity and Regression Analysis // 4th Intern. Conf. on Mathematical Applications in Engineering 2017 (ICMAE’17, International Islamic University Malaysia, Kuala Lumpur, Malaysia. Bristol: “IOPscience”, 2017. 227 p.
- Hastie T. The Elements of Statistical Learning: Data Mining, Inference, and Prediction: 2nd ed. Springer, 2017. 764 p.
- Жукова А.А., Минец М.Л. Биометрия: пособие. В 3 ч. Ч. 3. Корреляция и регрессия. Минск: БГУ, 2021. 103 с.
- Kotsiantis S.B., Kanellopoulos D., Pintelas P.E. Decision Trees: A Recent Overview. WSEAS Transactions on Computers. 2022. V. 21. P. 123–134.
- Zhang Y., Wang X., Li J. Ensemble Learning Methods: A Survey and Recent Advances. Information Fusion. 2023. V. 82. P. 10–28.
- Breiman L., Friedman J.H., Olshen R.A., Stone C.J. Classification and Regression Trees. Boca Raton: CRC Press, 2017. 368 p.
- Lin Y., Hu R., Karypis G. Generalized and Scalable Optimal Sparse Decision Trees Proc. 26th ACM SIGKDD Intern. Conf. on Knowledge Discovery & Data Mining. Toronto: KDD, 2020. P. 428–438.
- Mohri M., Rostamizadeh F., Talwalkar F. Foundations of Machine Learning. 2nd ed. Cambrige: MIT Press, 2018. 640 p.
- Shalev-Shwartz S., Ben-David S. Understanding Machine Learning: From Theory to Algorithms. N. Y.: Cambridge University Press, 2014. 449 p.
- James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning with Applications in R. 2nd ed. N. Y.: Springer, 2024. 500 p.
- Hastie T., Tibshirani R., Wainwright M. Statistical Learning with Sparsity: The Lasso and Generalizations. 2nd ed. N. Y.: Chapman and Hall/CRC, 2024. 400 p.
- Friedman J., Hastie T., Tibshirani R. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 3rd ed. N. Y.: Springer, 2024. 800 p.
Дополнительные файлы
