Экономический вестник ДонГТУ

Статья

Наименование Методы снижения размерности для анализа экономических данных
Авторы Лепило Н. Н., к. т. н., доц.
Катан К. С., асс.
Раздел Математические, статистические и инструментальные методы в экономике
Год 2026 Выпуск 24 Страницы 49 - 58
УДК 330.46 EDN TIULIP
Аннотация В статье рассмотрены и проанализированы современные методы снижения размерности, особенности их использования для анализа данных. В качестве примера реализации методов на языке Python использован известный набор данных, содержащий информацию о клиентах банка и параметрах проводимой с ними маркетинговой кампании. Разработаны рекомендации по использованию методов в сфере анализа экономических данных.
Реферат Цель. Анализ современных методов снижения размерности и разработка рекомендаций по их применению в сфере анализа экономических данных.
Методика. Методический подход к разработке рекомендаций по применению методов снижения размерности в сфере анализа экономических данных включает следующие основные этапы: рассмотреть и проанализировать существующие методы снижения размерности; рассмотреть реализацию этих методов с помощью современных программных продуктов; разработать рекомендации по использованию рассмотренных методов в сфере анализа экономических данных.
Научная новизна. Получили дальнейшее развитие вопросы использования современных методов снижения размерности при анализе экономических данных, включающие анализ существующих методов снижения размерности; реализацию этих методов с помощью специализированных библиотек языка Python; разработку рекомендаций по использованию линейных и нелинейных методов в сфере анализа экономических данных.
Практическая значимость. Использование предложенных рекомендаций по применению методов снижения размерности позволит упростить анализ и визуализацию сложных данных. Это особенно актуально в условиях, когда исследователи сталкиваются с большими объёмами информации, содержащими множество переменных.
Ключевые слова снижение размерности, анализ данных, набор данных, сингулярное разложение, независимые компоненты, многомерное масштабирование.
Финансирование
Благодарности
Список источников
1. Городнова Н. В. Развитие цифровой экономики: теория и практика // Вопросы инновационной экономики. 2021. Т. 11. № 3. С. 911–928. DOI: 10.18334/vinec.11.3.112227 EDN RBVHJM
2. Дмитриев А. П., Лейба С. Ш. Стремительный рост цифровых данных: анализ мировых трендов и прогноз развития в России // Региональная и отраслевая экономика. 2024. № 1. С. 141–152. DOI: 10.47576/2949-1916.2024.1.1.019 EDN PCNILO
3. Miller G. A. The magical number seven, plus or minus two: Some limits on our capacity for processing information // Psychological Review. 1956. Vol. 63 (2). P. 81–97. URL: https://colab.ws/articles/10.1037%2Fh0043158. DOI: 10.1037/h0043158
4. Bachmann J. M. Bank Marketing Dataset [Electronic resource]: Kaggle: [website]. [2026]. URL: https://www.kaggle.com/datasets/janiobachmann/bank-marketing-dataset?resource=download&select=bank.csv.
5. Shlens J. A. Tutorial on Principal Component Analysis // arXiv preprint. 2014. arXiv:1404.1100v1. 12 р.
6. Van der Maaten L., Hinton G. Visualizing Data using t-SNE // Journal of Machine Learning Research. 2008. № 9. P. 2579–2605.
7. Hyvärinen A., Oja E. Independent component analysis: algorithms and applications // Neural Networks. 2000. Vol. 13. № 4–5. P. 411–430. EDN AHTWPL
8. McInnes L., Healy J., Melville J. UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction // Journal of Open Source Software. 2018. Vol. 3. № 29. P. 861. DOI: 10.21105/joss.00861
9. Adams H., Blumstein M., Kassab L. Multidimensional scaling on infinite metric measure spaces // arXiv preprint. 2019. arXiv:1907.01379v1. 13 p.
10. Kruskal J. B. Nonmetric multidimensional scaling: a numerical method // Psychometrika. 1964. Vol. 29. № 2. P. 115–129. DOI: 10.1007/bf02289694 EDN GVZKRU
Полный текст