<?xml version="1.0" encoding="UTF-8"?>
    <!DOCTYPE article PUBLIC "-//NLM/DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
    <!--<?xml-stylesheet type="text/xsl" href="article.xsl">-->
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.2" xml:lang="en">
	<front>
		<journal-meta>
			<journal-id journal-id-type="eissn">3034-1558</journal-id>
			<journal-title-group>
				<journal-title>Cifra. Информационные технологии и телекоммуникации</journal-title>
			</journal-title-group>
			<publisher>
				<publisher-name>ООО Цифра</publisher-name>
			</publisher>
		</journal-meta>
		<article-meta>
			<article-id pub-id-type="doi">10.60797/itech.2025.8.1</article-id>
			<article-categories>
				<subj-group>
					<subject>Brief communication</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Интеллектуальный анализ факторов, влияющих на статус заказа клиента</article-title>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author" corresp="yes">
					<contrib-id contrib-id-type="rinc">https://elibrary.ru/author_profile.asp?id=1271522</contrib-id>
					<name>
						<surname>Баранова</surname>
						<given-names>Анна Петровна</given-names>
					</name>
					<email>ann.brnv24@gmail.com</email>
					<xref ref-type="aff" rid="aff-2">2</xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-3785-0538</contrib-id>
					<contrib-id contrib-id-type="rinc">https://elibrary.ru/author_profile.asp?id=384580</contrib-id>
					<name>
						<surname>Миролюбова</surname>
						<given-names>Анастасия Александровна</given-names>
					</name>
					<email>mirolubowa@mail.ru</email>
					<xref ref-type="aff" rid="aff-1">1</xref>
				</contrib>
			</contrib-group>
			<aff id="aff-1">
				<label>1</label>
				<institution>Ивановский государственный химико-технологический университет</institution>
			</aff>
			<aff id="aff-2">
				<label>2</label>
				<institution>Ивановский государственный химико-технологический университет</institution>
			</aff>
			<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2025-10-14">
				<day>14</day>
				<month>10</month>
				<year>2025</year>
			</pub-date>
			<pub-date pub-type="collection">
				<year>2025</year>
			</pub-date>
			<volume>6</volume>
			<issue>8</issue>
			<fpage>1</fpage>
			<lpage>6</lpage>
			<history>
				<date date-type="received" iso-8601-date="2025-02-24">
					<day>24</day>
					<month>02</month>
					<year>2025</year>
				</date>
				<date date-type="accepted" iso-8601-date="2025-07-15">
					<day>15</day>
					<month>07</month>
					<year>2025</year>
				</date>
			</history>
			<permissions>
				<copyright-statement>Copyright: &amp;#x00A9; 2022 The Author(s)</copyright-statement>
				<copyright-year>2022</copyright-year>
				<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
					<license-p>
						This is an open-access article distributed under the terms of the Creative Commons Attribution 4.0 International License (CC-BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. See 
						<uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>
					</license-p>
					.
				</license>
			</permissions>
			<self-uri xlink:href="https://itech.cifra.science/archive/4-8-2025-october/10.60797/itech.2025.8.1"/>
			<abstract>
				<p>В данной работе проводится интеллектуальный анализ данных интернет-магазина техники с целью выявления ключевых факторов, оказывающих влияние на статус заказа клиента. Исследование включает анализ различных характеристик клиентов и их заказов, таких как пол, возраст, стоимость заказа, участие в программе лояльности и другие параметры. Для оценки взаимосвязей между этими характеристиками и статусом заказа проведен расчет коэффициентов корреляции, что позволило выявить наиболее значимые факторы, влияющие на процесс оформления и выполнения заказов. Результаты данного анализа могут быть использованы для оптимизации бизнес-процессов интернет-магазина, повышения эффективности логистики, улучшения прогнозирования спроса и минимизации рисков, связанных с отменой или задержкой заказов.</p>
			</abstract>
			<kwd-group>
				<kwd>интеллектуальный анализ данных</kwd>
				<kwd> статус заказа</kwd>
				<kwd> корреляция</kwd>
				<kwd> машинное обучение</kwd>
				<kwd> прогнозирование заказов</kwd>
			</kwd-group>
		</article-meta>
	</front>
	<body>
		<sec>
			<title>HTML-content</title>
			<p>1. Введение</p>
			<p>В условиях стремительного развития электронной коммерции и цифровизации бизнес-процессов особое значение приобретает задача эффективного управления заказами клиентов. Одним из ключевых аспектов в этой области является анализ факторов, влияющих на статус заказа, что позволяет оптимизировать бизнес-процессы, повысить удовлетворённость клиентов и снизить издержки. Современные методы интеллектуального анализа данных, в частности машинное обучение и глубокое обучение, предоставляют широкие возможности для решения подобных задач.</p>
			<p>Ранее для анализа факторов, влияющих на заказы, применялись преимущественно методы регрессионного анализа и традиционные статистические подходы. Однако современные исследования демонстрируют эффективность использования автоматизированных моделей машинного обучения, которые позволяют выявлять сложные нелинейные зависимости между переменными и обеспечивать более высокую точность прогнозирования.</p>
			<p>Целью данной работы является построение и обоснование моделей машинного обучения для анализа влияния различных факторов на статус заказа клиента, а также сравнение эффективности различных подходов. В работе особое внимание уделяется корректному выбору методов, этапам построения модели и интерпретации полученных результатов.</p>
			<p>2. Методы и принципы исследования</p>
			<p>Описание данных</p>
			<p>В исследовании использовался набор данных, содержащий информацию о заказах в интернет-магазине техники за 2023–2024 гг. Для каждого заказа были доступны следующие признаки:</p>
			<p>1. Пол клиента (мужской/женский).</p>
			<p>2. Возраст клиента.</p>
			<p>3. Участие в программе лояльности (да/нет).</p>
			<p>4. Способ оплаты (онлайн/наличными).</p>
			<p>5. Сумма заказа.</p>
			<p>6. Количество товаров в заказе.</p>
			<p>7. География доставки (город/регион).</p>
			<p>8. Статус заказа (успешно выполнен/отменён/возвращён).</p>
			<p>Постановка задачи</p>
			<p>Задача формулируется как задача классификации: на основе имеющихся признаков необходимо предсказать статус заказа. Статус заказа рассматривается как целевая переменная с тремя классами.</p>
			<p>Предварительная обработка данных</p>
			<p>Пропущенные значения обработаны методом медианного заполнения.</p>
			<p>Категориальные признаки преобразованы методом однократного кодирования.</p>
			<p>Данные разделены на обучающую (70%) и тестовую (30%) выборки.</p>
			<p>Выбор и обоснование методов</p>
			<p>Для решения задачи классификации были выбраны следующие модели:</p>
			<p>Логистическая регрессия — это метод классификации, который использует логистическую функцию для прогнозирования вероятности принадлежности наблюдения к определённому классу </p>
			<p>[5, С. 77]</p>
			<p>Случайный лес — ансамблевый метаалгоритм, предназначенный для улучшения стабильности и точности алгоритмов машинного обучения, используемых в задачах классификации и регрессии </p>
			<p>[3]</p>
			<p>Градиентный бустинг — современный ансамблевый алгоритм, который широко применяется для задач классификации и регрессии, поскольку обеспечивает высокую точность, устойчивость к переобучению и хорошую работу с данными, содержащими сложные зависимости </p>
			<p>[1, С. 264]</p>
			<p>K-ближайших соседей — выбран для сравнения, так как часто используется для задач классификации с небольшим количеством признаков.</p>
			<p>Глубокая нейронная сеть — использовалась для оценки возможности выявления сложных нелинейных зависимостей.</p>
			<p>Выбор моделей обусловлен необходимостью сравнения как простых, так и сложных алгоритмов, их интерпретируемости, устойчивости к переобучению и способности работать с разными типами данных.</p>
			<p>Оценка качества моделей</p>
			<p>Для оценки качества моделей использовались следующие метрики:</p>
			<p>1. Accuracy (точность).</p>
			<p>2. Оценка F1 для каждого класса.</p>
			<p>3. Матрица ошибок (матрица смешения).</p>
			<p>4. ROC-AUC (для бинарных классификаций).</p>
			<p>Для предотвращения переобучения использовалась кросс-валидация (5-кратная).</p>
			<p>3. Основные результаты</p>
			<p>Корреляционный анализ</p>
			<p>В ходе исследования был проведён комплексный анализ факторов, влияющих на статус заказа клиента интернет-магазина техники. На первом этапе выполнен корреляционный анализ с использованием коэффициента Крамера, который показал, что наиболее существенные связи наблюдаются между статусом заказа и такими признаками, как участие в программе лояльности (0,32), способ оплаты (0,28) и сумма заказа (0,27). Согласно шкале Чеддока, эти значения соответствуют слабой или умеренной связи </p>
			<p>[4]</p>
			<p>Сравнение моделей</p>
			<p>Для более глубокого анализа были построены и сравнены различные модели машинного обучения: логистическая регрессия, случайный лес, градиентный бустинг, метод k-ближайших соседей и глубокое обучение. Сравнение проводилось по метрикам точности (accuracy) и F1-оценки для каждого класса (успешно выполнен, отменён, возвращён).</p>
			<table-wrap id="T1">
				<label>Table 1</label>
				<caption>
					<p>Сравнение эффективности моделей машинного обучения для классификации статуса заказа</p>
				</caption>
				<table>
					<tr>
						<td>Модель</td>
						<td>Точность</td>
						<td>Оценка F1 (успешно)</td>
						<td>Оценка F1 (отмена)</td>
						<td>Оценка F1 (возврат)</td>
						<td>Примечания</td>
					</tr>
					<tr>
						<td>Логистическая регрессия</td>
						<td>0,71</td>
						<td>0,78</td>
						<td>0,65</td>
						<td>0,60</td>
						<td>Хорошая интерпретируемость, базовый уровень</td>
					</tr>
					<tr>
						<td>Случайный лес</td>
						<td>0,77</td>
						<td>0,82</td>
						<td>0,71</td>
						<td>0,68</td>
						<td>Высокая устойчивость к переобучению</td>
					</tr>
					<tr>
						<td>Градиентный бустинг</td>
						<td>0,79</td>
						<td>0,84</td>
						<td>0,74</td>
						<td>0,70</td>
						<td>Лучшая точность, хорошо работает с данными</td>
					</tr>
					<tr>
						<td>K-ближайших соседей</td>
						<td>0,69</td>
						<td>0,76</td>
						<td>0,62</td>
						<td>0,58</td>
						<td>Чувствителен к масштабу признаков</td>
					</tr>
					<tr>
						<td>Глубокое обучение</td>
						<td>0,78</td>
						<td>0,83</td>
						<td>0,72</td>
						<td>0,69</td>
						<td>Требует больше данных и вычислений</td>
					</tr>
				</table>
			</table-wrap>
			<p>Лучшие результаты продемонстрировал градиентный бустинг с общей точностью 0,79 и наивысшими F1-оценками по всем классам, что объясняется его способностью выявлять сложные нелинейные зависимости и устойчивостью к переобучению. Глубокое обучение показало сопоставимые результаты (точность 0,78), однако требует большего объёма данных и вычислительных ресурсов. Модели случайного леса и логистической регрессии также показали достойные результаты, но уступили по точности ансамблевым методам.</p>
			<p>Важность признаков</p>
			<p>Анализ важности признаков (по модели случайного леса и градиентного бустинга) показал, что наибольшее влияние на статус заказа оказывают:</p>
			<p>1. Сумма заказа.</p>
			<p>2. Участие в программе лояльности.</p>
			<p>3. Способ оплаты.</p>
			<p>4. География доставки.</p>
			<p>4. Обсуждение</p>
			<p>Полученные результаты исследования подтверждают, что для анализа факторов, влияющих на статус заказа клиента, целесообразно использовать современные ансамблевые методы машинного обучения и глубокое обучение, поскольку они способны выявлять значимые закономерности и тенденции </p>
			<p>[2]</p>
			<p>Выбор моделей обусловлен их способностью работать с разнородными и частично коррелированными признаками, а также устойчивостью к переобучению, что особенно важно при наличии большого количества параметров и ограниченного объёма данных. Кросс-валидация позволила объективно оценить качество моделей и снизить риск переобучения.</p>
			<p>Важно отметить, что коэффициенты корреляции показали лишь слабую или умеренную связь между отдельными признаками и статусом заказа, что свидетельствует о необходимости комплексного подхода к анализу, включающего построение сложных моделей и анализ их интерпретируемости. Кроме того, выявленные значимые факторы (сумма заказа, программа лояльности, способ оплаты, география) могут быть использованы для разработки персонализированных стратегий взаимодействия с клиентами и оптимизации бизнес-процессов.</p>
			<p>5. Заключение</p>
			<p>В работе проведён всесторонний интеллектуальный анализ факторов, влияющих на статус заказа клиента в интернет-магазине техники. Использование ансамблевых методов машинного обучения и глубоких нейронных сетей позволило достичь наилучших результатов в задаче классификации статуса заказа, что подтверждается высокими значениями точности и F1-оценки.</p>
			<p>Наиболее значимыми факторами, влияющими на статус заказа, были определены сумма заказа, участие в программе лояльности, способ оплаты и география доставки. Полученные результаты могут быть практически применены для повышения эффективности логистики, оптимизации бизнес-процессов, улучшения прогнозирования спроса и минимизации рисков отмены или возврата заказов. Кроме того, они создают основу для дальнейших исследований и внедрения персонализированных сервисов в электронной коммерции.</p>
		</sec>
		<sec sec-type="supplementary-material">
			<title>Additional File</title>
			<p>The additional file for this article can be found as follows:</p>
			<supplementary-material xmlns:xlink="http://www.w3.org/1999/xlink" id="S1" xlink:href="https://doi.org/10.5334/cpsy.78.s1">
				<!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://itech.cifra.science/media/articles/18500.docx">18500.docx</inline-supplementary-material>]-->
				<!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://itech.cifra.science/media/articles/18500.pdf">18500.pdf</inline-supplementary-material>]-->
				<label>Online Supplementary Material</label>
				<caption>
					<p>
						Further description of analytic pipeline and patient demographic information. DOI:
						<italic>
							<uri>https://doi.org/10.60797/itech.2025.8.1</uri>
						</italic>
					</p>
				</caption>
			</supplementary-material>
		</sec>
	</body>
	<back>
		<ack>
			<title>Acknowledgements</title>
			<p/>
		</ack>
		<sec>
			<title>Competing Interests</title>
			<p/>
		</sec>
		<ref-list>
			<ref id="B1">
				<label>1</label>
				<mixed-citation publication-type="confproc">Арланова А.А. Интеллектуальный анализ данных: виды и методы / А.А. Арланова, А.М. Нобатов // Вестник науки. — 2023. — Т. 2. — № 1 (58). — С. 7–10. — URL: https://cyberleninka.ru/article/n/intellektualnyy-analiz-dannyh-vidy-i-metody (дата обращения: 15.02.25).</mixed-citation>
			</ref>
			<ref id="B2">
				<label>2</label>
				<mixed-citation publication-type="confproc">Лыгина Н.И. Разработка информационной системы принятия решения интернет-магазина на основе ситуационного анализа / Н.И. Лыгина, Т.Н. Окшин // Молодой ученый. — 2020. — № 21 (311). —  С. 56–63. — URL: https://moluch.ru/archive/311/70586/ (дата обращения: 13.02.25).</mixed-citation>
			</ref>
			<ref id="B3">
				<label>3</label>
				<mixed-citation publication-type="confproc">Мищенко А.А. Обзор прикладных решений в области анализа данных на примере ювелирной отрасли / А.А. Мищенко, Т.Е. Тимашкова // Российская наука, инновации, образование (РОСНИО-II-2023) : cборник научных статей по материалам II Всероссийской (национальной) научной конференции с международным участием. — 2023. — С. 8–23. — DOI: 10.47813/rosnio-II.2023.8.8-23. — EDN DJNKEU.</mixed-citation>
			</ref>
			<ref id="B4">
				<label>4</label>
				<mixed-citation publication-type="confproc">Тесленко И.Б. Big Data = Большие данные : учебное пособие / И.Б. Тесленко, С.А. Кузнецов, Н.Н. Ползунова [и др.]. — Владимир : Издательство ВлГУ, 2021. — 123 с.</mixed-citation>
			</ref>
			<ref id="B5">
				<label>5</label>
				<mixed-citation publication-type="confproc">Трегуб А.В. Методика построения модели ARIMA для прогнозирования динамики временных рядов / А.В. Трегуб, И.В. Трегуб // Лесной вестник. — 2011. — № 5. — С. 179–183. — URL: https://cyberleninka.ru/article/n/metodika-postroeniya-modeli-arima-dlya-prognozirovaniya-dinamiki-vremennyh-ryadov (дата обращения: 15.02.25).</mixed-citation>
			</ref>
		</ref-list>
	</back>
	<fundings/>
</article>