Preview

Социология власти

Расширенный поиск

К прогнозированию вероятности невооруженной революционной дестабилизации методами машинного обучения

EDN: IBNXWP

Содержание

Перейти к:

Аннотация

В своей статье авторы предлагают систематический обзор основных способов применения методов машинного обучения, релевантного для политической социологии. Описывается история перехода от использования простых регрессионных моделей к комплексным моделям машинного обучения. Анализируются причины и преимущества такого перехода. Определяются основные способы использования моделей машинного обучения, которыми пользуются в смежных дисциплинах, и приводятся способы их применения к задачам предсказания революционных событий. Рассматривается когорта других исследователей, которые по-своему решали вопрос предсказания политической нестабильности от использования множества регрессионных моделей до применения машинного обучения как классификатора для твитов во время «арабской весны». Приводится расширенное описание основных направлений в области изучения поведения предикторов в моделях машинного обучения. Анализируются кейсы их применения и ограничения, с которыми могут столкнуться исследователи. Авторы приводят описание различных статистических подходов к задаче оценки параметров моделей машинного обучения. На примере анализа моделей, построенных для предсказания вероятности возникновения невооруженных революционных эпизодов, рассматриваются способы ранжирования параметров модели через оценку решающих деревьев и изменения в результирующей силе моделей. Авторы показывают, как коррелированные переменные могут влиять на полученный результат ранжирования, почему переменные могут при разных системах подсчета их важности оказываться в различных частях рейтинга. Также рассматривается способ определения границы, после которой параметры модели можно рассматривать как статистически значимые. Авторами проводится способ генерализованного представления направления связи различных переменных, с учетом их взаимодействия с другими предикторами, и дается интерпретация полученных результатов с использованием векторов Шепли. Из содержательных результатов проведенных тестов особо следует отметить выявление исключительно мощного эффекта революционных волн в революционных событиях XXI века, притом что в XXI веке эффект глобальных революционных волн оказывается сильнее эффекта волн региональных. Проведенные тесты заставляют предполагать, что особо сильными факторами, значимо повышающими в XXI веке вероятность начала невооруженных революционных выступлений (кроме эффекта революционных волн), являются следующие: высокий уровень политической коррупции, эффект инерции (невооруженные революционные или мощные протестные события в недавнем прошлом), аномалии экономического роста, высокие объемы помощи со стороны США (эффект «железной клетки либерализма» по Д. Риттеру), отсутствие нефтяной ренты, высокая численность населения, высокая продовольственная инфляция, средний уровень экономического развития, продолжительное пребывание первого лица у власти и промежуточный тип политического режима.

Для цитирования:


Медведев И.А., Коротаев А.В. К прогнозированию вероятности невооруженной революционной дестабилизации методами машинного обучения. Социология власти. 2025;37(2):108-141. EDN: IBNXWP

For citation:


Medvedev I.A., Korotayev A.V. Towards Forecastingting the Probability of Unarmed Revolutionary Destabilization Using Machine Learning Methods. Sociology of Power. 2025;37(2):108-141. (In Russ.) EDN: IBNXWP

Введение

В современном мире политические процессы становятся все более сложными и динамичными, требующими новых подходов к их анализу и прогнозированию. Одним из таких подходов является использование методов машинного обучения, которые позволяют обрабатывать большие объемы данных и выявлять скрытые закономерности. Однако для того, чтобы модели машинного обучения были эффективными, необходимо правильно оценить их параметры.

За последние 30 лет задача предсказания нестабильности приобретает все более комплексный характер. В конце ХХ века для анализа значительной части политических процессов использовались описательные статистики, статистические тесты и достаточно простые регрессионные модели (Caves, 1976; Edwards, 1978; King, 1988), но уже к началу XXI века практика анализа и предсказания политических процессов с технической точки зрения заметно продвинулась вперед. В первую очередь это было связано с ростом вычислительных мощностей компьютеров, но также и с развитием статистических методов в социальных науках (Keely, 2008).

Здесь надо отметить, что регрессионное моделирование имеет некоторое количество ограничений, которые значительно усложняют их использование применительно ко многим исследовательским вопросам (Алексеев, 2006). В частности, хотелось бы обратить внимание на проблему анализа комплексных процессов, подверженных влиянию большого количества факторов. Для классических регрессионных моделей достаточно остро стоит вопрос большого количества предикторов; в такой ситуации модели могут значительно завышать показатели своего качества (Lahiri, Monokroussos, Zhao, 2016). В то же время условия, которые должны быть соблюдены для состоятельной оценки с помощью такого рода моделей, достаточно жесткие. В связи с этим для анализа многофакторных процессов начали использовать более продвинутые и сложные регрессионные методы, например, методы байесовского анализа (De Mol, Giannone, Reichlin, 2008).

С аналогичной проблемой столкнулись и мы, когда перед нами встал вопрос изучения факторов, влияющих на возникновение революционных событий. Революция является многомерным феноменом, и на ее генезис влияет невероятное множество различных факторов. Аналогичным вопросом задавались также и другие авторы, однако для своего анализа они часто ограничивались достаточно узкой постановкой вопроса, например, задачей исключительно предсказания нестабильности или задачей анализа отдельных факторов (Goldstone et al., 2010; Ulfelder, 2012; Korotayev, Medvedev, Zinkina, 2022). Одновременно и решить задачу построения достаточно качественной модели, способной предсказывать революции, и иметь возможность проанализировать множество факторов до этого пытались всего несколько исследователей (Beissinger, 2022; Blair, Sambanis, 2020). Их работы были в основном сфокусированы на подходе, который использует множество моделей, использующих небольшое количество заранее отобранных переменных, которые достаточно подробно изучались по отдельности.

Но сегодня уже вполне распространенной становится методология, которая позволяет нивелировать достаточно большое количество факторов, осложняющих использование классических регрессионных моделей для анализа широкого спектра факторов. Это модели машинного обучения. В качестве референсного примера (схожего по сложности и многофакторности оказываемого влияния) можно привести задачу предсказания погоды, где достаточно активно начали внедрять схожие методы еще в начале XXI века (Ben Bouallègue, 2024)¹.

1 - Впрочем, сравнение социальных движений с погодой не совсем уместно, поскольку в случае с погодой прогнозы не могут ее изменять. 

Прогнозирование политической нестабильности в том или ином проявлении является одной из ключевых задач в области политической социологии. Оно позволяет выявлять потенциальные угрозы и риски, связанные с политическими, демографическими, экономическими, социальными и иными процессами, и принять меры по их предотвращению или минимизации. Модели машинного обучения могут выявлять скрытые закономерности в данных, которые не очевидны или не видны в классических методах анализа. Это может помочь объяснить глубинные причины политических процессов и предсказать их более точными методами, чем это было доступно в середине XX века. Использование машинного обучения может повысить точность прогнозов политических процессов за счет учета большего количества факторов и анализа больших объемов данных.

У моделей машинного обучения есть несколько значительных плюсов, которые отличают их от регрессионных моделей. Например, модели машинного обучения заметно менее чувствительны к скореллированности независимых переменных в модели; поэтому в них значительно слабее ограничения на используемое в них число факторов (Chan et al., 2022). Стоит сказать, что модели машинного обучения применялись в основном для задачи прогнозирования тех или иных факторов и не применялись так активно для задачи ранжирования факторов. В связи с этим не существует сложившихся подходов, которые помогли бы проанализировать, на основе чего модель делает свое предсказание. Для множества случаев применения (что верно также и для методов использования искусственного интеллекта) она оставалась «черным ящиком» (Von Eschenbach, 2021). В своей работе мы хотели бы рассмотреть и сравнить различные способы анализа моделей машинного обучения для решения задачи ранжирования факторов предикторов нестабильности.

Основные подходы

Как мы говорили выше, методы с использованием машинного обучения были использованы в социальных науках не сами по себе, а после успешного апробирования в смежных областях. Так, работы в области экономики и демографии показали состоятельность этого метода (Bishop, 2006). Эти исследования в основном ставили перед собой задачу предсказания комплексных процессов. В то же время первые работы с применением машинного обучения для задачи анализа нестабильности начали использоваться применительно к теме «арабской весны» (Joseph et al., 2014). При этом эти работы также были сильно связаны с темой дата-майнинга (data-mining). Исследователи использовали полуобученные (semi-supervised) модели для классификации твитов и авторов твитов по различным предварительно вручную выделенным категориям. «Арабская весна» показала сильную роль социальных медиа в процессе организации революционных событий (Коротаев, Шишкина, Исаев, 2016; Akaev et al., 2017; AlSayyad, Guvenc, 2015; Bayat, 2017; Beissinger, 2017; Levin et al., 2018; Lotan, 2011). В связи с этим понадобился инструментарий для анализа текстовой информации, в частности, контента из твиттера, так как исследователи выделяли именно его как один из основных факторов среди всех медиа. Анализ текстовой информации с применением машинного обучения использовался не только для анализа и категоризации текстовой информации, но и для задачи предсказания нестабильности. Опираясь на исследования, связывающие протестную активность и наличие выборов в стране в этот год, Тумасьян с коллегами пытались обогатить данные этих моделей дополнительной информацией о характере информационного поля в твиттере за период года до выборов (Tumasjan et al., 2010). Анализ они проводили с помощью регрессионного моделирования, но набор данных был ими собран именно с помощью методов машинного обучения. Проводились также исследования с аналогичным подходом по предсказанию войн на основе новостных статей (Chadefaux, 2014).

Однако оставалась проблема, связанная со значительной степенью неинтерпретируемости логики внутренней работы модели машинного обучения. Анализируя интернациональные конфликты, Голдсмит и его коллеги также обозначают проблему неинтерпретируемости, используя методы машинного обучения «как комплементарный метод к логит-модели» (Goldsmith, Chalup, Quinlan, 2008, p. 750). Упоминается также проблема, связанная с тем, что для работы продвинутых моделей в рамках анализа данных о нестабильности часто требуется значительный объем данных (Gleditsch, Metternich, 2014). С распространением новой методологии значительно увеличивается и необходимость в различных методах, связанных с анализом моделей машинного обучения. Так, можно выделить два направления анализа: анализ значимости и анализ направления связи. Задача выделения значимости в первую очередь связана с задачей ранжирования независимых переменных, так как ранжированный список позволяет определить, какие переменные можно с уверенностью считать значимыми для предсказания, а какие вносят несущественный вклад (Grömping, 2015; Tang, Liu, 2012). Вторым направлением работ по анализу моделей является определение направления связи между предиктором и зависимой переменной (Боровский, 2015; Sun et al., 2012). Таким образом, перед нами стояла задача по апробации и комбинации методов по анализу различных моделей машинного обучения.

Поговорим чуть подробнее про методы, связанные с определением значимых факторов моделей. Одним из первых и наиболее распространенных методов является оценка важности предикторов (Feature Importance). Этот метод используется для оценки параметров вклада каждого из предикторов модели в результат ее работы. Этот метод применяется преимущественно для моделей, построенных на основе дерева решений или родственных ему. При этом можно использовать два основных подхода — по уменьшению ошибки в процессе предсказания модели или по частоте использования переменной в построении деревьев (Baehrens, 2010).

Для моделей, построенных на деревьях решений, через анализ того, насколько каждый предиктор уменьшает неопределенность при разбиении данных, вычисляется важность предикторов по уменьшению ошибки. Модель делит данные на основе значений предикторов, чтобы сделать подгруппы максимально гомогенными, и при этом максимизировать различия между ними. Важность признака определяется через сумму уменьшения критерия расщепления, например, энтропии или индекса Джини для всех узлов, где предиктор используется. Выбор критерия расщепления делается в зависимости от характера зависимой переменной. На каждом узле дерева выбирается тот предиктор, который обеспечивает наибольшее уменьшение неопределенности. Чем больше предиктор уменьшает неопределенность, тем выше важность признака. Это позволяет выявить признаки, наибольшим образом влияющие на результаты модели. Важно отметить, что этот метод может быть чувствителен к мультиколлинеарным предикторам, так как при условии сильной корреляции модель может выбирать только один признак из набора скоррелированных метрик, снижая видимую важность других. Поэтому обычно этим методом пользуются в сочетании с другими способами оценки важности признаков, чтобы получить более полную картину (Altmann, 2010; Nicodemus, 2010; Nirmalraj et al., 2023; Medvedev et al., 2022).

Для оценок, построенных на изменении в функции потерь, оценивается вклад каждого признака в модель машинного обучения путем анализа того, как изменение предикторов модели влияет на ее предсказательную способность. Этот подход использует информацию о том, насколько исключение или изменение значения конкретного предиктора увеличивает или уменьшает ошибку модели. Функция потерь в данном случае — это математическая формула, измеряющая степень отклонения предсказания модели от реального результата, известного нам заранее. В задачах классификации чаще всего применяются такие функции потерь, как Cross-Entropy, AUC, PRAUC. Важно отметить, что оценка через функцию потерь может быть чувствительна к размерности данных, которые мы используем (Muthukumar et al., 2021). Однако этот подход особенно хорошо работает не просто в моделях с деревьями решений, а в ансамблевых моделях с применением градиентного бустинга, где интерпретация важности признаков может быть менее очевидной за счет построения не одного, а целого набора из решающих деревьев. При этом по отдельности каждое из этих деревьев обладает относительно низкой предсказательной силой, но достаточно высокую предсказательную силу они демонстрируют в комплексе (Li, Yang, 2003).

Оценки модели по методу случайной переменной необходимы в первую очередь для определения порога значимости переменных в модели. Основная идея метода заключается в добавлении случайно перемешанной переменной в тестовом наборе данных и последующем измерении влияния этого на точность модели; перед этим оценивается производительность модели на тестовом наборе данных без изменений, чтобы получить референсное значение (Yun, 2015). Далее мы проводим оценку важности наших предикторов по любому из вышеописанных методов и получаем границу отсечения, по которой мы способны измерить то, с какой точки мы не можем быть уверены в реальной статистической значимости наших переменных. Этот метод легко интерпретируется и может применяться к различным типам моделей, включая сложные ансамблевые методы. Однако метод может быть чувствителен к выбросам и шуму в данных.

Поговорим теперь про методы оценки направления связи наших предикторов с зависимой переменной. Одним из основных и самых известных является метод с использованием векторов Шепли (SHAP Values). Метод становится все более популярным среди исследователей и практиков, стремящихся получить прозрачные и обоснованные интерпретации моделей машинного обучения. Этот метод оценивает важность признаков, обеспечивая интерпретацию на уровне каждого предсказания. Метод основан на концепции из теории игр, где значения Шепли используются для справедливого распределения выигрыша среди игроков, участвующих в кооперативной игре (Antonini et al., 2024). При использовании этого подхода к машинному обучению «игроками» являются признаки, а «выигрыш» — предсказание модели. При оценке учитываются все возможные комбинации признаков и вычисляется среднее изменение в предсказании модели. Такой подход обеспечивает уникальную интерпретируемость как на уровне каждого отдельного наблюдения, так и для направления связи на уровне усредненных данных. Одной из главных особенностей SHAP является его способность учитывать взаимодействия между признаками. При этом SHAP Values обеспечивают согласованность и точность, что делает оценки, сделанные с помощью данного метода, особенно полезными для сложных моделей, таких как ансамбли деревьев решений, в том числе бустинговые (Hamilton, 2023).

Используемые данные и ограничения

Для начала стоит обозначить, какие данные мы будем использовать для наших задач. Так как перед нами базово стояла задача предсказания, то мы использовали максимально широкий спектр данных, которые охватывают большую часть аспектов, влияющих на возникновение революционных событий. В большой степени используемый нами набор пересекается с теми факторами, которые выделяет Бейсинджер в своей книге об анализе различных факторов, влияющих на революции (Beissinger, 2022), а также теми, значимость которых для генезиса революционной дестабилизации была показана нами в наших предыдущих исследованиях (см., например: (Коротаев, Васькин и др., 2017; Коротаев, Исаев и др., 2015; Коротаев, Сойер и др., 2020; Мусиева и др., 2023; Устюжанин, Гринин и др., 2022; Устюжанин, Костин и др., 2023; Устюжанин, Степанищева и др., 2023; Grinin et al., 2019; Korotayev, Issaev et al., 2015; Korotayev, Vaskin et al., 2018; Korotayev, Zhdanov et al., 2025; Kostin, Korotayev, 2024).

Список использованных независимых переменных представлен ниже в таблице 1.

Таблица 1. Используемые параметры в модели
Table 1. Parameters used in the model

Название переменной 
в БД
РасшифровкаИсточник
By_world_main_dvКоличество революционных эпизодов в мире в исследуемый год (исключены революционные события в самой стране)Собственный подсчет
By_region_main_dvКоличество революционных эпизодов в регионе в исследуемый год (исключены революционные события в стране)Собственный подсчет
VDEM_v2x_corrИндекс политической коррупцииV-Dem
domestic6_8Усредненные за 5 лет данные о количестве протестов и бунтов в странеCNTS
gap_GDP_per_capita_growthРост ВВП на душу населения, в %GAP
Us_foreign_aid_obligationsconstant_amountПомощь со стороны 
США (в $)
USAID
BPOil production (TWh)Объем добычи нефти 
и газа, в Твт/ч
BritishPetroleum
WB_InflationConsumerPriceИндекс потребительских ценWorld Bank
WPP_All_SumНаселениеWorld Population 
Prospects
Polity5_durableКоличество лет с предыдущей смены режимаPolity 5
FAO_FoodPriceIndexИзменение цен на продовольственную корзину, в %Food Agriculture Organisation
gap_Income_per_personВВП на душу населения, в пост. $ СШАGAP
REIGN_Incumbent_durationВремя пребывания первого лица у властиREIGN
VDEM_v2x_polyarchyИндекс электоральной демократии (0-1)V-Dem
Bessinger_percmuslim_plus_WPopReview_muslim_in...Процент мусульманского населения(Beissinger, 2022) и UNDP
WPP_15_29_share_15plusДоля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старшеWorld Population 
Prospects
BESS_plus_WB_UrbanizationУрбанизация(Beissinger, 2022) и World Bank
HDR_BL_sovmest_mysСреднее число лет 
обучения
(Barro, Lee, 1996) и Human Development Report 
CDetat_total_5yrSumУсредненные за 5 лет перевороты и попытки переворотаCIFP, Coup D’Etat
epr_discriminated_sizeДоля дискриминируемого населения(Wimmer et al., 2009)

В то же время у нас имеется значительное количество пропущенных данных, которые могут сильно влиять на работу нашей модели. Чтобы избежать ситуации, когда пропуски в данных могут быть не случайными и приводить к проблеме эндогенности, мы использовали подход по вероятностному заполнению пропусков. Так, страны с более низким уровнем благосостояния и государственной состоятельности и, соответственно, более низким качеством сбора государственной статистики имеют бо́льшую вероятность того, что в их данных могут быть пропуски (Lall, 2016). В качестве основного подхода к заполнению данных использовалась модель Amelia II, учитывающая панельную структуру наших таблиц (Honaker, King, Blackwell, 2011).

Также отдельно стоит сказать об используемой зависимой переменной. Мы используем данные о революционных эпизодах за XXI век (с 2000 года по 2024 год) (Коротаев, Гринин, Устюжанин, 2024). Эта база данных включает в себя информацию о типе тактики протестующих, цели, степени успеха и вооруженности протестующих. Наша база данных содержит более пяти с половиной тысяч строчек данных и состоит из 20 факторов, пропуски в которых заполнены по 50 разным сценариям. Далее все оценки будут приводиться нами по усредненным значениям.

Необходимо особо подчеркнуть, что в тестах, результаты которых мы приводим ниже, в качестве зависимой переменной использованы исключительно невооруженные революционные выступления. Это важная оговорка, так как исследования последних лет (которые можно отнести к пятому поколению исследований революций (Коротаев, Гринин и др., 2025; Grinin, Korotayev, 2024; Korotayev, Grinin et al., 2025; Korotayev, Ustyuzhanin et al., 2025)) убедительно показали, что предикторы начала вооруженных и невооруженных революционных выступлений различаются очень сильно; так что факторы, увеличивающие вероятность начала невооруженных революций, могут снижать вероятность начала вооруженных восстаний, и наоборот (см., например: (Коротаев, Жданов, 2023а; Устюжанин, Жодзишская и др., 2022; Устюжанин, Сумерников и др., 2022; Устюжанин, Коротаев, 2022; Beissinger, 2022; Butcher, Svensson, 2016; Chenoweth, Ulfelder, 2017; Pinckney, RezaeeDaryakenari, 2022)).

Перейдем к непосредственному описанию модели, которую мы используем. Для начала нам необходима была модель, которая построена на основе решающих деревьев с ансамблем, так как они показывают наилучший результат при прочих равных. Под эти критерии подходит достаточно большое количество моделей, но мы решили прибегнуть к моделям с градиентным бустингом, так как мы используем не так много переменных, поэтому имеем возможность применить не самые производительные, но наиболее точные модели. Среди таких моделей можно выделить AdaBoost, XGBoost и CatBoost. Подробнее о причинах выбора модели мы говорили в предыдущих работах (Медведев, Коротаев, 2020), но стоит сказать дополнительно, что для задачи предсказания нестабильности использование CatBoost может быть предпочтительным по нескольким причинам. Во-первых, CatBoost обладает встроенной поддержкой категориальных признаков, что делает его особенно полезным в контексте анализа социально-экономических и политических данных, где такие признаки часто встречаются. За счет хорошо подобранных стандартных параметров риск переобучения меньше, а модель более устойчива к шуму в данных. Во-вторых, CatBoost известен своей высокой производительностью и точностью, особенно на небольших и средних наборах данных. Алгоритм основан на градиентном бустинге, но использует уникальные методы для устранения смещения, вызванного порядком обучения, и для повышения общей стабильности модели. Эти особенности позволяют CatBoost эффективно справляться с перекосами и взаимодействиями между признаками, что особенно полезно для задач с исследованием различных факторов.

Также среди условий работы нашей модели была кросс-валидация по методу K-fold. Одним из базовых принципов работы модели машинного обучения является разбиение выборки на обучающую и тестовую. Тестовая выборка не принимает участия в процессе разбиения параметров модели в деревьях, но на ее основе принимается решение о качестве работы модели. Это защищает нас от так называемой проблемы переобучения. Чтобы получить правильно обобщенный прогноз, на который не влияет эффект разбиения данных, кросс-валидация делит данные на несколько частей, обучает модель на одних данных и проверяет ее на других. Это помогает понять, насколько хорошо модель работает на новых данных и насколько она устойчива к переобучению, при этом проверка происходит путем поочередного перебора всего датасета, попеременно делая тестовой одну из заранее разбитых частей.

При этом для подбора оптимальных параметров мы будем использовать поиск по сетке параметров (GridSearch). Этот метод используется в процессе обучения модели, когда такие ее гиперпараметры, как количество деревьев, глубина деревьев, скорость обучения, существенно влияют на производительность и точность предсказаний. GridSearch позволяет систематически перебрать все возможные комбинации заданных гиперпараметров и найти наиболее оптимальную конфигурацию, которая минимизирует ошибку модели на валидационном наборе данных. Это критически важно, так как правильная настройка гиперпараметров может значительно улучшить качество предсказаний, избежать переобучения и повысить общую устойчивость модели.

Все вышеописанные операции будут применяться к каждому из 50 прогнозных датасетов с импутацией. Помимо этого, 2023 и 2024 годы мы исключали из тестовой и обучающей выборок и сделали из них отдельный валидационный датасет, на котором проверяли качество предсказания модели на данных, которые не принимали участия в обучении. Все эти методы требуют много времени и вычислительных ресурсов для обработки данных, а также диапазонной оценки факторов, что усложняет процесс прогнозирования.

Результаты тестирования методов

Рассмотрим теперь полученные нами результаты (см. табл. 2). 

Таблица 2. Оценка параметров модели через важность в разбиении данных в деревьях
Table 2. Estimating model parameters via importance in data partitioning in trees

Название переменнойУровень вклада, в %
Количество революционных эпизодов в мире в исследуемый год (исключены революционные события в стране)7,084
Количество революционных эпизодов в регионе в исследуемый год (исключены революционные события в стране)6,907
Индекс политической коррупции6,628
Усредненные за 5 лет данные о количестве протестов и массовых беспорядков в стране6,552
Рост ВВП на душу населения, в %6,351
Помощь со стороны США (в $)6,253
Объем добычи нефти и газа, в Твт/ч5,986
Индекс потребительских цен5,737
Численность населения5,677
Количество лет с предыдущей смены режима5,571
Изменение цен на продовольственную корзину, в %4,970
ВВП на душу населения, в пост. $ США4,608
Время пребывания первого лица у власти4,256
Индекс электоральной демократии (0-1)4,091
Процент мусульманского населения3,953
Доля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старше3,880
Урбанизация3,431
Среднее число лет обучения3,179
Усредненные за 5 лет перевороты и попытки переворота2,765
Доля дискриминируемого населения2,117

Для начала отметим, что мы не имеем значительно доминирующей переменной, что уже положительно говорит о качестве модели. В то же время снижение уровня вклада идет плавно, без скачков, что дополнительно указывает на состоятельность полученной модели. На первые два места в нашей модели попали переменные, которые отвечают за наличие революционных эпизодов в стране и в мире в конкретный год. Это подчеркивает исключительно высокую значимость феномена революционных волн, которому в рамках пятого поколения теорий революции уделяется очень большое внимание (Beck, 2011, 2014; Beissinger, 2022; Grinin, 2022; Grinin, Grinin, 2022; Grinin et al., 2022; Rozov, 2022). При этом примечательно, что вклад эффекта глобальных революционных волн оказывается даже сильнее эффекта волн региональных, хотя ряд исследований пятого поколения и утверждают, что значимы только лишь региональные волны (Gleditsch, Rivera, 2017). Это дает дополнительные аргументы в пользу утверждений об исключительно высокой значимости глобальных волн в революционных процессах XXI века (Braithwaite et al., 2015; Goldstone et al., 2022; Grinin, 2022; Grinin, Grinin, 2022; Grinin et al., 2022; Issaev, Korotayev, 2022; Голдстоун и др., 2022). Также данный феномен подтверждается и исследованиями в области распространения протестных настроений (protest diffusion) (Huang, Boranbay-Akan, Huang, 2019). Стоит также упомянуть, что исследуя такие движения, как Occupy, исследователи сходятся во мнении, что процесс распространения протестов происходит через интернет и часто не связан с конкретным регионом (Tremayne, 2016; Kavada, 2020).

В то же время примечательно, что в топе факторов оказываются именно те параметры, которые выделялись как одни из сильнейших и при использовании других методов: динамика ВВП (Устюжанин, Жодзишская и др., 2022; Beissinger, 2022; Cebul, Grewal, 2022; Knutsen, 2014; Ustyuzhanin, Sawyer et al., 2023), индекс коррупции (Устюжанин, Костин и др., 2023; Beissinger, 2022), численность населения (Brunnschweiler, Lujala, 2019; Dahl et al., 2021), эффект инерции (Устюжанин, Коротаев, 2022; Albrecht, Koehler, 2020; Braithwaite et al., 2014, 2015; Brooks, White, 2023; Butcher, Svensson, 2016; Dahl et al., 2021), продовольственная инфляция (Жданов, Коротаев, 2024). При этом значимая роль здесь общей инфляции была ранее выявлена с использованием именно методов машинного обучения (Pinckney, RezaeeDaryakenari, 2022).

Посмотрим теперь, какой результат даст разбиение по принципу ухудшения качества результирующей метрики. Обратим внимание, что мы применили два принципа пересчета — с полным исключением переменной из расчета и со случайным перемешиванием ее значений (см. табл. 3).

Таблица 3. Оценка параметров модели через изменение в функции оценки. Оба подсчета проранжированы по убыванию вклада
Table 3. Estimation of model parameters via change in the scoring function. Both estimates are ranked in descending order of contribution

Название переменнойИзменение оценки при исключенииНазвание переменнойИзменение оценки при рандомизации колонки
Усредненные за 5 лет данные о количестве протестов и бунтов 
в стране
0,062661Количество 
революционных эпизодов в мире в исследуемый год (исключены революционные 
события в стране)
0,009708
Количество революционных эпизодов в мире в исследуемый год (исключены революционные 
события в стране)
0,055752Усредненные за 5 лет данные о количестве протестов и бунтов 
в стране
0,006212
Индекс потребительских цен0,04654Рост ВВП на душу населения, в %0,003742
Усредненные 
за 5 лет перевороты и попытки переворота
0,04652Индекс политической коррупции0,003625
Помощь со стороны США (в $)0,038953Объем добычи нефти и газа, в Твт/ч0,003286
Количество лет с предыдущей смены режима0,038932Количество лет с предыдущей смены режима0,003222
Доля дискриминируемого 
населения
0,037925Помощь со стороны США (в $)0,003088
Доля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старше0,037637Количество революционных эпизодов в регионе в исследуемый год (исключены революционные 
события в стране)
0,003058
Изменение цен 
на продовольственную корзину, в %
0,035416Население0,002873
Индекс электоральной демократии (0-1)0,034532Индекс потребительских цен0,002832
Население0,033936Изменение цен 
на продовольственную корзину, в %
0,002799
Рост ВВП на душу 
населения, в %
0,027418Время пребывания первого лица у власти0,002716
Количество революционных 
эпизодов в регионе в исследуемый год (исключены революционные события в стране)
0,024724Индекс электоральной демократии (0-1)0,002218
Индекс политической коррупции0,023737Среднее число лет обучения0,002171
Процент мусульманского 
населения
0,023038ВВП на душу населения, в пост. $ США0,001964
ВВП на душу населения, в пост. $ США0,020283Доля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старше0,001815
Объем добычи нефти и газа, в Твт/ч0,0202Урбанизация0,001690
Среднее число лет 
обучения
0,019234Усредненные за 5 лет перевороты и попытки переворота0,001587
Урбанизация0,018823Процент мусульманского 
населения
0,001573
Время пребывания первого лица у власти0,007945Доля дискриминируемого 
населения
0,000843

Интересно отметить, что наиболее сильным и стабильным фактором оказались усредненные протесты за последние 5 лет, и количество революционных эпизодов в мире. В то же время показатель количества революционных эпизодов в регионе значительно снизился, особенно в версии с исключением его из датасета. Как и предполагалось, фактор региональных революционных волн не так значительно влияет на модель и может быть «абсорбирован» другими переменными и их взаимодействием. Это дает дополнительное подтверждение того, что в XXI веке эффект глобальных революционных волн оказывается сильнее эффекта волн региональных.

Из стабильных факторов также показывает себя количество лет с предыдущей смены режима (что в заметной степени отражает эффект революционной инерции (Коротаев, Жданов, 2023а; Устюжанин, Коротаев, 2022; Albrecht, Koehler, 2020; Braithwaite et al., 2014, 2015; Brooks, White, 2023; Butcher, Svensson, 2016; Dahl et al., 2021)). Интересно, что доля дискриминируемого населения оказывается для оценки с перетасовыванием значений внутри параметра наименее важным фактором, в то время как для исключения он оказывается среди средне-значимых (в какой-то степени это может быть связано с тем обстоятельством, что фактор этот, безусловно, очень важен, но только для одного типа революций, «этно-сепаратистских» (Ustyuzhanin, Korotayev, 2023)). И для того, чтобы окончательно принять решение по списку значимых переменных, проведем нашу операцию с включением случайно сгенерированной переменной в модель и посмотрим, какие из метрик для какой из оценок она исключит (см. табл. 4).

Таблица 4. Оценка параметров модели путем добавления случайной нормально распределенной переменной
Table 4. Estimation of model parameters by adding a random normally distributed variable

Топ по исключению из датасетаТоп по рандомизацииТоп по важности при разбиении
Усредненные за 5 лет данные о количестве протестов и бунтов в странеКоличество революционных эпизодов в мире в исследуемый год (исключены революционные события 
в стране)
Количество революционных эпизодов в мире 
в исследуемый год (исключены революционные события в стране)
Количество революционных эпизодов в мире в исследуемый год (исключены революционные события в стране)Усредненные за 5 лет данные о количестве протестов и бунтов в странеКоличество революционных эпизодов в регионе в исследуемый год (исключены революционные события в стране)
Индекс потребительских ценРост ВВП на душу населения, в %Индекс политической 
коррупции
Усредненные за 5 лет перевороты и попытки переворотаИндекс политической коррупцииУсредненные за 5 лет данные о количестве протестов и бунтов в стране
Помощь со стороны США (в $)Объем добычи нефти и газа, в Твт/чРост ВВП на душу населения, в %
Количество лет с предыдущей смены режимаКоличество лет с предыдущей смены режимаПомощь со стороны США (в $)
Доля дискриминируемого населенияПомощь со стороны США (в $)Объем добычи нефти и газа, в Твт/ч
Доля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старшеКоличество революционных эпизодов в регионе в исследуемый год (исключены революционные события в стране)Индекс потребительских цен
Изменение цен на продовольственную корзину, в %НаселениеНаселение
Индекс электоральной демократии (0-1)Индекс потребительских ценКоличество лет с предыдущей смены режима
НаселениеИзменение цен на продовольственную корзину, в %Изменение цен на продовольственную корзину, в %
Рост ВВП на душу населения, в %Время пребывания первого лица у властиВВП на душу населения, в пост. $ США
Количество революционных эпизодов в регионе в исследуемый год (исключены революционные события в стране)Индекс электоральной демократии (0-1)Время пребывания первого лица у власти
Индекс политической коррупцииСреднее число лет обученияИндекс электоральной демократии (0-1)
Процент мусульманского населенияВВП на душу населения, в пост. $ СШАПроцент мусульманского населения
ВВП на душу населения, в пост. $ СШАДоля молодежи в возрасте 15–29 лет в численности населения от 15 лет и старшеДоля молодежи в возрасте 15–29 лет в численности населения от 15 и старше
Объем добычи нефти и газа, в Твт/чУрбанизацияУрбанизация
Среднее число лет обученияУсредненные за 5 лет 
перевороты и попытки 
переворота
Среднее число лет обучения
УрбанизацияПроцент мусульманского населенияУсредненные за 5 лет перевороты и попытки переворота
Время пребывания первого лица у властиДоля дискриминируемого населенияДоля дискриминируемого населения

Примечательно, что количество незначимых независимых переменных в этом случае оказалось меньше, чем для других моделей. Можно вполне однозначно говорить о высокой важности таких факторов, как: количество революционных эпизодов в мире (эффект глобальных революционных волн), усредненные за пять лет данные о количестве антиправительственных демонстраций и массовых беспорядков в стране, численность населения, рост ВВП на душу населения, финансовая помощь со стороны США (о последнем факторе см.: (Kostin, Korotayev, 2024; Medvedev et al., 2022)). Посмотрим теперь более внимательно на усредненные направления связи по некоторым из этих переменных.

Рис. 1. SHAP Values для численности населения, в тысячах, ln
Fig. 1. SHAP Values for population, in thousands, ln

Как мы видим, высокая численность населения очень заметно увеличивает вероятность невооруженных революционных выступлений, особенно для стран, которые переходят порог в 80 миллионов, при этом показывая стабильно низкий результат для малых стран, что выглядит вполне оправданным, ведь с ростом населения у нас растет и вероятность возникновения того или иного эпизода нестабильности (Dorward, Fox, 2022); чем больше людей, тем больше и потенциальных точек пересечений разных интересов (Cincotta, Weber, 2021; Gleditsch и др., 2021). Как отмечает М. Бейссинджер, «кросс-национальные исследования уже давно показали, что численность населения страны положительно связана с уровнем дестабилизационной активности в ней1. Причины никогда не были полностью прозрачными, но могут объясняться теорией критической массы, которая утверждает, что размер населения облегчает мобилизацию, увеличивая вероятность того, что достаточное количество потенциальных участников может иметь необходимое время, ресурсы и мотивацию для участия1» (Beissinger, 2022, p. 115).

1 - Отметим, что это подтверждает и целый ряд проведенных нами кросснациональных исследований (см., например: (Коротаев, Сойер, Гладышев и др., 2021; Романов и др., 2021; Korotayev, Sawyer et al., 2021; Korotayev, Vaskin et al., 2021)). 
1 - Со ссылкой на: (Marwell, Oliver, 1993). В применении к революциям см.: (Kurzman, 1996). 

Рис. 2. SHAP Values для годовых темпов роста ВВП на душу населения, %. Слева мы можем видеть полный вид диаграммы. Справа же мы видим только ее часть для диапазона между -10 и 8%
Fig. 2. SHAP Values for annual growth rates of GDP per capita, %. On the left we can see the full view of the chart. On the right we see only a part of it for the range between -10 and 8%

Здесь мы видим значительный перекос в сторону стран с резким экономическим ростом или падением. В то же время видим значительный рост для стран с небольшой отрицательной динамикой и резкое падение для стран с динамикой роста около 5–10%. Рост около ноля выступает промежуточным звеном. В целом центральная часть графика, которая не зааффекчена выбросами в данных, выглядит более чем логично и предсказуемо. При этом провоцировать такие выступления может как экономический спад (Cebul, Grewal, 2022; Knutsen, 2014; Shaheen, 2015; Ustyuzhanin, Sawyer et al., 2023; Слав, Коротаев, 2021), так и экономический подъем (Beissinger, 2022; Медведев и др., 2022; Устюжанин, Жодзишская и др., 2022). Более подробно о связи экономического развития и возникновения протестов и революций мы уже писали в своих предыдущих работах (Коротаев, Жданов, 2023; Устюжанин, Михеева и др., 2023; Korotayev, Sawyer, Romanov, 2021).

Заключение

В данной работе мы показали, каким образом можно применить находки различных исследователей в области социальных наук применительно к задаче ранжирования факторов революционных событий. Мы рассмотрели самые распространенные способы анализа результатов, выдаваемые машинным обучением. В то же время данная область постоянно развивается и появляется множество иных способов использовать модели машинного обучения не просто как «черные ящики», а вытащить из них больше информации о внутренней логике модели. При этом появляется возможность разработки таких моделей, которые не просто являются интерпретируемыми, но и дают возможность прогнозировать будущие риски возникновения нестабильности с большей точностью. Также мы рассмотрели спорный вариант метода с отсечением незначимых переменных, однако в итоге оказалось отсечено небольшое их количество, и многие из них действительно пересекались между собой. Из содержательных результатов проведенных тестов особо следует отметить выявление исключительно мощного эффекта революционных волн в революционных событиях XXI века, притом что в XXI веке эффект глобальных революционных волн оказывается сильнее эффекта волн региональных. В целом проведенные тесты заставляют предполагать, что наиболее сильными факторами, значимо повышающими в XXI веке вероятность начала невооруженных революционных выступлений (кроме эффекта революционных волн), являются следующие: высокий уровень политической коррупции, эффект инерции (невооруженные революционные или мощные протестные события в недавнем прошлом), аномалии экономического роста, высокие объемы помощи со стороны США (эффект «железной клетки либерализма» по Д. Риттеру (Ritter, 2015)), отсутствие нефтяной ренты, высокая численность населения, высокая продовольственная инфляция, средний уровень экономического развития, продолжительное пребывание первого лица у власти и промежуточный тип политического режима.

Список литературы

1. Алексеев Т. Д. (2016) Анализ последовательностей в социологии: возможности, ограничения и потенциал применения. Социология: методология, методы, математическое моделирование, 43, c. 100–127. EDN: WPVYSV

2. Боровский А. А. (2015) Перспективы применения технологий машинного обучения к обработке больших массивов исторических данных. Кибернетика и программирование, (1), c. 77–114. EDN: TEUTCF. https://doi.org/10.7256/2306-4196.2015.1.13730

3. Голдстоун Дж. А., Гринин Л. Е., Коротаев А. В. (2022) Волны революций XXI столетия. Полис. Политические исследования, (4), c. 108–119. EDN: DVNOBB. https://doi.org/10.17976/jpps/2022.04.09

4. Жданов А. И., Коротаев А. В. (2024) Инфляционное давление и революционная дестабилизация: оценка воздействия и сравнительный анализ. Социология власти, 36 (2), c. 113–141. EDN: NQBWZK. https://doi.org/10.22394/2074-0492-2024-2-113-141

5. Коротаев А., Васькин И., Билюга С. (2017) Гипотеза Олсона-Хантингтона о криволинейной зависимости между уровнем экономического развития и социально-политической дестабилизацией: опыт количественного анализа. Социологическое обозрение, 16(1), c. 9–49. EDN: YKUXXJ. https://doi.org/10.17323/1728-192X2017-1-9-49.

6. Коротаев А. В., Гринин Л. Е., Устюжанин В. В. (2024) База данных по революционным событиям XXI века. М.: НИУ ВШЭ. EDN: AVSRLM

7. Коротаев А., Гринин Л., Устюжанин В., Файн Е. (2025) Пятое поколение исследований революции. Систематический обзор. Логос, 35(1), c. 191–316. EDN: RFTSEX. https://doi.org/10.17323/0869-5377-2025-1-193-296

8. Коротаев А. В., Жданов А. И. (2023a) Количественный анализ политических факторов революционной дестабилизации. Опыт систематического обзора. Полития: Анализ. Хроника. Прогноз (Журнал политической философии и социологии политики), (3), c. 149–171. EDN: NAZUCB. https://doi.org/10.30570/2078-5089-2023-110-3-149-171

9. Коротаев А. В., Жданов А. И. (2023б) Количественный анализ экономических факторов революционной дестабилизации: результаты и перспективы. Социология власти, 35(1), c. 118–159. EDN: VKRMWA. https://doi.org/10.22394/2074-0492-2023-1-118-159

10. Коротаев А.В., Исаев Л.М., Васильев А.М. (2015) Количественный анализ революционной волны 2013–2014 гг. Социологические исследования, (8), c. 119–127. EDN: UFZJFZ

11. Коротаев А. В., Сойер П. С., Гринин Л. Е., Шишкина А. Р., Романов Д. М. (2020) Социально-экономическое развитие и антиправительственные протесты в свете новых результатов количественного анализа глобальных баз данных. Социологический журнал, 26(4), c. 61–78. EDN: SCFFFV. https://doi.org/10.19181/socjour.2020.26.4.7642

12. Коротаев А. В., Шишкина А. Р., Исаев Л. М. (2016) Арабская весна как триггер глобального фазового перехода. Полис. Политические исследования, (3), c. 108–122. EDN: VWPTBL. https://doi.org/10.17976/jpps/2016.03.09

13. Медведев И. А., Коротаев А. В. (2020) К построению индекса социально-политической дестабилизации в различных мир-системных зонах. Системный мониторинг глобальных и региональных рисков, 11, c. 433–454. EDN: JHHHTO

14. Мусиева Д. М., Устюжанин В. В., Гринин Л. Е., Коротаев А. В. (2023) Субъективное благополучие и революционная дестабилизация. Опыт количественного анализа. Социология власти, 35 (3), c. 57–94. EDN: IYBOUU. https://doi.org/10.22394/2074-0492-2023-3-57-94

15. Устюжанин В. В., Гринин Л. Е., Медведев И. А., Коротаев А. В. (2022) Образование и революции (Почему революционные выступления принимают вооруженную или невооруженную форму?). Полития: Анализ. Хроника. Прогноз, (1), c. 50–71. EDN: TIZIXP. https://doi.org/10.30570/2078-5089-2022-104-1-50-71

16. Устюжанин В. В., Жодзишская П. А., Коротаев А. В. (2022) Демографические факторы как предикторы революционных ситуаций. Опыт количественного анализа. Социологический журнал, 28(4), c. 34–59. EDN: VEVEEC. https://doi.org/10.19181/socjour.2022.28.4.9314

17. Устюжанин В. В., Коротаев А. В. (2022) Регрессионное моделирование вооруженной и невооруженной революционной дестабилизации в афразийской макрозоне нестабильности. Системный мониторинг глобальных и региональных рисков, 13, c. 192–226. EDN: ADTXLI. https://doi.org/10.30884/978-5-7057-6184-5_07

18. Устюжанин В. В., Костин М. С., Гринин Л. Е., Коротаев А. В. (2023) Коррупция и революционная дестабилизация: опыт количественного анализа. Журнал социологии и социальной антропологии, 26(3), c. 53–99. EDN: YTNMDC. https://doi.org/10.31119/jssa.2023.26.3.3.

19. Устюжанин В. В., Михеева В. А., Сумерников И. А., Коротаев А. В. (2023) Экономические истоки революций: связь между ВВП и рисками революционных выступлений. Полития: Анализ. Хроника. Прогноз (Журнал политической философии и социологии политики), (1), c. 64–87. EDN: VRPOBO. https://doi.org/10.30570/2078-5089-2023-108-1-64-87

20. Устюжанин В., Степанищева Я., Галлямова А., Гринин Л., Коротаев А. (2023) Образование и риски революционной дестабилизации: опыт количественного анализа. Социологическое обозрение, 22(1), c. 98–128. EDN: WSZVDJ. https://doi.org/10.17323/1728-192X-2023-1-98-128

21. Устюжанин В. В., Сумерников И. А., Гринин Л. Е., Коротаев А. В. (2022) Урбанизация и революции: количественный анализ. Социологические исследования, (10), c. 85–95. EDN: WSMVJE. https://doi.org/10.31857/S013216250018478-8

22. Beissinger M.R. (2017) “Conventional” and “virtual” civil societies in autocratic regimes. Comparative Politics, 49(3), pp. 351–371. http://dx.doi.org/10.5129/001041517820934267

23. Beissinger M. R. (2022) The revolutionary city: Urbanization and the global transformation of rebellion. Princeton, NJ: Princeton University Press.

24. Ben Bouallègue Z. et al. (2024) The Rise of Data-Driven Weather Forecasting: A First Statistical Assessment of Machine Learning–Based Weather Forecasts in an Operational-Like Context. Bulletin of the American Meteorological Society, 105(6), pp. 864–883. https://doi.org/10.1175/BAMS-D-23-0162.1

25. Blair R. A., Sambanis N. (2020) Forecasting civil wars: Theory and structure in an age of “big data” and machine learning. Journal of Conflict Resolution, 64(10), pp. 1885–1915. https://doi.org/10.1177/0022002720918923

26. Braithwaite A., Braithwaite J. M., Kucik J. (2015) The conditioning effect of protest history on the emulation of nonviolent conflict. Journal of Peace Research, 52(6), pp. 697–711. https://doi.org/10.1177/0022343315593993.

27. Braithwaite A., Kucik J., Maves J. (2014) The costs of domestic political unrest. International Studies Quarterly, 58(3), pp. 489–500. https://doi.org/10.1111/isqu.12061.

28. Brooks R., White P. B. (2023) The military before the march: Civil-military grand bargains and the emergence of nonviolent resistance in autocracies. Journal of Peace Research, 61(6), pp. 1002–1018. https://doi.org/10.1177/00223433231180921

29. Brunnschweiler C. N., Lujala P. (2019) Economic backwardness and social tension. The Scandinavian Journal of Economics, 121(2), pp. 482–516. https://doi.org/10.1111/sjoe.12281

30. Butcher C., Svensson I. (2016) Manufacturing dissent: Modernization and the onset of major nonviolent resistance campaigns. Journal of Conflict Resolution, 60(2), pp. 311–339. https://doi.org/10.1177/0022002714541843

31. Caves R. E. (1976) Economic models of political choice: Canada’s tariff structure. Canadian Journal of Economics, 9(2), pp. 278–300. https://doi.org/10.2307/134522

32. Cebul M. D., Grewal S. (2022) Military conscription and nonviolent resistance. Comparative Political Studies, 55(13), pp. 2217–2249. https://doi.org/10.1177/00104140211066209

33. Chadefaux T. (2023) An automated pattern recognition system for conflict. Journal of Computational Science, 72, pp. 102–114. https://doi.org/10.1016/j.jocs.2023.102074

34. Chadefaux T. (2014) Early warning signals for war in the news. Journal of Peace Research, 51(1), pp. 5–18. https://doi.org/10.1177/0022343313507302

35. Chan J. Y. L. et al. (2022) Mitigating the multicollinearity problem and its machine learning approach: a review. Mathematics, 10(8), pp. 1283–1291. http://dx.doi.org/10.3390/math10081283

36. Chenoweth E., Ulfelder J. (2017) Can structural conditions explain the onset of nonviolent uprisings? Journal of Conflict Resolution, 61(2), pp. 298–324. https://doi.org/10.1177/0022002715576574

37. Dahl M., Gates S., Gleditsch K., González B. (2021) Accounting for Numbers: Group Characteristics and the Choice of Violent and Nonviolent Tactics. The Economics of Peace and Security Journal, 16(1), pp. 1–25. https://doi.org/10.15355/epsj.16.1.5

38. De Mol C., Giannone D., Reichlin L. (2008) Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components? Journal of Econometrics, 146(2), pp. 318–328. https://doi.org/10.1016/j.jeconom.2008.08.011

39. Dorward N., Fox S. (2022) Population pressure, political institutions, and protests: A multilevel analysis of protest events in African cities. Political Geography, 99, pp. 102–111. https://doi.org/10.1016/j.polgeo.2022.102762

40. Edwards P. K. (1978) Time Series Regression Models of Strike Activity: A Reconsideration with American Data. British Journal of Industrial Relations, 16(3), pp. 47–62. https://doi.org/10.1111/j.1467-8543.1978.tb00289.x

41. Gleditsch K. S., Metternich N. W., Ruggeri A. (2014) Data and progress in peace and conflict research. Journal of Peace Research, 51(2), pp. 301–314. https://doi.org/10.1177/0022343313496803

42. Goldsmith B. E., Chalup S. K., Quinlan M. J. (2008) Regime type and international conflict: towards a general model. Journal of Peace Research, 45(6), pp. 743–763. https://doi.org/10.1177/0022343308096154

43. Goldstone J. A. et al. (2010) A global model for forecasting political instability. American journal of political science, 54(1), pp. 190–208. https://doi.org/10.1111/j.1540-5907.2009.00426.x

44. Goldstone J. A., Grinin L., Korotayev A. (2022) Introduction. Changing yet Persistent: Revolutions and Revolutionary Events. In: J. A. Goldstone, L. Grinin, A. Korotayev (Eds.), Handbook of Revolutions in the 21st Century: The New Waves of Revolutions, and the Causes and Effects of Disruptive Political Change (pp. 1–34). Cham: Springer Nature. https://doi.org/10.1007/978-3-030-86468-2_1

45. Grinin L. (2022) On revolutionary waves since the 16th century. In: J. A. Goldstone, L. Grinin, A. Korotayev (Eds.), Handbook of Revolutions in the 21st Century: The New Waves of Revolutions, and the Causes and Effects of Disruptive Political Change (pp. 389–411). Cham: Springer Nature. https://doi.org/10.1007/978-3-030-86468-2_13

46. Grinin L., Grinin A. (2022) Revolutionary Waves and Lines of the 20th Century //In: Goldstone J. A., Grinin L., Korotayev A. (Eds.), Handbook of Revolutions in the 21st Century: The New Waves of Revolutions, and the Causes and Effects of Disruptive Political Change (pp. 315-388). Cham: Springer Nature. https://doi.org/10.1007/978-3-030-86468-2_12

47. Grinin L., Grinin A. Korotayev A. (2022) 20th century revolutions: characteristics, types, and waves. Humanities and Social Sciences Communications, 9(1), pp. 1–13. https://doi.org/10.1057/s41599-022-01120-9.

48. Grinin L., Korotayev A. (2024) Is the Fifth Generation of Revolution Studies Still Coming? Critical Sociology, 50(6), pp. 1039–1067. https://doi.org/10.1177/08969205241245215

49. Grinin L., Korotayev A., Tausch A. (2019) Islamism, Arab Spring, and the Future of Democracy. World System and World Values Perspectives. Cham: Springer Nature. https://doi.org/10.1007/978-3-319-91077-2

50. Grömping U. (2015) Variable importance in regression models. Wiley interdisciplinary reviews: Computational statistics, 7(2), pp. 137-152. https://doi.org/10.1002/wics.1346

51. Hamilton R. I., Papadopoulos P. N. (2023) Using SHAP values and machine learning to understand trends in the transient stability limit. IEEE Transactions on Power Systems, 39(1), pp. 1384–1397. https://doi.org/10.1109/TPWRS.2023.3248941

52. Honaker J., King G., Blackwell M. (2011) Amelia II: A program for missing data. Journal of statistical software, 45(7), pp. 1–47. https://doi.org/10.18637/jss.v045.i07

53. Huang H., Boranbay-Akan S., Huang L. (2019). Media, protest diffusion, and authoritarian resilience. Political Science Research and Methods, 7(1), pp. 23–42. https://doi.org/10.1017/psrm.2016.25

54. Issaev L., Korotayev A. (2022) Introduction. New Wave of Revolutions in the MENA region//In: Issaev L., Korotayev A. (Eds.), New wave of revolutions in the MENA region. A comparative perspective (pp. 1–32). Cham: Springer. https://doi.org/10.1007/978-3-031-15135-4_1

55. Joseph K., Carley K. M., Filonuk D., Morgan G. P., Pfeffer J. (2014) Arab Spring: from newspaper. Social Network Analysis and Mining, 4(177), pp. 1–17. https://doi.org/10.1007/s13278-014-0177-5

56. Kavada A. (2020) Creating the collective: social media, the Occupy Movement and its constitution as a collective actor. Protesttechnologies and media revolutions (pp. 107-125). Emerald Publishing Limited.

57. Keele L. J. (2008) Semiparametric regression for the social sciences. Hoboken, NJ: John Wiley & Sons.

58. King G. (1988) Statistical models for political science event counts: Bias in conventional procedures and evidence for the exponential Poisson regression model. American Journal of Political Science, 32(3), pp. 838–863. https://doi.org/10.2307/2111248

59. Knutsen C. H. (2014) Income Growth and Revolutions. Social Science Quarterly, 95(4), pp. 920–937. https://doi.org/10.1111/ssqu.12081

60. Korotayev A., Grinin L., Ustyuzhanin V., Fain E. (2025) The Fifth Generation of Revolution Studies. Part I: When, Why and How Did It Emerge. Critical Sociology, 51(2), pp. 257–282. https://doi.org/10.1177/08969205241300596

61. Korotayev A., Issaev L., Zinkina J. (2015) Center-periphery dissonance as a possible factor of the revolutionary wave of 2013–2014: A cross-national analysis. Cross-Cultural Research, 49(5), pp. 461–488. https://doi.org/10.1177/1069397115595374

62. Korotayev A., Medvedev I., Zinkina J. (2022) Global Systems for Sociopolitical Instability Forecasting and Their Efficiency: A Comparative Analysis. Comparative Sociology, 21(1), pp. 64–104. https://doi.org/10.1163/15691330-bja10050

63. Korotayev A. V., Sawyer P. S., Romanov D. M. (2021) Socio-economic development and protests: A quantitative reanalysis. Comparative Sociology, 20(2), pp. 195–222. https://doi.org/10.1163/15691330-bja10030

64. Korotayev A., Ustyuzhanin V., Grinin L., Fain E. (2025) The fifth generation of revolution studies. Part II: A systematic review of substantive findings (Revolution Causes, Forms, and Waves). Critical Sociology 51(3), pp. 429–450. https://doi.org/10.1177/08969205241300595

65. Korotayev A., Vaskin I., Bilyuga S., Ilyin I. (2018) Economic Development and Sociopolitical Destabilization: A Re-Analysis. Cliodynamics, 9(1), pp. 59–118. https://doi.org/10.21237/c7clio9137314

66. Korotayev A., Zhdanov A., Grinin L., Ustyuzhanin V. (2025) Revolution and Democracy in the Twenty-First Century. Cross-Cultural Research, 59(2), pp. 180–215. https://doi.org/10.1177/10693971241245862

67. Kostin M., Korotayev A. (2024) USAID Democracy Promotion as a Possible Predictor of Revolutionary Destabilization. Comparative Sociology, 23(2), pp. 240–278. https://doi.org/10.1163/15691330-bja10102

68. Lahiri K., Monokroussos G., Zhao Y. (2016) Forecasting consumption: The role of consumer confidence in real time with many predictors. Journal of Applied Econometrics, 31(7), pp. 1254–1275. https://doi.org/10.1002/jae.2494

69. Lall R. (2016) How multiple imputation makes a difference. Political Analysis, 24(4), pp. 414–433. https://doi.org/10.1093/pan/mpw020

70. Levin N., Ali S., Crandall D. (2018) Utilizing remote sensing and big data to quantify conflict intensity: the Arab Spring as a case study. Applied Geography, 94, pp. 1–17. https://doi.org/10.1016/j.apgeog.2018.03.001

71. Li F., Yang Y. (2003) A loss function analysis for classification methods in text categorization. Proceedings of the 20th international conference on machine learning (ICML-03), pp. 472–479.

72. Lotan G., Graeff E., Ananny M., Gaffney D., Pearce I. (2011) The Arab Spring| the revolutions were tweeted: Information flows during the 2011 Tunisian and Egyptian revolutions. International journal of communication, 5(5), pp. 1375–1405.

73. Medvedev I., Ustyuzhanin V., Zinkina J., Korotayev A. (2022) Machine learning for ranking factors of global and regional protest destabilization with a special focus on Afrasian instability macrozone. Comparative Sociology, 21 (6), pp. 604–645. https://doi.org/10.1163/15691330-bja10062

74. Muthukumar V. et al. (2021) Classification vs regression in overparameterized regimes: Does the loss function matter? Journal of Machine Learning Research, 22(222), pp. 1–69.

75. Nicodemus K. K. et al. (2010) The behaviour of random forest permutation-based variable importance measures under predictor correlation. BMC bioinformatics, 11, pp. 1–13. https://doi.org/10.1186/1471-2105-11-110

76. Nirmalraj S. et al. (2023) Permutation feature importance-based fusion techniques for diabetes prediction. Soft Computing, 2023, pp. 1–12. https://doi.org/10.1007/s00500-023-08041-y

77. Pinckney J., RezaeeDaryakenari B. (2022) When the levee breaks: A forecasting model of violent and nonviolent dissent. International Interactions, 48(5), pp. 997–1026. https://doi.org/10.1080/03050629.2022.2090933

78. Ritter D. P. (2015) The iron cage of liberalism: International politics and unarmed revolutions in the Middle East and North Africa. Oxford: Oxford University Press.

79. Rozov N. (2022) Typology and principles of dynamics of revolutionary waves in world history. In: J. A. Goldstone, L. Grinin, A. Korotayev (Eds.), Handbook of Revolutions in the 21st Century: The New Waves of Revolutions, and the Causes and Effects of Disruptive Political Change (pp. 241–264). Springer. https://doi.org/10.1007/978-3-030-86468-2_9

80. Sun X. et al. (2012) Using cooperative game theory to optimize the feature selection problem. Neurocomputing, 97, pp. 86–93. https://doi.org/10.1016/j.neucom.2012.05.001

81. Tang J., Liu H. (2012) Feature selection with linked data in social media. Proceedings of the 2012 SIAM International Conference on Data Mining. Society for Industrial and Applied Mathematics, pp. 118–128.

82. Taylor L., Schroeder R., Meyer E. (2014) Emerging practices and perspectives on Big Data analysis in economics: Bigger and better or more of the same? Big Data & Society, 1(2), article 2053951714536877. https://doi.org/10.1177/2053951714536877

83. Tremayne M. (2016) Anatomy of protest in the digital era: A network analysis of Twitter and Occupy Wall Street. Social Networks and Social Movements. London: Routledge, pp. 110–126.

84. Tumasjan A. et al. (2010) Predicting elections with twitter: What 140 characters reveal about political sentiment. Proceedings of the international AAAI conference on web and social media, 4(1), pp. 178–185. https://doi.org/10.1609/icwsm.v4i1.14009

85. Ulfelder J. (2012) Forecasting Political Instability: Results from a Tournament of Methods. Available at SSRN 2156234.

86. Ustyuzhanin V., Korotayev A. (2023) Revolutions and Democracy. Can Democracies Prevent Revolutionary Armed Violence? Comparative Sociology, 22(1), pp. 95–137. https://doi.org/10.1163/15691330-bja10073

87. Ustyuzhanin V. V., Sawyer P. S., Korotayev A. V. (2023) Students and protests: A quantitative cross-national analysis. International Journal of Comparative Sociology, 64(4), pp. 375–401. https://doi.org/10.1177/00207152221136042

88. Von Eschenbach W. J. (2021) Transparency and the black box problem: Why we do not trust AI. Philosophy & Technology, 34(4), pp. 1607–1622. https://doi.org/10.1007/s13347-021-00477-0

89. Yun Y. H., Liang F., Deng B. C., Lai G. B., Vicente Gonçalves C. M., Lu H. M., Liang Y. Z. (2015) Informative metabolites identification by variable importance analysis based on random variable combination. Metabolomics, 11, pp. 1539–1551. https://doi.org/10.1007/s11306-015-0803-x


Об авторах

И. А. Медведев
Национальный исследовательский университет «Высшая школа экономики»
Россия

Медведев Илья Александрович — магистр социологии, младший научный сотрудник, Центр изучения стабильности и рисков.

Москва



А. В. Коротаев
Национальный исследовательский университет «Высшая школа экономики»; Институт Африки РАН
Россия

Коротаев Андрей Витальевич — д.и.н., директор, Центр изучения стабильности и рисков, НИУ «ВШЭ»; г.н.с., Институт Африки РАН.

Москва



Рецензия

Для цитирования:


Медведев И.А., Коротаев А.В. К прогнозированию вероятности невооруженной революционной дестабилизации методами машинного обучения. Социология власти. 2025;37(2):108-141. EDN: IBNXWP

For citation:


Medvedev I.A., Korotayev A.V. Towards Forecastingting the Probability of Unarmed Revolutionary Destabilization Using Machine Learning Methods. Sociology of Power. 2025;37(2):108-141. (In Russ.) EDN: IBNXWP

Просмотров: 322

JATS XML


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2074-0492 (Print)
ISSN 2413-144X (Online)