Статистическое исследование цифровых следов в киберпространстве: языковые маркеры деструктивных сообществ
УДК 81'33, ББК 81.1
Аннотация
В связи с повсеместным распространением информационно-коммуникационных технологий растет и тенденция к увеличению агрессивного и деструктивного контента, который представлен в текстовом формате, в связи с чем возникает потребность в разработке новых методов выявления и описания групп лиц, оставляющих подобные «цифровые следы». В настоящей работе описана процедура лингвистического профилирования текстов, основанная на системно-структурном изучении языковых параметров и их количественном исчислении. Для эксперимента собран тестовый набор данных, представленный текстами с платформ, на которых потенциально публикуется деструктивный контент. Корпус кластеризирован методом k-means, были определены тематически ориентированные группы текстов – проекции деструктивных сообществ пользователей. С помощью языка программирования Python реализован алгоритм, который включает предобработку текстов, вычисление статистических связей между языковыми характеристиками и, наконец, определение уровня значимости, который позволяет утверждать о характерных языковых признаках деструктивных сообществ. Установлены значимые зависимости между коэффициентом лексической плотности и частотой употребления глаголов/имен существительных, а также type-token ratio (коэффициент лексического богатства, отношение количества уникальных слов к общему количеству слов в тексте). Приведена стилеметрическая характеристика представленных кластеров.
Скачивания
Литература
Ананьева М. И., Девяткин Д. А., Кобозева М. В., Смирнов И. В. Лингвостатистический анализ текстов экстремистской направленности / Ситуационные центры и информационно-аналитические системы класса 4i для задач мониторинга и безопасности: материалы Международной конференции (SCVRT2015–16). – 2016. – С. 210-213.
Бакиров Р. Р., Грязнов А. Н., Валиахметов И. Р. Социально-психологическая типология членов ОПГ с позиции их готовности к социальной интеграции / Общество, государство, личность: применение научных знаний и технологий в решении социально-экономических задач региона. – 2023. – С. 101-111.
Васильева Н. В, Майборода А. В., Ясавеев И. Г. «Почему уходят в ИГИЛ ?»: дискурс-анализ нарративов молодых дагестанцев / Социологическое обозрение. – 2017. – Т. 16. – №. 2. – С. 54-74.
Володин Е. А. Особенности внедрения искусственного интеллекта в судебные процессы: автоматизация и цифровизация правоприменения / Юридическая наука. – 2025. – №. 4. – С. 85-89.
Литвинова Т. А. Компаративное исследование текстов участников экстремистского форума и лиц с известными психологическими характеристиками с использованием методов стилеметрического анализа / Известия Воронежского государственного педагогического университета. – 2020. – №. 1. – С. 168-175.
Литвинова Т. А. Стилеметрическое исследование текстов участников экстремистского форума: гендерный аспект / Известия Воронежского государственного педагогического университета. – 2019. – №. 4. – С. 227-236.
Мамаев И. Д., Митрофанова О. А., Петров В. В., Марусенко М. А. Методы автоматического выявления и анализа дискурса сообщества иностранных агентов в цифровой среде (лингвокриминалистический аспект) / Филологические науки. Вопросы теории и практики. – 2025. – Т. 18. – №. 7. – С. 3106-3115.
Марусенко М. А., Бессонов Б. Л., Богданова Л. М., Аникин М. А., Мясоедова Н. Е. В поисках потерянного автора: Этюды атрибуции. СПб., 2001.
Министерство юстиции Российской Федерации. Экстремистские материалы. Hatewall. URL: https://www.minjust.gov.ru/ru/extremist-materials/?q=hatewall
Осипенко А. Л. Организованная преступная деятельность в киберпространстве: тенденции и противодействие / Юридическая наука и практика: Вестник Нижегородской академии МВД России. – 2017. – №. 4 (40). – С. 181-188.
Пристансков В. Д., Харатишвили А. Г., Евстратова Ю. А. Искусственный интеллект – новая форма использования специальных знаний в расследовании и раскрытии киберпреступлений / Всероссийский криминологический журнал. – 2023. – Т. 17, № 6. – C. 586-596.
Уголовный кодекс Российской Федерации от 13.06.1996 N 63-ФЗ (ред. от 28.12.2024) (с изм. и доп., вступ. в силу с 08.01.2025). URL: https://www.consultant.ru/document/cons_doc_LAW_10699/
Федеральный закон от 25.07.2002 №114-ФЗ «О противодействии экстремистской деятельности». URL: https://www.consultant.ru/document/cons_doc_LAW_37867/
Федеральный закон от 6 марта 2006 года № 35-ФЗ «О противодействии терроризму». URL: https://www.consultant.ru/document/cons_doc_LAW_58840/
Ahmed M. H., Tiun S., Omar N., Sani N.S. Short text clustering algorithms, application and challenges: A survey / Applied Sciences. – 2022. – Vol. 13. – No. 1. – Pp. 1-38.
Benko V., Zakharov V. P. Very Large Russian Corpora: New Opportunities and New Challenges / Computational Linguistics and Intellectual Technologies. – Российский государственный гуманитарный университет. – 2016. – Pp. 79-93.
Resende de Mendonça R., Felix de Brito D., de Franco Rosa F., dos Reis J. C., Bonacin R. A framework for detecting intentions of criminal acts in social media: A case study on twitter / Information. – 2020. – Vol. 11. – No. 3. – Pp. 1-40.
Swales J. Discourse communities, genres and English as an international language / World Englishes. – 1988. – Vol. 7. – No. 2. – Pp. 211-220.
Copyright (c) 2025 Иван Мамаев, Михаил Марусенко, Вадим Петров

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
1. Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
2. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
3. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).





