Статистическое исследование цифровых следов в киберпространстве: языковые маркеры деструктивных сообществ

УДК 81'33, ББК 81.1

  • Иван Мамаев Балтийский государственный технический университет «Военмех» им. Д. Ф. Устинова https://orcid.org/0000-0003-3362-9131 Email: mamaev_id@voenmeh.ru
  • Михаил Марусенко Санкт-Петербургский государственный университет Email: m.marusenko@spbu.ru
  • Вадим Петров Санкт-Петербургский государственный университет Email: vadim.petrov@spbu.ru
Ключевые слова: криминалистика, деструктивные группы, экстремистский контент, профилирование автора текста, социальные сети, языковые маркеры

Аннотация

В связи с повсеместным распространением информационно-коммуникационных технологий растет и тенденция к увеличению агрессивного и деструктивного контента, который представлен в текстовом формате, в связи с чем возникает потребность в разработке новых методов выявления и описания групп лиц, оставляющих подобные «цифровые следы». В настоящей работе описана процедура лингвистического профилирования текстов, основанная на системно-структурном изучении языковых параметров и их количественном исчислении. Для эксперимента собран тестовый набор данных, представленный текстами с платформ, на которых потенциально публикуется деструктивный контент. Корпус кластеризирован методом k-means, были определены тематически ориентированные группы текстов – проекции деструктивных сообществ пользователей. С помощью языка программирования Python реализован алгоритм, который включает предобработку текстов, вычисление статистических связей между языковыми характеристиками и, наконец, определение уровня значимости, который позволяет утверждать о характерных языковых признаках деструктивных сообществ. Установлены значимые зависимости между коэффициентом лексической плотности и частотой употребления глаголов/имен существительных, а также type-token ratio (коэффициент лексического богатства, отношение количества уникальных слов к общему количеству слов в тексте). Приведена стилеметрическая характеристика представленных кластеров.

Скачивания

Данные скачивания пока недоступны.

Биографии авторов

Иван Мамаев, Балтийский государственный технический университет «Военмех» им. Д. Ф. Устинова

кандидат филологических наук, старший преподаватель кафедры Р7 «Теоретической и прикладной лингвистики», Балтийский государственный технический университет «Военмех» им. Д.Ф. Устинова;

ассистент кафедры математической лингвистики, Санкт-Петербургский государственный университет

Михаил Марусенко, Санкт-Петербургский государственный университет

Доктор филологических наук, профессор, профессор кафедры математической лингвистики

Вадим Петров, Санкт-Петербургский государственный университет

Кандидат медицинских наук, старший преподаватель кафедры уголовного процесса и криминалистики

Литература

Ананьева М. И., Девяткин Д. А., Кобозева М. В., Смирнов И. В. Лингвостатистический анализ текстов экстремистской направленности / Ситуационные центры и информационно-аналитические системы класса 4i для задач мониторинга и безопасности: материалы Международной конференции (SCVRT2015–16). – 2016. – С. 210-213.

Бакиров Р. Р., Грязнов А. Н., Валиахметов И. Р. Социально-психологическая типология членов ОПГ с позиции их готовности к социальной интеграции / Общество, государство, личность: применение научных знаний и технологий в решении социально-экономических задач региона. – 2023. – С. 101-111.

Васильева Н. В, Майборода А. В., Ясавеев И. Г. «Почему уходят в ИГИЛ ?»: дискурс-анализ нарративов молодых дагестанцев / Социологическое обозрение. – 2017. – Т. 16. – №. 2. – С. 54-74.

Володин Е. А. Особенности внедрения искусственного интеллекта в судебные процессы: автоматизация и цифровизация правоприменения / Юридическая наука. – 2025. – №. 4. – С. 85-89.

Литвинова Т. А. Компаративное исследование текстов участников экстремистского форума и лиц с известными психологическими характеристиками с использованием методов стилеметрического анализа / Известия Воронежского государственного педагогического университета. – 2020. – №. 1. – С. 168-175.

Литвинова Т. А. Стилеметрическое исследование текстов участников экстремистского форума: гендерный аспект / Известия Воронежского государственного педагогического университета. – 2019. – №. 4. – С. 227-236.

Мамаев И. Д., Митрофанова О. А., Петров В. В., Марусенко М. А. Методы автоматического выявления и анализа дискурса сообщества иностранных агентов в цифровой среде (лингвокриминалистический аспект) / Филологические науки. Вопросы теории и практики. – 2025. – Т. 18. – №. 7. – С. 3106-3115.

Марусенко М. А., Бессонов Б. Л., Богданова Л. М., Аникин М. А., Мясоедова Н. Е. В поисках потерянного автора: Этюды атрибуции. СПб., 2001.

Министерство юстиции Российской Федерации. Экстремистские материалы. Hatewall. URL: https://www.minjust.gov.ru/ru/extremist-materials/?q=hatewall

Осипенко А. Л. Организованная преступная деятельность в киберпространстве: тенденции и противодействие / Юридическая наука и практика: Вестник Нижегородской академии МВД России. – 2017. – №. 4 (40). – С. 181-188.

Пристансков В. Д., Харатишвили А. Г., Евстратова Ю. А. Искусственный интеллект – новая форма использования специальных знаний в расследовании и раскрытии киберпреступлений / Всероссийский криминологический журнал. – 2023. – Т. 17, № 6. – C. 586-596.

Уголовный кодекс Российской Федерации от 13.06.1996 N 63-ФЗ (ред. от 28.12.2024) (с изм. и доп., вступ. в силу с 08.01.2025). URL: https://www.consultant.ru/document/cons_doc_LAW_10699/

Федеральный закон от 25.07.2002 №114-ФЗ «О противодействии экстремистской деятельности». URL: https://www.consultant.ru/document/cons_doc_LAW_37867/

Федеральный закон от 6 марта 2006 года № 35-ФЗ «О противодействии терроризму». URL: https://www.consultant.ru/document/cons_doc_LAW_58840/

Ahmed M. H., Tiun S., Omar N., Sani N.S. Short text clustering algorithms, application and challenges: A survey / Applied Sciences. – 2022. – Vol. 13. – No. 1. – Pp. 1-38.

Benko V., Zakharov V. P. Very Large Russian Corpora: New Opportunities and New Challenges / Computational Linguistics and Intellectual Technologies. – Российский государственный гуманитарный университет. – 2016. – Pp. 79-93.

Resende de Mendonça R., Felix de Brito D., de Franco Rosa F., dos Reis J. C., Bonacin R. A framework for detecting intentions of criminal acts in social media: A case study on twitter / Information. – 2020. – Vol. 11. – No. 3. – Pp. 1-40.

Swales J. Discourse communities, genres and English as an international language / World Englishes. – 1988. – Vol. 7. – No. 2. – Pp. 211-220.

Опубликован
2025-12-30
Как цитировать
Мамаев, И., Марусенко, М., & Петров, В. (2025). Статистическое исследование цифровых следов в киберпространстве: языковые маркеры деструктивных сообществ. Юрислингвистика, (38 (49), 62-73. https://doi.org/10.14258/leglin(2025)3811
Раздел
Лингвоэкспертология

Наиболее читаемые статьи этого автора (авторов)