ІНТЕГРАЦІЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ В СЕМАНТИЧНИЙ АНАЛІЗ OSINT-ДАНИХ: АЛГОРИТМИ ТА РЕЗУЛЬТАТИ
DOI:
https://doi.org/10.31319/2519-2884.46.2025.16Ключові слова:
семантичний аналіз, розвідка на основі відкритих джерел, машинне навчання, алгоритм кластеризації, моделі глибокого навчання, обробка природної мовиАнотація
У роботі описується процес розробки універсального програмного модуля для семантичного аналізу даних розвідки на основі відкритих джерел із використанням методів машинного навчання. Запропоноване рішення автоматизує процеси збору, обробки та кластеризації великих масивів інформації, підвищуючи точність аналізу та спрощуючи інтерпретацію результатів для спеціалістів у сферах кібербезпеки, бізнес-аналітики та журналістики.
Посилання
Використання технологій OSINT для отримання розвідувальної інформації / О. В. Минько та ін. Системи управління, навігації та зв’язку. 2016. 4. С. 81–84.
Hwang Y. W., Lee I. Y., Kim H., Lee H., Kim D. Current status and security trend of OSINT. Wireless Communications and Mobile Computing. Vol. 2022 (1), ID 1290129.
Evangelista J. R. G., Sassi R. J., Romero M., Napolitano D. Systematic literature review to in-vestigate the application of open source intelligence (OSINT) with artificial intelligence. Journal of Applied Security Research. 2021. Vol. 16(3). P. 345–369.
Литвиненко О. Є, Бурко Д. А. Моделі семантичного аналізу текстів. Наукоємні техно-логії. 2009. Т. 4 : 4. С. 55–58.
Анісімов А. В., Марченко О. О., Никоненко А. О. Алгоритмічна модель асоціативно-семантичного контекстного аналізу текстів природною мовою. Проблеми програмування. 2008. 2-3. С. 379–384.
Maulud D. H., Zeebaree S. R., Jacksi K., Sadeeq M. A. M., Sharif K. H. State of art for seman-tic analysis of natural language processing. Qubahan academic journal. 2021. Vol. 1(2). P. 21–28.
Velupillai S., Mowery D., South B. R., Kvist M., Dalianis H. Recent advances in clinical natu-ral language processing in support of semantic analysis. Yearbook of medical informatics. 2015. Vol. 24(1). P. 183–193.
Molenaar A., Lukose D., Brennan L., Jenkins E. L., McCaffrey T. A. Using Natural Language Processing to explore social media opinions on Food Security: sentiment analysis and topic modeling study. Journal of Medical Internet Research. 2024. Vol. 26. e47826.
Liu J., Li K., Zhu A., Hong B., Zhao P., Dai S., Su H. Application of deep learning-based natu-ral language processing in multilingual sentiment analysis. Mediterranean Journal of Basic and Applied Sciences (MJBAS). 2024. Vol. 8(2). P. 243–260.
Block L. The long history of OSINT. Journal of Intelligence History. 2024. Vol. 23(2). P. 95–109.
Analytics of Big Data and social networks. URL: http://www.osp.ru/os/2013/08/13037856 (дата звернення: 16.03.2025).
Kontostathis A., Edwards L., Leatherman A. Text mining and cybercrime. Text Mining. Appli-cations and Theory / ed. by Berry M. W., Kogan J. Chichester: Wiley, 2010. P. 149–164.
Dua S., Du X. Data Mining and Machine Learning in Cybersecurity. New York, 2011.
Text Mining: Applications and Theory / ed. by Berry M. W., Kogan J. Wiley, 2010. 224 p.
Thorsten J. Text Categorization with Support Vector Machines: Learning with Many Relevant Features URL: https://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdf (дата звер-нення: 16.03.2025).
Sebastiani F. Machine learning in automated text categorization. ACM Computing Surveys. 2010. Р. 1–47.
Esuli A., Sebastiani F. Determining the Semantic Orientation of Terms through Gloss Classifica-tion. Conference of Information and Knowledge Management (Bremen). ACM, New York, NY, 2005. Р. 617–624.
Gupta M., Mishra A., Kumar V. A survey on fake news detection using machine learning tech-niques. Journal of Big Data. 2020. Vol. 7(1). P. 1–21.
Zhang Z., Chen Y., Chen L. Methods for detecting fake news: A survey. ACM Computing Sur-veys. 2020. Vol. 53(6). P. 1–37.
Browne T. O., Abedin M., Chowdhury M. J. M. A systematic review on research utilising arti-ficial intelligence for open source intelligence (OSINT) applications. International Journal of In-formation Security. 2024. Vol. 23(4). P. 2911–2938.
Mynko, O. V., Iokhov, O. Yu., Olenchenko, V. T., & Vlasov, K. V. (2016). Vykorystannia tekhnolohii OSINT dlia otrymannia rozviduvalnoi informatsii [Using OSINT technologies to ob-tain intelligence information]. Systemy upravlinnia, navihatsii ta zv’iazku, (4), 81–84. [in Ukrainian].
Hwang, Y. W., Lee, I. Y., Kim, H., Lee, H., & Kim, D. (2022). Current status and security trend of OSINT. Wireless Communications and Mobile Computing, 2022(1), 1290129. DOI: https://doi.org/10.1155/2022/1290129
Evangelista, J. R. G., Sassi, R. J., Romero, M., & Napolitano, D. (2021). Systematic literature review to investigate the application of open-source intelligence (OSINT) with artificial intelli-gence. Journal of Applied Security Research, 16(3), 345–369. DOI: https://doi.org/10.1080/19361610.2020.1761737
Anisimov, A. V., Marchenko, O. O., & Nikonenko, A. O. (2008). Alhorytmichna model asot-siatyvno-semantychnoho kontekstnoho analizu tekstiv pryrodnoiu movoiu [Algorithmic model of associative-semantic contextual analysis of texts in natural language]. Problemy prohramuvan-nia, (2–3), 379–384. [in Ukrainian].
Lytvynenko, O. Ye., & Burko, D. A. (2009). Modeli semantychnoho analizu tekstiv [Models of semantic text analysis]. Naukoiemni tekhnolohii, 4(4), 55–58. [in Ukrainian].
Maulud, D. H., Zeebaree, S. R., Jacksi, K., Sadeeq, M. A. M., & Sharif, K. H. (2021). State of art for semantic analysis of natural language processing. Qubahan Academic Journal, 1(2), 21–28.
Velupillai, S., Mowery, D., South, B. R., Kvist, M., & Dalianis, H. (2015). Recent advances in clinical natural language processing in support of semantic analysis. Yearbook of Medical Informatics, 24(1), 183–193.
Molenaar, A., Lukose, D., Brennan, L., Jenkins, E. L., & McCaffrey, T. A. (2024). Using natu-ral language processing to explore social media opinions on food security: Sentiment analysis and topic modeling study. Journal of Medical Internet Research, 26, e47826.
Liu, J., Li, K., Zhu, A., Hong, B., Zhao, P., Dai, S., ... & Su, H. (2024). Application of deep learning-based natural language processing in multilingual sentiment analysis. Mediterranean Journal of Basic and Applied Sciences (MJBAS), 8(2), 243–260.
Block, L. (2024). The long history of OSINT. Journal of Intelligence History, 23(2), 95-109.
Analytics of Big Data and social networks. (n.d.). Retrieved from http://www.osp.ru/os/2013/08/13037856.
Kontostathis, A., Edwards, L., & Leatherman, A. (2010). Text mining and cybercrime. In M. W. Berry & J. Kogan (Eds.), Text mining: Applications and theory (pp. 149–164). Wiley.
Dua, S., & Du, X. (2011). Data mining and machine learning in cybersecurity. New York.
Berry, M. W., & Kogan, J. (Eds.). (2010). Text mining: Applications and theory. Wiley. 224 p.
Thorsten, J. (1998). Text categorization with support vector machines: Learning with many rele-vant features. Retrieved from https://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdf.
Sebastiani, F. (2010). Machine learning in automated text categorization. ACM Computing Surveys, 1–47.
Esuli, A., & Sebastiani, F. (2005). Determining the semantic orientation of terms through gloss classification. Conference of Information and Knowledge Management (Bremen), ACM, New York, NY, 617–624.
Gupta, M., Mishra, A., & Kumar, V. (2020). A survey on fake news detection using machine learning techniques. Journal of Big Data, 7(1), 1–21.
Zhang, Z., Chen, Y., & Chen, L. (2020). Methods for detecting fake news: A survey. ACM Computing Surveys, 53(6), 1–37.
Browne, T. O., Abedin, M., & Chowdhury, M. J. M. (2024). A systematic review on research utilising artificial intelligence for open-source intelligence (OSINT) applications. International Journal of Information Security, 23(4), 2911-2938.