АЛГОРИТМИ АВТОМАТИЗОВАНОЇ ПЕРЕВІРКИ ПАРАМЕТРІВ АКАДЕМІЧНИХ ДОКУМЕНТІВ
DOI:
https://doi.org/10.36994/2788-5518-2025-02-10-15Ключові слова:
форматування документів, docx, python-docx, інтегральна оцінка, структурний аналіз, автоматизація оформлення.Анотація
Анотація. У статті розглядаються теоретичні та практичні аспекти автоматизованої перевірки форматування текстових документів формату docx. Проведений аналіз сучасних літературних джерел дозволив виявити прогалини в існуючих рішеннях, які здебільшого зосереджені на автоматичному створенні документів або перевірці окремих параметрів, і не охоплюють повного циклу структурного та форматного контролю. Дослідження свідчать, що завдяки автоматизації перевірки оформлення можна знизити кількість помилок більш ніж на 40 %, особливо у звітній документації формату docx. У зв’язку з цим, актуальність дослідження зумовлена потребою у створенні уніфікованої системи, здатної автоматично аналізувати структуру документа, перевіряти параметри оформлення та формувати інтегральну оцінку якості. Метою дослідження є проєктування та розробка системи автоматизованої перевірки форматування документів формату docx, що порівнює параметри оформлення з вимогами ДСТУ 3008:2015 та внутрішніми стандартами закладів вищої освіти. У межах цієї статті авторами запропоновано модульну архітектуру програмного прототипу, яка включає StyleAnalyzer – для аналізу стилів тексту, FormatValidator – для перевірки параметрів сторінки, структури та нумерації, і ReportGenerator – для автоматичного формування звіту. Реалізацію алгоритмів здійснено засобами мови Python із використанням бібліотеки python-docx. Результати експериментального тестування підтвердили ефективність створеного прототипу, який може бути використаний для автоматизації процесів форматування та стандартизації академічних документів. Запропонована архітектура дозволяє уніфіковано перевіряти до 95 % вимог форматування ДСТУ 3008:2015, скорочуючи час контролю одного документа у середньому на 70 % порівняно з ручною перевіркою.
Посилання
Martsinkevich V., Veselova E. Web Tool for Automated Document Formatting Verification. Proceedings of FRUCT Conference. 2020. [Online] URL: https://fruct.org/publications/volume-33/acm33/files/Mar.pdf
Nasyrov N. Automated Formatting Verification Technique of Paperwork Elements. Procedia Computer Science. Elsevier, 2020. Vol. 169. pp. 719–724. DOI: 10.1016/j.procs.2020.02.189. URL: https://www.sciencedirect.com/science/article/pii/S1877050920324170
Zhigalova M., Morozova A., Bessarabov K. System of Automated Checking of Textual Document Design. HSE University Publications. 2015. URL: https://publications.hse.ru/pubs/share/folder/0rdkqezioy/185788493.pdf
Peña A. Continuous document layout analysis: Human-in-the-loop…, Information Sciences. Elsevier. 2024. [Online]. URL: https://www.sciencedirect.com/science/article/pii/S1566253524001763
Сидоренко В. В., Кулішов В. С., Гірка С. В. Порядок проведення інструментальної перевірки на академічний плагіат, наявність текстових запозичень у рукописах кваліфікаційних робіт здобувачів вищої освіти освітнього ступеня «магістр» у 2025 році. Біла Церква : БІНПО, 2025. 18 с. URL: https://lib.iitta.gov.ua/id/eprint/744928
Музичук Д. Р., Войтко В. В., Черноволик Г. О. Розробка засобів системи автоматизованого формування і редагування текстових документів. Інформаційні технології і автоматизація – 2024 : матеріали XVII міжнародної науково-практичної конференції (Одеса, 31 жовтня – 1 листопада 2024 р.). Одеса : Видавництво ОНТУ, 2024. С. 479–482.
Вербовий Д. С., Саяпіна І. О. Метод для автоматичної перевірки документів на відповідність нормативним вимогам. Системні технології. 2025. № 3 (158). С. 181–187.
Сидорко Д. С., Глухов В. С. Програмна реалізація методів аналізу та нормоконтролю текстових технічних звітів. Computer systems and networks. 2024. № 6 (2). С. 208–221. DOI: 10.23939/csn2024.02.208.
Заболотня Т., Сєчин І. Комбінований метод виявлення нечітких дублікатів текстових документів. Progressive Science and Achievements : proceedings of the 4th International Scientific and Practical Conference (May 16–18, 2024). Doha, Qatar, 2024. № 200. С. 229–232.
Данильченко В. М. Багатокритеріальне розпізнавання відповідності текстів темі на основі алгоритму TF-IDF. Зв’язок. 2025. № 3. С. 36–41. DOI: 10.31673/2412-9070.2025.027728.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

