Обработка символьной информации средствами
языка программирования Python
Цибуленко Светлана Николаевна
В настоящее время люди все больше и больше используют информационные технологии в различных сферах человеческой деятельности. На сегодняшний день существует множество программ для решения прикладных задач. Одной из важных задач является работа с информацией, в том числе текстовой. Вручную обрабатывать большие объемы текстовой информации очень проблематично, поэтому существует необходимость в разработке программных средств для упрощения процесса обработки.Для разработки программы обработки символьной информации был выбран язык программирования Python.
Программа должна позволять пользователю:
- Определять статистику, т.е. узнавать количество слов и предложений во введённом тексте, а также узнавать количество символов с учетом пробела и без его учета;
- Находить три наиболее часто встречающихся слова и количество вхождений каждого из них;
- Находить самое длинное слово в тексте, а также самое длинное предложение из этого текста;
- Находить все слова-палиндромы, то есть слова, которые читаются одинаково справа налево и слева направо;
- Создать интервальный вариационный ряд, с равными интервалами с указанием пользователем числа групп.
Для создания программы были использованы модули: simpletk (модуль для работы с графическим интерфейсом); tkinter (кроссплатформенная библиотека для разработки графического интерфейса на языке Python); re модуль регулярных выражений языка программирования Python).
Программа состоит из многострочных текстовых полей, для ввода и вывода больших объёмов текстовой информации. Эти поля позволяют вводить и выводить текст в несколько строк, если требуется, перенося на следующую строку при помощи клавиши Enter или же перенося автоматически по словам.
Приведём фрагмент программного кода для создания многострочного текстового поля.
textvvod = Text(app, width=40, heigh=3, font=f, wrap=WORD)
textvvod.grid(row=0, column=0, padx=15, pady=40)
- – класс tkinter, который предназначен для ввода не одной строки текста, а существенно больше.
- .grid – менеджер размещения элементов
pady – расположение по Y
column – отвечает за расположение в столбце
row – отвечает за расположение элементов в строке
На форме программы расположены следующие кнопки:
- импорт текста из файла, позволяющая загрузить готовый образец текста;
- запись текста в файл, позволяющая загрузить результат обработки текста в файл;
- очистить, позволяющая убрать текст в поле ввода и вывода текста.
Рис. 1 Окно программы
Для последующей обработки текста пользователю необходимо выбрать одну из задач обработки текста (см. Рис. 1).
Например, при нажатии на кнопку «Определение статистики» результат выводится следующим образом (см. Рис. 2):
Рис. 2 Окно результата выполнения программы
В результате, удалось разработать программу, которая позволяет выполнять базовые операции с текстовой информацией, такие как:
- Определение статистики;
- Нахождение трех наиболее часто встречающихся слов и количество вхождения каждого из них;
- Нахождение самого длинного слова в тексте, а так же самого длинного предложения из этого текста;
- Нахождение всех слов-палиндромов;
- Создание интервально вариационного ряда, с равными интервалами с указанием пользователем числом групп.
Список литературы:
- Орехов И., Статья: программирование на Python / Режим доступа: https://www.ibm.com/developerworks/ru/library /Дата обращения: (27.04.2021)
- Прохорецок Н. А. Python 3 и PyQt. Разработка приложений. – СПб: БХВ-Петербург, 2012. – 704 с.
- Самоучитель Python | Python 3 для начинающих и чайников [Электронный ресурс] / Режим доступа: https://pythonworld.ru/samouchitel-python /Дата обращения: (28.04.2021)
- Шапошников С., "Лаборатория юного линуксоида" [Электронный ресурс] / Режим доступа: http://younglinux.info/python.php /Дата обращения: (28.04.2021)