Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Поиск по текстам Пушкина #8

Open
iprst opened this issue Apr 17, 2023 · 6 comments
Open

Поиск по текстам Пушкина #8

iprst opened this issue Apr 17, 2023 · 6 comments

Comments

@iprst
Copy link
Collaborator

iprst commented Apr 17, 2023

Произведения в свободном доступе Национальной электронной библиотеки
https://rusneb.ru/search/?q_author=Пушкин+А.С.&q_name

@audetv
Copy link
Collaborator

audetv commented Apr 17, 2023

Добавил в план Концепция связности

@iprst
Copy link
Collaborator Author

iprst commented Jun 5, 2023

Идёт разработка парсера для стихотворных форм.

@iprst
Copy link
Collaborator Author

iprst commented Jun 9, 2023

Я так подумал — ведь нам не требуется на самом деле именно парсить стихотворения в их реальные строфы. Мы можем стандартно парсить строки теми инструментами что уже сейчас есть, пусть строка будет короткой, но в обработанных таблицах можно создать логический ключ «стихотворная форма», например poem: true / false и в случае если он выбран, выдача осуществляется связкой из нескольких строк, притом не четверостишием, а например минимальный порог сделать 16 строк, тогда всё что короче будет отдано целиком, а всё что длиннее можно уже смотреть в источнике.

@audetv
Copy link
Collaborator

audetv commented Jun 9, 2023

да, согласен. В теории поиск найдет нужные строки даже если поисковые запрос будет содержать слова в двух соседних строках, он их выдаст рядом. Проверим.
Будем работать по уже сформированному алгоритму, параграф - строка и посмотрим как будет, ну, и вариант «стихотворная форма» хорош.

@iprst
Copy link
Collaborator Author

iprst commented Jun 9, 2023

А поле с логическим ключом может быть необязательным? Например, если мы по умолчанию считаем все тексты прозой, то поле вообще можно в таблицу не вводить, а если обработан стих, тогда можно подключить поле со значением true, так, чтобы отсутствие поля или значения в нём обрабатывалось бы как false.

@audetv
Copy link
Collaborator

audetv commented Jun 9, 2023

А поле с логическим ключом может быть необязательным?

Да поля могут быть необязательным, это нормально. Или со значениями по умолчанию.
Вначале вопрос появился, т.к. в текстах толстых книг обнаружил стихи, там их не будем никак размечать, и посмотрим, как будет работать поиск, а к текстам Пушкина уже подойдём подготовленными.

@iprst iprst transferred this issue from terratensor/svodd Jun 12, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants