Skip to content

Commit

Permalink
changed configs
Browse files Browse the repository at this point in the history
  • Loading branch information
audetv committed Jul 15, 2024
1 parent f8e2353 commit e6cd1d3
Show file tree
Hide file tree
Showing 3 changed files with 23 additions and 24 deletions.
16 changes: 3 additions & 13 deletions config/parser/local.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -10,17 +10,7 @@ splitter:
opt_chunk_size: 1800 # оптимальный размер фрагмента контента для поиска, на эти фрагменты будет разбит контент
max_chunk_size: 3600 # максимальный размер фрагмента контента для поиска
parsers:
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/question/view-50275
- url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
current: true
# pages: 13
fetch_all: false
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
# pages: 0
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
# pages: 1
# pages: 0 означает, что нужно обработать все страницы. отрицательное значение так же означает все старницы.
# Если параметр и число не указаны, означает что нужно обработать только последнюю запись на странице, последний выпуск вопрос ответ.
# положительное число означет сколько страниц надо обработать, например 2 означает обработать все записи на двух страницах
# pages: -1
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/question
current: flase
pages: 1
fetch_all: false
16 changes: 16 additions & 0 deletions config/parser/prod.yaml
Original file line number Diff line number Diff line change
@@ -0,0 +1,16 @@
env: "prod" # Окружение - local, dev или prod
workers: 1
delay: 2s
random_delay: 0s
manticore:
- index: questions
- index: questions_ext
entry_chan_buffer: 20
splitter:
opt_chunk_size: 1800 # оптимальный размер фрагмента контента для поиска, на эти фрагменты будет разбит контент
max_chunk_size: 3600 # максимальный размер фрагмента контента для поиска
parsers:
- url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
current: false
pages: 1
fetch_all: false
15 changes: 4 additions & 11 deletions config/prod.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -10,16 +10,9 @@ splitter:
opt_chunk_size: 1800 # оптимальный размер фрагмента контента для поиска, на эти фрагменты будет разбит контент
max_chunk_size: 3600 # максимальный размер фрагмента контента для поиска
parsers:
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/question/view-50275
- url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
delay: 3600s
random_delay: 600s
previous: false
pages: 0
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
# pages: 0
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/video
# pages: 1
# pages: 0 означает, что нужно обработать все страницы. отрицательное значение так же означает все старницы.
# Если параметр и число не указаны, означает что нужно обработать только последнюю запись на странице, последний выпуск вопрос ответ.
# положительное число означет сколько страниц надо обработать, например 2 означает обработать все записи на двух страницах
# pages: -1
# - url: https://xn----8sba0bbi0cdm.xn--p1ai/qa/question
current: true
pages: 1

0 comments on commit e6cd1d3

Please sign in to comment.